タグ

2013年11月23日のブックマーク (4件)

  • バンディットアルゴリズム入門と実践

    東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

    バンディットアルゴリズム入門と実践
  • / 採用 | リコー

    リコーの採用情報です。

  • WindowsのService Packを恒久化してCドライブの容量を増やそう!

    Cドライブの肥大化の原因を追究するために、C:\Windowsフォルダのサイズなどを調べていると、C:\Windows\winsxsが大きな領域を使用していることがあります。WinSxSはWindows コンポーネントストアディレクトリでサービシング処理に使われており、これにはWindows更新プログラム、Service Pack、修正プログラムなどが含まれています。 WinSxSフォルダ内にはハードリンクが置かれており、これらを削除することはWindowsを不安定にする危険性が高いため推奨されません。そこで今回はWindowsのService Packを恒久化することで、WinSxSの容量を減らしたいと思います。 Service Packのインストールを恒久化することで、Service Packファイルに使用されている領域を再利用することができますが、Service Packを恒久化した

    WindowsのService Packを恒久化してCドライブの容量を増やそう!
  • ANA、国内線の旅客システムをオープン化、34年間のメインフレームの歴史に終止符 | IT Leaders

    30年以上にわたり使い続けたシステムを入れ替える。企業ITに携わる人間ならば、その困難さを想像するのは難しくないはずだ。このほどANAは、8年間の歳月をかけて、国内線の予約、発券、搭乗業務を支える旅客システムをオープン化。34年間、ビジネスを支えたメインフレームに別れを告げた。プロジェクトの指揮官に話を聞く(文中敬称略)。 聞き手:田口 潤 IT Leaders発行人 Photo:陶山 勉 ――今回、8年間にわたる国内旅客システムの刷新という大規模プロジェクトを終えた訳ですが、もともと、いつ頃から検討を始めたのですか? 金子:“次”を考え始めたのは、2000年頃だったと思います。30年以上にわたって、メインフレームを使い続けてきましたが、そのころから限界を感じ始めていたのです。 コストについては、必要経費ですから、それほど問題視していませんでしたが、むしろ、技術者の確保には頭を悩ませていま

    ANA、国内線の旅客システムをオープン化、34年間のメインフレームの歴史に終止符 | IT Leaders