Brainvalley

人工知能と脳科学のアーカイブサイト。

サイドバー

最新情報を購読する

最新情報は、feedlyかRSSで購読できます。

脳科学・神経科学を網羅的に学ぶ必読書

カンデル神経科学

カンデル神経科学は、脳科学・神経科学分野のバイブル的存在。2014年4月に日本語版が出版され、英語や医学用語が得意でない方にも大変読みやすくなりました。脳科学、神経科学について学ぶなら絶対に持っておきたいおすすめの一冊。

最新記事

人工知能・脳科学エッセイ

書籍・セミナー・勉強会

オンライン大学

論文検索

研究者の採用・求人

Actor-Critic

Actor-CriticはTD学習(Temporal Difference Learning)を用いた最も初期の強化学習(Reinforcement Learning)で使われていたアルゴリズム。Actor-Criticには、下記2点のメリットがある。

  1. 行動選択に最小限の計算量しか必要としない。連続値行動のような“可能な行動の個数が無限大である”ときに、行動価値算出のためにQ学習などでは1つの行動を選び出すために無限集合のなかを探索することになる。しかし、Actor-Criticでは行動選択に最小限の計算量しか必要としない。
  2. 確率的な行動選択を学習することができるので、いろいろな行動に対してそれを選択するような最適確率を学習することができる。

関連