現在位置: Brainvalley » Actor-Critic

サイドバー

最新情報を購読する

最新情報は、feedlyかRSSで購読できます。

脳科学・神経科学を網羅的に学ぶ必読書

カンデル神経科学

カンデル神経科学は、脳科学・神経科学分野のバイブル的存在。2014年4月に日本語版が出版され、英語や医学用語が得意でない方にも大変読みやすくなりました。脳科学、神経科学について学ぶなら絶対に持っておきたいおすすめの一冊。

最新記事

人工知能・脳科学エッセイ

書籍・セミナー・勉強会

オンライン大学

Machine Learning - Stanford University

論文検索

J-STAGE

研究者の採用・求人

JREC-IN Portal

Actor-Critic

Actor-CriticはTD学習(Temporal Difference Learning)を用いた最も初期の強化学習(Reinforcement Learning)で使われていたアルゴリズム。Actor-Criticには、下記2点のメリットがある。

行動選択に最小限の計算量しか必要としない。連続値行動のような“可能な行動の個数が無限大である”ときに、行動価値算出のためにQ学習などでは1つの行動を選び出すために無限集合のなかを探索することになる。しかし、Actor-Criticでは行動選択に最小限の計算量しか必要としない。
確率的な行動選択を学習することができるので、いろいろな行動に対してそれを選択するような最適確率を学習することができる。

Actor-Critic

関連

Plugin Backlinks: 該当文書はありませんでした。

Actor-Critic, 強化学習, TD学習, アルゴリズム