行動価値関数

関連

マルコフ決定過程
強化学習(Reinforcement Learning)

強化学習, 行動価値関数