行動価値関数
関連
マルコフ決定過程
強化学習(Reinforcement Learning)
強化学習
,
行動価値関数