状態価値関数
関連
マルコフ決定過程
状態価値関数
,
マルコフ決定過程
,
強化学習