( 5.9 )根据定理 3.30 ,可知对于每个状态 ES ,如果一个平稳策略仅由在集合 A ( i ) ... 只需继续从 N.开始到,对每个状态 S ,在新的行动集合 A ( i )里构造最优策略就可以 ...
確定! 回上一頁