域中. 胡龄爻等[6] 采用Q-learning算法,通过控制空调 ... 元组{S, A, P, R}[15],定义冷源MDP模型为:S是由冷 ... 源控制器的可用控制指令组成的动作空间;P 是冷源 ...
確定! 回上一頁