排序方式: 共有2条查询结果,搜索用时 46 毫秒
1
1.
本文讨论的是由可数状态空间,任意行动空间及半马氏决策矩阵所确定的半马氏决策过程的期望平均准则,在半马氏决策矩阵和报酬函数满足一定的条件下,用概率论中的稳定性定理,证明了ε(≥0)-强最优平稳策略的存在性。 相似文献
2.
1