【强化学习同一个学习率的图一样吗】强化学习同一个学习率的图不一样 。监督学习要求训练集和测试集数据分布越相近越好 , 但是包含的数据不一样 , 不能把分类任务中的一张图片 , 同时放到训练集和测试集中 , 因为实际情况中可能出现训练集不包含的图片 , 这时要保证监督学习算法具有一定的泛化能力 , 能够在没见过这张图片的情况下 , 对其正确处理 。强化学习的目的是优化马尔科夫决策过程中的智能体的策略 , 每次学习是专门针对一个任务进行的 。因此 , 不能让强化学习优化好一个走迷宫的任务 , 然后拿学习好的策略去干其他事 , 哪怕是让训练好的智能体走一个布局稍有变化的迷宫 , 效果也会下降 。
推荐阅读
- 破解版和盗版是同一个东西吗
- 6686i听英语听力材料的攻略以及在英语学习的作用
- 电脑培训学校哪里好,都说现在学习电脑比较好,我也想在
- 学习的途径有哪些
- 盛泰合击怎么卡强化装备
- 蒲公英和苦菜花是不是同一个植物
- 我想系统的学习电脑的装机和维护,应该从哪里学起,谁
- 刺玫瑰和玫瑰花一样吗 刺玫花和玫瑰花是同一个吗
- 希望保持这种学习态度后面怎么接
- 求电脑主装机配置单,学习型的,价格在3000到4000元的,高