账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
强化学习:入门指南
 

【作者: Emmanouil Tzorakoleftherakis】2019年11月14日 星期四

浏览人次:【10634】

强化学习(Reinforcement learning)潜力无穷,能解决许多开发应用上面临的艰难决策问题,包括产业自动化、自主驾驶、电玩竞技游戏以及机器人等,因此备受瞩目。


强化学习是机器学习(Machine learning)的一种,指的是电脑透过与一个动态(dynamic)环境不断重复地互动,来学习正确地执行一项任务。这种尝试错误(trial-and-error)的学习方法,使电脑在没有人类干预、没有被写入明确的执行任务程式下,就能够做出一系列的决策。最著名的强化学习案例就是AlphaGo,它是第一支打败人类围棋比赛世界冠军的电脑程式。


强化学习的运作主要是仰赖动态环境中的资料—也就是会随着外部条件变化而改变的资料,像是天气或交通流量。强化学习演算法的目标,即是于找出能够产生最佳结果的策略。强化学习之所以能达成目标,是借着软体当中被称为主体 (agent)的部分在环境中进行探索、互动和学习的方法。
...
...

另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
一般使用者 10/ごとに 30 日間 0/ごとに 30 日間 付费下载
VIP会员 无限制 25/ごとに 30 日間 付费下载

相关文章
以马达控制器ROS1驱动程式实现机器人作业系统
CAD/CAM软体无缝加值协作
创新更容易!2024年受瞩目的Arduino创新产品简介
确保机器人的安全未来:资安的角色
双臂机器人引风潮 类人形应用尤欠东风
相关讨论
  相关新闻
» 工研院开发智慧舒眠睡垫 可监测使用者心跳等睡眠数据
» 资策会通过ISO 17020国际认证 助半导体与电子制造业突破资安挑战
» 工研院SiC技术亮相日本 助攻电动车产业升级
» MIT新创公司革新能源技术 以低成本地热炼氨
» 微波技术革新氢能生产 韩国研究团队大幅降低制氢门槛


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2025 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK91N5K9YLGSTACUKS
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: [email protected]