CTIMES- 强化学习：入门指南 :强化学习,機器學習,主体,自动驾驶,算法,机器人,鈦思,MathWorks

│新东西市集│东西讲座│影音频道│出版中心│智动化专区│

元件次系统自动控制

最新动态

解析2025产业趋势：MIC所长 x CTIMES编辑

产业快讯

整合创新X智造未来TIMTOS 2025 聚焦AI新商机

汽配及移动科技产业，叁展热烈报名中!

CTIMES / 文章 /

强化学习：入门指南

【作者： Emmanouil Tzorakoleftherakis】2019年10月29日星期二

浏览人次：【12214】

强化学习（Reinforcement learning）潜力无穷，能解决许多开发应用上面临的艰难决策问题，包括产业自动化、自主驾驶、电玩竞技游戏以及机器人等，因此备受瞩目。

强化学习是机器学习（Machine learning）的一种，指的是电脑透过与一个动态（dynamic）环境不断重复地互动，来学习正确地执行一项任务。这种尝试错误（trial-and-error）的学习方法，使电脑在没有人类干预、没有被写入明确的执行任务程式下，就能够做出一系列的决策。最著名的强化学习案例就是AlphaGo，它是第一支打败人类围棋比赛世界冠军的电脑程式。

强化学习的运作主要是仰赖动态环境中的资料—也就是会随着外部条件变化而改变的资料，像是天气或交通流量。强化学习演算法的目标，即是于找出能够产生最佳结果的策略。强化学习之所以能达成目标，是借着软体当中被称为主体（agent）的部分在环境中进行探索、互动和学习的方法。
...
...

另一名雇主	限られたニュース	文章閱讀限制	出版品優惠
一般訪客	10/ごとに 30 日間	5//ごとに 30 日間	付费下载
VIP会员	无限制	20/ごとに 30 日間	付费下载

‧	CAD/CAM软体无缝加值协作
‧	创新更容易！2024年受瞩目的Arduino创新产品简介
‧	确保机器人的安全未来：资安的角色
‧	双臂机器人引风潮类人形应用尤欠东风
‧	量子运算：打造自动驾驶汽车新领域

comments powered by Disqus

相关新闻

»	AI与互动需求加持人型机器人估2027年市场产值将突破20亿美元
»	台达助台中港导入智慧园区解决方案携手打造低碳永续商港
»	高效能磁浮离心冰水机降低温室效应工研院助大厂空调节电60%
»	传产及半导体业共享净零转型成果产官学研联手打造净零未来
»	联合国气候会议COP29即将闭幕聚焦AI资料中心节能与净零建筑

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3 v3.20.1.HK8BU68GSZ2STACUKG
		地址:台北数位产业园区（digiBlock Taipei） 103台北市大同区承德路三段287-2号A栋204室电话 (02)2585-5526 #0 转接至总机 / E-Mail: [email protected]