CTIMES- 強化學習：入門指南 :強化學習,機器學習,主體,自動駕駛,演算法,機器人,鈦思,MathWorks

│新東西市集│東西講座│影音頻道│出版中心│

元件次系統自動控制

最新動態

【東西講座】2/14 川普2.0時代的低碳轉型策略！

產業快訊

4/16-18Touch系列展:智慧顯示x製造x電子設備

4/16-18Touch系列:智慧顯示x製造x電子設備

立即預登參觀! 360o MOBILITY 移動產業專業展

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

CTIMES / 文章 /

強化學習：入門指南

【作者： Emmanouil Tzorakoleftherakis】 2019年10月29日星期二

瀏覽人次：【12434】

強化學習（Reinforcement learning）潛力無窮，能解決許多開發應用上面臨的艱難決策問題，包括產業自動化、自主駕駛、電玩競技遊戲以及機器人等，因此備受矚目。

強化學習是機器學習（Machine learning）的一種，指的是電腦透過與一個動態（dynamic）環境不斷重複地互動，來學習正確地執行一項任務。這種嘗試錯誤（trial-and-error）的學習方法，使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下，就能夠做出一系列的決策。最著名的強化學習案例就是AlphaGo，它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。

強化學習的運作主要是仰賴動態環境中的資料—也就是會隨著外部條件變化而改變的資料，像是天氣或交通流量。強化學習演算法的目標，即是於找出能夠產生最佳結果的策略。強化學習之所以能達成目標，是藉著軟體當中被稱為主體（agent）的部分在環境中進行探索、互動和學習的方法。
...
...

使用者別	新聞閱讀限制	文章閱讀限制	出版品優惠
一般使用者	10則/每30天	0則/每30天	付費下載
VIP會員	無限制	25則/每30天	付費下載

‧	以馬達控制器ROS1驅動程式實現機器人作業系統
‧	CAD/CAM軟體無縫加值協作
‧	創新更容易！2024年受矚目的Arduino創新產品簡介
‧	確保機器人的安全未來：資安的角色
‧	雙臂機器人引風潮類人形應用猶欠東風

相關討論

相關新聞

»	觀測空氣污染品質源頭找出災防應對措施
»	鳳梨纖維零廢棄造綠金雲林首座鳳梨葉自動化取纖計畫啟動
»	受惠物流、高階自駕需求光達市場2029年產值估53.52億美元
»	台達代子公司Delta International Holding Limited B.V.公告發行總額美金525,000,000元
»	UPS收購醫療保健冷鏈物流供應商強化端對端溫控服務

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2025 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.1.HK9211WZC0ASTACUKB
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: [email protected]