Re: [討論] 為何機器人AI不透過強化式學習訓練？

作者cateran (雲川閒步)

看板Tech_Job

標題Re: [討論] 為何機器人AI不透過強化式學習訓練？

時間Thu Oct 17 09:29:34 2024

強化學習只有在遊戲取得成功是有原因的因為遊戲世界本身就是一個純虛擬的環境操控的自由度也不高比如說圍棋就是19*19取一格落子 (19*19看起來很高可是特斯拉的機器人光手掌就有二十幾個dof) 所以下圍棋可以一秒鐘就下幾千萬盤棋但你如果要做一隻機械手臂拿實體棋子取棋然後落子在棋盤上光是第一手天元這個動作可能就要訓練幾個小時實體世界的維度超乎想像得高然後機械零件是有壽命的除非AI能真正發展出像人腦一樣的推理能力不然以現有RL那樣讓機器人在一個環境瞎雞巴亂弄就算有錢如馬斯克也是會被實體世界的複雜度擊垮 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 96.230.198.240 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1729128577.A.D09.html

推 whatzup1124 : 這個第一手天元太熟悉了 10/17 09:42

推 aria0520 : 其實就算不第一手天元應該也能贏 10/17 10:01

推 xu3vul3vmp : Omniverse 10/17 11:46

推 steven88669 : RL目前看到比較多在封閉的倉儲agv 應用 10/17 12:55

推 Chricey : b群作用 10/17 12:55

推 dildoe : 想這麼多不考慮亞洲大外包嗎？ 10/17 13:21

推 DrizztMon : 其實loss寫得出來的問題都沒有必要用RL阿 10/17 13:37