国产精品一区二区三区99,国产欧美激情视频,韩国电影味道,午夜精品久久久久久久久久久久久蜜桃,国产成年综合,亚洲午夜精品久久久,欧美一区亚洲一区

      <code id='7909DD0F2C'></code><style id='7909DD0F2C'></style>
    • <acronym id='7909DD0F2C'></acronym>
      <center id='7909DD0F2C'><center id='7909DD0F2C'><tfoot id='7909DD0F2C'></tfoot></center><abbr id='7909DD0F2C'><dir id='7909DD0F2C'><tfoot id='7909DD0F2C'></tfoot><noframes id='7909DD0F2C'>

    • <optgroup id='7909DD0F2C'><strike id='7909DD0F2C'><sup id='7909DD0F2C'></sup></strike><code id='7909DD0F2C'></code></optgroup>
        1. <b id='7909DD0F2C'><label id='7909DD0F2C'><select id='7909DD0F2C'><dt id='7909DD0F2C'><span id='7909DD0F2C'></span></dt></select></label></b><u id='7909DD0F2C'></u>
          <i id='7909DD0F2C'><strike id='7909DD0F2C'><tt id='7909DD0F2C'><pre id='7909DD0F2C'></pre></tt></strike></i>

          新聞中心

          RL「誤人」?LeCun 在技術路線上又有何戰略搖擺?

          機器之心PRO · 會員通訊 Week 47

          RL「誤人」?LeCun 在技術路線上又有何戰略搖擺?

          ---- 本周為您解讀 ③個值得細品的誤人?AI & Robotics?業內要事 ----

          1.?RL「誤人」?LeCun 在技術路線上又有何戰略搖擺?

          Karpathy 為何「悔做 RL」?LeCun 是如何評價 RL 的?LeCun 推崇的關鍵技術有過幾輪變化?Energy-Based SSL 和世界模型有什么關系?什么是 Objective-Driven AI?...

          2.大半年過去,主流視頻生成模型們超越Sora 了嗎?術路

          Sora 發布大半年之后,主流的線上文生視頻模型表現如何?類 Sora 模型們追上了嗎?T2V 模型目前面臨的共同挑戰有哪些?T2V 領域有哪些關鍵技術進展?AI 視頻生成應用距離「好用」還有多遠?...

          3. 2025 IT 優先事項報告:在產線中集成 AI 是保持競爭力的關鍵

          為何在產線集成 AI 是企業 2025 年最優先事項?企業 IT 領導還關注哪些高優先任務?AI 的投資回報率上漲了嗎?為什么 AI+FinOps 火了?企業的 AI 預算漲了嗎?...

          ...本期完整版通訊含 3 項專題解讀 + 30 項本周 AI & Robotics 賽道要事速遞,其中技術方面 10?項,何戰國內方面 10 項,略搖國外方面 10 項。誤人

          本期通訊總計 24189 字,術路可免費試讀至 9%?

          ?消耗?99?微信豆即可兌換完整本期解讀(約合人民幣?9.9?元)?

          要事解讀① RL「誤人」?線上LeCun 在技術路線上又有何戰略搖擺?

          引言:Andrey Karpathy 近日有關「悔做 RL」的言論引起許多關注,而他在后悔的何戰同時對 Yann LeCun 從一開始就不看好強化學習的態度始終正確的說法引發了 AI 社區對另一件事的興趣,即「LeCun 的略搖 AI 戰略是否出現過搖擺?」

          LeCun 推崇技術的更替了解一下?

          1、OpenAI 創始成員、誤人研究科學家、術路原特斯拉前 AI 高級總監 Andrej Karpathy 近期在社交平臺上有關「悔做 RL」的線上評論引起了極大關注,他將自己在 OpenAI 選擇強化學習而沒有選擇自回歸語言模型的何戰決策描述為「有史以來最大、最令人困惑的略搖研究生涯錯誤」。[1]

          ① Karpathy 所描述的「彎路」在于他早期對語言模型的潛力有所認識,但后來卻將研究重心轉向了強化學習,沒有持續在語言模型這一方向上深耕。

          ② 在 2015 年前后,當時普遍看法認為 RNN 難以訓練,但 Karpathy 在 2015 年的文章《RNN 的不合理有效性》中探討了循環神經網絡(RNN)的潛力,并通過實驗展示了 RNN 在文本生成、代碼生成等方面的能力。

          2、Karpathy 提到 Yann LeCun 當時對強化學習持保留態度,并用「蛋糕」比喻來說明強化學習在整個 AI 領域中的次要地位,而 Karpathy 認為 LeCun 在概念上一直是正確的。[1]

          3、相比于 Karpathy 的「悔恨」,知名 AI 學者、圖靈獎得主 Yann LeCun 對其所推崇的技術路線十分堅定。在他歷年的學術大會和訪談等公開場合分享的觀點中,LeCun 始終強調實現人類水平智能不可能是監督學習或純強化學習,他所推崇的技術也在這條主線上逐步更迭。

          ① 2016 年,LeCun 強調無監督學習「根據任何可用信息預測過去、現在或未來的任何部分感知」的能力可以填補機器學習不具備預測能力的空白,并將其比喻為一個蛋糕的主體。[2]

          ② 2019 年,LeCun 用「自監督學習」取代了「無監督學習」,并預測未來的神經網絡是擁有大量數據和超大網絡的自監督學習。[3]

          ③ 2019 年末,LeCun 在 SSL 是未來的基礎上開始推崇能量模型,即 Energy-Based SSL,而后強調能量模型和世界模型對下一代 AI 的重要性。[4]

          ④ 2023 年,LeCun 在實現人類水平的 AI 的必要條件清單中增加了 Objective-DrivenAI 架構,與世界模型、能量模型和其他組件共同構成了自主智能(autonomous intelligence)的大框架。[5]

          圖:LeCun 歷年推崇的關鍵技術。[2] -[5]圖:LeCun 歷年推崇的關鍵技術。[2] -[5]

          讓 LeCun 放棄無監督的 Energy-Based SSL 和世界模型有什么關系?

          Yann LeCun 在 2016 年的 NIPS(現在的 NeuRIPS)大會上首次提出了「蛋糕比喻」,他將智能(Intelligence)比作一個蛋糕,其中大部分蛋糕(主體)是無監督學習,蛋糕上的糖霜(小部分)是監督學習,蛋糕上的櫻桃(極小部分)是強化學習(RL)。[2] 這個比喻在 AI 社區中廣為流傳,并確立了 LeCun 作為無監督學習的堅定支持者。

          1、LeCun 一直在強調,人類會利用預測和推理等能力從可用信息中推斷未來,而非通過篩選大量標記數據來理解世界。無監督學習或預測學習可以彌補當前 AI 在推理不同對象之間的關系或預測人類動作等方面的空白。

          ① 在 2019 年 5 月的 ISSCC 大會中,LeCun 開始重新表述他的觀點,給予了自監督學習(SSL)更高的評價,認為這種特殊的無監督學習方式是構建人工智能未來的重要因素,并在后續逐步提出了圍繞 SSL 的一系列新概念。[3]

          2、相較于對無監督學習/自監督學習的重視,LeCun 在歷年的演講和訪談等場合均表達了對(純)強化學習方法的不看好。雖然該論調持續吸引了許多來自 RL 社區的反擊,但他的態度始終沒有改變。[7]

          ① LeCun 認為強化學習需要過多(Insane Amounts)的實驗來學習,存在樣本利用率低、過度依賴大量訓練數據等局限,且僅完成特定目標后給予獎勵,缺少對過程的反饋。

          ② LeCun 沒有否認 RL 的價值,他列舉了 RL 當時在各類游戲中取得的成就。然而,他認為在簡單的虛擬世界中有效的 RL 無法實時且并行地在真實世界中運行,這與人類學習的方式存在顯著差異,不適用大多數真實世界場景,因此建議將 RL 視為最后的選擇,即蛋糕上的櫻桃。

          3、2019 年 5 月在 ISSCC 的演講中,LeCun 將下階段 AI 所需的核心技術從無監督學習改為了 SSL,后在在該年 9 月,他 UCLA 的演講中重點介紹了 Energy-Based SSL,即能量模型(EBM)。[3] [4]

          ① EMB 在機器學習領域并不是新概念,但隨著相關研究的深入,能量模型的可行性和應用前景在不斷提升。EBM 提供了一種新的視角,允許人們放棄對概率模型的依賴,轉而關注能量函數本身,從而簡化模型的構建和訓練過程。

          上一篇:塞那Z50Spro骨傳導耳機超值優惠 原價189元到手139元 下一篇:奇瑞瑞虎3避光墊改裝汽車專用防曬隔熱遮光墊裝飾中控儀表臺配件

          Copyright © 2026 優游風采 版權所有   網站地圖