Meta發(fā)布新AI模型：利用AI來評估AI的能力，無需人類參與

發(fā)布日期：2024-10-19 14:43:05 瀏覽：

IT之家 10 月 19 日消息，據(jù)路透社報道，Meta 當(dāng)?shù)貢r間周五宣布，其研究團隊推出了一系列新的 AI 模型，其中包括一個名為“自我訓(xùn)練評估器”的工具。該工具有望推動 AI 開發(fā)過程中減少對人類干預(yù)的依賴。這個工具早前在 8 月的論文中首次亮相，其使用與 OpenAI 新發(fā)布的 o1 模型類似的“思維鏈”技術(shù)，讓 AI 對模型的輸出做出可靠判斷。

這種技術(shù)將復(fù)雜問題分解為多個邏輯步驟，從而提高了在科學(xué)、編程和數(shù)學(xué)等高難度領(lǐng)域中的答案準(zhǔn)確性。Meta 的研究人員使用完全由 AI 生成的數(shù)據(jù)來訓(xùn)練這個評估器，從而在這一過程中完全摒棄了人類的參與。

使用 AI 來評估 AI 的能力展示了實現(xiàn)自主 AI 智能體的可能性，這類代理能夠從自身錯誤中學(xué)習(xí)。兩位負(fù)責(zé)該項目的 Meta 研究人員表示，許多 AI 專家設(shè)想未來可以開發(fā)出“智能化程度極高”的數(shù)字助手，可以自主處理大量任務(wù)，而無需人類介入。

自我改進的模型有望減少目前使用的“基于人類反饋的強化學(xué)習(xí)”（RLHF）過程的需求。這一過程往往昂貴且低效，因為它依賴于擁有專業(yè)知識的人類來標(biāo)注數(shù)據(jù)和驗證復(fù)雜問題的答案是否正確。

“我們希望，隨著 AI 的發(fā)展，它能超越人類，逐漸具備自行檢查工作的能力，并在準(zhǔn)確性上超過普通人類水平，”項目研究員之一 Jason Weston 說。“自我訓(xùn)練和評估的能力是實現(xiàn)超人級 AI 的關(guān)鍵因素之一。”他補充道。

IT之家從報道中獲悉，包括谷歌和 Anthropic 在內(nèi)的其他科技公司也在研究 RLAIF（基于 AI 反饋的強化學(xué)習(xí)）這一概念，但與 Meta 不同，這些公司通常不會公開發(fā)布其研究模型。

Meta 此次發(fā)布的其他 AI 工具還包括對其圖像識別模型“Segment Anything”的更新，一個加速大語言模型響應(yīng)時間的工具，以及一些有助于發(fā)現(xiàn)新型無機材料的數(shù)據(jù)集。

上一篇：尊威熱水器24小時人工服務(wù)熱線

下一篇：三洋制冰機維修電話是多少

Meta發(fā)布新AI模型：利用AI來評估AI的能力，無需人類參與

相關(guān)推薦

熱門排行

最新發(fā)布

“蝴蝶”二次登陸，“土臺風(fēng)”路徑多變不容小覷

34小時夜空守望，天文攝影師抓拍4000光年外的恒星搖籃

夏天這8種東西千萬別放車?yán)?/h2>
2025-06-12

海南發(fā)布海浪橙色預(yù)警風(fēng)暴潮藍(lán)色預(yù)警

小米汽車遙控鑰匙上新：SU7輪廓造型，199元起

隨便看看

24小時家電維修熱線： 400—1558638

Meta發(fā)布新AI模型：利用AI來評估AI的能力，無需人類參與

相關(guān)推薦

熱門排行

最新發(fā)布

“蝴蝶”二次登陸，“土臺風(fēng)”路徑多變不容小覷

34小時夜空守望，天文攝影師抓拍4000光年外的恒星搖籃

夏天這8種東西千萬別放車?yán)?/h2> 2025-06-12

海南發(fā)布海浪橙色預(yù)警 風(fēng)暴潮藍(lán)色預(yù)警

小米汽車遙控鑰匙上新：SU7輪廓造型，199元起

隨便看看

24小時家電維修熱線： 400—1558638

夏天這8種東西千萬別放車?yán)?/h2>
2025-06-12

海南發(fā)布海浪橙色預(yù)警風(fēng)暴潮藍(lán)色預(yù)警