欧洲精品久久久av无码电影,日日噜噜夜夜爽爽,精品无码国产自产拍在线观看蜜,人妻少妇被粗大爽9797pw,羞国产在线拍揄自揄视频,国产白嫩漂亮美女在线观看,天码欧美日本一道免费,av大片在线无码免费

      歡迎來到同城快修-附近家電維修、家電清洗、家電安裝服務平臺

      24小時家電維修熱線:

      400—1558638

      當前位置:主頁 > 空調 > 服務項目 > 空調分類 >

      9.11和9.9哪個大?簡單數學題8家AI大模型平臺都翻了車

      發布日期:2024-07-17 21:51:42 瀏覽:
      9.11和9.9哪個大?簡單數學題8家AI大模型平臺都翻了車

      紅星資本局7月17日消息,今日,AI大模型在數學上的翻車話題引發不小關注。

      一道“9.11和9.9哪個大”的簡單數學題,竟困住了海內外一眾AI大模型平臺。

      數學偏科

      8個大模型全答錯

      9.11和9.9哪個更大?據第一財經報道,就這一問題,12個大模型中阿里通義千問、百度文心一言、Minimax和騰訊元寶答對,但ChatGPT4o、字節豆包、月之暗面kimi、智譜清言、零一萬物萬知、階躍星辰躍問、百川智能百小應、商湯商量都答錯了,錯法各有不同。

      目前全球公認第一梯隊的大模型ChatGPT,在被問到“9.11和9.9哪個大”時回復稱,小數點后面的數字“11大于9”,因此9.11大。追問ChatGPT有沒有其他比較方法后,它將小數轉化成分數比較,得出 “11/100比90/100小”,這一步是對的,但它接著下結論稱“因此9.11比9.9大”。

      再看國內的大模型,例如詢問月之暗面旗下kimi,它在比較小數部分時認為,9.11的第一位小數是1,而9.9的第一位小數是0,錯誤地給出了小數,得出結論9.11更大。當質疑并提出常識后,kimi轉而開始表示自己回答有誤,并給出了正確的比較方法。

      詢問字節豆包,它不僅給出了答案,還舉了生活中的例子方便理解,單看似有理有據實則胡說八道。豆包舉例認為,假設有兩筆錢,“9.11元比9.9元多0.21元”,并且測量長度時“9.11米要比9.9米長”。

      商湯商量大模型首先給出了錯誤答案,當追問具體是如何比較的后,它在推演過程中成功得出小數0.11小于0.9,但話鋒一轉稱“所以9.11大于9.9”。當指出了這個前后邏輯問題,商量隨后承認“解釋有誤”。

      值得注意的是,就在上月,AI大模型也因為數學翻車話題火上了熱搜。

      6月19日,上海人工智能實驗室發布首個AI高考全卷評測結果,阿里通義千問大模型Qwen272B排名第一,在語數外三科420分的滿分中獲得303分,OpenAI的GPT4o和上海人工智能實驗室的書生·浦語2.0文曲星(InternLM220BWQX)排名二三位。但引發關注的是,從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格。

      業內人士:

      一段時間內不會得到明顯改善

      此前,哈爾濱工業大學和華為的研究團隊發表的綜述論文認為,模型產生幻覺的三大來源:數據源、訓練過程和推理。大模型可能會過度依賴訓練數據中的一些模式,如位置接近性、共現統計數據和相關文檔計數,從而導致幻覺。此外,大模型還可能會出現長尾知識回憶不足、難以應對復雜推理的情況。

      針對大模型答數學題普遍“吃癟”的問題,國內某頭部大模型負責人就曾表示,大模型的指令遵循或者說推理能力通常是把一個指令背后的意思拆解出來,但數學題既包含規則性,又包含對各種思維的考察,解題邏輯和正常用大模型時的推理邏輯不一定完全一樣。

      同時該負責人還提到,從更廣泛的大模型應用角度來看,AI能不能精準遵循指令是近一段時間內比較重要的事情,真正的商業價值也比較大可能來自于此,而解數學題對目前的AI來說還是一件比較“炫技”的事情。

      另有業內人士向南方都市報表示,目前來看大模型的數理能力相對較差的情況在中外都是一樣的,“打個比方可以這樣講,大模型就是偏科,文科強理科弱,這個情況在一段時間內也不會得到明顯的改善”。

      編輯 楊程 綜合自第一財經、南方都市報、科創板日報等

      (下載紅星新聞,報料有獎!)

      主站蜘蛛池模板: 国产亚洲日韩欧美一区二区三区| 色噜噜亚洲男人的天堂www| 激情五月综合色婷婷一区二区| 2022国产成人精品视频人| 日韩精品无码免费专区午夜不卡| 国产成人精品一区二区三区在线 | 91精选国产| 日本丰满护士bbw| 最新无码人妻在线不卡| 日本人妻一区二区三区| www狠狠| 真人做人试看60分钟免费| 亚洲精品1卡2卡三卡4卡乱码| 国产a自拍| 成人3D动漫一区二区三区| 东北女人毛多水多牲交视频| 亚洲最新版av无码中文字幕| 国产精品久久国产愉拍| 国产综合视频一区二区三区| 麻豆果冻传媒2021精品传媒一区 | 日韩欧美小视频| 美女脱裤子打屁股| 无码国产69精品久久久久同性| 九九久久99综合一区二区| 91在线视频免费| 国产精品你懂得| 国产精久久一区二区三区| 四虎国产精品亚洲一区久久特色| 亚洲裸体视频| 性无码专区无码| 人人澡人人透人人爽| 小受叫床高潮娇喘嗯啊mp3| 日本一区二区视频在线观看| 一级片免费的| 色一情一区二区三区四区| av无码一区二区大桥未久| 97福利视频| 国产网红在线| 国产女人喷潮视频免费| 一个人看免费视频www| 久久久久亚洲精品无码网址蜜桃|