2023國(guó)內(nèi)大模型發(fā)展情況盤點(diǎn)(二)--中美大模型情況發(fā)展比較
(本文作者王鵬為北京市社會(huì)科學(xué)院研究員,數(shù)據(jù)資產(chǎn)化研究院執(zhí)行院長(zhǎng))
截止2023年5月,中國(guó)已成功發(fā)布超過(guò)79個(gè)擁有10億以上參數(shù)的基礎(chǔ)大語(yǔ)言模型,相同等級(jí)模型下,美國(guó)發(fā)布數(shù)量達(dá)到100個(gè)。全球范圍內(nèi)累計(jì)推出的10億以上參數(shù)大語(yǔ)言模型總數(shù)為202個(gè),其中中美兩國(guó)所發(fā)布的模型總數(shù)占比近90%。相關(guān)數(shù)據(jù)體現(xiàn)國(guó)內(nèi)于大型語(yǔ)言模型開發(fā)領(lǐng)域已躋身領(lǐng)先行列,本文將通過(guò)中美大型語(yǔ)言模型發(fā)展比較深入了解發(fā)展現(xiàn)狀。
一、融資水平
根據(jù)PitchBook以及Crunchbase的數(shù)據(jù),2023年上半年全球AI領(lǐng)域共實(shí)現(xiàn)融資1387起,總額達(dá)255億美元。同時(shí),美國(guó)維持在AI投資上的增長(zhǎng)勢(shì)頭,2022年投資額達(dá)243.5億美元,年復(fù)合增長(zhǎng)率為422.5%。在硅谷地區(qū),2023年上半年共完成42起AI領(lǐng)域容詞,涉資約140億美元,占全球總額的55%,顯示了其在AI領(lǐng)域融資中的主導(dǎo)地位。與之相應(yīng)的,據(jù)國(guó)內(nèi)商業(yè)信息服務(wù)平臺(tái)企名片數(shù)據(jù)顯示,2023年上半年國(guó)內(nèi)人工智能領(lǐng)域共發(fā)生161起投融資事件,其中包括人工智能核心技術(shù)44起,人工智能基礎(chǔ)支撐43起,人工智能應(yīng)用場(chǎng)景40起,人工智能通用場(chǎng)景34起。相較去年投融資水平,同期下降153起,同比下降49%。此外,據(jù)欽媒體數(shù)據(jù),2023年上半年,國(guó)內(nèi)披露獲得投資的大模型公司僅20家,融資額普遍為千萬(wàn)至數(shù)億元之間。
二、基礎(chǔ)大模型發(fā)展水平
2023年11月21日,《財(cái)富》雜志首都揭曉“人工智能創(chuàng)新者50強(qiáng)”名單,其中絕大多數(shù)為美國(guó)企業(yè),包括Open AI、Meta、Google以及Microsoft等行業(yè)巨頭,并涉及一批入Midjourney、Adept以及ARC等新型企業(yè)。相比較下,百度為唯一一家上榜的中國(guó)公司,憑借在處理多項(xiàng)中文特定任務(wù)中優(yōu)于Open AI聊天機(jī)器人以及與ChatGPT在復(fù)雜度與功能上相媲美的“文心一言4.0”模型贏得認(rèn)可。從《財(cái)富》榜單上班企業(yè)數(shù)量上看,中美于人工智能創(chuàng)新力方面仍存顯著差距。恰如戴瓊海教授所言,中國(guó)具備最大的人工智能應(yīng)用市場(chǎng),但在基礎(chǔ)科技與人才培養(yǎng)方面仍然落后于世界領(lǐng)先水平。而中國(guó)大模型在基礎(chǔ)發(fā)展水平上落后于國(guó)際領(lǐng)先水平,其根本原因在于構(gòu)成大模型的四大要素,分別為數(shù)據(jù)、模型、算力和場(chǎng)景。
(一)數(shù)據(jù)總量缺乏以及數(shù)據(jù)質(zhì)量精細(xì)化程度較低
大模型訓(xùn)練數(shù)據(jù)源于公開文檔、資料以及數(shù)據(jù)。第一,從數(shù)據(jù)數(shù)量上看,公開英文數(shù)據(jù)占主導(dǎo)優(yōu)勢(shì),中文數(shù)據(jù)開放程度相對(duì)較低;第二,從數(shù)據(jù)質(zhì)量上看,由于國(guó)內(nèi)于數(shù)據(jù)產(chǎn)業(yè)投入以及精細(xì)化程度有限,導(dǎo)致了可用訓(xùn)練數(shù)據(jù)的進(jìn)一步減少。
(二)算力資源的缺乏
百川智能創(chuàng)始人王小川在2023騰訊ConTech大會(huì)上介紹調(diào)研信息,Open AI嘗試將1000萬(wàn)塊GPU相連以訓(xùn)練單個(gè)大規(guī)模模型。而英偉達(dá)年產(chǎn)量約為100萬(wàn)塊GPU,訓(xùn)練GPT4需要2.5萬(wàn)塊GPU,國(guó)內(nèi)對(duì)標(biāo)GPT3.5需要4000塊GPU用于訓(xùn)練。資源層面上,國(guó)內(nèi)大模型發(fā)展嚴(yán)重受限于算力劣勢(shì)。
(三)場(chǎng)景滲透率有限
2023年9月,鈦媒體國(guó)際智庫(kù)發(fā)布的《2023AI大模型應(yīng)用中美比較研究》報(bào)告綜合了大模型行業(yè)滲透度、行業(yè)接受層度以及行業(yè)應(yīng)用成熟度等維度,對(duì)部分AI應(yīng)用主流行業(yè)進(jìn)行現(xiàn)狀分析。在辦公、金融以及醫(yī)療領(lǐng)域均一定程度上落后于美國(guó)。但在文娛、教育、交通以及能源領(lǐng)域有望實(shí)現(xiàn)彎道超車。
雖然國(guó)內(nèi)大模型發(fā)展受限于數(shù)據(jù)、算力以及場(chǎng)景滲透率的落后,但在具體技術(shù)層面仍有可喜之處,目前國(guó)內(nèi)于自然語(yǔ)言處理領(lǐng)域?qū)W術(shù)成果斐然。2023年8月,集微咨詢(JW Insights)推出的《ChatGPT掀起AIGC新一輪熱潮的背后:從學(xué)術(shù)角度分析自然語(yǔ)言處理技術(shù)》報(bào)告對(duì)自然語(yǔ)言處理領(lǐng)域的學(xué)術(shù)論文進(jìn)行全方位解析。從論文的整體區(qū)域分布看,中美實(shí)現(xiàn)學(xué)術(shù)領(lǐng)域斷層領(lǐng)先,相關(guān)論文數(shù)量超過(guò)1.8萬(wàn)篇。從發(fā)表論文機(jī)構(gòu)看,中國(guó)科學(xué)院以1971篇論文的數(shù)量排名全球第一。此外,中國(guó)自然科學(xué)基金會(huì)資助的論文量最高,為8335篇。但同時(shí)需要指出的是,在具體論文影響力、撰寫質(zhì)量、先進(jìn)性綜合分析中,前50名入選論文中國(guó)內(nèi)論文僅占6篇。
三、應(yīng)用層發(fā)展水平
總體而言,我國(guó)大模型發(fā)展于場(chǎng)景應(yīng)用水平仍然處于跟隨狀態(tài)。辦公領(lǐng)域,微軟作為智能辦公引領(lǐng)者,于2023年3月16日正式發(fā)布Microsoft 365 Copilot,并集成于包括Word、Excel以及Powerpoint等應(yīng)用程序中。用戶僅需通過(guò)向其發(fā)號(hào)指令,便可自動(dòng)生成文字、表格、演示文稿等內(nèi)容。國(guó)內(nèi)企業(yè)中金山辦公同樣將公司產(chǎn)品逐步添加AI功能,例如智能美化、智能校對(duì)等,此外介入了多個(gè)大模型供應(yīng)商以滿足用戶AI創(chuàng)作需求;金融領(lǐng)域,根據(jù)咨詢公司 Evident 的最新數(shù)據(jù),目前美國(guó)銀行的招聘中,約 40%的空缺職位是與人工智能相關(guān)的職位,例如數(shù)據(jù)工程師和量化分析師,以及合規(guī)、道德治理等職位。美國(guó)于開發(fā)應(yīng)用方面起步較早并且掌握核心技術(shù)。國(guó)內(nèi)AI+金融同樣進(jìn)入應(yīng)用階段,同時(shí)我國(guó)于該領(lǐng)域開發(fā)投資積極性較高,疊加近期數(shù)據(jù)政策支持,有望于金融領(lǐng)域?qū)崿F(xiàn)應(yīng)用發(fā)展水平的追趕。相較基礎(chǔ)大模型發(fā)展,國(guó)內(nèi)大模型于應(yīng)用層發(fā)展具備一定優(yōu)勢(shì)?!袄硐肷下徊?,落地上快三步”是王小川針對(duì)當(dāng)前中國(guó)大模型機(jī)會(huì)的詮釋。我國(guó)在應(yīng)用層方面具備市場(chǎng)和用戶基礎(chǔ)、多樣化應(yīng)用場(chǎng)景以及政府支持和推動(dòng)的優(yōu)勢(shì)。
(一)龐大的市場(chǎng)和用戶基礎(chǔ)
中國(guó)擁有巨大的人口基數(shù),這為大模型的應(yīng)用提供了豐富的數(shù)據(jù)。例如,上海人工智能實(shí)驗(yàn)室開發(fā)的書生浦語(yǔ)大模型,涵蓋了數(shù)十億參數(shù),能夠有效結(jié)合算法、數(shù)據(jù)和算力。這種大模型是在中國(guó)豐富的數(shù)據(jù)環(huán)境中訓(xùn)練和優(yōu)化的,反映了本土環(huán)境和語(yǔ)境的特點(diǎn)。
(二)多樣化的應(yīng)用場(chǎng)景
中國(guó)的經(jīng)濟(jì)和社會(huì)多樣性為大模型提供了廣泛的應(yīng)用場(chǎng)景。例如,在智慧城市領(lǐng)域,基于多模態(tài)大模型和跨模態(tài)通用人工智能平臺(tái),研發(fā)了建筑工程全閉環(huán)智能應(yīng)用系統(tǒng),旨在顯著提升建筑行業(yè)的智能化水平。此外,智慧醫(yī)療領(lǐng)域也見證了大模型的成功應(yīng)用,例如云知聲與北京友誼醫(yī)院聯(lián)合開發(fā)的門診病歷生成系統(tǒng),顯著提升了醫(yī)生的工作效率。
(三)政府支持和推動(dòng)
中國(guó)政府一直在積極推動(dòng)人工智能產(chǎn)業(yè)的發(fā)展,為大模型的應(yīng)用提供了有力的政策支持。例如,北京市科委和中關(guān)村管委會(huì)積極推動(dòng)大模型技術(shù)產(chǎn)業(yè)的發(fā)展,征集人工智能行業(yè)大模型應(yīng)用案例與行業(yè)應(yīng)用場(chǎng)景需求,加快推動(dòng)相關(guān)技術(shù)及產(chǎn)品的落地和應(yīng)用。中國(guó)政府發(fā)布了《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見》,旨在加速人工智能的高水平應(yīng)用,推動(dòng)經(jīng)濟(jì)的高質(zhì)量發(fā)展。盡管中國(guó)在大語(yǔ)言模型發(fā)展上于某些方面仍然面臨挑戰(zhàn),但其在大模型技術(shù)的應(yīng)用和市場(chǎng)發(fā)展方面表現(xiàn)出了顯著的活力。中國(guó)政府在推動(dòng)人工智能技術(shù),特別是大型語(yǔ)言模型的發(fā)展上,顯示出明確的方向和決心。結(jié)合龐大的市場(chǎng)和用戶基礎(chǔ)、多樣化的應(yīng)用場(chǎng)景,以及政府的積極支持,中國(guó)在大模型技術(shù)的發(fā)展和應(yīng)用上具有獨(dú)特的優(yōu)勢(shì)。這不僅促進(jìn)了技術(shù)創(chuàng)新,還為各行各業(yè)的數(shù)字化轉(zhuǎn)型提供了強(qiáng)有力的支撐。未來(lái),隨著技術(shù)的進(jìn)一步成熟和應(yīng)用的深入,預(yù)計(jì)中國(guó)將在人工智能領(lǐng)域?qū)崿F(xiàn)更多突破,為經(jīng)濟(jì)社會(huì)的高質(zhì)量發(fā)展注入新動(dòng)力。
本文僅代表作者觀點(diǎn)。
- 電熱水器耗電么(你需要知道的真相)。08-15
- 熱水器上顯示e5(該如何處理?)08-28
- 1制冰機(jī)常見故障代碼(如何解決)?
- 2Vaillant壁掛爐維修服務(wù)部(Vaillant壁掛爐維修,一站式服務(wù))
- 3冰箱制冷劑加多了(會(huì)對(duì)冰箱造成什么影響?)
- 4格力32變頻H4故障(格力32變頻H4故障分析)
- 54k電視四級(jí)能效能買嗎(對(duì)環(huán)保有貢獻(xiàn)還能省電費(fèi)嗎?)
- 6海爾電熱水器安裝日期(如何查詢和確認(rèn))?
- 7勝獅保險(xiǎn)柜全國(guó)服務(wù)熱線(勝獅保險(xiǎn)柜服務(wù)熱線:為您保駕護(hù)航!)
- 8結(jié)冰了怎么快速除冰(實(shí)用方法大全)
- 9液晶電視高壓包怎么強(qiáng)制點(diǎn)亮(液晶電視高壓包強(qiáng)制點(diǎn)亮的方法)
- 10脈秀指紋鎖沒電了怎么辦(脈秀指紋鎖沒電解決辦法)
-
世界男排聯(lián)賽再爆大冷!中國(guó)男排3-1歐洲勁旅,首次連勝排名飆升
2025-06-14
-
“蝴蝶”在廣東雷州市西部沿海再次登陸,廣州多區(qū)發(fā)布暴雨預(yù)警
2025-06-14
-
紅色預(yù)警!確認(rèn)影響浙江,周末天氣太刺激
2025-06-13
-
vivo首款FE后綴手機(jī):X200 FE被曝7月發(fā)布
2025-06-13


