“據(jù)不完全統(tǒng)計(jì),中國(guó)10億以上參數(shù)規(guī)模的大模型已經(jīng)發(fā)布了79個(gè),從地區(qū)來看北京和廣東最多,自然語言處理是大模型研發(fā)最活躍的領(lǐng)域。”在中關(guān)村論壇上,中國(guó)科學(xué)技術(shù)信息研究所所長(zhǎng),科技部新一代人工智能發(fā)展研究中心主任趙志耕披露了中國(guó)人工智能大模型的情況。
今天人工智能領(lǐng)域的競(jìng)爭(zhēng)比以往任何時(shí)候都更加激烈。有人把近日扎堆的大模型創(chuàng)業(yè)稱作“百模大戰(zhàn)”,從百度文心一言、阿里通義千問到商湯、昆侖萬維等推出大模型,到王小川的百川智能、王慧文的光年之外、李志飛的序列猴子等,“中國(guó)版ChatGPT”在近幾個(gè)月里幾乎迎來扎堆發(fā)布的熱潮。而在大模型的應(yīng)用層,已有包括在線辦公、金融科技、在線教育等多個(gè)細(xì)分垂直領(lǐng)域公布了大模型領(lǐng)域進(jìn)展。
(資料圖片僅供參考)
創(chuàng)新工場(chǎng)董事長(zhǎng)、首席執(zhí)行官李開復(fù)在論壇演講中表示,AI大模型是一個(gè)絕對(duì)不能錯(cuò)過的歷史機(jī)遇, AI大模型已經(jīng)慢慢走向?qū)嶓w經(jīng)濟(jì),它會(huì)改寫每一個(gè)應(yīng)用,重構(gòu)人類的工作,很多重復(fù)性的勞動(dòng)會(huì)被取代。
論壇過后,有參會(huì)嘉賓被記者問到如何看待如火如荼的大模型創(chuàng)業(yè)潮時(shí),評(píng)價(jià)“這說明中國(guó)企業(yè)非常熱情”,又補(bǔ)充一句:“像在煉丹。”
北京、廣東大模型數(shù)量最多
趙志耕表示,從全球大模型發(fā)展態(tài)勢(shì)來看,美國(guó)谷歌、OpenAI等機(jī)構(gòu)不斷引領(lǐng)大模型前沿的技術(shù)方向,同時(shí)歐洲、俄羅斯、以色列等越來越多的研發(fā)團(tuán)隊(duì)也在加入到大模型的研發(fā)中。
從全球已經(jīng)發(fā)布的大模型分布來看,中國(guó)和美國(guó)超過全球總數(shù)的80%,美國(guó)在大模型數(shù)量居全球之首,中國(guó)從2020年進(jìn)入大模型快速發(fā)展期,目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。
根據(jù)中關(guān)村論壇上發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》,中國(guó)人工智能大模型的地域分布明顯特點(diǎn),14個(gè)省市地區(qū)都有開展大模型研究,其中北京和廣東最多,北京有38個(gè)大模型,廣東有20個(gè)大模型。
在模型領(lǐng)域分布上,自然語言處理仍是目前大模型研發(fā)最活躍的重點(diǎn)領(lǐng)域,其次是多模態(tài)領(lǐng)域。計(jì)算機(jī)視覺和智能語音等領(lǐng)域仍有待進(jìn)一步突破,目前模型較少。
如果大模型的生成式AI誕生過程比作“煉丹”,那么作為GPU的算力就好比煉丹爐下燃燒的烈火。報(bào)告通過調(diào)研全國(guó)范圍內(nèi)的算力基礎(chǔ)設(shè)施分布情況發(fā)現(xiàn),北京、廣東、浙江、上海等地的大模型數(shù)量最多,同時(shí)這4個(gè)地方也是近三年人工智能服務(wù)器采購(gòu)數(shù)量最高的地區(qū),表現(xiàn)出非常明顯的強(qiáng)相關(guān)性,為大模型研發(fā)應(yīng)用提供了重要支撐。
在發(fā)表相關(guān)論文方面,中國(guó)大模型通過學(xué)術(shù)論文發(fā)表方式已經(jīng)形成一定學(xué)術(shù)影響力。其中北京、廣東、上海三地不論是論文發(fā)表量還是引用量都居國(guó)內(nèi)最高,體現(xiàn)出明顯的人才儲(chǔ)備優(yōu)勢(shì),江蘇、廣東、上海也是大模型人才相對(duì)較多的地區(qū)。
開源創(chuàng)新生態(tài)方面,目前已經(jīng)有超過半數(shù)大模型實(shí)現(xiàn)開源。北京、廣東、上海三地開源數(shù)量和開源影響力均居國(guó)內(nèi)前三,這背后主要是高校和機(jī)構(gòu)在推動(dòng),如清華大學(xué)的ChatGLM-6B、復(fù)旦大學(xué)的MOSS以及百度的文心系列大模型開源等。
大模型人才稀缺、原始創(chuàng)新不足
人才為大模型研發(fā)提供關(guān)鍵智力要素支撐。但從數(shù)量上看,目前各地大模型人才總量仍然稀缺,數(shù)量均不充足。
李開復(fù)在談到當(dāng)前AI大模型面臨的挑戰(zhàn)時(shí),也提到包括需要質(zhì)量更高的數(shù)據(jù)、需要更多的AI工程師與AI科學(xué)家等。
此前拉勾招聘發(fā)布的《2023第一季度AIGC人才供需報(bào)告》顯示,2023年第一季度,AIGC人才招聘需求連續(xù)三月攀升,今年3月AIGC人才崗位需求量環(huán)比增加42%。在招聘平臺(tái)上,不少企業(yè)甚至開出百萬年薪以搶奪AI技術(shù)人才。
而中國(guó)的大模型自身也需要不斷打磨。在推動(dòng)開源開放的同時(shí),多位業(yè)內(nèi)人士都提到中國(guó)還需要加強(qiáng)基礎(chǔ)研究,“自主創(chuàng)新是發(fā)展大模型的必經(jīng)之路。”
李開復(fù)提到,要支持開源,但中國(guó)大模型公司不能過度依賴開源模型。“需要盡快建立自己的IP(知識(shí)產(chǎn)權(quán))和技術(shù)優(yōu)勢(shì),形成護(hù)城河。”因?yàn)殚_源模型無法達(dá)到國(guó)外大廠自研模型的性能,它的能力會(huì)成為“天花板”;同時(shí)海外大廠的開源技術(shù)還有關(guān)閉風(fēng)險(xiǎn)。而且,由于國(guó)內(nèi)外文化、用戶習(xí)慣和法律法規(guī)不同,將在國(guó)外訓(xùn)練好的模型帶到國(guó)內(nèi)進(jìn)行微調(diào)是存在風(fēng)險(xiǎn)的。
中國(guó)工程院院士戴瓊海也表示,目前我國(guó)人工智能領(lǐng)域應(yīng)用強(qiáng),但原始創(chuàng)新不足,在基礎(chǔ)性技術(shù)和人才方面與美國(guó)相比處于弱勢(shì)。戴瓊海建議,我國(guó)應(yīng)從政策、機(jī)制和投入上深化人工智能的人才培養(yǎng)和基礎(chǔ)研究,強(qiáng)化原始創(chuàng)新。
此外,盡管國(guó)內(nèi)大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體都在積極參與大模型研發(fā),但學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合開發(fā)相對(duì)較少。趙志耕提到,“我們觀察到合作收縮趨勢(shì),這是接下來需要注意的。”
她建議,要加強(qiáng)資源和研發(fā)力量的統(tǒng)籌,促進(jìn)大模型的有序發(fā)展, 例如加強(qiáng)智算中心、超算中心、云計(jì)算中心等計(jì)算資源的統(tǒng)籌。與此同時(shí),同時(shí)加快基礎(chǔ)研究和技術(shù)創(chuàng)新,提升學(xué)術(shù)和開源影響力。
她還強(qiáng)調(diào)了強(qiáng)化國(guó)際合作,積極參與全球人工智能治理的重要性。各國(guó)對(duì)于AIGC合規(guī)性的重視正在推動(dòng)相應(yīng)的監(jiān)管措施出臺(tái)。今年4月中國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》。趙志耕表示,希望這些治理原則和倫理規(guī)范能夠在大模型的全鏈條中落地生根。在增進(jìn)共識(shí)的基礎(chǔ)上,加強(qiáng)人工治理的全球合作,創(chuàng)造中國(guó)的智慧和治理方案。有從業(yè)者指出,要參與規(guī)則的制定,中國(guó)的大模型要先上牌桌,才能擁有話語權(quán),才有全球競(jìng)賽的入場(chǎng)券。
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) 93dn.com 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com