中國(guó)已有79個(gè)10億參數(shù)大模型，業(yè)界呼吁盡快建立自主創(chuàng)新“護(hù)城河”

2023-05-29 19:58:07 來源：第一財(cái)經(jīng)

“據(jù)不完全統(tǒng)計(jì)，中國(guó)10億以上參數(shù)規(guī)模的大模型已經(jīng)發(fā)布了79個(gè)，從地區(qū)來看北京和廣東最多，自然語言處理是大模型研發(fā)最活躍的領(lǐng)域。”在中關(guān)村論壇上，中國(guó)科學(xué)技術(shù)信息研究所所長(zhǎng)，科技部新一代人工智能發(fā)展研究中心主任趙志耕披露了中國(guó)人工智能大模型的情況。

今天人工智能領(lǐng)域的競(jìng)爭(zhēng)比以往任何時(shí)候都更加激烈。有人把近日扎堆的大模型創(chuàng)業(yè)稱作“百模大戰(zhàn)”，從百度文心一言、阿里通義千問到商湯、昆侖萬維等推出大模型，到王小川的百川智能、王慧文的光年之外、李志飛的序列猴子等，“中國(guó)版ChatGPT”在近幾個(gè)月里幾乎迎來扎堆發(fā)布的熱潮。而在大模型的應(yīng)用層，已有包括在線辦公、金融科技、在線教育等多個(gè)細(xì)分垂直領(lǐng)域公布了大模型領(lǐng)域進(jìn)展。

(資料圖片僅供參考)

創(chuàng)新工場(chǎng)董事長(zhǎng)、首席執(zhí)行官李開復(fù)在論壇演講中表示，AI大模型是一個(gè)絕對(duì)不能錯(cuò)過的歷史機(jī)遇， AI大模型已經(jīng)慢慢走向?qū)嶓w經(jīng)濟(jì)，它會(huì)改寫每一個(gè)應(yīng)用，重構(gòu)人類的工作，很多重復(fù)性的勞動(dòng)會(huì)被取代。

論壇過后，有參會(huì)嘉賓被記者問到如何看待如火如荼的大模型創(chuàng)業(yè)潮時(shí)，評(píng)價(jià)“這說明中國(guó)企業(yè)非常熱情”，又補(bǔ)充一句：“像在煉丹。”

北京、廣東大模型數(shù)量最多

趙志耕表示，從全球大模型發(fā)展態(tài)勢(shì)來看，美國(guó)谷歌、OpenAI等機(jī)構(gòu)不斷引領(lǐng)大模型前沿的技術(shù)方向，同時(shí)歐洲、俄羅斯、以色列等越來越多的研發(fā)團(tuán)隊(duì)也在加入到大模型的研發(fā)中。

從全球已經(jīng)發(fā)布的大模型分布來看，中國(guó)和美國(guó)超過全球總數(shù)的80%，美國(guó)在大模型數(shù)量居全球之首，中國(guó)從2020年進(jìn)入大模型快速發(fā)展期，目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。

根據(jù)中關(guān)村論壇上發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》，中國(guó)人工智能大模型的地域分布明顯特點(diǎn)，14個(gè)省市地區(qū)都有開展大模型研究，其中北京和廣東最多，北京有38個(gè)大模型，廣東有20個(gè)大模型。

在模型領(lǐng)域分布上，自然語言處理仍是目前大模型研發(fā)最活躍的重點(diǎn)領(lǐng)域，其次是多模態(tài)領(lǐng)域。計(jì)算機(jī)視覺和智能語音等領(lǐng)域仍有待進(jìn)一步突破，目前模型較少。

如果大模型的生成式AI誕生過程比作“煉丹”，那么作為GPU的算力就好比煉丹爐下燃燒的烈火。報(bào)告通過調(diào)研全國(guó)范圍內(nèi)的算力基礎(chǔ)設(shè)施分布情況發(fā)現(xiàn)，北京、廣東、浙江、上海等地的大模型數(shù)量最多，同時(shí)這4個(gè)地方也是近三年人工智能服務(wù)器采購(gòu)數(shù)量最高的地區(qū)，表現(xiàn)出非常明顯的強(qiáng)相關(guān)性，為大模型研發(fā)應(yīng)用提供了重要支撐。

在發(fā)表相關(guān)論文方面，中國(guó)大模型通過學(xué)術(shù)論文發(fā)表方式已經(jīng)形成一定學(xué)術(shù)影響力。其中北京、廣東、上海三地不論是論文發(fā)表量還是引用量都居國(guó)內(nèi)最高，體現(xiàn)出明顯的人才儲(chǔ)備優(yōu)勢(shì)，江蘇、廣東、上海也是大模型人才相對(duì)較多的地區(qū)。

開源創(chuàng)新生態(tài)方面，目前已經(jīng)有超過半數(shù)大模型實(shí)現(xiàn)開源。北京、廣東、上海三地開源數(shù)量和開源影響力均居國(guó)內(nèi)前三，這背后主要是高校和機(jī)構(gòu)在推動(dòng)，如清華大學(xué)的ChatGLM-6B、復(fù)旦大學(xué)的MOSS以及百度的文心系列大模型開源等。

大模型人才稀缺、原始創(chuàng)新不足

人才為大模型研發(fā)提供關(guān)鍵智力要素支撐。但從數(shù)量上看，目前各地大模型人才總量仍然稀缺，數(shù)量均不充足。

李開復(fù)在談到當(dāng)前AI大模型面臨的挑戰(zhàn)時(shí)，也提到包括需要質(zhì)量更高的數(shù)據(jù)、需要更多的AI工程師與AI科學(xué)家等。

此前拉勾招聘發(fā)布的《2023第一季度AIGC人才供需報(bào)告》顯示，2023年第一季度，AIGC人才招聘需求連續(xù)三月攀升，今年3月AIGC人才崗位需求量環(huán)比增加42%。在招聘平臺(tái)上，不少企業(yè)甚至開出百萬年薪以搶奪AI技術(shù)人才。

而中國(guó)的大模型自身也需要不斷打磨。在推動(dòng)開源開放的同時(shí)，多位業(yè)內(nèi)人士都提到中國(guó)還需要加強(qiáng)基礎(chǔ)研究，“自主創(chuàng)新是發(fā)展大模型的必經(jīng)之路。”

李開復(fù)提到，要支持開源，但中國(guó)大模型公司不能過度依賴開源模型。“需要盡快建立自己的IP（知識(shí)產(chǎn)權(quán)）和技術(shù)優(yōu)勢(shì)，形成護(hù)城河。”因?yàn)殚_源模型無法達(dá)到國(guó)外大廠自研模型的性能，它的能力會(huì)成為“天花板”；同時(shí)海外大廠的開源技術(shù)還有關(guān)閉風(fēng)險(xiǎn)。而且，由于國(guó)內(nèi)外文化、用戶習(xí)慣和法律法規(guī)不同，將在國(guó)外訓(xùn)練好的模型帶到國(guó)內(nèi)進(jìn)行微調(diào)是存在風(fēng)險(xiǎn)的。

中國(guó)工程院院士戴瓊海也表示，目前我國(guó)人工智能領(lǐng)域應(yīng)用強(qiáng)，但原始創(chuàng)新不足，在基礎(chǔ)性技術(shù)和人才方面與美國(guó)相比處于弱勢(shì)。戴瓊海建議，我國(guó)應(yīng)從政策、機(jī)制和投入上深化人工智能的人才培養(yǎng)和基礎(chǔ)研究，強(qiáng)化原始創(chuàng)新。

此外，盡管國(guó)內(nèi)大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體都在積極參與大模型研發(fā)，但學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合開發(fā)相對(duì)較少。趙志耕提到，“我們觀察到合作收縮趨勢(shì)，這是接下來需要注意的。”

她建議，要加強(qiáng)資源和研發(fā)力量的統(tǒng)籌，促進(jìn)大模型的有序發(fā)展, 例如加強(qiáng)智算中心、超算中心、云計(jì)算中心等計(jì)算資源的統(tǒng)籌。與此同時(shí)，同時(shí)加快基礎(chǔ)研究和技術(shù)創(chuàng)新，提升學(xué)術(shù)和開源影響力。

她還強(qiáng)調(diào)了強(qiáng)化國(guó)際合作，積極參與全球人工智能治理的重要性。各國(guó)對(duì)于AIGC合規(guī)性的重視正在推動(dòng)相應(yīng)的監(jiān)管措施出臺(tái)。今年4月中國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布了《生成式人工智能服務(wù)管理辦法（征求意見稿）》。趙志耕表示，希望這些治理原則和倫理規(guī)范能夠在大模型的全鏈條中落地生根。在增進(jìn)共識(shí)的基礎(chǔ)上，加強(qiáng)人工治理的全球合作，創(chuàng)造中國(guó)的智慧和治理方案。有從業(yè)者指出，要參與規(guī)則的制定，中國(guó)的大模型要先上牌桌，才能擁有話語權(quán)，才有全球競(jìng)賽的入場(chǎng)券。

標(biāo)簽：

人妻 白嫩 蹂躏 惨叫,亚洲精品一区久久久久久,少妇愉情理伦片高潮电影,女人和公猪交内射

中國(guó)已有79個(gè)10億參數(shù)大模型，業(yè)界呼吁盡快建立自主創(chuàng)新“護(hù)城河”

人妻白嫩蹂躏惨叫,亚洲精品一区久久久久久,少妇愉情理伦片高潮电影,女人和公猪交内射