以深度學(xué)習(xí)為代表的新一代人工智能和以大模型為代表的通用人工智能不斷取得技術(shù)突破,將成為智能產(chǎn)業(yè)的根技術(shù)和智能經(jīng)濟(jì)的基礎(chǔ)設(shè)施。相較國(guó)際上的大模型發(fā)展,我國(guó)大模型發(fā)展水平處于什么階段?
(資料圖)
在清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松教授看來(lái),ChatGPT出現(xiàn)之前,我國(guó)人工智能發(fā)展水平和國(guó)際先進(jìn)水平相差半個(gè)肩位,現(xiàn)在這個(gè)距離從半個(gè)肩位到了100米,這半年經(jīng)過(guò)追趕后縮短了“30米”,但仍然還有差距。
在他看來(lái),我國(guó)乃至全球發(fā)展大模型最終的突破關(guān)鍵,是基礎(chǔ)科學(xué)的突破。
孫茂松日前在浦江基礎(chǔ)科學(xué)發(fā)展論壇上接受第一財(cái)經(jīng)采訪時(shí)說(shuō),對(duì)于大模型,當(dāng)前的問(wèn)題在于并不清楚OpenAI的機(jī)理是如何運(yùn)作的,就連推出ChatGPT的OpenAI公司首席執(zhí)行官薩姆·奧特曼也表示,雖然做出了GPT但也不清楚發(fā)生的原理,“實(shí)際上就是對(duì)這個(gè)機(jī)理還不清楚。”
他認(rèn)為,現(xiàn)有的人工智能模型已經(jīng)能做到說(shuō)話通順,但這個(gè)問(wèn)題的內(nèi)在仍然十分復(fù)雜。如果弄清楚了大模型里的規(guī)律、ChatGPT背后的機(jī)理,就有可能克服現(xiàn)有人工智能大模型的局限性,建立下一代人工智能的理論和模型。
“百模大戰(zhàn)”不是貶義
今年以來(lái),生成式人工智能的發(fā)展成為地方政府和科技大廠瞄準(zhǔn)的關(guān)鍵詞。科技部人工智能發(fā)展研究中心5月底發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,當(dāng)前國(guó)內(nèi)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè)。
不過(guò),與熱度不減的市場(chǎng)呼聲相比,我國(guó)國(guó)產(chǎn)大模型并未有驚艷的使用體驗(yàn)。
提到我國(guó)如今出現(xiàn)的“百模大戰(zhàn)”情況,孫茂松強(qiáng)調(diào)這并不是一個(gè)貶義詞,而是我國(guó)人工智能的實(shí)力象征。
早在2010年國(guó)內(nèi)就已跟進(jìn)大模型研究,在學(xué)術(shù)界和工業(yè)界一直都很“熱”,只不過(guò)這次ChatGPT點(diǎn)了幾把“火”。孫茂松說(shuō):“之前我們和國(guó)際先進(jìn)水平相差半個(gè)肩位,ChatGPT的出現(xiàn)一下甩出‘100米’,經(jīng)過(guò)這半年的追趕縮短了‘30米’,但還沒(méi)有質(zhì)的變化。目前ChatGPT用于專業(yè)領(lǐng)域還不行,建議‘百模’在提升基礎(chǔ)模型能力基礎(chǔ)上,深耕行業(yè)的垂直應(yīng)用。”
業(yè)界有個(gè)說(shuō)法,人工智能主要是中美之間的PK。根據(jù)前不久中國(guó)科學(xué)技術(shù)信息研究所發(fā)布的《2022全球人工智能創(chuàng)新指數(shù)報(bào)告》,中美兩國(guó)引領(lǐng)、呈梯次分布的全球人工智能發(fā)展總格局保持不變。美國(guó)人工智能創(chuàng)新指數(shù)已連續(xù)四年位居全球第一。中國(guó)人工智能發(fā)展成效顯著,人工智能創(chuàng)新指數(shù)近三年一直保持全球第二的水平,在人才、教育、專利產(chǎn)出等方面均有所進(jìn)步,但基礎(chǔ)資源建設(shè)水平仍有待提高。
相比2021年,中國(guó)有10個(gè)三級(jí)指標(biāo)2022年名次有所上升,主要集中在人才、教育、專利產(chǎn)出、創(chuàng)新制度等方面。優(yōu)勢(shì)指標(biāo)數(shù)量也不斷增長(zhǎng),從2021年的15個(gè)增加到2022年的18個(gè)。但整體發(fā)展水平與美國(guó)還存在一定差距。此外,相較于自身快速增長(zhǎng)的創(chuàng)新產(chǎn)出而言,其創(chuàng)新投入規(guī)模和質(zhì)量還有很大提升空間。
基礎(chǔ)科學(xué)是縮小差距的關(guān)鍵
談及如何進(jìn)一步追趕國(guó)際先進(jìn)水平,孫茂松認(rèn)為還是要回到基礎(chǔ)科學(xué)上來(lái)。“如果能夠研究透徹大模型的機(jī)理,就可能棋高一著。”
他認(rèn)為,現(xiàn)有的人工智能模型已經(jīng)能做到說(shuō)話通順,但這個(gè)問(wèn)題的內(nèi)在仍然十分復(fù)雜。
“深度神經(jīng)網(wǎng)絡(luò)背后的元素都是數(shù)學(xué),但它又跟純數(shù)學(xué)有不一樣的地方,它的信息量非常大,以前數(shù)學(xué)從來(lái)沒(méi)有想到能放這么多東西進(jìn)來(lái),現(xiàn)在大模型背后涉及的大數(shù)據(jù)是萬(wàn)億級(jí)的。數(shù)學(xué)家以前也從來(lái)沒(méi)解過(guò)這么大的一個(gè)方程組。”孫茂松說(shuō)。
除了基礎(chǔ)科學(xué),他還提到了人才的重要性。
“人工智能最前沿之爭(zhēng)就是人才的競(jìng)爭(zhēng),頂尖高手決定了人工智能的高度,廣泛的應(yīng)用決定了人工智能的廣度。”孫茂松認(rèn)為,人工智能的發(fā)展需要一流的人才,這些人才除了具備頂尖的能力,還要有遠(yuǎn)大的科學(xué)理想、敏銳的洞察力和對(duì)技術(shù)的激情。
另外,對(duì)于大模型出現(xiàn)一本正經(jīng)講廢話的情況,業(yè)界也開始討論語(yǔ)料投喂的范圍。
在孫茂松看來(lái),由于現(xiàn)在大模型的語(yǔ)料利用還處于粗放階段,僅僅是從網(wǎng)絡(luò)上抓取語(yǔ)料,并未涉及超鏈接、圖片處理以及文本結(jié)構(gòu)的識(shí)別等。因此,現(xiàn)階段運(yùn)用大模型寫長(zhǎng)文小說(shuō)肯定是不行的,但寫一些短文還不錯(cuò)。“它沒(méi)有辦法保持邏輯流暢,因?yàn)榇竽P途褪菍?duì)下一個(gè)詞的預(yù)測(cè),預(yù)測(cè)得再好,它對(duì)語(yǔ)料的利用還是有明顯的不足。”
孫茂松認(rèn)為,雖然要對(duì)語(yǔ)料質(zhì)量保持關(guān)注,刪除糟糕的語(yǔ)料以及計(jì)算機(jī)生成的語(yǔ)料,但語(yǔ)料的選取也有兩面性。“水至清則無(wú)魚,越純?cè)胶玫恼Z(yǔ)料可能導(dǎo)致多樣性損失,需要找到一個(gè)平衡。比如我喂的語(yǔ)料都是‘高大上的’,大模型就看不懂現(xiàn)在這些帶有表情符的語(yǔ)料。歸根結(jié)底要根據(jù)使用者所需要的模型來(lái)訓(xùn)練。”
(實(shí)習(xí)生張玙萱對(duì)本文亦有幫助)
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) 93dn.com 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com