大模型“發(fā)槍”，這些問題不解決應(yīng)用就沒法“沖刺”|寧可直說

2023-07-08 15:54:22 來源：第一財(cái)經(jīng)

在WAIC2023的展館現(xiàn)場， 30多個(gè)大模型在每一家的展臺(tái)上都能完美呈現(xiàn)，僅僅根據(jù)呈現(xiàn)的任務(wù)處理能力，很難分辨它們本質(zhì)的不同。

“也不需要把一些過程想得太復(fù)雜，當(dāng)你選擇繼續(xù)生成或者重新生成，這本身就是對(duì)大模型的一種反饋，告訴它‘這次你做得可能不夠好，要繼續(xù)調(diào)整’。”一位展臺(tái)人員這樣向觀展者介紹。

大模型已然“發(fā)槍”，應(yīng)用開發(fā)商有人選擇“拿錘找釘”，也有人加速產(chǎn)品迭代，但在商業(yè)化路徑上還很難翻出花樣。應(yīng)用為何沒法“沖刺”？

(資料圖片僅供參考)

離不開高質(zhì)量數(shù)據(jù)訓(xùn)練

在大模型的應(yīng)用中，需要應(yīng)用開發(fā)商和購買應(yīng)用的企業(yè)用戶關(guān)系綁定更為緊密，因?yàn)榇竽Ｐ偷挠?xùn)練需要企業(yè)用戶特有的數(shù)據(jù)才能在模型調(diào)優(yōu)時(shí)更精準(zhǔn)。先做出大模型新產(chǎn)品demo（模型）再去尋找客戶，這個(gè)“拿錘找釘”不失為一個(gè)好辦法。

武漢百智誠遠(yuǎn)推出的文書精靈主打可智能生成裁判文書，通過在紫東太初大模型上基于華為昇思AI框架訓(xùn)練了6個(gè)月，已經(jīng)可以形成不錯(cuò)的質(zhì)量文本，但也不是沒有問題。公司發(fā)現(xiàn)，雖然案件當(dāng)事人雙方提供的起訴狀和案件卷宗有著相對(duì)固定的格式，內(nèi)容數(shù)據(jù)質(zhì)量相對(duì)較高，“因?yàn)殡p方當(dāng)事人觀點(diǎn)相左，所以還得由人最后確認(rèn)文本邏輯是否正確”，也因?yàn)槿绱耍ぷ魅藛T表示當(dāng)下“還沒有開始收費(fèi)，現(xiàn)在需要更多的數(shù)據(jù)來訓(xùn)練”。這背后的問題是數(shù)據(jù)庫的建設(shè)和使用。

“我們認(rèn)為在整個(gè)數(shù)據(jù)產(chǎn)業(yè)鏈中，還需要各種類型的數(shù)據(jù)庫才能真正把這個(gè)大模型用起來。” 星環(huán)科技創(chuàng)始人兼CEO 孫元浩說。大模型輸入的是自然語言，過去已有很多結(jié)構(gòu)化的工作把自然語言變成計(jì)算機(jī)可以識(shí)別的結(jié)構(gòu)化的信息，但現(xiàn)在要變成大模型可以理解的語言，如果要推理，就要把它向量化。因此想要輔助大模型理解數(shù)據(jù)，還需要有新一批工具的出現(xiàn)。

正如騰訊云數(shù)據(jù)庫副總經(jīng)理羅云不久前在發(fā)布AI原生向量數(shù)據(jù)庫時(shí)談道，向量數(shù)據(jù)庫是企業(yè)數(shù)據(jù)和大模型之間的橋梁，能夠彌補(bǔ)大模型在時(shí)間和空間上的限制。

找準(zhǔn)客戶需求

技術(shù)應(yīng)用終需迎接商業(yè)化挑戰(zhàn)，這需要盡快地得到購買企業(yè)服務(wù)的用戶認(rèn)可。

一些大模型產(chǎn)品是應(yīng)用開發(fā)商基于已有產(chǎn)品的迭代升級(jí)。以前，語言智能科技企業(yè)蜜度推出負(fù)責(zé)校對(duì)服務(wù)的是AI工具“校對(duì)通”，在大語言模型（LLM）的加持下，新推出的蜜度文修運(yùn)用高質(zhì)量數(shù)據(jù)學(xué)習(xí)多種特色子任務(wù)，能夠在一個(gè)模型里同時(shí)實(shí)現(xiàn)多個(gè)校對(duì)任務(wù)，完善了過去難以解決的易混詞細(xì)微語義辨析，并在領(lǐng)域公認(rèn)的數(shù)據(jù)集里表現(xiàn)優(yōu)異。在SIGHAN數(shù)據(jù)集（關(guān)注拼寫錯(cuò)誤）的幾項(xiàng)測(cè)試中，蜜度文修的F1值均為60-70%，以ChatGPT為代表的通用大模型則為30-50%，體現(xiàn)出垂直領(lǐng)域大模型的優(yōu)勢(shì)。

“用于訓(xùn)練數(shù)據(jù)的質(zhì)量和機(jī)器所做的任務(wù)類型對(duì)模型最終輸出的能力而言至關(guān)重要。我傾向于認(rèn)為，工具的最大商業(yè)價(jià)值，一定在于是否能有效解決客戶的問題。在這個(gè)過程中，我們不斷收集到反饋和需求，這就促使我們一定要跟上主流技術(shù)路線來提升和完善能力。”上海蜜度智能校對(duì)事業(yè)部總經(jīng)理張曉娟說。

有業(yè)內(nèi)人士表示，如果不是ChatGPT在面向C端時(shí)火了，可能不會(huì)有人關(guān)注到這個(gè)更有可能在to B領(lǐng)域掘金的領(lǐng)域。不過正如張曉娟提到“商業(yè)化的路徑倒沒有本質(zhì)性的變更”，打動(dòng)客戶的是高效解決問題，大模型應(yīng)用的變現(xiàn)關(guān)鍵點(diǎn)也正在于此。

審慎判斷投入力度

大模型作為新興的MaaS（模型即服務(wù)）層，吸引了應(yīng)用開發(fā)者的關(guān)注，如何評(píng)估投入？

微盟集團(tuán)在今年5月正式發(fā)布基于大模型的AI應(yīng)用型產(chǎn)品WAI，上線了包括“話術(shù)生產(chǎn)、短信模板、商品描述、種草筆記、直播口播稿、公眾號(hào)推文、短視頻帶貨文案”等在內(nèi)25個(gè)實(shí)際應(yīng)用場景，在618購物節(jié)期間就迎來了第一波“實(shí)戰(zhàn)反饋”。微盟數(shù)據(jù)顯示，以SaaS融合形態(tài)為例，從采用率來看，商品描述占比最高，達(dá)到40%；種草筆記正文達(dá)36%，而商家最為關(guān)注的口播稿的直接采用率也達(dá)到22%。這意味著，在微盟WAI為商家生成的內(nèi)容中，平均2-3條就有1條內(nèi)容可以被商家直接采用。

有了這樣的結(jié)果，除了成為百度文心一言生態(tài)合作伙伴，618剛過微盟馬上又與騰訊云啟動(dòng)了行業(yè)大模型的共建合作。“這次的AI確實(shí)和以往不一樣，所以我們會(huì)密切關(guān)注，包括最開始內(nèi)測(cè)的時(shí)候，實(shí)際上我們還是想鋪開的，看情況決定加大投入。從目前效果來看，我們能夠走到今天已經(jīng)很不容易了。我們理念也很清晰，也證明了我們不只是想講故事，而是踏踏實(shí)實(shí)做事。” 微盟首席運(yùn)營官尹世明說。微盟表示，正積極研究GPT、Bard等，并嘗試在部分領(lǐng)域的開源自研。

可以看到，現(xiàn)在大模型應(yīng)用在垂直領(lǐng)域的發(fā)展機(jī)會(huì)不少。然而，“是不是所有事情都用大模型？不盡然，因?yàn)檎嬲齽?dòng)用大模型一定要考慮到成本和效益之間的平衡。通用大模型實(shí)現(xiàn)商業(yè)變現(xiàn)程度到底怎么樣，無論從國際還是國內(nèi)，現(xiàn)在看不出來。”畢馬威中國數(shù)字化賦能主管合伙人張慶杰提醒。

想要應(yīng)用加速“沖刺”，還需要一段時(shí)間。

標(biāo)簽：

人妻 白嫩 蹂躏 惨叫,亚洲精品一区久久久久久,少妇愉情理伦片高潮电影,女人和公猪交内射

大模型“發(fā)槍”，這些問題不解決應(yīng)用就沒法“沖刺”|寧可直說

人妻白嫩蹂躏惨叫,亚洲精品一区久久久久久,少妇愉情理伦片高潮电影,女人和公猪交内射