在WAIC2023的展館現(xiàn)場, 30多個(gè)大模型在每一家的展臺(tái)上都能完美呈現(xiàn),僅僅根據(jù)呈現(xiàn)的任務(wù)處理能力,很難分辨它們本質(zhì)的不同。
“也不需要把一些過程想得太復(fù)雜,當(dāng)你選擇繼續(xù)生成或者重新生成,這本身就是對(duì)大模型的一種反饋,告訴它‘這次你做得可能不夠好,要繼續(xù)調(diào)整’。”一位展臺(tái)人員這樣向觀展者介紹。
大模型已然“發(fā)槍”,應(yīng)用開發(fā)商有人選擇“拿錘找釘”,也有人加速產(chǎn)品迭代,但在商業(yè)化路徑上還很難翻出花樣。應(yīng)用為何沒法“沖刺”?
(資料圖片僅供參考)
離不開高質(zhì)量數(shù)據(jù)訓(xùn)練
在大模型的應(yīng)用中,需要應(yīng)用開發(fā)商和購買應(yīng)用的企業(yè)用戶關(guān)系綁定更為緊密,因?yàn)榇竽P偷挠?xùn)練需要企業(yè)用戶特有的數(shù)據(jù)才能在模型調(diào)優(yōu)時(shí)更精準(zhǔn)。先做出大模型新產(chǎn)品demo(模型)再去尋找客戶,這個(gè)“拿錘找釘”不失為一個(gè)好辦法。
武漢百智誠遠(yuǎn)推出的文書精靈主打可智能生成裁判文書,通過在紫東太初大模型上基于華為昇思AI框架訓(xùn)練了6個(gè)月,已經(jīng)可以形成不錯(cuò)的質(zhì)量文本,但也不是沒有問題。公司發(fā)現(xiàn),雖然案件當(dāng)事人雙方提供的起訴狀和案件卷宗有著相對(duì)固定的格式,內(nèi)容數(shù)據(jù)質(zhì)量相對(duì)較高,“因?yàn)殡p方當(dāng)事人觀點(diǎn)相左,所以還得由人最后確認(rèn)文本邏輯是否正確”,也因?yàn)槿绱耍ぷ魅藛T表示當(dāng)下“還沒有開始收費(fèi),現(xiàn)在需要更多的數(shù)據(jù)來訓(xùn)練”。這背后的問題是數(shù)據(jù)庫的建設(shè)和使用。
“我們認(rèn)為在整個(gè)數(shù)據(jù)產(chǎn)業(yè)鏈中,還需要各種類型的數(shù)據(jù)庫才能真正把這個(gè)大模型用起來。” 星環(huán)科技創(chuàng)始人兼CEO 孫元浩說。大模型輸入的是自然語言,過去已有很多結(jié)構(gòu)化的工作把自然語言變成計(jì)算機(jī)可以識(shí)別的結(jié)構(gòu)化的信息,但現(xiàn)在要變成大模型可以理解的語言,如果要推理,就要把它向量化。因此想要輔助大模型理解數(shù)據(jù),還需要有新一批工具的出現(xiàn)。
正如騰訊云數(shù)據(jù)庫副總經(jīng)理羅云不久前在發(fā)布AI原生向量數(shù)據(jù)庫時(shí)談道,向量數(shù)據(jù)庫是企業(yè)數(shù)據(jù)和大模型之間的橋梁,能夠彌補(bǔ)大模型在時(shí)間和空間上的限制。
找準(zhǔn)客戶需求
技術(shù)應(yīng)用終需迎接商業(yè)化挑戰(zhàn),這需要盡快地得到購買企業(yè)服務(wù)的用戶認(rèn)可。
一些大模型產(chǎn)品是應(yīng)用開發(fā)商基于已有產(chǎn)品的迭代升級(jí)。以前,語言智能科技企業(yè)蜜度推出負(fù)責(zé)校對(duì)服務(wù)的是AI工具“校對(duì)通”,在大語言模型(LLM)的加持下,新推出的蜜度文修運(yùn)用高質(zhì)量數(shù)據(jù)學(xué)習(xí)多種特色子任務(wù),能夠在一個(gè)模型里同時(shí)實(shí)現(xiàn)多個(gè)校對(duì)任務(wù),完善了過去難以解決的易混詞細(xì)微語義辨析,并在領(lǐng)域公認(rèn)的數(shù)據(jù)集里表現(xiàn)優(yōu)異。在SIGHAN數(shù)據(jù)集(關(guān)注拼寫錯(cuò)誤)的幾項(xiàng)測(cè)試中,蜜度文修的F1值均為60-70%,以ChatGPT為代表的通用大模型則為30-50%,體現(xiàn)出垂直領(lǐng)域大模型的優(yōu)勢(shì)。
“用于訓(xùn)練數(shù)據(jù)的質(zhì)量和機(jī)器所做的任務(wù)類型對(duì)模型最終輸出的能力而言至關(guān)重要。我傾向于認(rèn)為,工具的最大商業(yè)價(jià)值,一定在于是否能有效解決客戶的問題。在這個(gè)過程中,我們不斷收集到反饋和需求,這就促使我們一定要跟上主流技術(shù)路線來提升和完善能力。”上海蜜度智能校對(duì)事業(yè)部總經(jīng)理張曉娟說。
有業(yè)內(nèi)人士表示,如果不是ChatGPT在面向C端時(shí)火了,可能不會(huì)有人關(guān)注到這個(gè)更有可能在to B領(lǐng)域掘金的領(lǐng)域。不過正如張曉娟提到“商業(yè)化的路徑倒沒有本質(zhì)性的變更”,打動(dòng)客戶的是高效解決問題,大模型應(yīng)用的變現(xiàn)關(guān)鍵點(diǎn)也正在于此。
審慎判斷投入力度
大模型作為新興的MaaS(模型即服務(wù))層,吸引了應(yīng)用開發(fā)者的關(guān)注,如何評(píng)估投入?
微盟集團(tuán)在今年5月正式發(fā)布基于大模型的AI應(yīng)用型產(chǎn)品WAI,上線了包括“話術(shù)生產(chǎn)、短信模板、商品描述、種草筆記、直播口播稿、公眾號(hào)推文、短視頻帶貨文案”等在內(nèi)25個(gè)實(shí)際應(yīng)用場景,在618購物節(jié)期間就迎來了第一波“實(shí)戰(zhàn)反饋”。微盟數(shù)據(jù)顯示,以SaaS融合形態(tài)為例,從采用率來看,商品描述占比最高,達(dá)到40%;種草筆記正文達(dá)36%,而商家最為關(guān)注的口播稿的直接采用率也達(dá)到22%。這意味著,在微盟WAI為商家生成的內(nèi)容中,平均2-3條就有1條內(nèi)容可以被商家直接采用。
有了這樣的結(jié)果,除了成為百度文心一言生態(tài)合作伙伴,618剛過微盟馬上又與騰訊云啟動(dòng)了行業(yè)大模型的共建合作。“這次的AI確實(shí)和以往不一樣,所以我們會(huì)密切關(guān)注,包括最開始內(nèi)測(cè)的時(shí)候,實(shí)際上我們還是想鋪開的,看情況決定加大投入。從目前效果來看,我們能夠走到今天已經(jīng)很不容易了。我們理念也很清晰,也證明了我們不只是想講故事,而是踏踏實(shí)實(shí)做事。” 微盟首席運(yùn)營官尹世明說。微盟表示,正積極研究GPT、Bard等,并嘗試在部分領(lǐng)域的開源自研。
可以看到,現(xiàn)在大模型應(yīng)用在垂直領(lǐng)域的發(fā)展機(jī)會(huì)不少。然而,“是不是所有事情都用大模型?不盡然,因?yàn)檎嬲齽?dòng)用大模型一定要考慮到成本和效益之間的平衡。通用大模型實(shí)現(xiàn)商業(yè)變現(xiàn)程度到底怎么樣,無論從國際還是國內(nèi),現(xiàn)在看不出來。”畢馬威中國數(shù)字化賦能主管合伙人張慶杰提醒。
想要應(yīng)用加速“沖刺”,還需要一段時(shí)間。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) 93dn.com 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com