當(dāng)前大模型和AIGC引領(lǐng)新一輪人工智能創(chuàng)新浪潮。那么,隨之而來的數(shù)據(jù)流通和安全倫理問題,應(yīng)該如何解決?
在2023世界人工智能大會(huì)(WAIC)上,政企學(xué)界圍繞人工智能的數(shù)據(jù)流通和安全可靠進(jìn)行了討論。
數(shù)據(jù)有效供給是關(guān)鍵
(資料圖片僅供參考)
作為人工智能大模型中的關(guān)鍵性因素,數(shù)據(jù)決定了模型的訓(xùn)練質(zhì)量、性能表現(xiàn)和應(yīng)用領(lǐng)域的廣度與深度。如何有效獲取數(shù)據(jù),成為生成式人工智能的第一道“關(guān)卡”。
在8日舉行的WAIC“大模型時(shí)代下的數(shù)據(jù)要素流通”主題論壇上,上海數(shù)交所總經(jīng)理湯奇峰說, 大模型時(shí)代下的語料庫建設(shè)存在供給不足、質(zhì)量不高、多樣性匱乏、標(biāo)準(zhǔn)欠缺等問題。 “語料庫建設(shè)不是單一企業(yè)的責(zé)任,需要多方共同推進(jìn),如果每個(gè)企業(yè)都單獨(dú)建設(shè)維護(hù)語料庫,會(huì)拉低效率,也會(huì)增加企業(yè)成本,數(shù)交所希望通過自己的努力加強(qiáng)數(shù)據(jù)要素建設(shè)提升語料庫建設(shè)效率。”
中國電子副總經(jīng)理陸志鵬也表示,大模型技術(shù)實(shí)現(xiàn)高質(zhì)量發(fā)展,數(shù)據(jù)有效供給是關(guān)鍵,亟需建設(shè)安全可信的數(shù)據(jù)底座。當(dāng)前數(shù)據(jù)合規(guī)確權(quán)、計(jì)量估價(jià)、協(xié)調(diào)分配、安全隱私保護(hù)等核心難題需要破解。
關(guān)于語料庫建設(shè)的挑戰(zhàn),湯奇峰稱,這主要集中在開放程度和數(shù)據(jù)質(zhì)量?jī)煞矫?。比如,能否有大模型企業(yè)所需的高質(zhì)量語料?目標(biāo)對(duì)象愿不愿意開放數(shù)據(jù)?針對(duì)數(shù)據(jù)質(zhì)量高但開放程度低的供方,可以通過數(shù)據(jù)交易鏈有效破解語料數(shù)據(jù)流通的信任問題。“核心問題之一在于產(chǎn)權(quán)和參與大模型后的收益分配。”
7月7日,上海數(shù)交所官網(wǎng)正式上線語料庫,累計(jì)掛牌近30個(gè)語料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域,并牽頭發(fā)起語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計(jì)劃。
湯奇峰說,大模型建設(shè)中,語料庫是非常重要的方向,語料庫采購已經(jīng)在不少大模型企業(yè)成本中占較大比重。上海數(shù)交所希望以市場(chǎng)配置的方式組織數(shù)據(jù)要素推動(dòng)語料庫建設(shè)。“比如,有的企業(yè)具有海量高質(zhì)量數(shù)據(jù)資源,開放意愿度也很高,但需要組織大量社會(huì)第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練,我們針對(duì)四類數(shù)據(jù)產(chǎn)品開發(fā)情況不同、實(shí)際需求不同的供方企業(yè)制定了差異化工作策略,著力打造語料數(shù)據(jù)生態(tài)。”
金葉子/攝
安全倫理如何解決
如何平衡大模型發(fā)展中的技術(shù)與倫理問題,也是今年WAIC論壇上業(yè)內(nèi)人士關(guān)注的問題。
中國信通院副院長(zhǎng)王志勤在“2023聚焦·大模型時(shí)代AIGC新浪潮論壇可信AI專場(chǎng)”上表示,伴隨著大模型能力的涌現(xiàn),人工智能固有技術(shù)風(fēng)險(xiǎn)也在持續(xù)加大。人工智能可信面臨著全新的挑戰(zhàn),對(duì)人工智能安全可信的要求也提到前所未有的高度。各國政府、業(yè)界紛紛加入推動(dòng)可信人工智能發(fā)展行列中。
在中科院自動(dòng)化研究所研究員、人工智能倫理與治理中心主任曾毅看來,生成式人工智能目標(biāo)是通用、多任務(wù)。但一個(gè)生成式人工智能,沒有進(jìn)行倫理和價(jià)值觀校準(zhǔn)前,問它倫理道德相關(guān)問題,它的回答具有非常明確的統(tǒng)計(jì)顯著性,這個(gè)統(tǒng)計(jì)顯著性反映的是人類的偏見。沒有安全倫理框架的人工智能,實(shí)際上是沒有底線的。“為什么我們進(jìn)行可信人工智能、人工智能倫理研究?這正是它的必要性所在。我要明確表示一個(gè)觀點(diǎn),我們應(yīng)該明確區(qū)分人工智能與人類的界限。”
曾毅認(rèn)為,在用生成式人工智能進(jìn)行創(chuàng)新的時(shí)候,不能僅僅討論機(jī)遇,也不能只看法律限制。在某些問題上,即使沒有觸犯法律,但違反了社會(huì)倫理道德,也不應(yīng)該去做。“即使通用人工智能真正 ‘上善若水’,人與人工智能是否能夠和諧共生,最終取決于人如何行為,而不是人工智能。”
本屆WAIC發(fā)布了《可信AI技術(shù)和應(yīng)用進(jìn)展白皮書(2023)》、《人工智能大模型倫理規(guī)范操作指引》、《AIGC風(fēng)險(xiǎn)評(píng)估框架(1.0)》等一批成果,規(guī)范生成式人工智能發(fā)展中伴隨的風(fēng)險(xiǎn)和倫理問題。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) 93dn.com 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com