大模型涌現(xiàn)，數(shù)據(jù)流通和安全倫理怎么辦？業(yè)界談了這些要點(diǎn)

2023-07-08 19:04:02 來源：第一財(cái)經(jīng)

當(dāng)前大模型和AIGC引領(lǐng)新一輪人工智能創(chuàng)新浪潮。那么，隨之而來的數(shù)據(jù)流通和安全倫理問題，應(yīng)該如何解決？

在2023世界人工智能大會(huì)（WAIC）上，政企學(xué)界圍繞人工智能的數(shù)據(jù)流通和安全可靠進(jìn)行了討論。

數(shù)據(jù)有效供給是關(guān)鍵

(資料圖片僅供參考)

作為人工智能大模型中的關(guān)鍵性因素，數(shù)據(jù)決定了模型的訓(xùn)練質(zhì)量、性能表現(xiàn)和應(yīng)用領(lǐng)域的廣度與深度。如何有效獲取數(shù)據(jù)，成為生成式人工智能的第一道“關(guān)卡”。

在8日舉行的WAIC“大模型時(shí)代下的數(shù)據(jù)要素流通”主題論壇上，上海數(shù)交所總經(jīng)理湯奇峰說，大模型時(shí)代下的語料庫建設(shè)存在供給不足、質(zhì)量不高、多樣性匱乏、標(biāo)準(zhǔn)欠缺等問題。 “語料庫建設(shè)不是單一企業(yè)的責(zé)任，需要多方共同推進(jìn)，如果每個(gè)企業(yè)都單獨(dú)建設(shè)維護(hù)語料庫，會(huì)拉低效率，也會(huì)增加企業(yè)成本，數(shù)交所希望通過自己的努力加強(qiáng)數(shù)據(jù)要素建設(shè)提升語料庫建設(shè)效率。”

中國電子副總經(jīng)理陸志鵬也表示，大模型技術(shù)實(shí)現(xiàn)高質(zhì)量發(fā)展，數(shù)據(jù)有效供給是關(guān)鍵，亟需建設(shè)安全可信的數(shù)據(jù)底座。當(dāng)前數(shù)據(jù)合規(guī)確權(quán)、計(jì)量估價(jià)、協(xié)調(diào)分配、安全隱私保護(hù)等核心難題需要破解。

關(guān)于語料庫建設(shè)的挑戰(zhàn)，湯奇峰稱，這主要集中在開放程度和數(shù)據(jù)質(zhì)量?jī)煞矫?。比如，能否有大模型企業(yè)所需的高質(zhì)量語料？目標(biāo)對(duì)象愿不愿意開放數(shù)據(jù)？針對(duì)數(shù)據(jù)質(zhì)量高但開放程度低的供方，可以通過數(shù)據(jù)交易鏈有效破解語料數(shù)據(jù)流通的信任問題。“核心問題之一在于產(chǎn)權(quán)和參與大模型后的收益分配。”

7月7日，上海數(shù)交所官網(wǎng)正式上線語料庫，累計(jì)掛牌近30個(gè)語料數(shù)據(jù)產(chǎn)品，包含文本、音頻、圖像等多模態(tài)，覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域，并牽頭發(fā)起語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計(jì)劃。

湯奇峰說，大模型建設(shè)中，語料庫是非常重要的方向，語料庫采購已經(jīng)在不少大模型企業(yè)成本中占較大比重。上海數(shù)交所希望以市場(chǎng)配置的方式組織數(shù)據(jù)要素推動(dòng)語料庫建設(shè)。“比如，有的企業(yè)具有海量高質(zhì)量數(shù)據(jù)資源，開放意愿度也很高，但需要組織大量社會(huì)第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練，我們針對(duì)四類數(shù)據(jù)產(chǎn)品開發(fā)情況不同、實(shí)際需求不同的供方企業(yè)制定了差異化工作策略，著力打造語料數(shù)據(jù)生態(tài)。”

金葉子／攝

安全倫理如何解決

如何平衡大模型發(fā)展中的技術(shù)與倫理問題，也是今年WAIC論壇上業(yè)內(nèi)人士關(guān)注的問題。

中國信通院副院長(zhǎng)王志勤在“2023聚焦·大模型時(shí)代AIGC新浪潮論壇可信AI專場(chǎng)”上表示，伴隨著大模型能力的涌現(xiàn)，人工智能固有技術(shù)風(fēng)險(xiǎn)也在持續(xù)加大。人工智能可信面臨著全新的挑戰(zhàn)，對(duì)人工智能安全可信的要求也提到前所未有的高度。各國政府、業(yè)界紛紛加入推動(dòng)可信人工智能發(fā)展行列中。

在中科院自動(dòng)化研究所研究員、人工智能倫理與治理中心主任曾毅看來，生成式人工智能目標(biāo)是通用、多任務(wù)。但一個(gè)生成式人工智能，沒有進(jìn)行倫理和價(jià)值觀校準(zhǔn)前，問它倫理道德相關(guān)問題，它的回答具有非常明確的統(tǒng)計(jì)顯著性，這個(gè)統(tǒng)計(jì)顯著性反映的是人類的偏見。沒有安全倫理框架的人工智能，實(shí)際上是沒有底線的。“為什么我們進(jìn)行可信人工智能、人工智能倫理研究？這正是它的必要性所在。我要明確表示一個(gè)觀點(diǎn)，我們應(yīng)該明確區(qū)分人工智能與人類的界限。”

曾毅認(rèn)為，在用生成式人工智能進(jìn)行創(chuàng)新的時(shí)候，不能僅僅討論機(jī)遇，也不能只看法律限制。在某些問題上，即使沒有觸犯法律，但違反了社會(huì)倫理道德，也不應(yīng)該去做。“即使通用人工智能真正 ‘上善若水’，人與人工智能是否能夠和諧共生，最終取決于人如何行為，而不是人工智能。”

本屆WAIC發(fā)布了《可信AI技術(shù)和應(yīng)用進(jìn)展白皮書（2023）》、《人工智能大模型倫理規(guī)范操作指引》、《AIGC風(fēng)險(xiǎn)評(píng)估框架（1.0）》等一批成果，規(guī)范生成式人工智能發(fā)展中伴隨的風(fēng)險(xiǎn)和倫理問題。

標(biāo)簽：

人妻 白嫩 蹂躏 惨叫,亚洲精品一区久久久久久,少妇愉情理伦片高潮电影,女人和公猪交内射

大模型涌現(xiàn)，數(shù)據(jù)流通和安全倫理怎么辦？業(yè)界談了這些要點(diǎn)

人妻白嫩蹂躏惨叫,亚洲精品一区久久久久久,少妇愉情理伦片高潮电影,女人和公猪交内射

大模型涌現(xiàn)，數(shù)據(jù)流通和安全倫理怎么辦？業(yè)界談了這些要點(diǎn)