大模型涌現(xiàn)，數(shù)據(jù)流通和安全倫理怎么辦？業(yè)界談了這些要點

2023-07-08 19:04:02 來源：第一財經(jīng)

當前大模型和AIGC引領(lǐng)新一輪人工智能創(chuàng)新浪潮。那么，隨之而來的數(shù)據(jù)流通和安全倫理問題，應(yīng)該如何解決？

在2023世界人工智能大會（WAIC）上，政企學界圍繞人工智能的數(shù)據(jù)流通和安全可靠進行了討論。

數(shù)據(jù)有效供給是關(guān)鍵

(資料圖片僅供參考)

作為人工智能大模型中的關(guān)鍵性因素，數(shù)據(jù)決定了模型的訓(xùn)練質(zhì)量、性能表現(xiàn)和應(yīng)用領(lǐng)域的廣度與深度。如何有效獲取數(shù)據(jù)，成為生成式人工智能的第一道“關(guān)卡”。

在8日舉行的WAIC“大模型時代下的數(shù)據(jù)要素流通”主題論壇上，上海數(shù)交所總經(jīng)理湯奇峰說，大模型時代下的語料庫建設(shè)存在供給不足、質(zhì)量不高、多樣性匱乏、標準欠缺等問題。 “語料庫建設(shè)不是單一企業(yè)的責任，需要多方共同推進，如果每個企業(yè)都單獨建設(shè)維護語料庫，會拉低效率，也會增加企業(yè)成本，數(shù)交所希望通過自己的努力加強數(shù)據(jù)要素建設(shè)提升語料庫建設(shè)效率。”

中國電子副總經(jīng)理陸志鵬也表示，大模型技術(shù)實現(xiàn)高質(zhì)量發(fā)展，數(shù)據(jù)有效供給是關(guān)鍵，亟需建設(shè)安全可信的數(shù)據(jù)底座。當前數(shù)據(jù)合規(guī)確權(quán)、計量估價、協(xié)調(diào)分配、安全隱私保護等核心難題需要破解。

關(guān)于語料庫建設(shè)的挑戰(zhàn)，湯奇峰稱，這主要集中在開放程度和數(shù)據(jù)質(zhì)量兩方面。比如，能否有大模型企業(yè)所需的高質(zhì)量語料？目標對象愿不愿意開放數(shù)據(jù)？針對數(shù)據(jù)質(zhì)量高但開放程度低的供方，可以通過數(shù)據(jù)交易鏈有效破解語料數(shù)據(jù)流通的信任問題。“核心問題之一在于產(chǎn)權(quán)和參與大模型后的收益分配。”

7月7日，上海數(shù)交所官網(wǎng)正式上線語料庫，累計掛牌近30個語料數(shù)據(jù)產(chǎn)品，包含文本、音頻、圖像等多模態(tài)，覆蓋金融、交通運輸和醫(yī)療等領(lǐng)域，并牽頭發(fā)起語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計劃。

湯奇峰說，大模型建設(shè)中，語料庫是非常重要的方向，語料庫采購已經(jīng)在不少大模型企業(yè)成本中占較大比重。上海數(shù)交所希望以市場配置的方式組織數(shù)據(jù)要素推動語料庫建設(shè)。“比如，有的企業(yè)具有海量高質(zhì)量數(shù)據(jù)資源，開放意愿度也很高，但需要組織大量社會第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練，我們針對四類數(shù)據(jù)產(chǎn)品開發(fā)情況不同、實際需求不同的供方企業(yè)制定了差異化工作策略，著力打造語料數(shù)據(jù)生態(tài)。”

金葉子／攝

安全倫理如何解決

如何平衡大模型發(fā)展中的技術(shù)與倫理問題，也是今年WAIC論壇上業(yè)內(nèi)人士關(guān)注的問題。

中國信通院副院長王志勤在“2023聚焦·大模型時代AIGC新浪潮論壇可信AI專場”上表示，伴隨著大模型能力的涌現(xiàn)，人工智能固有技術(shù)風險也在持續(xù)加大。人工智能可信面臨著全新的挑戰(zhàn)，對人工智能安全可信的要求也提到前所未有的高度。各國政府、業(yè)界紛紛加入推動可信人工智能發(fā)展行列中。

在中科院自動化研究所研究員、人工智能倫理與治理中心主任曾毅看來，生成式人工智能目標是通用、多任務(wù)。但一個生成式人工智能，沒有進行倫理和價值觀校準前，問它倫理道德相關(guān)問題，它的回答具有非常明確的統(tǒng)計顯著性，這個統(tǒng)計顯著性反映的是人類的偏見。沒有安全倫理框架的人工智能，實際上是沒有底線的。“為什么我們進行可信人工智能、人工智能倫理研究？這正是它的必要性所在。我要明確表示一個觀點，我們應(yīng)該明確區(qū)分人工智能與人類的界限。”

曾毅認為，在用生成式人工智能進行創(chuàng)新的時候，不能僅僅討論機遇，也不能只看法律限制。在某些問題上，即使沒有觸犯法律，但違反了社會倫理道德，也不應(yīng)該去做。“即使通用人工智能真正 ‘上善若水’，人與人工智能是否能夠和諧共生，最終取決于人如何行為，而不是人工智能。”

本屆WAIC發(fā)布了《可信AI技術(shù)和應(yīng)用進展白皮書（2023）》、《人工智能大模型倫理規(guī)范操作指引》、《AIGC風險評估框架（1.0）》等一批成果，規(guī)范生成式人工智能發(fā)展中伴隨的風險和倫理問題。

標簽：

大模型涌現(xiàn)，數(shù)據(jù)流通和安全倫理怎么辦？業(yè)界談了這些要點

大模型涌現(xiàn)，數(shù)據(jù)流通和安全倫理怎么辦？業(yè)界談了這些要點