當前大模型和AIGC引領(lǐng)新一輪人工智能創(chuàng)新浪潮。那么,隨之而來的數(shù)據(jù)流通和安全倫理問題,應(yīng)該如何解決?
在2023世界人工智能大會(WAIC)上,政企學界圍繞人工智能的數(shù)據(jù)流通和安全可靠進行了討論。
數(shù)據(jù)有效供給是關(guān)鍵
(資料圖片僅供參考)
作為人工智能大模型中的關(guān)鍵性因素,數(shù)據(jù)決定了模型的訓(xùn)練質(zhì)量、性能表現(xiàn)和應(yīng)用領(lǐng)域的廣度與深度。如何有效獲取數(shù)據(jù),成為生成式人工智能的第一道“關(guān)卡”。
在8日舉行的WAIC“大模型時代下的數(shù)據(jù)要素流通”主題論壇上,上海數(shù)交所總經(jīng)理湯奇峰說, 大模型時代下的語料庫建設(shè)存在供給不足、質(zhì)量不高、多樣性匱乏、標準欠缺等問題。 “語料庫建設(shè)不是單一企業(yè)的責任,需要多方共同推進,如果每個企業(yè)都單獨建設(shè)維護語料庫,會拉低效率,也會增加企業(yè)成本,數(shù)交所希望通過自己的努力加強數(shù)據(jù)要素建設(shè)提升語料庫建設(shè)效率。”
中國電子副總經(jīng)理陸志鵬也表示,大模型技術(shù)實現(xiàn)高質(zhì)量發(fā)展,數(shù)據(jù)有效供給是關(guān)鍵,亟需建設(shè)安全可信的數(shù)據(jù)底座。當前數(shù)據(jù)合規(guī)確權(quán)、計量估價、協(xié)調(diào)分配、安全隱私保護等核心難題需要破解。
關(guān)于語料庫建設(shè)的挑戰(zhàn),湯奇峰稱,這主要集中在開放程度和數(shù)據(jù)質(zhì)量兩方面。比如,能否有大模型企業(yè)所需的高質(zhì)量語料?目標對象愿不愿意開放數(shù)據(jù)?針對數(shù)據(jù)質(zhì)量高但開放程度低的供方,可以通過數(shù)據(jù)交易鏈有效破解語料數(shù)據(jù)流通的信任問題。“核心問題之一在于產(chǎn)權(quán)和參與大模型后的收益分配。”
7月7日,上海數(shù)交所官網(wǎng)正式上線語料庫,累計掛牌近30個語料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運輸和醫(yī)療等領(lǐng)域,并牽頭發(fā)起語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計劃。
湯奇峰說,大模型建設(shè)中,語料庫是非常重要的方向,語料庫采購已經(jīng)在不少大模型企業(yè)成本中占較大比重。上海數(shù)交所希望以市場配置的方式組織數(shù)據(jù)要素推動語料庫建設(shè)。“比如,有的企業(yè)具有海量高質(zhì)量數(shù)據(jù)資源,開放意愿度也很高,但需要組織大量社會第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練,我們針對四類數(shù)據(jù)產(chǎn)品開發(fā)情況不同、實際需求不同的供方企業(yè)制定了差異化工作策略,著力打造語料數(shù)據(jù)生態(tài)。”
金葉子/攝
安全倫理如何解決
如何平衡大模型發(fā)展中的技術(shù)與倫理問題,也是今年WAIC論壇上業(yè)內(nèi)人士關(guān)注的問題。
中國信通院副院長王志勤在“2023聚焦·大模型時代AIGC新浪潮論壇可信AI專場”上表示,伴隨著大模型能力的涌現(xiàn),人工智能固有技術(shù)風險也在持續(xù)加大。人工智能可信面臨著全新的挑戰(zhàn),對人工智能安全可信的要求也提到前所未有的高度。各國政府、業(yè)界紛紛加入推動可信人工智能發(fā)展行列中。
在中科院自動化研究所研究員、人工智能倫理與治理中心主任曾毅看來,生成式人工智能目標是通用、多任務(wù)。但一個生成式人工智能,沒有進行倫理和價值觀校準前,問它倫理道德相關(guān)問題,它的回答具有非常明確的統(tǒng)計顯著性,這個統(tǒng)計顯著性反映的是人類的偏見。沒有安全倫理框架的人工智能,實際上是沒有底線的。“為什么我們進行可信人工智能、人工智能倫理研究?這正是它的必要性所在。我要明確表示一個觀點,我們應(yīng)該明確區(qū)分人工智能與人類的界限。”
曾毅認為,在用生成式人工智能進行創(chuàng)新的時候,不能僅僅討論機遇,也不能只看法律限制。在某些問題上,即使沒有觸犯法律,但違反了社會倫理道德,也不應(yīng)該去做。“即使通用人工智能真正 ‘上善若水’,人與人工智能是否能夠和諧共生,最終取決于人如何行為,而不是人工智能。”
本屆WAIC發(fā)布了《可信AI技術(shù)和應(yīng)用進展白皮書(2023)》、《人工智能大模型倫理規(guī)范操作指引》、《AIGC風險評估框架(1.0)》等一批成果,規(guī)范生成式人工智能發(fā)展中伴隨的風險和倫理問題。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.fyuntv.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com