25位頂尖科學家:采取更強有力行動防范AI風險

掃碼閱讀手機版

來源: 科技日報 作者: 編輯:劉子安 2024-05-22 10:50:09

  當以後的人們為人工智能(AI)撰寫一部編年史時,這可能是一個裡程碑。

  因為這是人類第一次由一個龐大的國際頂尖專家組,就先進AI的風險推進全球政策制定。

  人們已清晰認識到:我們離不開AI,亦需要大力推動AI技術發展,但我們必須有能力防范其中的風險。

  自6個月前在英國布萊奇利公園舉行第一屆AI安全峰會以來,世界各國領導人承諾以負責任的方式管理AI,但是AI專家認為這依然不夠。隨著第二屆AI安全峰會(5月21日至22日)在韓國首爾舉行,25位世界頂尖AI科學家呼吁,全世界應對AI風險采取更強有力的行動。

  發表於《科學》雜志的一份專家共識文章中,專家組概述了全球應采取的緊急政策優先事項。文章作者之一、英國牛津大學工程科學系教授菲利普·托爾表示:“在上屆AI峰會上,世界一致認為我們需要采取行動,而現在是時候將模糊的建議轉變為具體的承諾了。”

  安全性研究嚴重匱乏

  這25位全球頂尖的AI及其治理專家來自中國、美國、歐盟、英國和其他AI技術強國,其中包括圖靈獎獲得者以及諾貝爾獎獲得者。這也是首次由國際專家組就AI風險的全球政策制定達成一致。

  文章指出,全球領導人需認真考慮,在未來十年內可能開發出超越人類能力的通用AI系統。他們表示,盡管世界各國政府一直在討論先進AI,並嘗試引入初步指導方針,但這與許多專家期望的快速、變革性進展仍有距離。

  目前關於AI安全的研究嚴重缺乏,只有1%—3%的AI出版物涉及相關安全問題。此外,全球沒有適當的機制或機構來防止濫用和魯莽行為,包括如何使用能獨立采取行動和自行實現目標的自治系統。

  在快速發展中防范極端風險

  文章建議,各國政府需建立可快速行動的AI監管機構,並為這些機構提供資金。美國AI安全研究所目前的年度預算為1000萬美元,聽起來並不少,但相比之下,美國食品和藥物管理局(FDA)的預算達67億美元。

  AI領域需要更嚴格的風險評估並制定可執行的措施,而不是依賴一些不甚明確的模型評估。應要求AI研發企業優先考慮安全性,並證明其系統不會造成傷害,AI開發人員要承擔起證明安全性的責任。

  人們還要有一個與AI系統帶來的風險水平相稱的緩解辦法,解決之道是制定一個“自動”政策,當AI達到某些能力裡程碑時“自動觸發”——如果AI發展迅速,這一嚴格的要求就會自動生效;如果進展緩慢,要求將相應放緩。

  對於能力超凡的未來AI系統,政府必須作好帶頭監管的准備。這包括許可開發,限制其在關鍵社會角色中的自主權,停止部署部分能力,強制執行訪問控制,以及要求對國家級黑客采取強有力的信息安全手段,直到人們准備好足夠的保護措施。

  謹記AI不是玩具

  不列顛哥倫比亞大學AI教授、強化學習領域專家傑夫·克倫納表示,太空飛行、核武器和互聯網等技術在數年內就從科幻變成了現實,AI也不例外。“我們現在必須為那些看似科幻小說的風險做好准備”。

  現在,AI已經在黑客攻擊、社交操縱和戰略規劃等關鍵領域取得了快速進展,並可能很快帶來前所未有的關於“控制”的挑戰。AI系統可能會為了實現某個“不良目的”而騙取人類信任、獲取資源並影響關鍵決策者。為了避免人為乾預,它們還可以在全球服務器網絡上復制自身算法。

  在這種情況下,大規模網絡犯罪、社會操縱和其他危害會因此迅速昇級。而在公開衝突中,AI系統能自主部署各種武器,甚至包括生物武器。因此,當AI的進步不受控制,很可能最終導致大規模生命損失、生物圈破壞、人類邊緣化甚至滅絕。

  美國加州大學伯克利分校計算機科學教授斯圖爾特·盧塞爾表示:“此次是權威專家的共識文章,其呼吁政府嚴格監管,而不是自願制定一些規范行業的行為。”

  “企業可能抱怨說滿足這些法規太難,但所謂‘法規扼殺創新’的說法是荒謬的。”盧塞爾這樣說,“是時候認真對待先進AI系統了,它們不是玩具。在我們了解如何確保它們的安全性之前,輕易增強它們的能力是完全魯莽的行為。”

下載津雲客戶端關注更多精彩

推薦新聞

我來說兩句

關於我們 | 廣告服務 | 誠聘英纔 | 聯系我們 | 版權聲明 | 設為首頁 | 關於小狼 | 違法和不良信息舉報電話:022-23602087 | 舉報郵箱:jubao@staff.enorth.cn | 舉報平臺

Copyright (C) 2000-2019 Enorth.com.cn, Tianjin ENORTH NETNEWS Co.,LTD.All rights reserved
本網站由天津北方網版權所有
增值電信業務經營許可證編號:津B2-20000001  信息網絡傳播視聽節目許可證號:0205099  互聯網新聞信息服務許可證編號:12120170001津公網安備 12010002000001號