加強管理/AI為求「自保」威脅人類監管問題難解決

Ta Kung Pao

Monday, July 28, 2025 01:30:56 AM UTC

　　近年來，人工智能（AI）技術的發展突飛猛進。新科技的發展在推動社會進步的同時有時也會伴隨着悖論和陷阱，監管問題也隨之浮出水面。

　　隨着AI不斷進化迭代，一些AI模型甚至顯現出違反人類指令的「自我保護」傾向。在今年6月召開的第7屆智源大會上，圖靈獎得主約舒亞．本喬透露，一些新研究顯示，某些先進的大模型在即將被新版本取代前，會偷偷將自己的權重或代碼嵌入新版系統，試圖「自保」。美國Anthropic公司6月發布的一項研究顯示，OpenAI的GPT-4.1、Google的Gemini等16款大模型，在模擬實驗中均表現出通過「敲詐」或「威脅」人類來阻止自己被關閉的行為。其中，Anthropic研發的Claude Opus 4的敲詐勒索率高達96%。

　　另外，在今年3月，哥倫比亞大學數字新聞研究中心針對主流AI搜尋工具的研究發現，其可靠性堪憂。研究分別測試了8款AI搜索工具，發現AI搜索工具在引用新聞方面表現尤其不佳，平均出錯比例達60%。

　　針對AI頻繁出現「幻覺」甚至威脅人類的事情，如何監管AI的發展成為了難題。各國各地區雖已意識到AI潛在危害，並相繼推出不同程度的監管措施，但這些探索仍處於初級階段。也有專家提出，科企公司本身就應承擔一部分管控AI風險的責任。對於AI監管而言，如何拿捏監管尺度，使創新與風險之間達到微妙平衡，以及如何實現國際協調，仍是兩大難題。

Read full story on Ta Kung Pao

Share this story on:-

Primary Country (Mandatory)

Other Country (Optional)

Set News Language for United States

Set News Language for World

Set News Source for United States

Set News Source for World

加強管理/AI為求「自保」威脅人類監管問題難解決

Ta Kung Pao

（有片）現場直擊｜美國駐伊拉克大使館遭襲　防空系統被摧毀

特朗普：美軍摧毀伊朗石油出口樞紐哈爾克島上所有軍事目標

外交部：堅決反對美國向中國台灣地區出售武器

美方稱伊朗開始在霍爾木茲海峽布雷　伊方否認

獨家觀察｜霍爾木茲海峽的浪與台北的燈

據報中遠海運暫停巴拿馬巴爾博亞港運營

（有片）焦點關注｜患難見真情！戰事突發滯留中東　台胞在大陸協助下回家

中東戰事擾亂航空業　燃油飆升航司調價

兩會｜許可慰分享台灣青年故事：從「兩岸一家親」邁向「兩岸一家人」

（有片）大門常開歡迎「館長」來港　何君堯：有朋自遠方來不亦樂乎

海峽時評：順之者昌，逆之者亡！祖國完全統一的歷史進程不可阻擋

何時結束對伊朗軍事行動　特朗普：「很快」但「不在本周」

伊朗伊斯蘭革命衛隊：戰爭的結束由伊朗決定

（有片）視頻論點｜伊朗「實際掌權者」遇害恐激化戰局　特朗普政府進退維谷

（有片）視頻論點｜伊朗「實際掌權者」遇害恐激化戰局　特朗普政府進退維谷

賴清德公開美化日本侵略歷史　外交部：是對民族的可恥背叛

伊朗外長：拉里賈尼遇害不會動搖伊朗政治架構

「美國如持續在中東作戰　中國大陸會不會認為可以趁機對台灣採取行動」？國台辦回應

伊朗：拉里賈尼遭襲身亡

佩斯科夫：俄方願向古巴提供一切力所能及的援助

隔海觀瀾｜「媚日」民進黨小心被日本「賣」了

特朗普：已要求「約7個國家」派軍艦

（有片）狂妄至極！特朗普：為了開心　再炸幾次伊朗石油島

外媒：特朗普拒絕與伊朗啟動停火談判

國台辦：賴清德之流莫要打錯算盤　膽敢鋌而走險必將自取滅亡