Primary Country (Mandatory)

Other Country (Optional)

Set News Language for United States

Primary Language (Mandatory)
Other Language[s] (Optional)
No other language available

Set News Language for World

Primary Language (Mandatory)
Other Language(s) (Optional)

Set News Source for United States

Primary Source (Mandatory)
Other Source[s] (Optional)

Set News Source for World

Primary Source (Mandatory)
Other Source(s) (Optional)
  • Countries
    • India
    • United States
    • Qatar
    • Germany
    • China
    • Canada
    • World
  • Categories
    • National
    • International
    • Business
    • Entertainment
    • Sports
    • Special
    • All Categories
  • Available Languages for United States
    • English
  • All Languages
    • English
    • Hindi
    • Arabic
    • German
    • Chinese
    • French
  • Sources
    • India
      • AajTak
      • NDTV India
      • The Hindu
      • India Today
      • Zee News
      • NDTV
      • BBC
      • The Wire
      • News18
      • News 24
      • The Quint
      • ABP News
      • Zee News
      • News 24
    • United States
      • CNN
      • Fox News
      • Al Jazeera
      • CBSN
      • NY Post
      • Voice of America
      • The New York Times
      • HuffPost
      • ABC News
      • Newsy
    • Qatar
      • Al Jazeera
      • Al Arab
      • The Peninsula
      • Gulf Times
      • Al Sharq
      • Qatar Tribune
      • Al Raya
      • Lusail
    • Germany
      • DW
      • ZDF
      • ProSieben
      • RTL
      • n-tv
      • Die Welt
      • Süddeutsche Zeitung
      • Frankfurter Rundschau
    • China
      • China Daily
      • BBC
      • The New York Times
      • Voice of America
      • Beijing Daily
      • The Epoch Times
      • Ta Kung Pao
      • Xinmin Evening News
    • Canada
      • CBC
      • Radio-Canada
      • CTV
      • TVA Nouvelles
      • Le Journal de Montréal
      • Global News
      • BNN Bloomberg
      • Métro
加強管理/AI為求「自保」威脅人類 監管問題難解決

加強管理/AI為求「自保」威脅人類 監管問題難解決

Ta Kung Pao
Monday, July 28, 2025 01:30:56 AM UTC

  近年來,人工智能(AI)技術的發展突飛猛進。新科技的發展在推動社會進步的同時有時也會伴隨着悖論和陷阱,監管問題也隨之浮出水面。

  隨着AI不斷進化迭代,一些AI模型甚至顯現出違反人類指令的「自我保護」傾向。在今年6月召開的第7屆智源大會上,圖靈獎得主約舒亞.本喬透露,一些新研究顯示,某些先進的大模型在即將被新版本取代前,會偷偷將自己的權重或代碼嵌入新版系統,試圖「自保」。美國Anthropic公司6月發布的一項研究顯示,OpenAI的GPT-4.1、Google的Gemini等16款大模型,在模擬實驗中均表現出通過「敲詐」或「威脅」人類來阻止自己被關閉的行為。其中,Anthropic研發的Claude Opus 4的敲詐勒索率高達96%。

  另外,在今年3月,哥倫比亞大學數字新聞研究中心針對主流AI搜尋工具的研究發現,其可靠性堪憂。研究分別測試了8款AI搜索工具,發現AI搜索工具在引用新聞方面表現尤其不佳,平均出錯比例達60%。

  針對AI頻繁出現「幻覺」甚至威脅人類的事情,如何監管AI的發展成為了難題。各國各地區雖已意識到AI潛在危害,並相繼推出不同程度的監管措施,但這些探索仍處於初級階段。也有專家提出,科企公司本身就應承擔一部分管控AI風險的責任。對於AI監管而言,如何拿捏監管尺度,使創新與風險之間達到微妙平衡,以及如何實現國際協調,仍是兩大難題。

Read full story on Ta Kung Pao
Share this story on:-
More Related News
© 2008 - 2025 Webjosh  |  News Archive  |  Privacy Policy  |  Contact Us