
AI产出的影片以假乱真 如何辨识?
The Epoch Times
现在网路上充斥着人工智能(AI)产出的图像或影片,几乎到了以假乱真的地步,让人防不胜防,甚至受骗。但有专家说,有一个可靠的方法可以辨识出AI影片,那就是听人的声音。
大纪元此前报导,有一段介绍马来西亚霹雳州(Perak)某景点的AI短片在网上走红。该国一对老夫妇看了之后深受吸引,特地跑了三百多公里的路程前去探访,但到了当地才知道,该短片介绍的景点是虚构的,就连片中的众多游客与沿路介绍和访问游客的女记者也是不存在的。
针对如何避免像这对老夫妇一样被AI影片欺骗,有多名专家分享了为何AI影片中的声音和音效经常能暴露AI生成的明显迹象。
据《赫芬顿邮报》报导,真人说话有自然的节奏,有些字会说得慢一些。但AI合成的声音听起来往往都很急促,非常不自然。
专门拆穿社交媒体上的AI影片的专家卡拉斯科(Jeremy Carrasco)表示,他注意到OpenAI旗下的AI影片应用程式Sora所发布的影片通常“过于活跃”。他说:“他们说了很多,但实际上什么都没说,只是在塞进文字。”
就连OpenAI也意识到了这个蛛丝马迹。针对Sora的AI影片中出现破折号的意思,Sora的负责人皮普尔斯(Bill Peeples)先前在接受直播节目TBPN访问时的回答很能说明问题。
他回答说:“我认为目前的‘破折号’是Sora的一种略显怪异的语音模式,它喜欢快速地说出很多词。”
在语言学家看来,人们说话的节奏就是“协同发音”(coarticulation)。这是指人们在说话时,气流通过鼻腔和口腔,声音从一个音节自然过渡到另一个音节的过程。
但很多AI产生的语音在这方面做得仍不够好,会发出含糊不清的声音,听起来像是把自然音调压平了。



