百度要推中国版ChatGPT,质量待观察,审查不会少
Voice of America
美国研究机构开发的人工智能解答程序ChatGPT自去年11月横空出世后,在全球爆红,也引发中国用户关注。百度公司最近宣布,将推出类似的中文工具。分析认为,百度虽具技术实力,但中文版的同类工具质量能否与美版媲美还有待观察,其AI工具代入政治审查也将是必然。
ChatGPT:AI的核心技术突破
基于人工智能(AI)技术的对话式聊天工具已经出现多年,常常用于虚拟客服、企业培训等领域。不同于这些传统的对话软件,由美国OpenAI研究实验室开发的ChatGPT可以进行的对话更为复杂,凭借其海量数据储备,对任何提问来者不拒,甚至可以说笑话、起名字、吟诗作对——这些语言功能以前被认为是机器人无法掌握的创意工作。
同时,ChatGPT还具备编写和调试计算机程序的能力。美国宾夕法尼亚大学沃顿商学院教授克里斯蒂安·特尔维什(Christian Terwiesch)今年1月发表文章透露,ChatGPT通过了他主持的一次工商管理硕士(MBA)考试;最近,ChatGPT还通过了明尼苏达大学法学院教授给出的四项学生测试。
业界认为,ChatGPT标志着机器学习和人工智能的核心技术突破。
台湾AI实验室创始人、曾任微软公司AI部门亚太区研究总监的杜奕瑾最近在接受美国之音采访时说:“它(ChatGPT)利用庞大的资料、庞大的深入学习网路,透过非常高阶的高级电脑运算,透过这种运算出来的结果……透过理解完整的文件,去回答相对复杂的问题。”
杜奕瑾说:“要能回答的好,不管是文本的数量级、模型的复杂度、超级电脑的运算能力,都是有很大的突破才有办法做到这个结果。
ChatGPT界面简单,使用流畅,背后支撑的是美国科技公司的雄厚财力和技术实力,以及AI技术人才。
ChatGPT的技术依托于OpenAI实验室的“生成型预训练变换模型3”(简称GPT-3)。GPT-3这一大型语言模型出身谷歌公司2017年开发出的“Transformer”开放架构,可以写出与人类语言难以区分的文章。
乔治·华盛顿大学助理教授、研究AI相关政策问题的专家杰弗里·丁(Jeffrey Ding)对美国之音说:“早期的GPT-3模型基本上是在大量互联网文本上训练的,这方面的数据来自学术期刊文章,是在Reddit(网络论坛)、维基百科等语料库(corpus)上训练的。”
他说:“因此,这需要大量的数据、大量的计算能力,以及大量优秀的研究人员和工程师来确保训练以高效的方式进行……对于这些大型语言模型来说,入行门槛非常高。”