如何评价一个新技术——以 ChatGPT 为例
2015 年的时候,我写过一篇文章《如何评价一个新技术——以 Docker 为例》,今天打算按照类似的风格,评价一下最近异常火爆的 ChatGPT。
八年以前,我对于 Docker 做出了极高的评价,我认为 Docker 是比 Java 更加重要的技术进步。现在看来,也基本上没有说错。Docker 开启了云原生时代,促使 Google 开源了 K8S。虽然 Docekr 这家公司似乎已经不再重要,但是容器技术,云原生技术,已经改变了整个行业。
现在,ChatGPT 出现了,以较之当年更加快的速度,火爆、流行、出圈,引发资本追捧,也引发各种担忧,似乎全世界都在讨论。当然,也有一些不以为然的言论,认为:不能神话、不该高估、不过如此等等。所以,应该如何来看待这样一种新技术呢?
之前想要评价 Docker 还是比较简单的,因为当时大家一眼就能明白,Docker 到底是什么。但是,ChatGPT 到底是什么呢?我最近密集的看了好多篇文章、好多个介绍视频、参与了微信群与 Twitter 上的好多轮讨论,最大的感受就是:“盲人摸象”。
有各种比喻,比较出名的比喻有:已经初具雏形的通用人工智能(张俊林),模糊的有损压缩(特德·姜),剽窃能手(乔姆斯基),互联网时代刚刚诞生的浏览器(王建硕),猜题专家(N 篇微信公众号)等等。
看了这么多盲人摸象的文章,我虽然依然不知道如何定义/定位 ChatGPT,但是至少我知道:ChatGPT 是大象那个级别的。
网上现在流传着很多与 ChatGPT 的对话截图,大家都喜闻乐见。毕竟无论是惊人还是搞笑,无聊还是浅薄,都是值得大家去围观的新事物。不过,我们应该琢磨得更加深一些,看看那些对话的表象,到底体现了一些什么重要的特征?而这些特征是以前的对话式 AI,所不具备的。
2月12日我在twitter上与人讨论,有了一个猜想:ChatGPT学习的单位,应该不是“文本”,而是“一个场景下的多轮对话”,所以他的自然对话能力本来就极强,经过这一个多月的人类调教,他肯定会变得更强。
但是,这个背后的一些观点,在 twitter上没法展开。
我曾经提出过一个机器学习的语料来源,就是开源社区里的 PR,包括:代码提交 Diff,围绕各种评论,不断的改进,然后代码是否被合入。这样的一个讨论串,有代码,有自然语言,有针对具体代码行的评论,有代码前后的变化,有最终的判别
结果。如果机器能够学习这样的素材,自然能够更好的提供编程的建议。
推广到社交网络上的各种素材,其实 BBS,Blog,邮件列表,各种聊天室,社交网络等等地方,到处都在发生着对话。
这些对话不是单一内容,单一场景,单一语言的(很可能是混杂,甚至不断跑题的)
这些对话展现的是人类互相理解,各自表达,互相交流的过程
在 ChatGPT 推出之后,这个过程发生在人机之间,每一次的对话(这个在 ChatGPT 的界面上分得非常清楚),每次人类对于对话的评价(有点赞按钮),都是人们在帮助 ChatGPT 在继续训练
人们在对话中纠正 ChatGPT 的内容,同样也是训练输入
我们一直在讨论的是 AIGC,在讨论 ChatGPT 生成的内容如何如何。但是,真正应该关注的是:ChatGPT 的对话能力,是使用 AI 增强的。
我曾经问过 ChatGPT 一个问题:英文语料的增加,是否能够帮助你的中文能力提升?
他的回答是:是的,英文语料的增加也可以帮助 ChatGPT 的中文能力提升。作为一种多语言的语言模型,ChatGPT 可以同时学习多种语言的语法和语义。如果 ChatGPT 在训练过程中接触到大量的英文语料,它就会学习到英文语法和语义,从而增强它对中文语言的理解能力。请注意,模型的多语言能力不同于它的语言翻译能力,它仍然需要通过大量专业的翻译语料来增强翻译能力。
看了这样的回答,我们可以关注和分析以下一些内容:
ChatGPT 采用多语言模型
其实不仅仅是多种自然语言,而是多种自然语言,加多种编程语言,再加多种“人造语言”(比如:Markdown、XML、CSS、CSV 之类)
这么多种类的语言,在 GPT 3.5 内部,应该是能够互相促进,互相增强的一个整体
代码与语言的混合输入输出,多语言之间的翻译,都是 ChatGPT 基于统一的模型产生的能力
例如:ChatGPT 的翻译不是“准确翻译”,是“意译”,这个其实更加厉害
再注意他回答的最后一句:“模型的多语言能力不同于它的语言翻译能力,它仍然需要通过大量专业的翻译语料来增强翻译能力”
在 ChatGPT 使用的各种语言料中,是进行分类的
不同种类的语料,各有专长,但是又能互相增强
这句话,是他自己想到要说的,我的问题中,其实不包含翻译能力的提问。我只能猜测,在其他的多轮对话中,已经有无数人,问过 ChatGPT 的翻译能力从何而来的问题了。
人类之间的对话,其实可能讨论任何事情。但是,在过去的人机对话中,我们往往会预设:这个 AI 只能回答某些种类的问题。但是,由于 ChatGPT 的语料,可能是任何现存的人类对话实例,所以:我们也可以预期:各种类型的对话,都可以尝试与 ChatGPT 交流试试。
至于人机交流的效果,取决于这一类对话的语料数量与质量。所以,现在大家都在探索,能够与 ChatGPT 之间,聊些什么。这会很有趣,也可能会令人“悚然而惊”。
我比较认同张俊林的判断:ChatGPT 已经可以被认为是一种通用人工智能。就是由于这种通用对话能力,简言之:他什么都能跟你聊一聊,而且有很大的概率:这些聊天还有点价值。无论我们如何评价他的“套话”,至少他不是在说“空话”,不是像某些聊天机器人,只会抬杠或者胡扯。
前几天,我与 ChatGPT 聊了一下 开源学的问题。说实话,我是非常吃惊的。因为:根本就还没有开源学这门学科,最多就是我们一群开源人,在一个非常小的圈子里,在做一些早期的尝试而已。
在我看来,这意味着 ChatGPT 能够填补空白。在人类已经发展出来的学科 A 与学科 B 之间,存在着交叉学科的可能性,而这样的可能性,通过与 ChatGPT 交流,启发思考,是很有价值的。
在 8 年前的文章中,我其实是为 Docker 度身定制了三个标准,现在也可以试试看能不能套用来评价 ChatGPT。
当然,ChatGPT 极大的提升了我们的工作效率,而且是在我们的很多在以前不得不自己去完成的那些无聊、琐碎的事物性工作时(比如,写周报)非常明显。当然,还有人用他来干各种各样的工作,都取得了或多或少的成果。
不过,ChatGPT 并不会为内容的真实性负责,所以如果自己不做核查,甚至刻意造假的话,也会带来复杂、困难的真实性困扰。
在 ChatGPT 出现之前,我们原本在做的一些事情,比如:搜索、学习英语、找朋友聊天,现在可能都只需要和 ChatGPT 聊聊。当然,在 Bing+ChatGPT 推出之后,这样的搜索可能会让人从 Google,转身投向 Bing 的怀抱。
确实,选择比以前更多了(对 Google 不是啥好消息)
ChatGPT 的易用性,与用途的广泛性,大家降低了使用 AI 的门槛。虽然最快达到 1 亿用户量,可能是一个虚假的(过于夸大的)数字。但是,铺天盖地的用户涌入 ChatGPT,开始与其聊天,肯定是不争的事实。
但是,这样的评价标准,对于 ChatGPT 来说,根本就不足以衡量其重要性。
这个其实是当初那篇文章的最后一段题外话,用来评价 Docker,已经有点过了,不过对于 ChatGPT 倒是正好。
Docker 事实上已经引发了质变,整个 IT 研发、DevOps 都随之发生变化。而 ChatGPT,从此改变人工智能的本质,甚至改变 IT 产业的本质,都是可以想见的了。
Docker 创造的行业还不多,也许 YAML 配置工程师算一个。不过,我们可以预感到:ChatGPT 提供的 API,可以催生更多的 AI 应用,这个领域将广阔得难以想象。
AIGC 的危害,到了能够以假乱真的 ChatGPT 出现之后,进入了一个新的阶段
多家科研期刊,已经明确禁止 ChatGPT 参与的论文写作与投稿
已经有专家在非常严肃的讨论:AI 失业问题
ChatGPT 的出现,是一个远比 Docker 的出现重要的事件。也许是“新工业革命”级别的信号!下一个节点,也许就是 AI 能够找到方法:自我训练,自我调优,自行进化。
由于GPT 4,甚至 GPT 5 也并非AI技术发展的天花板,因此在未来的 5~10 年,我们需要非常非常关注这个领域,其他所有的技术领域的重要性,都必须往后排了。
PS. 区块链、元宇宙、Web3 之类的技术,真的没那么重要了。
作者 | 庄表伟
编辑 | 李佳阳
相关阅读 | Related Reading