最近OpenAI推出的ChatGPT在短短几天内爆火全球,一时间几乎成了各种媒体竞相关注的话题。一开始好奇人们仅仅用常规问题测试这个互联网应用,由于拿到的生成结果相比于以往的AI对话应用出现了质的飞跃,于是更多人们用更加大胆的方式来使用ChatGPT,比如:让ChatGPT帮助写个短视频的拍摄剧本,帮助做个酒店装修的策划案,甚至开始用ChatGPT作为Unity 3D编辑器的输入端做简单的3D应用设计。于是,无论是科技圈、金融圈还普通人都开始兴奋于技术带来的变化。然而,在我看来,有更多的问题从脑际不断涌向,一起来思考下这些问题?
ChatGPT这么火有什么用,AI这个话题炒了这么多年,但是生活依旧啊?
我们之所以没有觉得AI并没有改变多少生活,是我们以往对于新技术的理解都是聚焦在具体且有形的对象上,比如:我们对新能源带来的变化体会深刻,是因为我们经常会看到成片的光伏发电站、风车阵以及满大街的新能源汽车。但是,AI技术带来的都是润物细无声的巨大改变,实际上我们每天都在使用AI,甚至我们每天的衣食住行都无法离开AI。比如:从你每天打开手机起,手机中的主流应用都会使用大量的AI调用来帮助你。当你打开购物软件,系统会使用推荐算法给你推荐你最可能买的商品,使用导航软件时,后台会通过预测算法帮你规划出最优路径,语音播报则采用了语音合成技术让声音更加自然如人声。即便你不使用手机,生活中的AI也是无处不在,停车场会通过OCR识别你的车牌,医院会使用图像识别来帮助医生辅助诊断,还有大家经常用到的自动驾驶等等。在过去的数年里,AI已经渗透到了各行各业的方方面面,而且还将继续加速渗透。我们的生产,生活,工作其实已经离不开AI,而这次ChatGPT的爆火,将标志着AI更加深刻的改变我们的工作,学习和生活,甚至堪比20世纪末的互联网技术革命。
ChatGPT会带来哪些改变?相比于数年前AI带来的变化有何不同?
在回答这个问题之前,我们首先来看ChatGPT是什么?ChatGPT本质是基于NLP(自然语言处理)大模型的对话机器人程序。这个对话机器人程序跟我们以往用过的微软小冰,小米,小度有什么不同呢?不同点就在于对话机器人智能上有了巨大超越已经十分接近甚至某些方面已经超越了人类单体的智能。而智能上这次超越,则可能对人类社会带来巨大的冲击和挑战。我们的生活,学习和工作会变得大不相同。ChatGPT带来的技术突破相比于前几年流行的AI技术革新:计算机视觉(CV)、光学字符识别(OCR)、语音识别(ASR)、语音合成(TTS)、增强学习、图像合成、内容推荐等等有了质的变化。变化在哪里呢?变化在于过去这些AI模仿和替代的是人类的局部智能,而这些能力被视为对于人类而言是繁琐且辛苦的工作。例如在几年前:机场需要比对当前乘机旅客是否是购票者,各种重要的会议和论坛需要进行内容速记和整理,因此在以往这些工作需要查票员和速记员来做,工作十分辛苦。而现在,这些基本都可以使用AI来做,效率非常高,人类可以去做更有创造力的工作,比如:做个插画师、设计师、影视编剧或者小说家。但是,ChatGPT的出现,则大不同了。它是冲着替代人脑的主要功能来的,也就是说它也可以做更加有创造性的工作,例如:它可以驱动扩散模型来生成插画、驱动各种DCC软件来设计、编写剧本和写作更是拿手好戏。这个时候,人类是不是有一丝脊背发凉?
如果说,几年的AI技术革新带来的是简单工作被机器替代,那未来几年将是更多复杂工作被机器替代。而这些,则将深刻地改变我们的生活、学习和工作,并且产生新的社会挑战。
国内在类似ChatGPT对话智能应用进展如何,ChatGPT如何落地国内呢?
首先,过去几年国内在AI领域的进步都十分巨大,这些技术能力全球排在第一梯队、与美国相当。然而,相比于成熟的AI技术,如:计算机视觉(CV)、光学字符识别(OCR)、语音识别(ASR)、语音合成(TTS)、增强学习、图像合成、内容推荐等等我们已经没有技术差距,我们的AI科学家和工程师可以独立设计网络模型和算法;在NLP技术上,依然存在差距,这个差距甚至大于Google,微软与OpenAI之间的技术差距。在过去的几年里,国内流行的NLP模型依然是基于Google的Transformers模型和升级的Bert模型。虽然过去两年也有国内技术公司发布的超大规模多模态模型,而且模型参数规模都号称超过了GPT-3模型的1750亿参数,但是,由于这些模型尚未以在线服务的形式供公众测试,因此不能判断与ChatGPT之间的差距。但是,还可以从另一个角度来判断,就是模型训练的计算规模,GPT-3的训练计算量,相当于1024片最新GPU芯片并行训练30天,到目前为止,国内尚无哪家公司宣称使用过此规模或者比这个更大的AI训练集群。由此判断,国内依然有差距,参考过去在成熟AI上的追赶速度,再考虑到国内研发能力的提升,差距应该是1-2年左右。也就是说,我们可能在2024到2025年实现与现在ChatGPT相当或更好的NLP能力。
关于ChatGPT如何在国内落地,首先要看ChatGPT在美国的落地形式。ChatGPT在美国是以Web应用和标准API的方式提供服务,并且是基于云服务的形式部署。之所以基于云服务,主要是因为模型极其庞大且用户众多,所需计算资源只能基于云端无限的计算能力。换个角度说,用户要使用ChatGPT就要把所有数据需要提供给ChatGPT的数据中心。因此,基于众所周知的原因,国内不大可能允许开放使用ChatGPT,而对方国家也不可能将如此庞大的模型数据和高科技软件放在中国部署。最可能的方式是中国公司开发自己的类ChatGPT应用,正好也在数天前,国内知名互联网公司某度宣布了要开发类似的聊天机器人。除了某度,国内还有几家互联网科技公司具备这样的实力,也许在这波热度的带动下,国内的NLP会迎来突破,我们拭目以待。
普通人如何与ChatGPT相处呢?
这本质不是与ChatGPT相处,而是与ChatGPT这样类型的AI技术相处。首先,我们在前面已经论述过了,ChatGPT这样的AI本质上是对人脑功能的模拟和替代,对于社会的影响可以从积极和消极两个方面来看。首先是看积极的方面,由于ChatGPT的加持,使得诸多专业能力可以通过ChatGPT这样的AI所补足,普通人也可以逾越这些专业能力的束缚,发挥想象力来产生超越人+机器智能的能力。这就如同普通人使用手机+傻瓜化短视频剪辑工具也可以拍出来以往只有专业人士才能拍出的视频一样。这会极大地降低许多工作的专业门槛,充分解放大家的创造力。但是,也将带来消极的一面。而且消极的一面带来的问题更多,其一是许多与语言相关的岗位将被ChatGPT替代,诸多的白领岗位将消失,这其中也将包括程序员(程序员是计算机语言使用者),取而代之的是需要少量精英程序员即可,其他工作则由ChatGPT来补足。其二是由于ChatGPT带来的低成本创作能力,使得人类极有可能被机器智能创造的内容淹没,能想到的办法就是用ChatGPT对付ChatGPT,用魔法打败魔法。但是目前并不乐观,像当前那些通过推荐算法提供信息流和视频流的APP已经实现通过人类创作的内容来淹没人类,我们耳熟能详的超级APP几乎都成了时间和精力的杀手。这些,可能并不能单纯依靠技术或者技术厂商的自律可以解决。
讲回普通人与AI的相处方式,就是把它当做新的生产生活工具,基于它来发挥创造力,实现人+机器智能的能力放大。
ChatGPT是AI技术带给人类的最大危机吗?
来分享一张图,也就是上图。这张图是我2021年6月在Bing.com上搜索到的,到今天很感叹这张图时间预测的精准性,其实背后也有清晰的逻辑,类似的图还有很多,背后的逻辑是人类计算成本的降低带来的机器智能的提升。图里其实有几个关键时间点:2015,2023,2045。2015年主要是我前面说到的普通AI技术的突破,2023年的突破猜测是ChatGPT这样的NLP技术带来的对于人类单体智能的超越,2045年这个时间点则是最大的危机,也就是机器智能将超过全人类的智能。如何去理解呢?大家看过《流浪地球2》的话,可以理解成MOSS的智能,它将比人类全体的智能更强,此时很多事情似乎将变得不由人类自己决定。
在过去的很多影视作品里,经常遇到计算机上的AI具备意识并且出现失控的情况。即使不出现计算机上的AI系统拥有自我意识的情况,这样的AI系统如果了控制了全人类的信息,那也是一件非常令人不安的事情。它可以控制电梯,生产线,红绿灯,火车,飞机,雷达,塔台,自动驾驶汽车,手术机器人,生命维持系统,通信网络等等是不是?
不过,每次技术革命,似乎大家都有很多不安,而人类总是可以逢凶化吉,期待技术进步带来的好处也许更为明智。
(完)
2021-12-16 电科技发布了 《罗永浩划定重返科技界目标:AR/VR/MR,下一站元宇宙?》的文章
2021-11-17 电科技发布了 《爱奇艺2021Q3财报发布:总收入76亿元 会员营收43亿元》的文章
2021-11-05 电科技发布了 《将3A大作带入大屏场景,乐播携手天翼推出云游戏主机》的文章
2020-03-23 电科技获得了沐晨的关注