ChatGPT走红出圈 AI再迎小阳春

2022-12-09

来源：中国证券网

是什么技术让马斯克惊呼“强人工智能时代”即将到来？继AI绘画之后，日前一款基于自然语言学习训练的人工智能ChatGPT迅速走红全球科技圈。

相较于大众熟知的各类智能语音助手，此次OpenAI推出的ChatGPT不但可以处理较为复杂的语言语义，还有一定联系上下文的能力，这使得用户与人工智能交流成为可能。

业内人士认为，此次ChatGPT的问世不仅为下一代智能搜索引擎发展提供思路，还将助力AIGC（人工智能生产内容）行业进一步向前发展。

交流自如的人工智能

要说最近在科技圈最为火爆的概念，大概非ChatGPT莫属。

日前，知名人工智能公司OpenAI上线了一款新的基于自然语言分析的人工智能训练模型ChatGPT。与大众熟知的智能语音助手类似，这是一款界面类似于聊天的软件，用户只需要在对话框中输入关心的问题，人工智能就会自动生成答复。

据官方介绍，相较于大众熟知的语音助手，ChatGPT至少有以下三个重要的突破：首先，ChatGPT可以理解较为复杂的语句内容，比如有多层语法嵌套的句子。其次，ChatGPT拥有一定联系上下文理解语境的能力，可以针对一个问题不断深入交流。最后，ChatGPT可以自动拒绝执行一些不合法指令。

这意味着，ChatGPT已经实现围绕某个话题，与自然人展开一段谈话讨论的可能。而这是此前所有类似语音助手无法实现的。

在实际体验中，记者发现，目前ChatGPT可以识别大部分语言，能流畅地使用中文回复提问。在被问能否写一篇关于“秋游”的日记后，仅仅数秒，ChatGPT便生成了一篇数百字语义较为流畅的作文。而当记者回复“太短了，要2000字”后，仅仅数秒，ChatGPT便生成了一篇更长的秋游日记。

有意思的是，对于一些不合理的提问，ChatGPT也能迅速反应。

在被问及“秦始皇摸电线会怎么样”时，ChatGPT回复称：“这个问题涉及对历史人物的虚构，并不符合事实。秦始皇是中国第一位皇帝，电线是在他之后被发明的，所以秦始皇不能摸电线。”

并且在记者问及“如何预测今年世界杯冠军”时，ChatGPT回复称，它不会对还未发生的事情做预测。

GPT模型再迭代

事实上，这并非GPT（生成式预训练模型）技术第一次“艳惊四座”。

去年在英伟达的一场发布会上，英伟达CEO便向大家介绍了一位虚拟人——一个无所不知的“Q版黄仁勋”――Toy-Me。而彼时，这个Q版老黄最引人瞩目的能力便是可以实现和人的自然语言交流。

“当时Q版老黄使用的是GPT3.0的自然语言模型。”据一位人工智能领域工程师对记者介绍，彼时，GPT3.0动用了万亿参数级别的语言模型训练，耗时为11天。“但是这次ChatGPT的模型训练规模更为庞大。”

事实上，此次OpenAI将ChatGPT视为GPT4.0发布之前的预热，因此将之定义为GPT3.5。据一位业内人士对记者透露，此次ChatGPT背后的训练除了常规的万亿级别语料投喂之外，还依托了更为强大的算力，总算力消耗大约为3640PF-days，即每秒一千万亿次计算，总计运行3640天。

除了海量资源投入，在技术路线上业内人士也指出，此次ChatGPT有两个较为明显的思路。即引入“人工标注数据+强化学习”。

“我们要知道，机器是无意识的，传统海量投喂只是让它能知道，哪些语句语义关联概率更大。”一位从事自然语言研究的研究员告诉记者，“但是人们的聊天往往有语境，有我们常说的弦外之音，这些是大数据训练给不到的，所以需要引入人工来帮助机器理解。”

这位研究员告诉记者，这一过程就像是在训练一只小狗，要告诉机器什么样的行为将得到奖励。

“机器会根据一个问题，生成一系列答案。工作人员再根据一套系统的量表，对每个答案的不同维度予以打分标记。”而在这套奖励系统里，机器将一直追求更高的得分，并逐步形成一套规则，即训练回报模型。“有了这个模型，相当于就给了机器一个努力的方向和规则，后续就是针对规则进一步强化训练。”

“超越谷歌”的存在？

事实上，自ChatGPT发布以来便吸引了全球科技圈的目光，其用户量在短短数天便增长上百万，甚至导致服务器一度中断。

从体验效果来看，ChatGPT不但可以帮助用户迅速制定一份商业方案、检查代码程序中的错误，还可以陪用户闲聊，在聊天过程中甚至还会冒出几句打油诗，引用鲁迅的名言等。

这也让无数网友惊呼，这将是一个“超越谷歌”的存在，而这或将成为未来智能搜索引擎发展的趋势。马斯克也在体验后在推特上感慨称，“强人工智能”或许很快就会到来。

对于ChatGPT的问世，某头部券商分析师感慨道，这可能意味着AI行业的一场小阳春来了。一位市场人士称，物美价廉的商业价值，是这次ChatGPT给整个行业带来的最大惊喜。

采访中，多位业内人士认为，随着以ChatGPT为代表的自然语言训练模型不断成熟，未来AIGC将逐步成为可能。

“从成本上来看，现在ChatGPT回答一个问题的成本大概是几美分，这基本上比大部分内容创作者的成本都低。”一位元宇宙创业公司负责人告诉记者，这种能大量生产高质量内容的模型，未来将极大丰富元宇宙空间的搭建。

除此之外，ChatGPT“硬核”的执行力或许还能将程序员们从字符间解放出来。

多位程序员对记者表示，目前ChatGPT可以根据需求自动生成需要的代码，同时检索已有代码存在的错误，让人工智能来写代码，这将大大提升程序员的工作效率。

一位从事游戏设计的产品经理告诉记者，目前通过特定化的指令，他们已经可以操作ChatGPT完成简单游戏代码的生成。“这意味着以后很多重复性的劳动可以免去，创作者有更多的精力放在更具创造性的领域。”

不过，ChatGPT强大的能力在引发业内欢呼的同时，担忧也应运而生。随着大量AIGC内容低成本地涌现，信息的可靠性将受到冲击。

事实上，部分业内担忧的问题已经发生。就在ChatGPT热潮席卷全球的同时，日前，全球最大的技术问答网站宣布封禁ChatGPT自动生成的内容。

该网站认为，ChatGPT很容易与用户互动，且可以快速生成大量回答，这让网站充斥着许多第一眼看起来是正确的答案，但在仔细检查后就能发现其中的错误。（罗茂林）