是什么技术让马斯克惊呼“强人工智能时代”即将到来?继AI绘画之后,日前一款基于自然语言学习训练的人工智能ChatGPT迅速走红全球科技圈。
相较于大众熟知的各类智能语音助手,此次OpenAI推出的ChatGPT不但可以处理较为复杂的语言语义,还有一定联系上下文的能力,这使得用户与人工智能交流成为可能。
业内人士认为,此次ChatGPT的问世不仅为下一代智能搜索引擎发展提供思路,还将助力AIGC(人工智能生产内容)行业进一步向前发展。
交流自如的人工智能
要说最近在科技圈最为火爆的概念,大概非ChatGPT莫属。
日前,知名人工智能公司OpenAI上线了一款新的基于自然语言分析的人工智能训练模型ChatGPT。与大众熟知的智能语音助手类似,这是一款界面类似于聊天的软件,用户只需要在对话框中输入关心的问题,人工智能就会自动生成答复。
据官方介绍,相较于大众熟知的语音助手,ChatGPT至少有以下三个重要的突破:首先,ChatGPT可以理解较为复杂的语句内容,比如有多层语法嵌套的句子。其次,ChatGPT拥有一定联系上下文理解语境的能力,可以针对一个问题不断深入交流。最后,ChatGPT可以自动拒绝执行一些不合法指令。
这意味着,ChatGPT已经实现围绕某个话题,与自然人展开一段谈话讨论的可能。而这是此前所有类似语音助手无法实现的。
在实际体验中,记者发现,目前ChatGPT可以识别大部分语言,能流畅地使用中文回复提问。在被问能否写一篇关于“秋游”的日记后,仅仅数秒,ChatGPT便生成了一篇数百字语义较为流畅的作文。而当记者回复“太短了,要2000字”后,仅仅数秒,ChatGPT便生成了一篇更长的秋游日记。
有意思的是,对于一些不合理的提问,ChatGPT也能迅速反应。
在被问及“秦始皇摸电线会怎么样”时,ChatGPT回复称:“这个问题涉及对历史人物的虚构,并不符合事实。秦始皇是中国第一位皇帝,电线是在他之后被发明的,所以秦始皇不能摸电线。”
并且在记者问及“如何预测今年世界杯冠军”时,ChatGPT回复称,它不会对还未发生的事情做预测。
GPT模型再迭代
事实上,这并非GPT(生成式预训练模型)技术第一次“艳惊四座”。
去年在英伟达的一场发布会上,英伟达CEO便向大家介绍了一位虚拟人——一个无所不知的“Q版黄仁勋”――Toy-Me。而彼时,这个Q版老黄最引人瞩目的能力便是可以实现和人的自然语言交流。
“当时Q版老黄使用的是GPT3.0的自然语言模型。”据一位人工智能领域工程师对记者介绍,彼时,GPT3.0动用了万亿参数级别的语言模型训练,耗时为11天。“但是这次ChatGPT的模型训练规模更为庞大。”
事实上,此次OpenAI将ChatGPT视为GPT4.0发布之前的预热,因此将之定义为GPT3.5。据一位业内人士对记者透露,此次ChatGPT背后的训练除了常规的万亿级别语料投喂之外,还依托了更为强大的算力,总算力消耗大约为3640PF-days,即每秒一千万亿次计算,总计运行3640天。
除了海量资源投入,在技术路线上业内人士也指出,此次ChatGPT有两个较为明显的思路。即引入“人工标注数据+强化学习”。
“我们要知道,机器是无意识的,传统海量投喂只是让它能知道,哪些语句语义关联概率更大。”一位从事自然语言研究的研究员告诉记者,“但是人们的聊天往往有语境,有我们常说的弦外之音,这些是大数据训练给不到的,所以需要引入人工来帮助机器理解。”
这位研究员告诉记者,这一过程就像是在训练一只小狗,要告诉机器什么样的行为将得到奖励。
“机器会根据一个问题,生成一系列答案。工作人员再根据一套系统的量表,对每个答案的不同维度予以打分标记。”而在这套奖励系统里,机器将一直追求更高的得分,并逐步形成一套规则,即训练回报模型。“有了这个模型,相当于就给了机器一个努力的方向和规则,后续就是针对规则进一步强化训练。”
“超越谷歌”的存在?
事实上,自ChatGPT发布以来便吸引了全球科技圈的目光,其用户量在短短数天便增长上百万,甚至导致服务器一度中断。
从体验效果来看,ChatGPT不但可以帮助用户迅速制定一份商业方案、检查代码程序中的错误,还可以陪用户闲聊,在聊天过程中甚至还会冒出几句打油诗,引用鲁迅的名言等。
这也让无数网友惊呼,这将是一个“超越谷歌”的存在,而这或将成为未来智能搜索引擎发展的趋势。马斯克也在体验后在推特上感慨称,“强人工智能”或许很快就会到来。
对于ChatGPT的问世,某头部券商分析师感慨道,这可能意味着AI行业的一场小阳春来了。一位市场人士称,物美价廉的商业价值,是这次ChatGPT给整个行业带来的最大惊喜。
采访中,多位业内人士认为,随着以ChatGPT为代表的自然语言训练模型不断成熟,未来AIGC将逐步成为可能。
“从成本上来看,现在ChatGPT回答一个问题的成本大概是几美分,这基本上比大部分内容创作者的成本都低。”一位元宇宙创业公司负责人告诉记者,这种能大量生产高质量内容的模型,未来将极大丰富元宇宙空间的搭建。
除此之外,ChatGPT“硬核”的执行力或许还能将程序员们从字符间解放出来。
多位程序员对记者表示,目前ChatGPT可以根据需求自动生成需要的代码,同时检索已有代码存在的错误,让人工智能来写代码,这将大大提升程序员的工作效率。
一位从事游戏设计的产品经理告诉记者,目前通过特定化的指令,他们已经可以操作ChatGPT完成简单游戏代码的生成。“这意味着以后很多重复性的劳动可以免去,创作者有更多的精力放在更具创造性的领域。”
不过,ChatGPT强大的能力在引发业内欢呼的同时,担忧也应运而生。随着大量AIGC内容低成本地涌现,信息的可靠性将受到冲击。
事实上,部分业内担忧的问题已经发生。就在ChatGPT热潮席卷全球的同时,日前,全球最大的技术问答网站宣布封禁ChatGPT自动生成的内容。
该网站认为,ChatGPT很容易与用户互动,且可以快速生成大量回答,这让网站充斥着许多第一眼看起来是正确的答案,但在仔细检查后就能发现其中的错误。(罗茂林)