2022年人工智能图像技术迈大步

2023-01-03

来源：参考消息网

英国《新科学家》周刊网站12月27日刊登题为《2022年，人工智能让把一切绘制成图成为可能》的文章，作者是马修·斯帕克斯。内容编译如下：

2022年，人工智能（AI）继续在多个领域取得长足进步，但最大冲击之一可能是AI模型的出现。这些模型可以根据简单的描述性文本生成像照片一样逼真的图像。

可以让人们分享AI代码和数据集的Hugging Face网站的创建人之一托马斯·沃尔夫说：“要我说，这在2021年底还是完全出人意料的事。”

在2022年前，这种将文本转化为图像的AI还是一项相当不成熟的技术，其作品很粗糙。但到了今年，技术迅猛发展，以至于在今年美国科罗拉多州博览会的美术竞赛上获奖的作品之一就是AI创作的。

英国伯明翰大学的马克·李说，在硬件和软件优化的共同作用下，这项技术迅速发展。首先，研究人员开始将谷歌公司工程师2017年发明的一种名为转换器的算法用于生成图像。最初，此类AI模型被用于构建像“生成型已训练变换模型3”（GPT-3）这样的文本生成模型。

其次，硬件功能变得非常强大：在将大量显示卡转化为统一、高效的超级计算机方面不断取得进步。这种超级计算机适合完成像训练AI模型这样的任务，这使它们成为性价比明显更高的选项。

但李说，或许最重要的是，拥有训练这些模型的资金和资源的大公司开始免费提供部分研究成果，甚至向更大范围内的公众提供有限的使用机会。

李说：“人们原本预计这些大公司会完成所有这些工作，然后将成果据为己有，并靠它们赚钱。但将成果提供给更广泛的群体很有远见，因为如果这样做的话，就会有更多科学家涉足这个领域。”

沃尔夫说，尽管转换器模型在图像生成方面取得了初步进展，但一种名为扩散的新型算法最近几个月一直处于领先地位。

他说：“转换器能发挥作用，但它们往往会提供一些怪异的作品。扩散模型与转换器截然不同，它们能够创作出具有精细纹理的作品。我认为，正是这一点让这种新模型在达到‘令人赞叹的’效果方面脱颖而出。”

事实证明，这些AI已经带来了混乱。文学网站和杂志主编、图书封面创作者阿德里安·亚历山大·梅迪纳说，AI已经抢走了他的佣金，客户现在选择免费生成的图片，而不是付钱给人类创作者。

他说：“我和他们讨价还价……他们最终却换了一个方向，去购买或创作他们自己的、AI生成的封面。钱是他们的，他们有特权。不过，这确实令人沮丧和恼火。”

照片授权公司“快门存储”与研究机构开放人工智能公司甚至签署了一份协议。根据该协议，客户可以付费使用最新模型并按要求生成图像——梅迪纳把这比作“下水道的水漏到饮用水中”。

更令人恼火的是，AI模型必然都接受过海量数据集的训练，这些数据集包括从互联网上获取的海量图片。有人已经建了一个网站，允许人们搜索这些数据集，以寻找他们的作品已被纳入这种服务的证据。例如，如果你搜索《新科学家》就会发现，该刊此前的数百个封面已被纳入其中。

用人工智能创作定制艺术品所需的成本和时间将大幅减少，这最终可能会对人类创作者产生巨大影响。梅迪纳说：“一个人（利用人工智能）只花几个小时就能生成几十件作品，并将它们发给那些要么分不清好坏、要么根本不关心的客户。”