2022年DALL-E2引爆了AI作画领域,人们只要输入自己想要的内容和风格,机器就可以迅速画出一幅画,甚至对一些名画风格模仿之精准达到了难辨真假的程度;近期人工智能程序ChatGPT又因其“博学多才”“有问必答”风靡世界,大家饶有兴趣地与机器人谈古论今吟诗作赋。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,他们都是生成式AI的代表。生成式AI以其强大的内容生成能力和接近人类水平的“聪明”程度,给人们带来了巨大的震撼。

生成式AI即AIGC(AI-Generated Content),是一种专注于生成或创建新内容的人工智能。它利用现有的文本、音频或图像等大型数据集进行机器学习,然后生成全新内容。那么AIGC与过往的人工智能有什么不同呢?

首先是“无中生有”。传统模式中,人工智能给出的答复通常不会超出事先存入的数据库范围。生成式AI虽然和传统人工智能一样需要提前进行机器学习,然而它在收到指令信息后,给出的答复内容却并非是简单搜索复制数据库数据,而是进行了创造性地再创作。新生成的内容很多是训练数据中从未出现过的。比如有些生成式AI模型在“看”了几千张人脸后,可以画出一张它自己并没有“看”到过的人脸。从这个角度看,广义的AIGC可以看成是像人一样具备创造能力的AI技术。

其次是“自我训练”。AIGC是在基础生成算法的全面支撑下发展的。比如为人熟知的生成式对抗网络模型、Transformer、扩散模型等,这些算法使得机器可以在海量数据上进行无监督预训练,也就是“自己训自己”,大大缩短了训练时间。在此之前,模型机器训练就像一个孩子成长,标注数据就像是他的老师,通过人工的方式将一个个数据“打上标签”,再“喂”给机器海量的标注数据,这个过程需要耗费大量人力且低效。生成式预训练则不同,它降低了对标注数据的需求。人们可以将所有未标注数据一股脑“喂”给它,让AI自己去寻找和发现规律,进而分类、优选、积累和生成答案。在此基础上,人类只需要在给定任务的小规模有标注数据上进行微调,就能快速提升模型完成任务的能力。

最后是“走向通用”。AGI(Artifical General Intelligence)即通用人工智能是人工智能的巅峰理想。它可以简单理解为用一个模型处理任何事,而非只能用作单一用途,比如识别人脸或规划路径。AIGC正逐渐靠近这个理想,其背后的技术支撑为:第一,近些年,更多参数“大模型”正逐步取代传统“小模型”,且随着未来算力成本降低,模型会进一步增大,也越来越复杂;第二,随着生成式对抗网络(GAN)以及合成数据等技术和算法的发展,人类一切文字、图片,以及视频信息都可以被用来训练生成式AI,机器训练已经在一定程度上减轻了对于数据的依赖;第三,预训练模型显著提升了AIGC的通用性水平,同一个AIGC模型可以像“代工厂”和“流水线”一样,高质量地完成多种多样的内容生产任务;第四,多模态技术使得语言文字、图像、音视频等不同类型数据深度融合,逐渐打破了自然语言处理和计算机视觉“泾渭分明”的界限,这推动了产出的内容多样性,进一步增强了AIGC模型的通用化能力。

未来,生成式AI对现有的军事智能系统也将是一次全面的增强。如果将不同领域的系统整合起来,必将带来更大的浪潮。试想,熟知所有军兵种装备、又对各种战法和作战思想有所涉猎的“参谋们”,所制订的联合作战计划该是怎样的?战争期间,网上如果有一群机器每天散播大量信息并自动左右附和,同时上传假战地照片,将对作战造成怎样的影响?

任何技术都是一把双刃剑。生成式AI带给人类社会的,必将是彩虹和风雨共生,便捷与风险同在,机遇与挑战并存。这也就需要我们既“仰望星空”寻梦,又“脚踏实地”前行,勇敢接受新科技浪潮的洗礼。