ChatGPT掀起软件AI进化风暴

添加书签

ChatGPT向AGI更近一步,通用人工智能赋能应用软件成为可能,其中与工具软件结合想象空间宽广。对应用软件厂商而言,接入AI大模型短期成本低,长期想象空间大,因此我们观察到绝大多数应用软件厂商均积极接入大模型能力。

目前,以ChatGPT为代表的AI大模型能力主要在于人机交互对话AI以及创成式AI,其与应用软件的结合主要涵盖AI+工具类软件、AI+搜索引擎、AI+服务类应用、AI+垂直行业应用等方向。中金公司研究部认为,其中创成式AI与工具类软件具有天然契合性,下游应用场景、想象空间广阔。

AGI大模型渐入佳境,创成式AI深度赋能工具软件

ChatGPT掀起全球AI热潮,通往AGI的道路亦或将近。ChatGPT(Chat Generative Pre-Trained Transformer)是由OpenAI开发的人工智能聊天机器人程序,其基于GPT-3.5大模型,能够完成相对复杂的语言处理任务,包括人机对话、自动文本生成、自动摘要、编写代码等,在2022年11月推出,上线两个月后用户数量即达到1亿规模,在全球范围内掀起又一轮AI热潮。ChatGPT的火爆让业界意识到AI行业在通往AGI(通用人工智能)的路途上更近一步,进而也引发了世界范围内对AGI未来会如何重塑各行各业的讨论与畅想。

全球范围内各类应用软件厂商积极拥抱以OpenAI为代表的人工智能新生态。在ChatGPT推出之后,微软计划对OpenAI追加100亿美元投资并在旗下搜索、办公软件中探索融合应用场景。由于ChatGPT显现出的巨大应用潜力与可能性,全球广大应用厂商也均开始积极尝试接入OpenAI的技术接口,以期AI与其现有产品能够产生新的化学反应。国内市场亦快速跟进,百度宣布旗下对标产品文心一言将于3月完成内测、面向公众开放,目前国内已有上百家企业宣布接入文心一言,其中不乏汉得信息、金蝶、宇信等企业服务软件厂商。同时,我们预计国内外将持续出现更多的大模型,吸引更多的应用软件厂商丰富、壮大AI生态。

目前以ChatGPT为代表的AI大模型能力主要在于人机交互AI能力以及创成式AI能力等,而其与应用软件的结合主要涵盖以下几个方向:

AI+工具类软件:辅助文字、图片、视频生产。AI与创作工具类软件的融合应用主要发挥的是ChatGPT等LLM大模型的创成式AI能力,其能够基于用户输入的指令和引导完成文字生成、图片生成、视频生成等辅助创作类任务。目前典型的应用代表包括文字类的Notion AI、Office(微软计划将ChatGPT接入);图片类的Stable Diffusion(Stability AI旗下)、Midjourney、DALL-E(OpenAI旗下)、Imagen(谷歌旗下)和视频类的Designs.ai、Make-A-Video(Meta旗下)、Lumen5等。

AI+搜索引擎:借助自然语言处理将传统的搜索点击转变为互动问答形式,并生成个性化结果。AI与搜索引擎的结合发挥的主要是基于自然语言处理的人机交互对话能力,以问答的形式帮助用户解决问题,即时生成个性化的规划、建议、分析等。典型代表包括接入ChatGPT能力后增加互动聊天和辅助写作功能的微软NewBing搜索引擎。

AI+服务类应用:发挥人机交互能力改善自助式服务体验。AI与服务类应用的结合主要以自助问答聊天机器人的形式落地,发挥LLM大模型的人机交互能力。典型代表包括电商、游戏、地图等各类服务应用场景中的智能问答、帮助机器人。

AI+垂直行业应用:与现有垂类行业应用结合,本质上亦归属于上述三种形态。典型代表包括宇信、汉得、金蝶、恒生电子等,融合大模型的人机交互、创成能力,实现更高效的信息获取、分析、形成智能解决方案等。我们认为,其本质上亦可以归类为上述三种形态中的某一种,未来需要进一步探索如何与垂直场景进行更好的结合,针对行业性语料进行更深度的训练以发挥更好的效果。

资料来源:各公司官网,中金公司研究部

在上述的应用方向与场景中,我们更为关注创成式AI与工具软件结合的可能性。以ChatGPT为代表的大模型应用中,创成式AI是较为突出的能力,且与现有的工具类软件(文字创作工具、图片创作工具、3D模型创作工具等)具有天然的契合性,下游应用场景广阔、颇具想象空间。因此在本篇报告中,我们将主要聚焦于创成式AI对工具软件的赋能,以及其长期重塑工具软件底层商业逻辑和产业生态的可能性。

创成式AI赋能工具软件将为其创造哪些可能性?从短期维度来看,目前创成式AI主要以嵌入到现有工具软件中的方式,作为创新性的辅助功能来帮助用户提升生产效率,厂商可以将其作为增值服务来额外收费;但从长期来看,如果未来创成式AI能够实现不依赖于用户引导的主动式创作,则其有望实现从生产工具向生产力的蜕变,真正意义上替代部分“创作人员”的工作。因此我们对于创成式AI的态度是,短期保守,长期不低估。

资料来源:同花顺财经,IT之家,新民晚报,新浪财经,中金公司研究部

短期维度:融合创成式AI提升生产效率,成为工具软件竞争的新焦点

目前创成式AI主要以嵌入现有工具软件的方式帮助用户提升生产效率。工具软件融合创成式AI后,能够在用户指定的框架、指令与引导下进行辅助式创作,进而帮助用户减少重复性、机械性、规则导向的劳作,甚至进而承担具有一定创造性的工作,比如基于指引在现有语料库基础之上收集归纳形成文字创作、基于文字描述生成图片与视频、在3D模型创作中辅助实现参数优化等。目前在文字、2D图片、3D模型、音频、视频等多个模态领域已有众多厂商选择参与探索实践:

创成式AI与文字创作:海外厂商如Notion内置了AI写作助手可以根据用户描述自动生成不同应用场景下的文本内容,微软亦计划在Office中接入ChatGPT能力;国内厂商如金山办公旗下WPS可以实现文档校对、全文翻译和辅助写作等功能。除了C端应用之外,亦有厂商开发了专门面向企业的AI辅助文字创作产品,典型代表为第四范式旗下的式说,能够将GPT这类大型生成式语言模型与企业内部垂直领域知识融合、同时保障私有化部署,以满足企业级应用对垂直行业知识、数据安全、内容可信等的要求。

创成式AI与图片创作:海外已有较多公司推出基于文字生成图像的产品,流行度较高的包括OpenAI旗下DALL E 2、Stability AI旗下Stable Diffusion、Midjourney等,其操作流程大多类似,输入关键词即可生成多幅AI绘画内容,并支持进一步修改和添加细节,各厂商在生成图片风格上各异,DALL-E2偏写实、Midjourney偏科幻、Stable Diffusion无风格偏向可根据细节指令多次尝试调整。国内亦有厂商跟进如昆仑万维旗下的天工巧绘和万兴科技旗下的万兴爱画等。

创成式AI与音频创作:海外厂商如谷歌在去年10月发布了AudioLM,可以根据输入的音频片段生成相似风格的音频,今年1月又推出MusicLM,可直接根据文字、图像生成音乐;微软也于今年1月发布了VALL-E,只需3秒音频即可模仿人说话,且可以复制说话者的情绪和语气;此外还有Stability AI旗下的Dance Diffusion、Open AI旗下Jukebox。国内亦有厂商跟进,包括讯飞配音、百度语音合成和腾讯智影等。

创成式AI与视频创作:海外厂商如Meta旗下的Make-A-Video支持根据文字描述生成视频;谷歌旗下Imagen Video和Phenaki分别支持不同画质和长短要求的视频创作,2月初其再次发布视频编辑新方法Dreamix,能够实现对已有视频的编辑和通过提供图片与描述生成视频;此外还有Runway推出的AI视频生成模型GEN-1。国内厂商亦有所尝试,如万兴旗下的万兴播爆支持根据关键词生成数字人宣传视频、百度孵化的VidPress支持导入图文后自动实现配音、字幕、画面的视频内容生产,此外还有当虹科技的画质增量类AI产品和商汤智影推出的辅助智能脚本创作产品。

创成式AI与3D模型创作:Creo、Autodesk Fusion360、Solid Edge、Solidworks等3D CAD产品目前已广泛集成AI Inside应用能力,主要用于辅助实现参数优化和草图生成;在EDA领域,Synopsys、Cadence等海外EDA厂商在AI赋能芯片设计上均有所探索,通过已有的设计数据训练模型,实现更高的设计效率。

工具软件与AI的融合能够优化用户体验与生产效率,提升产品竞争力。无论从带给用户“新奇感”还是从提升用户生产效率的角度,接入AI对于工具软件而言都是提升产品吸引力与竞争力的较优选择。同时由于短期接入大模型的试错成本较低,我们判断广大的工具软件厂商对于相关能力的接入都会抱有开放的态度,产业生态有望快速壮大。

但客观来看,目前的创成式AI仍具有多方面不足,主要作为辅助生产工具的形式出现。由于目前以ChatGPT为代表的创成式AI仍存在缺乏特定行业语料训练、语料库滞后、无法保证逻辑推理正确性等多种不足,因此短期仅作为辅助生产工具的形式出现,并不具备完全主动进行生产创作的能力。并且在使用的过程中,用户也需要额外注意可能存在的版权纠纷、敏感信息、偏见歧视等方面的问题。我们认为,创成式AI与应用软件融合仍处于起步阶段、提升空间广阔。

长期维度:创成式AI或将重塑商业逻辑,实现生产工具向生产力的跃迁

理想中的AGI能够将生产工具升级为生产力,重塑工具软件底层商业逻辑。长期来看,AGI(通用人工智能)融合工具软件应用具有较大的想象空间,产业中不乏将通用人工智能比作新一次“工业革命”以及“科技奇点”的观点。理想情况下,我们认为,未来真正的AGI将能够不依赖于人类用户的命令与引导进行创作,彼时,融合了AGI自主创作能力之后的工具软件将不再仅仅是辅助人类用户提效的“生产工具”,而成为独立的增量“生产力”。

AI赋能下的工具软件成为生产力后应直接参与生产价值的分配,生产价值由底层AI能力提供方与工具软件厂商共享。

我们认为,未来,如果AI赋能下的工具软件能够完成生产工具提供方向生产力提供方的转变,其商业逻辑将不再是间接收取提供工具的费用,而应直接参与生产价值的分配,比如一本完全由AI赋能的文字创作软件撰写的书籍,底层通用AI能力提供方与文字创作工具软件提供方均有权从书籍销售额中获得分成。

信息来源:中金公司研究部,作者于钟海

END

加入AIGC开放社区交流群

添加微信:13331022201 ,备注“职位信息&名字”

管理员审核后加入讨论群