文心一言初体验:让“子弹”再飞一会儿
添加书签
作者丨董子博
编辑丨岑峰
千呼万唤始出来,文心一言终于正式发布。
3月16日,背负着整个国内科技圈子的期待,百度的压力不小。李彦宏也相当少有地亲自走上舞台,在聚光灯下聊起了产品,和百度的初心。
“最近一段时间,很多朋友问我:‘为什么是今天,你们真的ready了吗?’”
刚一开场,李彦宏就直面这个最受人关注的问题——讲到这里,如常穿着白色衬衣的李彦宏目光直视人群,并没盯着提词器,似乎是临时有感而发。
诚然,不过几天前,GPT-4强势登场。前代ChatGPT本就如同一道高墙,令人仰止;GPT-4则是在理解能力上更进一步,又有多模态如虎添翼——珠玉在前,百度的文心一言,将不可避免地被与GPT对标。
对于GPT,李彦宏不仅没有豪气干云的姿态,相反态度都相当保守,话只说七分满。
“不能说我们完全ready了……我自己测试感觉还是有很多不完美的地方。”李彦宏如是说道。
但文心一言的发布,在今天是势在必行。市场上已经有了太多的需求,呼唤着这样一款AI的生产力产品。李彦宏说:
“短短一个月的时间,就有超过650家合作伙伴宣布加入文心一言生态……百度希望和大家一起……让所有人都能够使用最先进的生产力工具,让所有人都能从中受益。”
随后在会上,李彦宏带头展示了文心一言文学创作、商业文案创作、数理推算、中文理解、多模态生成。在视频演示里,文心一言展现出了不错的检索、文本生成、归纳总结和逻辑推理能力,还能完成音频、图像、视频的生成,结合百度在NLP时代积累的知识图谱,甚至让文心一言表演了一段四川话,也算是饶有趣味。
作为一家AI公司,百度有近水楼台的智能云、充裕且体系健全的算力、运行平稳的深度学习框架、一群具有多年AI开发经验的人才,最重要的,还有一个日活数十亿搜索引擎来提供中文的本地化数据——某种程度上,距离大模型的完成形态,具备了大多数的硬条件。
透过文心一言,看整个市场可能的未来,李彦宏表示,一方面,新型的云计算公司,会通过MaaS(模型即服务)的方式,改变云计算行业的游戏规则;
另一方面,在模型重要性急剧上升的环境下,大模型的行业化、客制化就相当重要,有能力做模型精调的公司也会随之崛起;
不仅如此,基于大模型底座的应用开发,也会逐渐成为主流,李彦宏判断,不少新巨头会从中诞生,大模型如同金矿一样,为行业带来的无限可能性,还静静地等待着有人发掘。
“我们相信,人工智能会彻底改变我们今天的每一个行业,”李彦宏说道,“AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。”
要以文心一言突破行业,百度AI有哪些技术在背后支持?百度CTO王海峰随后上台,对技术问题做了简单的讲解。
王海峰表示,全栈的AI能力,是新一代人工智能产品背后坚实的技术支持。底层有昆仑芯的芯片支持,提供稳定可靠的算力和硬件基础;中间有飞桨产业级深度学习开源开放平台,提供核心框架、开发套件、工具组件等;再上一层,则是与各个场景深度接合的行业模型;最顶层则是产品层,依托AI模型的赋能,在显示的场景中提供各异的服务。
文心一言的技术模块上,一方面,是传统的SFT、RLHF和Prompt;另一方面,则是具有百度特色的知识增强、搜索增强和对话增强。
前三者,对于大模型构建来说,是老生常谈的基础操作;而后三者,则是通过百度长期积累下来的知识图谱、搜索引擎以及NLP对话技术,对大模型范式发展的创新之举。
知识增强,是指使用知识图谱,用更少的参数完成对大模型的高效训练,以实现降本增效;
搜索增强,则是利用了百度有过多年积累的搜索技术,通过语义理解和匹配,完成一个双塔模型,对生成模型进行联合优化,“这样我们可以把检索里面有价值的结果——比如一些精准的信息——带进生成里去,使生成效果更好”;
而对话增强,是依托在百度过去的对话AI——PLATO,以在PLATO上积累的经验,完成AI对语境的记忆,并提升AI的对话规划能力。
测试版发布
这次发布,百度令不少人诟病的,是李彦宏在谈到文心一言的能力时,并没有实际使用,而是放出了一个演示视频,并且似乎完全没有掩饰的意图,被人评价:就如同歌手假唱,而且连话筒干脆都不拿了。加之李彦宏、王海峰在会上的谨慎态度,不由得更加令人浮想联翩。
有人把这解读为,百度高层自己对文心一言,都没有百分之百的信任。
这样的声音,一定程度上也同样反映了在资本市场上:发布会开始不久,百度在港股的股价就开始急剧下跌,尽管后来有所波动,最终收盘跌幅8.50%。
当然,这并不是百度今日唯一被诟病的地方,差强人意的录播Demo、听上去并不“性感”的技术路径,更别提如同一片阴云笼罩在文心一言上空的GPT-4——文心一言似乎并非在众人的祝福下“出生”,而是从一开始,就被质疑和唱衰所包围。
而在会后,百度就放出了文心一言的邀请内测码,本着“是骡子是马拉出来遛遛”的精神,AI科技评论也加入了测试。测试的队伍一度十分火爆,甚至进入测试页面都有困难。
而在测试之后,AI科技评论发现,李彦宏和王海峰的谨慎不无道理:文心一言的不少能力,目前似乎还并没能达到及格线。
先以数学问题解决作为开始,首先是一则二元一次方程组:
一眼看上去似乎格式似乎还有些工整,但结果却驴唇不对马嘴:文心一言似乎完全无法理解方程组的解法,不仅如此,它还顽固地相信305-150=105。
可能二元一次方程对它来说太难了,第二个问题难度有所降低,是一个一元一次方程:
不必看,结果更是完全错误。
那在发布会上展示的鸡兔同笼问题呢?首先,如同在发布会上的场景类似,AI科技评论特地输入了一条错误的问题:
文心一言扳回一城,完成了发布会上实现过的操作,于是AI科技评论修改了问题:
终于,在鸡兔同笼问题上,文心一言不辱使命,给出了一个正确的答案。
再看看信息检索、归纳总结的能力:
在这个问题的回答下面,文心一言则是展示了两个ChatGPT的“传统艺能”——胡说八道和知错能改。
于是,下面为了“难为”文心一言,AI科技评论又要求他以电影的情节作诗一首:
从诗词创作的角度上,押韵到位,但平仄外行;从电影情节理解的角度上,虽然没有严丝合缝,但也相差不远。
往下,我们又提出了一个问题:
本来以为是个相当简单而常规的问题,文心一言又开始“胡说八道”,《勇敢的心》不仅被“翻译”成了“勇往直前”,故事的情节也被“篡改”成了父亲保护家人的故事;同时,语料“不惜一切代价”的出镜率也相当高,高得堪称离奇。
而在被李彦宏基于极高希望的To B领域,文心一言的分析能力如何?AI科技评论又一次向文心一言抛出了问题:
除了“老龄化会对环境造成影响”这点值得商榷以外,其他方面分析得中规中矩。AI科技评论又跟进问出了一个问题:
经历了之前的几轮问答,这次文心一言给出的答案相当令人信服,甚至让人有些喜出望外——至少在商业和产业领域,文心一言还是显得相当稳重,能提出一些靠谱的观点和建言。
测试过后,文心一言最后的一层面纱也被揭露,对于外界再也没了神秘可言。
AI科技评论看到,有网友在社交媒体上直言:这下不用担心AI取代了。下面配的图则是他与文心一言的测试问答。
对比港股昨天在信心低落中惨淡收盘,百度在纳斯达克的股价则是一路走高,截止收盘涨幅5.06%。
昨天为什么相比港股,华尔街对于百度的信心更足?
或许因为:时至今日,文心一言仍然是国内唯一一个,由大厂发布的类ChatGPT产品。
当下,除非客观条件出现重大改变,GPT系列在国内的地位相当尴尬——就算OpenAI把技术做出了花,但在国内如果没有合法地位,对于中国用户和开发者,GPT就只能是可望不可及的“白月光”。
而在这个背景下,文心一言的面前拥有着大量的市场真空。
抛开落地应用,单拼技术强度,这种言论某种程度上有些强词夺理。
在生成式AI的赛道竞逐中,作为最早一批“在雪地上留下脚印”的人,百度给人的态度并不争强斗狠,在技术上要和对手争个你死我活;反而更谦卑、更落地,更在意如何利用现有的技术和产品,让文心一言发挥实际作用,给市场带来更多创造价值的可能。
让文心一言这颗“子弹”再飞一会,这个判断并非基于盲目的乐观和信任,而是看好务实的商业模式下,可能形成的“数据飞轮”。
当下据披露,已有超过650家企业,宣布加入文心一言的生态。本着“先让产品被用起来”的务实思路,有更多人使用,就势必产生更多直接的高质量数据,也就越能让产品实现进化和完善——这样“以用带研”的思路,就是AI工程化相当使用的一种路径。
Quick and dirty,敏捷、“土味十足”,却行之有效。
在商业之路上,相对领先者与追赶者采取不同的发展战略,是理所应当。
作为行业先头的OpenAI,就应当一马当先,以强大的科研实力铸造竞争壁垒,巩固自己的先头地位;
而后进者,如果固执高举高打,技不惊人死不休,反而会错过最好的超车时机。
放下身段,反而能降低阻力,以求得更快速的前进。
“整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。未来这段时间它一定会飞速发展
来源:AI科技评论
END
加入AIGC开放社区交流群
添加微信:13331022201 ,备注“职位信息&名字”
管理员审核后加入讨论群