京东版“ChatGPT”也要来了!千亿级参数,生成文字30亿+

添加书签

专注AIGC领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展和应用落地,以及国内LLM的发展和市场研究,欢迎关注!

4月8日,每日经济新闻消息,由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。论坛上,京东集团副总裁何晓冬、华为云人工智能领域首席科学家田奇现身发表演讲。

京东集团副总裁何晓冬:京东将在今年发布新一代产业大模型

据证券时报,何晓冬表示,针对真实的产业需求,京东将在今年发布新一代产业大模型,言犀是“京东版”ChatGPT,言犀大模型预训练参数达到千亿级,品类覆盖3000+,人工审核通过率95%+、生成文字30亿+

何晓冬认为,ChatGPT是深度学习不断发展的结晶,是第一款真正意义上的AI原生产品。由于ChatGPT能实现人类意图来自于机器学习、神经网络以及Transformer模型的多种技术模型积累,可以说ChatGPT升级了AI创新范式。

此外,何晓冬指出,在以往模型的基础上,现在的ChatGPT模型有了多方面的显著提升,如更大的语料库、更高的计算资源、更加通用的预训练、更高的准确性、更高的适应性和更强的自我学习能力等等。

伴随着参数规模增速的不断提升,算力和训练成本仍存在瓶颈,大模型的性能天花板远未到来。同时,算法需要根据硬件优化,包括芯片级优化,数据中心架构、机器学习分布式架构在内的软硬件调优等算力创新将成为破局关键,转动起AI算力-AI应用的产业飞轮。

据何晓冬介绍,目前,京东在任务型智能对话交互方向上取得了一系列成果。在任务型智能对话交互探索方面,京东可以帮助用户通过语音、文本、数字人等多种人机对话形式完成复杂任务,比如客服等,实现高表现力、可控、可信的智能对话体验。

但在知识指导的多模态可控对话生成方面,目前难点在于生成语音时对上下文的建模不足,导致生成的声音缺乏表现力;在多轮对话决策推理方面,目前难点在于用户口语化、不规律停顿等问题情况下的人机话语权决策问题。就此问题,何晓冬在现场与京东AI客服通电话,为大家进行了演示。

本文素材来源每日经济新闻,如有侵权请联系删除

END

加入AIGC开放社区交流群

添加微信:13331022201 ,备注“职位信息&名字”

管理员审核后加入讨论群