京东版“ChatGPT”也要来了！千亿级参数，生成文字30亿+

添加书签

AIGC开放社区
2023-04-09

专注AIGC领域的专业社区，关注GPT-4、百度文心一言、华为盘古等大语言模型（LLM）的发展和应用落地，以及国内LLM的发展和市场研究，欢迎关注！

4月8日，每日经济新闻消息，由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。论坛上，京东集团副总裁何晓冬、华为云人工智能领域首席科学家田奇现身发表演讲。

京东集团副总裁何晓冬：京东将在今年发布新一代产业大模型

据证券时报，何晓冬表示，针对真实的产业需求，京东将在今年发布新一代产业大模型，言犀是“京东版”ChatGPT，言犀大模型预训练参数达到千亿级，品类覆盖3000+，人工审核通过率95%+、生成文字30亿+。

何晓冬认为，ChatGPT是深度学习不断发展的结晶，是第一款真正意义上的AI原生产品。由于ChatGPT能实现人类意图来自于机器学习、神经网络以及Transformer模型的多种技术模型积累，可以说ChatGPT升级了AI创新范式。

此外，何晓冬指出，在以往模型的基础上，现在的ChatGPT模型有了多方面的显著提升，如更大的语料库、更高的计算资源、更加通用的预训练、更高的准确性、更高的适应性和更强的自我学习能力等等。

伴随着参数规模增速的不断提升，算力和训练成本仍存在瓶颈，大模型的性能天花板远未到来。同时，算法需要根据硬件优化，包括芯片级优化，数据中心架构、机器学习分布式架构在内的软硬件调优等算力创新将成为破局关键，转动起AI算力-AI应用的产业飞轮。

据何晓冬介绍，目前，京东在任务型智能对话交互方向上取得了一系列成果。在任务型智能对话交互探索方面，京东可以帮助用户通过语音、文本、数字人等多种人机对话形式完成复杂任务，比如客服等，实现高表现力、可控、可信的智能对话体验。

但在知识指导的多模态可控对话生成方面，目前难点在于生成语音时对上下文的建模不足，导致生成的声音缺乏表现力；在多轮对话决策推理方面，目前难点在于用户口语化、不规律停顿等问题情况下的人机话语权决策问题。就此问题，何晓冬在现场与京东AI客服通电话，为大家进行了演示。

本文素材来源每日经济新闻，如有侵权请联系删除

END

加入AIGC开放社区交流群

添加微信：13331022201 ，备注“职位信息&名字”

管理员审核后加入讨论群

即将举行的活动