商汤发布“日日新SenseNova 5.0”大模型，性能对标GPT-4 Turbo

添加书签

AIGC开放社区
2024-04-26

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

商汤科技SenseTime在上海、深圳等多地举办技术交流日活动，并发布行业首个“云、端、边”全栈大模型产品矩阵，以满足不同行业的场景化需求。

全新发布的“日日新SenseNova 5.0”大模型有6000亿参数，在众多知名基准测试平台中，其推理、代码、数学等能力超过或接近OpenAI的GPT-4Turbo，全面超过了Meta最新开源的Llama-3 70B。

值得一提的是，商汤科技在发布5.0模型后，股价大涨30%以上并触发紧急暂停交易。复盘后股价仍然上涨了17.5%，成为国内AIGC领域的一支“妖股”。

5.0在线体验地址：https://chat.sensetime.com/wb/home

日日新开放平台：https://platform.sensenova.cn/home

日日新5.0模型能力提升一方面得益于采用混合专家架构（MoE），激活少量参数就能完成推理，且推理时上下文窗口高达200K 左右；

另一方面其训练数据超过10TB tokens、覆盖了数千亿量级的逻辑型合成思维链数据，同时在商汤AI大装置SenseCore算力设施与算法设计实现联合调优。

日日新5.0另一大技术亮点是多模态能力，其图文感知能力达到全球领先水平，在多模态大模型权威综合基准测试MMBench中综合得分排名首位。

在多个知名多模态榜单MathVista, AI2D, ChartQA, TextVQA, DocVQA，MMMU取得领先成绩。

日日新5.0的多模态支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的交互能力。

为了满足移动终端用户对大模型技术的应用需求，商汤在发布会上海推出了日日新·端侧大模型，性能实现同等尺度性能最优，跨级尺度全面领先。

商汤日日新·端侧大语言模型的推理速度达到了业内最快，可在中端平台实现18.3字/s的平均生成速度，旗舰平台更是达到了78.3字/s。

扩散模型同样可在端侧实现业内最快的推理速度，端侧LDM-AI扩图技术在某主流平台上，推理速度小于1.5秒，比友商云端App快10倍，支持输出1200万像素及以上的高清图片，支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

活动现场，商汤还邀请到金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾，共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

自2023年起，商汤与金山办公达成深度合作，基于“日日新”大模型的卓越代码生成及工具调用能力，助力WPS365打造更高效释放场景能力的办公新质生产力平台，为企业构建专属的“企业大脑”。

金山办公CEO章庆元表示：“在办公应用场景内，商汤大模型的表现十分出色，能够帮助我们的用户解决办公中的复杂问题，提升效率。”

在汽车领域，近期爆火的小米SU7的智能车舱中便应用了商汤的大模型技术，基于商汤端云大模型解决方案，小米小爱同学为车主提供智能化交互体验。

小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示：“商汤的云边端全栈组合，可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”

据商汤科技披露的2023年年报显示，公司全年实现营收34亿元，毛利润为15亿元，毛利率44%。商汤科技通过生成式AI取得的收入大幅提升，2023年，公司生成式AI项目共计取得11.84亿元人民币的收入，增幅达200%，占公司总收入之比由2022年的10.4%提升至34.8%。

目前，联通、电信、移动、招商银行、海通证券、京东、小米、阅文集团等头部企业皆是其客户，同时商汤科技与清华大学、上海交大等名校长期保持技术合作关系，实现更好的技术创新和功能迭代。

2024年，商汤主要经营生成式AI、传统AI和智能汽车三大业务板块，并将生成式AI业务列为重点发展方向。

本文素材来源商汤科技，如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区

即将举行的活动