商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo

添加书签

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

商汤科技SenseTime在上海、深圳等多地举办技术交流日活动,并发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同行业的场景化需求。

全新发布的“日日新SenseNova 5.0”大模型有6000亿参数,在众多知名基准测试平台中,其推理、代码、数学等能力超过或接近OpenAI的GPT-4Turbo,全面超过了Meta最新开源的Llama-3 70B。

值得一提的是,商汤科技在发布5.0模型后,股价大涨30%以上并触发紧急暂停交易。复盘后股价仍然上涨了17.5%,成为国内AIGC领域的一支“妖股”。

5.0在线体验地址:https://chat.sensetime.com/wb/home

日日新开放平台:https://platform.sensenova.cn/home

日日新5.0模型能力提升一方面得益于采用混合专家架构(MoE),激活少量参数就能完成推理,且推理时上下文窗口高达200K 左右;

另一方面其训练数据超过10TB tokens、覆盖了数千亿量级的逻辑型合成思维链数据,同时在商汤AI大装置SenseCore算力设施与算法设计实现联合调优。

日日新5.0另一大技术亮点是多模态能力,其图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位

在多个知名多模态榜单MathVista, AI2D, ChartQA, TextVQA, DocVQA,MMMU取得领先成绩。

日日新5.0的多模态支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的交互能力。

为了满足移动终端用户对大模型技术的应用需求,商汤在发布会上海推出了日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。

商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。

扩散模型同样可在端侧实现业内最快的推理速度,端侧LDM-AI扩图技术在某主流平台上,推理速度小于1.5秒,比友商云端App快10倍,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

活动现场,商汤还邀请到金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

自2023年起,商汤与金山办公达成深度合作,基于“日日新”大模型的卓越代码生成及工具调用能力,助力WPS365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。

金山办公CEO章庆元表示:“在办公应用场景内,商汤大模型的表现十分出色,能够帮助我们的用户解决办公中的复杂问题,提升效率。”

在汽车领域,近期爆火的小米SU7的智能车舱中便应用了商汤的大模型技术,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。

小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”

据商汤科技披露的2023年年报显示,公司全年实现营收34亿元,毛利润为15亿元,毛利率44%。商汤科技通过生成式AI取得的收入大幅提升,2023年,公司生成式AI项目共计取得11.84亿元人民币的收入,增幅达200%,占公司总收入之比由2022年的10.4%提升至34.8%。

目前,联通、电信、移动、招商银行、海通证券、京东、小米、阅文集团等头部企业皆是其客户,同时商汤科技与清华大学、上海交大等名校长期保持技术合作关系,实现更好的技术创新和功能迭代。

2024年,商汤主要经营生成式AI、传统AI和智能汽车三大业务板块,并将生成式AI业务列为重点发展方向。

本文素材来源商汤科技,如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区