商汤近日发布日日新50江南体育及全栈大模型产品矩阵

　　在日前举行的技术交流日活动中，商汤科技方面发布了自研大模型日日新SenseNova的5.0版本（以下简称为日日新5.0）。据了解，日日新5.0基于超过10TB tokens训练、覆盖大量合成数据，在采用混合专家（MoE）架构推理时，上下文窗口可以有效到200K左右。

　　据悉与上代相比，日日新5.0知识、数学、推理及代码能力均得到增强，且号称在主流客观评测上达到或超越GPT-4 Turbo，同时还几乎全方位碾压近期发布的Llama 3-70B。

　　具体而言，在文科能力方面，日日新5.0的创意写作能力、推理能力以及总结能力均大幅提升，相同的中文知识注入后，可以获得更好的理解总结及问答，为教育、内容产业等垂直应用场景提供有力辅助。在理科能力方面，日日新5.0的数理能力、代码能力及推理能力均达到业内领先水平，为金融、数据分析等场景落地提供坚实基础。

　　此外在多模态能力上，日日新5.0的图文感知能力达到全球领先水平，在多模态大模型权威综合基准测试MMBench中综合得分排名首位，并在多个知名多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA，以及MMMU等中取得了领先的成绩。

　　对此，商汤科技董事长兼首席执行官徐立表示，“日日新5.0大模型体系综合能力全面对标GPT-4 Turbo，技术领跑加速生成式AI向产业落地的全面跃迁，实现大模型按需所取”。同时他还指出，在人工智能发展的最基本法则尺度定律（Scaling Law）的准则下，商汤科技将持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界，为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

　　在此次活动中，商汤科技方面还发布了行业首个“云、端、边”全栈大模型产品矩阵，包括应用于终端设备的“商汤端侧大模型”，以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”等，以满足不同规模场景的应用需求。其中以商汤端侧大模型为例，据了解，该大模型可满足各类终端用户对大模型技术的应用需求，推理速度在中端平台可实现18.3字/s的平均生成速度，在旗舰平台则可达78.3字/s。

　　对此，商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示，“端侧模型市场潜力巨大，每年有30亿部手机，PC出货量一年也有2-3亿台规模，AI PC可以成为我们每个人的助手，汽车智能化也成为重要发展机遇期，从而能让大模型普及应用。”

　　此次活动中，商汤科技方面还公布了在“文生视频”等领域新的技术突破。据悉，徐立在现场播放了三段完全由商汤大模型生成的视频，并强调“文生视频”平台对于人物、动作和场景的可控性江南体育。

商汤近日发布日日新50江南体育及全栈大模型产品矩阵

联系我们

底部导航

扫描二维码