【环球播资讯】大模型进入爆发期，中国企业如何构建自身优势？

【文/观察者网吕栋】

(相关资料图)

到目前为止，如果要评选2023年最热的概念，非AI大模型莫属。这轮由ChatGPT引爆的技术热潮，经过一段时间的发酵，已在国内迎来爆发期，互联网大厂纷纷躬身入局。人们也似乎越来越认识到，大模型是通往通用人工智能（AGI）最明确的路径。

在此背景下，商汤科技也厚积薄发，于近期正式推出了自研AI大模型体系“日日新SenseNova”，其中不仅包含语言大模型，还拥有AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用。

在这轮AI大模型浪潮中，由于ChatGPT率先出圈，不少人认为，中国企业只是随波逐流，跟风模仿，甚至只是概念炒作。但实际上，想要推出一个经得起考验的大模型，绝不可能一蹴而就。国内已推出大模型的企业中，均有着长期规划，商汤自然也早有准备。

在算力、数据和应用场景等大模型核心能力上，商汤科技已处于国内B端第一梯队。其前瞻布局的AI大装置SenseCore，拥有2.7万块GPU，可以输出5.0 exaFLOPS的总算力，是亚洲目前最大的智算平台之一，也是商汤自研大模型体系的关键基础设施。

基于“大模型+大算力”双轮布局，无论在当下还是未来，商汤科技都对中国AI产业界具有重要的战略价值和意义。

千亿参数大模型，惊艳亮相

4月10日，在距上海市中心近百公里的临港，商汤科技在自己的智算中心举办技术交流日，现场投资者、分析师、记者等人流攒动，座无虚席。在大模型持续爆火几个月后，大家依然非常期待这个人工智能领域的头部企业能拿出更亮眼的作品。

商汤科技不负众望，董事长兼CEO徐立登场后，正式发布了国内首个大模型体系——“日日新SenseNova”。该名称出自《礼记·大学》中汤之《盘铭》：苟日新、日日新、又日新。这个名字也承载了商汤对大模型快速迭代、走向通用人工智能（AGI）的希冀。

由于ChatGPT持续火热，加之百度和阿里相继推出“文心一言”和“通义千问”，语言类大模型为人所熟知。在最新的大模型体系中，商汤也推出了自研语言大模型“商量SenseChat”。

与之前语音交互、图像识别等AI应用类似，语言大模型也被用于人机交互，人们能通过文字和机器对话，获得内容。但语言大模型的突破之处在于，它是真正在尝试理解人们的想法，并基于大数据集生成内容，而不是简单对比和匹配，这意味着AI拥有了一定的自学习能力。

关键词：

读图