书生·浦语2.5概览

【书生大模型实战营第四期】书生大模型全链路开源体系插图

核心技术思路

【书生大模型实战营第四期】书生大模型全链路开源体系插图1

大海捞针实验

给模型提供足够长的背景知识,判断模型是否能够在特别大量的信息下,定位到文章任何位置的任何信息。

开源模型谱系

【书生大模型实战营第四期】书生大模型全链路开源体系插图2

全链条开源

【书生大模型实战营第四期】书生大模型全链路开源体系插图3


在数据方面,已经达到了180TB

【书生大模型实战营第四期】书生大模型全链路开源体系插图4


开源数据处理,支持视频标注

【书生大模型实战营第四期】书生大模型全链路开源体系插图5


进行了现存优化,采用分布式训练

【书生大模型实战营第四期】书生大模型全链路开源体系插图6


适配多种生态。

【书生大模型实战营第四期】书生大模型全链路开源体系插图7

评测

广泛应用于头部大模型企业和科研机构,获得Meta官方推荐唯一国产大模型评测体系。

【书生大模型实战营第四期】书生大模型全链路开源体系插图8