This post was updated 389 days ago and some of the ideas may be out of date.

书生·浦语2.5概览

【书生大模型实战营第四期】书生大模型全链路开源体系插图

核心技术思路

【书生大模型实战营第四期】书生大模型全链路开源体系插图1

大海捞针实验

给模型提供足够长的背景知识,判断模型是否能够在特别大量的信息下,定位到文章任何位置的任何信息。

开源模型谱系

【书生大模型实战营第四期】书生大模型全链路开源体系插图2

全链条开源

【书生大模型实战营第四期】书生大模型全链路开源体系插图3


在数据方面,已经达到了180TB

【书生大模型实战营第四期】书生大模型全链路开源体系插图4


开源数据处理,支持视频标注

【书生大模型实战营第四期】书生大模型全链路开源体系插图5


进行了现存优化,采用分布式训练

【书生大模型实战营第四期】书生大模型全链路开源体系插图6


适配多种生态。

【书生大模型实战营第四期】书生大模型全链路开源体系插图7

评测

广泛应用于头部大模型企业和科研机构,获得Meta官方推荐唯一国产大模型评测体系。

【书生大模型实战营第四期】书生大模型全链路开源体系插图8