百川智能与鹏城实验室宣布合力研发“鹏城-百川·脑海33B”大模型

11月16日消息，百川智能与鹏城实验室宣布携手探索大模型训练和应用，合作研发基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”。

鹏城实验室表示，双方在合作过程中能够充分发挥各自优势形成合力，更好地满足我国不断增长的智能化转型需求，助力中国人工智能产业快速崛起。

百川智能与鹏城实验室宣布合力研发“鹏城-百川·脑海33B”大模型-风君雪科技博客

百川智能表示，本次百川智能与鹏城实验室合作研发“鹏城-百川·脑海33B”长窗口大模型，是国产算力大模型技术创新和落地的一次突破。未来，百川智能将在技术、算力等诸多维度不断深化与鹏城实验室的合作，持续助力本土大模型创新发展。

与此同时，百川智能和鹏城实验室展示了双方共同研发的“鹏城-百川·脑海33B”大模型。“鹏城-百川·脑海33B”的128K长上下文窗口基于“鹏城云脑”国产算力平台训练，未来可升级至192K，是基于国产算力训练的最长上下文窗口。

据介绍，为了更好地提升“鹏城-百川·脑海33B”上下文窗口长度和模型整体性能，百川智能和鹏城实验室对模型进行了全流程优化。在数据集构建方面，采用精细的数据构造，实现了段落、句子粒度的自动化数据过滤、选择、配比，良好的提升了数据质量；在训练架构上，通过NormHead、max-Z-Loss、dynamic-LR等自研或业界领先的模型训练优化技术，对Transformer模块进行深度优化，确保模型收敛稳定的同时，全面提升了模型优化效率和最终效果；此外，还在全生命周期的模型工具集中，通过与北京大学王亦洲、杨耀东老师团队的合作，首创了带安全约束的RLHF对齐技术，有效提升了模型内容生成质量和安全性。

未来，双方将在国产算力大模型技术创新和模型落地等方面继续加强合作，并与相关领域的优势单位如北京大学、清华大学等开展协同创新，助力本土大模型在模型性能、技术创新方面持续突破。（一橙）

百川智能与鹏城实验室宣布合力研发“鹏城-百川·脑海33B”大模型

【视频】vivo X100 Pro 体验，心中有天玑，手可拍悬日

首款基于开源鸿蒙的 KaihongOS 人形机器人发布

最新文章

怎么制作矢量图片(ai怎样把图片变成矢量)

我国建成 1200 余家先进级智能工厂，5G 基站总数超 414 万个

曝iPhone 18 Pro将首发可变光圈技术

松下推出 TOUGHBOOK 33mk4 三防二合一平板：搭 13 代酷睿、12 英寸触控屏

OPPO Reno 13系列即将全球发布提供全新发光设计

经期可以喝咖啡吗

白磷燃烧怎么扑灭

龙猫就是老鼠吗(宫崎骏的龙猫是老鼠还是猫)

董欣护肤品怎么样(董欣珍珠膏重金属)

去除马赛克（真的可以一键消除马赛克？）

最新评论

标签

关注我们么么哒！

百川智能与鹏城实验室宣布合力研发“鹏城-百川·脑海33B”大模型

【视频】vivo X100 Pro 体验，心中有天玑，手可拍悬日

首款基于开源鸿蒙的 KaihongOS 人形机器人发布

最新文章

怎么制作矢量图片(ai怎样把图片变成矢量)

最新评论

标签

关注我们 么么哒！

关注我们的公众号

关注我们么么哒！