当前位置:中国企业报道>> 聚焦>> 共同关注>>正文内容

昆仑万维开源2千亿稀疏大模型Skywork-MoE

2024年06月03日 来源:证券日报

6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台4090服务器推理的开源千亿MoE大模型。

昆仑万维方面表示,希望此次开源的Skywork-MoE模型、技术报告和相关的实验结果可以给开源社区贡献更多的MoE训练经验和Know-how,包括模型结构、超参选择、训练技巧、训练推理加速等方面,探索用更低的训练推理成本训练更大更强的模型,在通往AGI的道路上贡献一点力量。

责任编辑:郑伊丹
相关推荐
昆仑万维开源2千亿稀疏大模型Skywork-MoE

6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...[详细]

九洲集团全资子公司收到中标通知书 将对公司2024年经营业绩产生积极影响

九洲集团表示,2024年,公司将锚定销售目标,盘活全产业链资源,深度挖掘渠道价值,尤其是发挥风光储协同效应。同时,公司将以技术营销、高低压一体化为抓手,从渠道建设、价格与营销机制、...[详细]

逾1700人赴贵州茅台股东大会 新任董事长回应分红、创新等问题

“这是我第三年来参加股东大会。”还在就读大学的张先生向记者透露,他是一名“00后”,在父亲的熏陶下,张先生也早早成为了一名“茅粉”,他告诉记者:“今年最关注的是未来茅台的海外布局...[详细]

返回顶部