时间在变,空间随着时间也在变,不变的唯有真知灼见。
2024年12月26日  星期四
首页
财经
观察
参考
ESG
公告
市场
研究
IPO
周报
动态
推荐
首页 > 公司

浪潮信息“源2.0”系列大模型最新版本发布

来源:真灼财经 时间:2024-08-25 14:00:13

字号

                       

浪潮信息发布源2.0-M32大模型4bit和8bit量化版,性能比肩700亿参数的LLaMA3开源大模型。其中,4bit量化版推理运行显存仅需23.27GB,处理每token所需算力约为1.9 GFLOPs,算力消耗仅为同等当量大模型LLaMA3-70B的1/80。源2.0-M32大模型是浪潮信息“源2.0”系列大模型的最新版本,其创新性地提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),模型运行时激活参数为37亿。(美通社)


微信扫码 > 右上角点击 > 分享