您当前位置：首页 - 科技动态 - AMD首推AI小语种模型——“Llama-135m”：革新“推测解码”，RAM占用瘦身新纪元

AMD首推AI小语种模型——“Llama-135m”：革新“推测解码”，RAM占用瘦身新纪元

文章来源：互联网作者：稻谷资源网发布时间：2025-01-11 22:11:47

AMD于9月29日在Hugging Face平台上震撼发布其首个自主研发的“轻量级”语言模型——AMD-Llama-135m。该模型创新性地集成了高效推测解码技术，搭载着惊人的6700亿个token规模，彰显了强大的语言处理能力。更重要的是，AMD选择以Apache 2.0开源许可证分享此模型，促进了AI领域的开放合作与技术创新。

AMD首推AI小语种模型——“Llama-135m”：革新“推测解码”，RAM占用瘦身新纪元

据介绍，这款模型主打“推测解码”能力，其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少 RAM 占用，实现效率提升。

AMD 表示，这款模型在四个 AMD Instinct MI250 节点训练了六天，其“编程专用版本”变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。

AMD战略聚焦：优先扩大客户端显卡版图，旗舰产品部署非当前首要议程

9月9日消息，AMD的高级副总裁兼计算与图形事业部负责人Jack Huynh在接受Tom's Hardware采访时强调，公司当前战略重点聚焦于扩大在个人电脑显卡市场份额，相较于顶级旗舰产品的推进，更加侧重于这一核心领域的发展。

AMD战略聚焦：优先扩大客户端显卡版图，旗舰产品部署非当前首要议程

Jack Huynh 表示其在客户端显卡领域的首要任务是提升 AMD 的市场份额，因为开发人员更乐意支持市场占比更高的硬件产品。如果 AMD 的市占率仅有 10%，那开发者就会专注于英伟达显卡。

在得到开发人员充分支持后，AMD 将能够向高端客户端显卡领域发起冲击。

故而 AMD 在目前阶段将更专注主流中端消费者用户，在合适系统价位上提供性价比领先的产品，让 AMD 显卡消费者扩展到“买得起保时捷和法拉利汽车”外的群体。

Jack Huynh 认为数据中心市场与客户端市场不同，前者专注于 TCO（总拥有成本），性能的领先就一定意味着市场占有率的提升；而在后者中开发人员和市场推广起到重要作用。

以客户端 CPU 市场为例，AMD 连续多代推出了优秀 CPU 产品，但市场份额却没有明显增长。一款好的客户端产品可将市场份额提升至 20%，但要想达到 40% 的目标，则需要不同策略。

Jack Huynh 提到 AMD 已在内部为发烧友消费者准备基于 Chiplet 小芯片技术的产品，可在不影响 AMD 对客户端显卡市场份额的追求的同时提供优秀性能。

AMD 已将部分 RDNA 3 GPU 分割为单个 GCD 图形计算芯片和多个 MCD 多缓存 I/O 芯片。考虑到 Jack Huynh 的表达指向明显的性能区别，其实际含义应为单 GPU 包含多个 GCD，类似英伟达的 B200。

复制本文链接攻略文章为稻谷资源网所有，未经允许不得转载。

微软系统大范围故障震动科技界，与此同时百度“萝卜快跑”驶向商用新纪元

微软系统大范围故障震动科技界，与此同时百度“萝卜快跑”驶向商用新纪元

英国研发修路智能机器人：比人类快70%，可节省上百万美元开支

英国研发修路智能机器人：比人类快70%，可节省上百万美元开支

相关下载

相关攻略

热门资讯

热门游戏榜

MORE +

合集推荐