您当前位置: 首页 - 科技动态 - AMD首推AI小语种模型——“Llama-135m”:革新“推测解码”,RAM占用瘦身新纪元

AMD首推AI小语种模型——“Llama-135m”:革新“推测解码”,RAM占用瘦身新纪元

文章来源:互联网 作者:稻谷资源网 发布时间:2025-01-11 22:11:47

AMD于9月29日在Hugging Face平台上震撼发布其首个自主研发的“轻量级”语言模型——AMD-Llama-135m。该模型创新性地集成了高效推测解码技术,搭载着惊人的6700亿个token规模,彰显了强大的语言处理能力。更重要的是,AMD选择以Apache 2.0开源许可证分享此模型,促进了AI领域的开放合作与技术创新。

AMD首推AI小语种模型——“Llama-135m”:革新“推测解码”,RAM占用瘦身新纪元

据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。

AMD 表示,这款模型在四个 AMD Instinct MI250 节点训练了六天,其“编程专用版本”变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。

AMD战略聚焦:优先扩大客户端显卡版图,旗舰产品部署非当前首要议程

9月9日消息,AMD的高级副总裁兼计算与图形事业部负责人Jack Huynh在接受Tom's Hardware采访时强调,公司当前战略重点聚焦于扩大在个人电脑显卡市场份额,相较于顶级旗舰产品的推进,更加侧重于这一核心领域的发展。

AMD战略聚焦:优先扩大客户端显卡版图,旗舰产品部署非当前首要议程

Jack Huynh 表示其在客户端显卡领域的首要任务是提升 AMD 的市场份额,因为开发人员更乐意支持市场占比更高的硬件产品。如果 AMD 的市占率仅有 10%,那开发者就会专注于英伟达显卡。

在得到开发人员充分支持后,AMD 将能够向高端客户端显卡领域发起冲击。

故而 AMD 在目前阶段将更专注主流中端消费者用户,在合适系统价位上提供性价比领先的产品,让 AMD 显卡消费者扩展到“买得起保时捷和法拉利汽车”外的群体。

Jack Huynh 认为数据中心市场与客户端市场不同,前者专注于 TCO(总拥有成本),性能的领先就一定意味着市场占有率的提升;而在后者中开发人员和市场推广起到重要作用。

以客户端 CPU 市场为例,AMD 连续多代推出了优秀 CPU 产品,但市场份额却没有明显增长。一款好的客户端产品可将市场份额提升至 20%,但要想达到 40% 的目标,则需要不同策略。

Jack Huynh 提到 AMD 已在内部为发烧友消费者准备基于 Chiplet 小芯片技术的产品,可在不影响 AMD 对客户端显卡市场份额的追求的同时提供优秀性能。

AMD 已将部分 RDNA 3 GPU 分割为单个 GCD 图形计算芯片和多个 MCD 多缓存 I/O 芯片。考虑到 Jack Huynh 的表达指向明显的性能区别,其实际含义应为单 GPU 包含多个 GCD,类似英伟达的 B200。

复制本文链接 攻略文章为稻谷资源网所有,未经允许不得转载。