当前位置:首页 > AMD 推出自家首款小语言 AI 模型“Llama-135m ”,主打“推测解码”能力可减少 RAM 占用
AMD 推出自家首款小语言 AI 模型“Llama-135m ”,主打“推测解码”能力可减少 RAM 占用
作者:橙色手游网 发布时间:2024-10-02 11:42:19

本站 9 月 29 日消息,AMD在 Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有6700亿个token,采用 Apache 2.0开源许可,本站附模型地址如下(点此访问)。

据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。

AMD表示,这款模型在四个AMD Instinct MI250节点训练了六天,其“编程专用版本”变体AMD-Llama-135m-code则额外耗费了四天时间进行微调。