AMD 推出自家首款小语言模型“Llama-135m”
AMD 推出自家首款小语言模型“Llama-135m”
IT 之家 9 月 29 日消息,AMD 在 Huggingface 平台公布了自家首款 " 小语言模型 "AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,IT 之家附模型地址如下。
据介绍,这款模型主打 " 推测解码 " 能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。
AMD 表示,这款模型在四个 AMD Instinct MI250 节点训练了六天,其 " 编程专用版本 " 变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。
相关标签:
-
- 西安被誉为中国的什么博物馆
-
2025-10-09 02:15:48
-
- 外籍华人是中国公民吗
-
2025-10-09 02:13:36
-
- 提前15分钟交卷,公然嘲讽高考题目太简单的林欢,现在怎么样了?
-
2025-08-13 01:15:30
-
- 新能源大战MPV,谁能成为“埃尔法”的平替?
-
2024-01-17 16:50:28
-
- 军大衣过气后,东北老铁连夜翻出大花袄
-
2024-01-17 16:48:25
-
- 赛力斯,二次加速
-
2024-01-17 16:46:22
-
- “老年”格力的焦虑,不止是营销
-
2024-01-17 16:44:20
-
- 长春冰雪新天地冰雕师:热爱抵过寒冷,有的月薪十万
-
2024-01-17 16:42:17
-
- iPhone跌破底价,苹果真急了
-
2024-01-17 16:40:14
-
- 投年轻人、投B站,还是好生意吗?
-
2024-01-17 16:38:12
-
- “退烧”后的淄博:哪些人走了,哪些人留下来了?
-
2024-01-17 16:36:09
-
- 在北欧5年,我没能重启人生
-
2024-01-17 16:34:06
-
- 《年会不能停!》:大公司比小人物更可笑
-
2024-01-17 16:32:04
-
- 邢台县有多少个乡镇 邢台县有多少个村
-
2023-12-24 20:35:04