chatgpt吧 关注:134,564贴子:408,511
  • 3回复贴,共1

AMD 开源首款小语言模型 AMD-135M

只看楼主收藏回复

AMD 宣布推出 AMD-135M —— Llama 家族的第一个小型语言模型。
该模型具有推测解码功能,其训练代码、数据集和权重都是开源的,以便开发人员可以重现该模型并帮助训练其他 SLM 和 LLM。
“大语言模型通常使用自回归方法进行推理。然而,这种方法的一个主要限制是每次前向传递只能生成单个 token,导致内存访问效率低下并影响整体推理速度。推测解码的出现解决了这个问题。其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少内存访问消耗,并实现几个数量级的速度提升。”


IP属地:辽宁1楼2024-09-29 21:01回复
    463_人来人往、时势造丶j0英雄、阿萨德稳2454. . . 被楼主禁言,将不能再进行回复
    翻译翻译。


    IP属地:湖北来自Android客户端2楼2024-09-29 22:55
    回复
      @伊利亚重轰☞
      翻译看这里


      IP属地:辽宁来自iPhone客户端3楼2024-09-29 23:18
      回复
        嘻嘻


        IP属地:湖南来自iPhone客户端4楼2024-09-30 09:22
        回复