亚洲欧美一区二区精品久久久_在线观看欧美日韩电影_好了av在线_成人丝袜18视频在线观看_亚洲欧美日韩精品久久久_**女人18毛片一区二区_欧美一级日韩免费不卡_av免费网站观看_99久久久久国产精品_色综合天天综合网天天狠天天 _91社区在线高清_黑丝美女一区二区

AMD發(fā)布首個AI小語言模型:6900億token、推測解碼提速3.88倍

2024-10-01 16:58來源:快科技編輯:時寒峰

掃一掃

分享文章到微信

掃一掃

關(guān)注99科技網(wǎng)微信公眾號

  原標(biāo)題:AMD發(fā)布首個AI小語言模型:6900億token、推測解碼提速3.88倍

  10月1日消息,AMD發(fā)布了自己的首個小語言模型(SLM),名為“AMD-135M”。

  相比于越來越龐大的大語言模型(LLM),它體積小巧,更加靈活,更有針對性,非常適合私密性、專業(yè)性很強(qiáng)的企業(yè)部署。

  AMD-135小模型隸屬于Llama家族,有兩個版本:

AMD發(fā)布首個AI小語言模型:6900億token、推測解碼提速3.88倍

  一是基礎(chǔ)型“AMD-Llama-135M”,擁有多達(dá)6700億個token,在八塊Instinct MIM250 64GB加速器上訓(xùn)練了六天。

  二是延伸型“AMD-Llama-135M-code”,額外增加了專門針對編程的200億個token,同樣硬件訓(xùn)練了四天。

  創(chuàng)建與部署流程

  它使用了一種名為“推測解碼”(speculative decoding)的方法,通過較小的草稿模型,在單次前向傳播中生成多個候選token,然后發(fā)送給更大的、更精確的目標(biāo)模型,進(jìn)行驗(yàn)證或糾正。

  這種方法可以同時生成多個token,不會影響性能,還可以降低內(nèi)存占用,但因?yàn)閿?shù)據(jù)交易更多,功耗也會增加。

  AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型,測試了推測解碼使用與否的性能。

  比如在MI250加速器上,性能可提升最多約2.8倍,銳龍AI CPU上可提升最多約3.88倍,銳龍AI NPU上可提升最多約2.98倍。

  推測解碼

  AMD-135M小模型的訓(xùn)練代碼、數(shù)據(jù)集等資源都已經(jīng)開源,遵循Apache 2.0。

  按照AMD的說法,它的性能與其他開源小模型基本相當(dāng)或略有領(lǐng)先,比如Hellaswag、SciQ、ARC-Easy等任務(wù)超過Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務(wù)則基本類似GTP2-124MN、OPT-125M。

?????投稿郵箱:jiujiukejiwang@163.com ??詳情訪問99科技網(wǎng):http://www.hacbq.cn

相關(guān)推薦
“藍(lán)屏”從此再見!微軟Windows“黑屏”正式發(fā)布 “藍(lán)屏”從此再見!微軟Windows“黑屏”正式發(fā)布

原標(biāo)題:藍(lán)屏從此再見!微軟Windows黑屏正式發(fā)布:新增快速電腦恢復(fù)功能 6月

技術(shù)經(jīng)驗(yàn)2025-06-29

華為3月發(fā)布“原生鴻蒙手機(jī)”,究竟有何驚喜? 華為3月發(fā)布“原生鴻蒙手機(jī)”,究竟有何驚喜?

原標(biāo)題:華為3月發(fā)布原生鴻蒙手機(jī),究竟有何驚喜? 近日,華為公司高層余承

技術(shù)經(jīng)驗(yàn)2025-02-24

微信朋友圈實(shí)況圖片怎么發(fā) 微信朋友圈實(shí)況圖片 微信朋友圈實(shí)況圖片怎么發(fā) 微信朋友圈實(shí)況圖片

原標(biāo)題:微信朋友圈實(shí)況圖片怎么發(fā) 微信朋友圈實(shí)況圖片發(fā)布教程 微信派公眾

技術(shù)經(jīng)驗(yàn)2024-09-20

快手極速版發(fā)布的作品怎么刪除?手把手教你刪除 快手極速版發(fā)布的作品怎么刪除?手把手教你刪除

原標(biāo)題:快手極速版發(fā)布的作品怎么刪除手把手教你刪除快手極速版作品 快手

技術(shù)經(jīng)驗(yàn)2024-07-23

2022蘋果春季發(fā)布會新品有什么 蘋果春季發(fā)布會 2022蘋果春季發(fā)布會新品有什么 蘋果春季發(fā)布會

原標(biāo)題:2022蘋果春季發(fā)布會新品有什么 蘋果春季發(fā)布會2022新品介紹 2022蘋果春

技術(shù)經(jīng)驗(yàn)2022-03-02

紅米k50發(fā)布會時間 紅米k50什么時候發(fā)布 紅米k50發(fā)布會時間 紅米k50什么時候發(fā)布

原標(biāo)題:紅米k50發(fā)布會時間 紅米k50什么時候發(fā)布 紅米k50發(fā)布會什么時候?202

技術(shù)經(jīng)驗(yàn)2022-02-10

我國自主研制的首款內(nèi)生安全交換芯片對外發(fā)布 我國自主研制的首款內(nèi)生安全交換芯片對外發(fā)布

原標(biāo)題:我國自主研制的首款內(nèi)生安全交換芯片對外發(fā)布 從天津市濱海新區(qū)獲

技術(shù)經(jīng)驗(yàn)2021-12-18

全球首個活體機(jī)器人現(xiàn)在可以“生娃”了 我們采 全球首個活體機(jī)器人現(xiàn)在可以“生娃”了 我們采

原標(biāo)題:全球首個活體機(jī)器人現(xiàn)在可以生娃了 我們采訪了TA的締造者 一年前誕

技術(shù)經(jīng)驗(yàn)2021-12-06

Microsoft Teams 中端到端加密推遲到 12 月發(fā)布 Microsoft Teams 中端到端加密推遲到 12 月發(fā)布

原標(biāo)題:Microsoft Teams 中端到端加密推遲到 12 月發(fā)布 今年 3 月,微軟宣布即將在

技術(shù)經(jīng)驗(yàn)2021-11-21

發(fā)布 14 年 微軟終結(jié)「親兒子」技術(shù):曾是 Flas 發(fā)布 14 年 微軟終結(jié)「親兒子」技術(shù):曾是 Flas

原標(biāo)題:發(fā)布 14 年 微軟終結(jié)「親兒子」技術(shù):曾是 Flash 最大對手 Flash 當(dāng)年很

技術(shù)經(jīng)驗(yàn)2021-09-15

?