欧美日韩国产精品-欧美日韩国产精品综合-欧美日韩国产伦理-欧美日韩国产码高清综合人成-黄色网页在线观看-黄色网页在线播放

首頁 > 活動線報 > 每日福利 > 微軟亞研院多項創(chuàng)新技術(shù),彌合大模型低比特量化與終端部署間鴻溝

微軟亞研院多項創(chuàng)新技術(shù),彌合大模型低比特量化與終端部署間鴻溝

發(fā)布時間:2024-08-21 22:59:04來源: 13041198719

在人工智能領域,模型參數(shù)的增多往往意味著性能的提升。但隨著模型規(guī)模的擴大,其對終端設備的算力與內(nèi)存需求也日益增加。低比特量化技術(shù),由于可以大幅降低存儲和計算成本并提升推理效率,已成為實現(xiàn)大模型在資源受限設備上高效運行的關(guān)鍵技術(shù)之一。然而,如果硬件設備不支持低比特量化后的數(shù)據(jù)模式,那么低比特量化的優(yōu)勢將無法發(fā)揮。

為了解決這一問題,微軟亞洲研究院推出了全新的數(shù)據(jù)編譯器 Ladder 和算法 T-MAC,使當前只支持對稱精度計算的硬件能夠直接運行混合精度矩陣乘法。測試結(jié)果表明,Ladder 在支持 GPU 原本不支持的自定義數(shù)據(jù)類型方面,最高提速可達14.6倍;T-MAC 在搭載了最新高通 Snapdragon X Elite 芯片組的 Surface AI PC 上,使 CPU 上運行的大模型吞吐率比專用加速器 NPU 快兩倍。此外,研究員們還設計了 LUT Tensor Core 硬件架構(gòu),這種精簡設計使硬件能夠直接支持各種低比特混合精度計算,為人工智能硬件設計提供了新思路。

 

大模型已經(jīng)越來越多地被部署在智能手機、筆記本電腦、機器人等端側(cè)設備上,以提供先進的智能及實時響應服務。但包含上億參數(shù)的大模型對終端設備的內(nèi)存和計算能力提出了極高的要求,也因此限制了它們的廣泛應用。低比特量化技術(shù)因其能顯著壓縮模型規(guī)模,降低對計算資源的需求,成為了大模型在端側(cè)部署和實現(xiàn)高效推理的有效手段。

 

隨著低比特量化技術(shù)的發(fā)展,數(shù)據(jù)類型日益多樣化,如 int4、int2、int1 等低比特數(shù)據(jù),使得大模型在推理中越來越多地采用低比特權(quán)重和高比特權(quán)重計算的混合精度矩陣乘法(mixed-precision matrix multiplication,mpGEMM)。然而,現(xiàn)有的 CPU、GPU 等硬件計算單元通常只支持對稱計算模式,并不兼容這種混合精度的矩陣乘法。

 

混合精度矩陣乘法與傳統(tǒng)的矩陣乘法有何不同?

 

在傳統(tǒng)的矩陣乘法中,參與運算的兩端數(shù)值是對稱的,例如 FP16*FP16、int8*int8。但大模型的低比特量化打破了這種對稱性,使乘法的一端是高比特,另一端是低比特,例如在 1-bit 的 BitNet 模型中實現(xiàn)的 int8*int1 或 int8*int2,以及浮點數(shù)與整數(shù)的混合乘法 FP16*int4。

 

為了充分發(fā)揮低比特量化的優(yōu)勢,讓硬件設備能夠直接支持混合精度矩陣乘法,確保大模型在端側(cè)設備上的高速有效運行,微軟亞洲研究院的研究員們針對現(xiàn)有 CPU、GPU 計算算子和硬件架構(gòu)進行創(chuàng)新:

 

  • 推出了數(shù)據(jù)類型編譯器 Ladder,支持各種低精度數(shù)據(jù)類型的表達和相互轉(zhuǎn)換,將硬件不支持的數(shù)據(jù)類型無損轉(zhuǎn)換為硬件支持的數(shù)據(jù)類型指令,在傳統(tǒng)計算模式下,使得硬件能夠支持混合精度的 DNN(深度神經(jīng)網(wǎng)絡)計算;
  • 研發(fā)了全新算法 T-MAC,基于查找表(Lookup Table,LUT)的方法,實現(xiàn)了硬件對混合精度矩陣乘法的直接支持,軟件層面,在 CPU 上的計算相比傳統(tǒng)計算模式取得了更好的加速;
  • 提出了新的硬件架構(gòu) LUT Tensor Core,為下一代人工智能硬件設計打開了新思路。

 

每日福利更多>>

iOS 18.3正式版,近期表現(xiàn)最差的版本,不要升級。 三星電機發(fā)布全球首款用于激光雷達的超小型高容量MLCC 邁克爾·戴爾:從宿舍到科技巨頭的商業(yè)傳奇 華為、聯(lián)想搶先接入DeepSeek!AI手機終于要爆發(fā)了? 國產(chǎn)SUV的那些事兒:北汽昌河Q7,它到底咋了?銷量為零的真相! 預算18萬元,選小鵬P7+還是領克Z10,一文了解透 理想汽車:3個核心的競爭力! 新一輪價格戰(zhàn)“開打”!特斯拉、小鵬等品牌“加碼”,專家:今年市場競爭將兩極分化 ROG日本官方調(diào)侃主板插顯卡上,旗艦顯卡投影面積接近ITX主板 業(yè)主買下126㎡“老破舊”的二手房,改造完工后,原業(yè)主:我不賣 深圳樓市迎來“開門紅”;全國人均存款首超10萬;英歌舞這次又“火”出國門!| 灣區(qū)福財訊 性能黨必看!4款銷量‘最佳’的超強性能手機大盤點 2024直屏旗艦:魅族21、三星S24 、紅魔10 誰才是你的最愛? 魅族 22 仍在路上,星際魅族高管回應新機計劃有序推進中 雷軍“進廠上班”!小米新車將至,“正討論進一步提產(chǎn)”! 2024年全球智能手機市場回暖,華為增長37%最為迅猛 華為、蘋果等折疊新品將陸續(xù)面世,折疊機市場有望高增 OPPO Find N5邀請函來了,999純金打造,開工沾喜氣 凱迪拉克拿出硬實力!降幅超13萬,標配2.0T動力,家用真香 15萬級的SUV,配置豐富,解析零跑C11和特斯拉Model Y 小鵬MONA SUV渲染圖曝光 代替G3 15萬以內(nèi)最強? 東風汽車一、二把手親自主抓自主品牌業(yè)務:鋪就未來騰飛之路 人生第一臺車的“質(zhì)價比”之選:2025款別克君越深度解析 全新福特探險者攜三重犒賞禮遇重磅上市,全面煥新,再上昆侖! 造型更年輕運動!新一代奧迪A6諜照曝光,搭燃油動力,能火嗎? 2024年全球大尺寸交互平板顯示面板出貨量下降2.8% 零跑“逆襲”:憑什么成為第二家盈利新勢力? 市場觀察丨 多家車企推出補貼政策 特斯拉打出優(yōu)惠“組合拳” 上半年樓市預計止跌,杭州上海成都等八城將率先回穩(wěn) 未來10年房價預測:DeepSeek的深度洞察,太真實了!
主站蜘蛛池模板: 精品一级毛片 | 亚洲欧美国产精品专区久久 | 67194欧美成l人在线观看免费 | 丝袜高跟美脚国产1区 | 大色综合色综合资源站 | 经典三级四虎在线观看 | 在线播放 亚洲 | 四虎影视884aa·com | 国产精品日韩精品 | 欧美性猛交xxxx乱大交极品 | 亚洲三级中文字幕 | 四虎影院欧美 | 四虎国产精品永久地址48 | 久热中文字幕在线精品首页 | 国产区精品在线 | 国产精品三级视频 | 国产欧美精品专区一区二区 | 国产黄网站 | 在线观看中文字幕亚洲 | 精品69久久久久久99 | 亚洲综合激情视频 | 91免费福利精品国产 | 国产精品久久久久久久y | 亚洲欧美在线综合一区二区三区 | 色聚网 | 成人亚洲精品 | 四虎影视884a精品国产古代 | 国产成人综合亚洲欧美在线n | yyyyyy高清成人观看 | 在线免费观看毛片网站 | 国产成人精品系列在线观看 | 国产成人精品免费视频大全软件 | 久久久毛片免费全部播放 | 国产一区二区三区日韩 | 四虎永久免费地址在线观看 | 精品亚洲综合久久中文字幕 | 九九九国产在线 | 欧美亚洲国产成人不卡 | 国产在线欧美精品中文一区 | 亚洲第一区香蕉_国产a | 日本wwwww视频 |