欧美日韩国产精品-欧美日韩国产精品综合-欧美日韩国产伦理-欧美日韩国产码高清综合人成-黄色网页在线观看-黄色网页在线播放

首頁 > 生活分享 > 免費教學 > 性能與成本雙贏:實測戴爾AI工作站支撐企業大模型的本地部署與訓練

性能與成本雙贏:實測戴爾AI工作站支撐企業大模型的本地部署與訓練

發布時間:2024-10-12 22:05:29來源: 13041198719
談到大模型私有化部署,很多人會首先想到數據中心,以為動輒就得使用很多臺服務來支撐。一些中小企業或者應用部門,主要做知識庫和智能體方向的應用,模型大小基本在70B以內。只要搭配合理,用本地的專業工作站同樣可以訓練推理,算得上極具性價比的方案了。
 
隨著OpenAI o1-preview的發布,大模型已經越發成熟,距離走入企業生產應用已經很近了。但OpenAI提供訪問的次數非常有限,這給企業用戶的AI應用普及帶來了一定的費用焦慮和困擾。為了應對日益增長的訪問頻率需求,越來越多的企業用戶傾向于大模型的本地化部署。大模型本地部署可以極大地降低數據泄漏的風險,而且系統響應速度和實時性更強,在一些需要快速反饋的場景里優勢非常明顯,同時也能應對企業個性化需求。
 
通過在傳統數據中心上進行本地大模型部署的方法,會對IT設施帶來比較大的挑戰,因為從計算資源來說,很多企業的數據中心計算資源很緊張,而且擴展成本比較高,甚至有些中小企業還不具備搭建數據中心的能力。所幸的是,對于知識庫等企業級AI 應用來說,完全可以用高配的AI工作站來應對計算需求,以經濟高效的方式減輕對數據中心計算資源的壓力,從而降低云服務的成本支出。
 
這次我們選用的是Dell Precision 7960 Tower,搭載了4張「NVIDIA RTX 5880 Ada 」顯卡,每張顯卡顯存48GB,相當于在1臺工作站里就能最多有192GB顯存,完全可以部署Llama3.1 70B模型。
 
 
Dell Precision 7960 Tower
 
70B模型擁有700億參數量,在語言理解和生成方面具有顯著優勢,已經能夠滿足常見的企業級AI應用,比如知識庫應用、對話問答等,同時多任務處理能力也很強,可以支持企業在一個統一的平臺上運行多種AI 應用。同時,開源大模型70B的開放和靈活使得它在市場上具有廣泛的適用性,大大降低企業的使用成本。而且量化后的70B模型僅占70G的顯存,非常適合部署在工作站上,降低計算資源方面的成本。
 
購置機器前我們做了相對完整的測試和驗證,包括推理、訓練和噪音測試,下面給大家分享一些數據。
 
一、測試環境
硬件配置:
硬件平臺:Dell Precision 7960 Tower
 
CPU: Intel(R) Xeon(R) w5-3433
 
內存:64G DDR5 * 8
 
GPU: NVIDIA RTX 5880 ada * 4
 
軟件平臺環境:
操作系統:ubuntu22.04
 
Driver Version: 550.107.02
 
CUDA: 12.1
 
軟件包:conda python3.10 torch2.4 vllm0.6.1
 
測試模型:
這次我們分別測試了單GPU、雙GPU以及四卡GPU的表現情況。并在不同的模型下進行測試,模型參數分別為8B/13B/32B/70B,具體模型名稱如下:
 
Meta-Llama-3.1-8B-Instruct
 
Baichuan2-13B-Chat
 
Qwen1.5-32B-Chat
 
Meta-Llama-3.1-70B-Instruct
 
說明:接下來的推理測試,會使用FP16或FP8格式進行測試。在模型名稱的后綴,如果有FP8字樣,則使用的是FP8格式,否則使用的是FP16格式。
 
FP8是NVIDIA、Arm、Intel聯合推出的8位浮點數據格式,用于加速深度學習訓練和推理。相對于常用的半精度FP16而言,FP8在不損失多少精度的情況下,將顯存的占用大小減少了一半,特別適合于將大模型部署于工作站上。FP8訓練利用E5M2/E4M3格式,具備與FP16相當的動態范圍,適用于反向傳播與前向傳播。FP8訓練在相同加速平臺上的峰值性能顯著超越FP16/BF16,并且模型參數越大,訓練加速效果越好,且其與16-bits訓練在收斂性和下游任務表現上無顯著差異。
 
推理框架:
vllm推理引擎來進行測試,為最大程度利用GPU顯存,將其GPU utilization參數設置為0.99。
 
述語說明:
Batch size: 推理或訓練時輸入的數據批量數量,為1表示單個輸入,例如一段文字,為2表明同時進行兩段文字的生成,以此類推。它代表的是用戶并發數量。
 
token/s:推理或訓練的速度,每秒生成的數量。一個token是代表一個單詞或詞根,如果是中文的話,可能是一個字或一個詞。
 
AI 應用場景測試列表

 

免費教學更多>>

有個消息,高通2025第一季度利潤大增,自己手機處理器銷量不錯 手機市場利好:高通上季營收超預期增18%,本季或再兩位數增長 微軟iOS/ 安卓版Edge瀏覽器新功能:可將地址欄放置在底部 鴻蒙數字版權服務為蛇年春節民生供應“添油加醋” 鴻蒙生態每日Plog 小藝接入DeepSeek多款應用上架 2024平板市場中國廠商表現強勁 小米年增長率高達73% 2025年新款筆記本電腦,四千多有哪些推薦? 三星即將發布兩款全新折疊屏手機 屏幕折痕顯著改善 三星A36 5G與A56 5G通過認證 配置大量曝光 發布在即 戴爾Precision 5690移動工作站體驗 全新華碩靈耀14 Air 驍龍版,演繹極致輕薄科技美學 聯想全棧AI加速智能化轉型每一步!聯想智慧中國行·行業智能化轉型論壇杭州站舉辦 PD 3.1&聯想140W,首銷價799元,拯救者 PB9 游戲本快充移動電源上架 聯想AIPC個人智能體“小天”接入DeepSeek 重慶新能源汽車立Flag:今年產量力爭達130萬輛 在20萬預算內,每年行駛2萬公里,新能源和油車怎么選 駕駛極狐阿爾法S5,感受北汽極狐帶來的冬日溫暖與舒適 北汽極狐打造冬日駕駛新體驗,極狐阿爾法S5讓多巴胺持續飆升 上汽發布 1 月產銷快報,數據亮眼背后藏著哪些驚喜? 開工大吉!中國一汽新春啟航斗志揚 理想VS蔚來:誰才是30萬級新能源車的最優解? 綠色設計國際大獎巡禮(四) | 蔚來(NIO)ET7的可持續內飾設計 蔚來單日電池更換量創紀錄達136748次,其中樂道更換8000次 2025年3大新款新勢力SUV:小鵬G6造型微調,蔚來ES6平臺升級 埃安UT驚艷亮相,價格親民配置豐富,A級純電小車新標桿! 廣汽埃安又搞大事!過年送車,一天一輛,埃安UT也開始預售 廣汽豐田鋒蘭達和威蘭達雙子星年初一價到底,品質保底,購車福利 廣汽昊鉑宣布限時購車補貼,首購至高補貼3.1萬元 廣汽豐田一口價政策:品質堅守與大廠擔當的完美詮釋 特斯拉新年第一天降價,針對新款的model3車型,80...
主站蜘蛛池模板: 99久久精品免费精品国产 | 悠悠色影视 | 综合久久久久久 | 天堂在线天堂最新版 | 国产精品福利久久 | 久久亚洲精选 | 国99久9在线 | 免费 | 精品四虎 | 国产欧美日韩一区二区三区视频 | 91精品免费观看老司机 | 久久免费特黄毛片 | 四虎影院中文字幕 | 国产馆手机在线观看 | 六月天综合网 | 成人久久精品一区二区三区 | 国产一级成人毛片 | 国产精品久久久久国产精品 | 国产在线免 | 在线播放性xxx欧美 在线播放亚洲 | 亚洲丝袜制服 | 久久99国产精品一区二区 | 在线综合色 | 91精品视频在线观看免费 | 国产高清在线丝袜精品一区 | 黄色一级免费 | 一区二区三区不卡在线 | 国产精品特黄毛片 | 狠狠色很很在鲁视频 | 色噜噜狠狠狠狠色综合久不 | 91国内外精品自在线播放 | 色综合久久天天综合绕观看 | 亚洲国产精选 | 亚洲精品成人网久久久久久 | 手机看片福利永久 | dyav午夜片| 欧美国产日韩1区俺去了 | 国产91精品一区二区麻豆亚洲 | 性色成人网 | 免费毛片视频 | 91视频福利| 久久国产自偷自偷免 |