北京8月12日電 (袁佳薇 夏賓)2024開放計算中國峰會近日在京舉行,開放計算如何加速人工智能發(fā)展成為大會焦點話題。會上,“開放算力模組(OCM)”規(guī)范正式啟動,首批成員包括中國電子標準院、百度、小紅書、浪潮信息、聯(lián)想、超聚變、英特爾、AMD等機構和企業(yè)。這是國內首個服務器計算模組設計規(guī)范,產業(yè)上下游希望共同建立標準化的算力模組單元,構建開放合作、融合創(chuàng)新的產業(yè)生態(tài),激發(fā)人工智能技術創(chuàng)新發(fā)展。
圖說:“開放算力模組(OCM)”規(guī)范正式啟動。攝影:主辦方供圖。
本次峰會由開放計算社區(qū)OCP及開放標準組織OCTC(中國電子工業(yè)標準化技術協(xié)會開放計算標準工作委員會)聯(lián)合主辦,以“開放協(xié)同:協(xié)作、智慧、創(chuàng)新”為主題,聚焦數(shù)據(jù)中心基礎設施、人工智能創(chuàng)新、開放計算生態(tài)、綠色計算發(fā)展、開放系統(tǒng)&CXL等議題,包括百度、阿里云、中國工商銀行、字節(jié)跳動、三星、浪潮信息、英偉達、偉創(chuàng)力、Solidigm、英特爾、世紀互聯(lián)等在內的企業(yè),以及千余名IT工程師和數(shù)據(jù)中心從業(yè)者參與大會。
生成式人工智能的快速發(fā)展,帶來了更加豐富的智能應用場景,而智能應用的繁榮必然使得推理需要更多的算力來支撐,通用算力作為一種更加普遍且更易獲得的算力,一旦擁有AI計算的能力顯然會大大加速智能化進程。
浪潮信息服務器產品線總經(jīng)理趙帥直言:“不僅僅是AI芯片,一切計算皆AI,通用算力也要具有AI計算的能力,但目前CPU處理器的迭代也非??欤也煌脚_的技術路線和要求都不同,十多款芯片,可能要研發(fā)上百臺服務器。”
但目前x86、ARM、RISC-V等不同架構的CPU協(xié)議標準不統(tǒng)一,導致硬件開發(fā)、固件適配、部件測試等耗時巨大,同時為了更好適應AI推理高并行的計算特點,CPU總線互聯(lián)帶寬、內存帶寬及容量也需要特別優(yōu)化,使得系統(tǒng)功耗、總線速率、電流密度不斷提升……多種因素疊加之下,算力系統(tǒng)的設計與開發(fā)周期漫長且成本高昂。
在CPU多元化發(fā)展的趨勢下,如何快速完成CPU到計算系統(tǒng)的創(chuàng)新,使其能夠適用于AI推理負載,已經(jīng)成為緩解當前AI算力稀缺、推動人工智能發(fā)展的關鍵環(huán)節(jié)。
為此,會上開放算力模組(OCM)規(guī)范正式啟動立項,旨在以CPU、內存為核心構建最小算力單元,兼容x86、ARM等多架構芯片的多代處理器,方便用戶根據(jù)應用場景靈活、快速組合。
OCM規(guī)范的啟動,旨在建立基于處理器的標準化算力模組單元,通過統(tǒng)一不同處理器算力單元對外高速互連、管理協(xié)議、供電接口等,實現(xiàn)不同架構處理器芯片兼容,構建CPU的統(tǒng)一的算力底座,以解決CPU生態(tài)挑戰(zhàn)問題,方便客戶根據(jù)人工智能、云計算、大數(shù)據(jù)等多樣化應用場景,靈活、快速匹配最適合的算力平臺,推動算力產業(yè)高質量快速發(fā)展。OCM開放標準的制定,能夠為用戶提供更多通用性強、綠色高效、安全可靠的算力選擇。
此外,生成式人工智能正在重構數(shù)據(jù)中心基礎設施,對計算效能、存儲容量及性能、網(wǎng)絡方案、資源調度管理、能效控制與管理各個方面均提出更高要求,全向Scale(性能增強和規(guī)模擴展)能力成為構建先進AI基礎設施的核心。在本屆峰會上,包括CXL技術、面向AI的網(wǎng)絡架構、首款16通道PCIe5.0 TLC固態(tài)硬盤等一大批創(chuàng)新技術與產品方案,將進一步提升數(shù)據(jù)中心的Scale能力。
趙帥認為,開放計算對于智算時代有非常重要的意義和價值,要用開放應對多元算力的挑戰(zhàn),同樣也要用開放促進現(xiàn)在算力的Scale。算力Scale是Scale up(單系統(tǒng)性能提升)與Scale out(集群規(guī)模擴展)并存迭代、快速發(fā)展的過程?,F(xiàn)階段,開放加速模組和開放網(wǎng)絡實現(xiàn)了算力的Scale,開放固件解決方案實現(xiàn)了管理的Scale,開放標準和開放生態(tài)實現(xiàn)了基礎設施的Scale,未來要以開放創(chuàng)新加速算力系統(tǒng)全向Scale,應對大模型Scaling Law。
大會還發(fā)布了開放計算十大創(chuàng)新成果,包括超大規(guī)模數(shù)據(jù)中心部署指南、液冷式人工智能加速卡設計技術要求等,進一步體現(xiàn)出開放計算在數(shù)據(jù)中心領域所具備的創(chuàng)新活力。
智能時代,大模型正在重構AI基礎設施,數(shù)據(jù)中心迎來算力、網(wǎng)絡、存儲、管理、能效的全向Scale創(chuàng)新挑戰(zhàn),需構建全球化的開放協(xié)作平臺,合力解決上述重大問題,通過對人工智能基礎設施的全面優(yōu)化,為AI發(fā)展賦予無限可能