欧美日韩国产精品-欧美日韩国产精品综合-欧美日韩国产伦理-欧美日韩国产码高清综合人成-黄色网页在线观看-黄色网页在线播放

首頁(yè) > 活動(dòng)線報(bào) > 每日福利 > 如何定義一款新的AI處理器?AI芯片案例分析

如何定義一款新的AI處理器?AI芯片案例分析

發(fā)布時(shí)間:2024-10-20 22:09:38來(lái)源: 13041198719
AI大模型的熱潮不斷,預(yù)計(jì)未來(lái)十年,AGI時(shí)代即將到來(lái)。但目前支撐AI發(fā)展的GPU和AI專(zhuān)用芯片,都存在各種各樣的問(wèn)題。 那么,在分析這些問(wèn)題的基礎(chǔ)上,我們能不能針對(duì)這些問(wèn)題進(jìn)行優(yōu)化,重新定義一款能夠支持未來(lái)十年AGI大模型的、足夠靈活通用的、效率極高性能數(shù)量級(jí)提升的、單位算力成本非常低廉的、新的AI處理器類(lèi)型?
 
01.首先分析場(chǎng)景特點(diǎn),做好軟硬件劃分
 
1.1 一方面,AI處理器存在問(wèn)題
 
差不多是從2015年前后,開(kāi)始興起了專(zhuān)用AI芯片的浪潮。以谷歌TPU為典型代表的各種架構(gòu)的AI專(zhuān)用芯片,如雨后春筍般涌現(xiàn)。 但從AI落地情況來(lái)看,效果并不是很理想。這里的主要問(wèn)題在于:
 
AI芯片專(zhuān)用設(shè)計(jì),把許多業(yè)務(wù)邏輯沉到硬件里,跟業(yè)務(wù)緊密耦合;但業(yè)務(wù)變化太快,算法不斷更新,芯片和業(yè)務(wù)的匹配度很低。
 
AI算法是專(zhuān)用的,面向具體場(chǎng)景,比如人臉識(shí)別、車(chē)牌識(shí)別,各種物品識(shí)別等。綜合來(lái)看,算法有上千種,加上算法自身仍在快速演進(jìn),加上各種變種的算法甚至超過(guò)數(shù)萬(wàn)種。
 
用戶的業(yè)務(wù)場(chǎng)景是綜合性的,把業(yè)務(wù)場(chǎng)景比做一桌宴席,AI芯片就是主打的那道主菜。對(duì)AI芯片公司來(lái)說(shuō),自己只擅長(zhǎng)做這一道菜,并不擅長(zhǎng)做其他的菜品,更不擅長(zhǎng)幫助用戶搭配一桌美味可口、葷素均衡、營(yíng)養(yǎng)均衡的宴席。
 
1.2 另一方面,GPU也存在問(wèn)題
 
NVIDIA的GPU是通用并行處理器:
 
性能效率相對(duì)不高,性能逐漸見(jiàn)頂。要想算力提升,只能通過(guò)提升集群規(guī)模(Scale Out,增加GPU數(shù)量)的方式。
 
增加集群規(guī)模,受限于I/O的帶寬和延遲。一方面,集群的網(wǎng)絡(luò)連接數(shù)量為O(n^2),連接數(shù)量隨著集群規(guī)模的指數(shù)級(jí)增加;另一方面,AI類(lèi)的計(jì)算任務(wù),不同節(jié)點(diǎn)間的數(shù)據(jù)交互本身就非常巨大。因此,受阿姆達(dá)爾定律影響,I/O的帶寬和延遲,會(huì)約束集群規(guī)模的大小。(在保證集群交互效率的情況下,)目前能支持的集群規(guī)模大約在1500臺(tái)左右。
 
還有另外一個(gè)強(qiáng)約束,就是成本。據(jù)稱(chēng)GPT5需要5萬(wàn)張GPU卡,單卡的成本在5W美金左右,再加上其他硬件和基礎(chǔ)設(shè)施已經(jīng)運(yùn)營(yíng)的成本。僅硬件開(kāi)銷(xiāo)接近50億美金,即350億RMB。這對(duì)很多廠家來(lái)說(shuō),是天文數(shù)字。
 
1.3 問(wèn)題的核心:芯片的靈活性要匹配場(chǎng)景的靈活性
 
首先,仍然是從我們之前很多文章中提到的這個(gè)“從軟件到硬件的典型處理器劃分圖”開(kāi)始分析。
 
 
 
指令是處理器軟件和硬件的媒介:有的指令非常簡(jiǎn)單,就是基本的加減乘除等標(biāo)量計(jì)算;有的指令非常復(fù)雜,不是純粹的向量、矩陣或多維張量計(jì)算,而是各種維度計(jì)算再組合的一個(gè)混合的宏指令,或者說(shuō)是一個(gè)算子甚至算法,就對(duì)應(yīng)到一條(單位計(jì)算)指令。 AI專(zhuān)用處理器是一種DSA,是在ASIC基礎(chǔ)上具有一定的可編程能力。性能效率足夠好,但不夠靈活,不太適合業(yè)務(wù)邏輯和算法快速變化的AI場(chǎng)景。而GPU足夠靈活,但性能效率不夠,并且性能逐漸達(dá)到上限。 從目前大模型宏觀發(fā)展趨勢(shì)來(lái)看:
 
Transformer會(huì)是核心算法,在大模型上已經(jīng)顯露威力。未來(lái)模型的底層算法/算子會(huì)逐漸統(tǒng)一于Transformer或某個(gè)類(lèi)Transformer的算法。從此趨勢(shì)分析可得:AI場(chǎng)景的業(yè)務(wù)邏輯和算法在逐漸收斂,其靈活性在逐漸降低。
 
此外,AI計(jì)算框架也走過(guò)了百家爭(zhēng)鳴的階段,目前可以看到的趨勢(shì)是,PyTorch占據(jù)了絕大部分份額。這說(shuō)明整個(gè)生態(tài)也在逐漸收斂,整個(gè)系統(tǒng)的迭代也在放慢。
 
這兩個(gè)趨勢(shì)都說(shuō)明了,未來(lái),“專(zhuān)用”的AI芯片會(huì)逐漸地綻放光芒。當(dāng)然了,作為AI芯片的公司,不能等,而是需要相向而行:
 
需要定義一款,其性能/靈活性特征介于GPU和目前傳統(tǒng)AI-DSA處理器之間的,新型的通用AI處理器。“比GPU更高效,比AI芯片更通用”。
 
通用性體現(xiàn)在兩個(gè)方面:
 
一方面,處理器的通用性。能夠適配更多的算法差異性和算法迭代,覆蓋更多場(chǎng)景和更長(zhǎng)的生命周期。
 
另一方面,面向AGI通用人工智能。不再是專(zhuān)用AI的“場(chǎng)景千千萬(wàn),處理器千千萬(wàn)”,架構(gòu)和生態(tài)完全碎片;而是一個(gè)通用的強(qiáng)人工智能算法,一個(gè)通用的強(qiáng)處理器平臺(tái),去強(qiáng)智能化的適配各種場(chǎng)景。
 
02.大核少核 or 小核眾核?
 
 
 
CPU是大核,但通常一個(gè)芯片里只有不到100個(gè)物理核心;而GPU是小核眾核的實(shí)現(xiàn),目前通常在上萬(wàn)個(gè)核左右;而傳統(tǒng)AI芯片,通常是大的定制核+相對(duì)少量核(100核以內(nèi))的并行。
 
 
 
此外,一個(gè)很重要的現(xiàn)象是,GPU核,不再是之前只有CUDA核的標(biāo)量處理器,而是增加了很多Tensor核的類(lèi)協(xié)處理器的部分。新的GPU處理器不再在處理器核的數(shù)量上增加,反而把寶貴的晶體管資源用在單個(gè)核的協(xié)處理器上,把單核的能力做更多的強(qiáng)化。 因此,新型通用AI芯片需要:
 
在目前工藝情況下,并行的單芯片處理器核心(GA,通用AI處理器核心)數(shù)量在500-1000之間比較合適;
 
單個(gè)GA采用通用高效能CPU核(例如定制的RISC-v CPU)+強(qiáng)大的Tensor協(xié)處理器的方式。
 
03.極致擴(kuò)展性,多層次強(qiáng)化內(nèi)聯(lián)交互
 

每日福利更多>>

買(mǎi)房必看,2025年樓市開(kāi)局即變局,三個(gè)天花板、兩分化制約房?jī)r(jià) 兒子的房貸利率降了,但每月還要還11000多元。兒子說(shuō)他能扛得住 江鈴汽車(chē):1月總計(jì)銷(xiāo)量2.14萬(wàn)輛 同比增長(zhǎng)2.2% 蔚來(lái)汽車(chē)公布2025年1月銷(xiāo)量,樂(lè)道成為新的增長(zhǎng)點(diǎn) 春運(yùn)第7天客流持續(xù)走高,南昌鐵路局加開(kāi)旅客列車(chē)104列 杭州“傳奇宋韻、穿越未來(lái)”度假樂(lè)園來(lái)了 文化消費(fèi)成為上海經(jīng)濟(jì)發(fā)展重要驅(qū)動(dòng)力,非標(biāo)商業(yè)創(chuàng)造無(wú)限可能 陳家泠藝術(shù)迎春展在上海西岸啟幕 石鐘山《一世機(jī)密》:十年機(jī)密,一生守候 在荒誕中看到哲思,人藝新戲《羅慕路斯》陪你過(guò)年 這所少體校,為何成為上海跳水人的獨(dú)家回憶 青年力量推動(dòng)“國(guó)潮”崛起,卡游破圈背后的文化現(xiàn)象 從體育博物館移動(dòng)車(chē)到九子游戲,體育文化流淌在上海弄堂里 黃仁勛亮相英偉達(dá)北京迎春會(huì)現(xiàn)場(chǎng) 后現(xiàn)代體育:全球電競(jìng)之都的底色與遠(yuǎn)景 上海游戲產(chǎn)業(yè):文旅新引擎、文創(chuàng)新動(dòng)力、經(jīng)濟(jì)新活力 江南等地大寒開(kāi)場(chǎng)暖意明顯,未來(lái)三天我國(guó)大部雨雪稀少 上海呈現(xiàn)石虎晚年巨作,紐約聚焦小城錫耶納 佛光寺何以為唐構(gòu)?“梁思成林徽因文獻(xiàn)展”有實(shí)據(jù) 2025春節(jié)檔首日預(yù)售破多項(xiàng)紀(jì)錄,《射雕》票房遙遙領(lǐng)先 潮汕英歌舞動(dòng)百年弄堂,上海今潮8弄推多地非遺民俗迎春節(jié) 豫園燈會(huì)再次“出海”:主題燈組亮相越南河內(nèi) 泰興婚姻登記大數(shù)據(jù):結(jié)婚平均年齡繼續(xù)上升,再婚群體增多 “點(diǎn)亮心愿”慈善義拍在滬舉行,27幅書(shū)畫(huà)作品共籌善款697.8萬(wàn) 中國(guó)選手澳網(wǎng)雙打更進(jìn)一步,男單頭號(hào)種子辛納晉級(jí)16強(qiáng) 人文視閾下,語(yǔ)文教育的困境與出路 明起上海四大火車(chē)站全部進(jìn)入通宵運(yùn)營(yíng)模式,候車(chē)室24小時(shí)開(kāi)放 “開(kāi)禧北伐”:楊萬(wàn)里與陸游的政見(jiàn)分歧 利物浦6分領(lǐng)跑英超,張之臻晉級(jí)澳網(wǎng)男雙16強(qiáng) 江蘇泰興發(fā)布婚姻登記大數(shù)據(jù):結(jié)婚平均年齡繼續(xù)上升,再婚群體增多
主站蜘蛛池模板: 国产在线欧美精品 | 84pao国产成视频免费播放 | 91精品国产免费入口 | xx色综合| 九色国产在视频线精品视频 | 色妞在线视频 | 四虎精品免费国产成人 | 亚洲欧美综合网站 | a级黄视频 | 亚洲 欧美 制服 丝腿 | 亚洲视频在线视频 | 久久久不卡 | 亚洲a级片 | 国产精品55夜色66夜色 | 亚洲六月丁香六月婷婷花 | 日本精品三级 | 在线观看黄色网 | 欧美中文字幕在线播放 | 在线免费观看国产精品 | 四虎国产精品永免费 | 性―交―乱―色―情 | 日日狠日| 在线观看欧美精品 | 精品一区 二区三区免费毛片 | 久久精品视频免费看 | 亚洲69视频| 毛片在线观看视频 | 久久综合桃花 | 人人综合| 日本免费大黄在线观看 | 国产在线成人一区二区 | 综合在线播放 | 免费观看四虎精品成人 | 精品中文字幕不卡在线视频 | 91在线欧美精品观看 | 青青热久免费精品视频在首页 | 福利网站在线观看 | 一级二级毛片 | 国产精品福利资源在线 | 99伊人网 | 亚洲人成在线免费观看 |