今年以來(lái),大模型的火熱發(fā)展不僅讓人工智能重回行業(yè)舞臺(tái)中心,對(duì)于產(chǎn)業(yè)新一輪價(jià)值增長(zhǎng)也提供了新勢(shì)能。然而,隨著大模型技術(shù)研發(fā)的深入,參數(shù)規(guī)模增長(zhǎng),也使得相關(guān)的計(jì)算資源需求的急劇增加,為大模型發(fā)展的新一輪突破帶來(lái)了挑戰(zhàn)。
因此,高算力芯片的需求變得更為迫切,這種需求不僅僅體現(xiàn)在模型訓(xùn)練和推理上,同時(shí)也延伸到了API調(diào)用等方方面面。擁有足夠的算力資源,已經(jīng)成為評(píng)估一個(gè)人工智能企業(yè)實(shí)力的硬指標(biāo)之一。

近期,OpenAI的負(fù)責(zé)人山姆·奧特曼(Sam Altman)公開(kāi)表示,盡管目前還在評(píng)估中,但OpenAI并不排除自研 AI芯片的可能性。除了可能的自研計(jì)劃,OpenAI也為此投資了Cerebras、Rain Neuromorphics、Atomic Semi等頗具潛力的芯片初創(chuàng)公司,旨在更快、更廉價(jià)地生產(chǎn)芯片。
除了OpenAI外,人工智能企業(yè)的巨頭,例如微軟、谷歌、Meta等企業(yè)也在積極探索AI芯片的研發(fā)。一時(shí)之間,AI芯片相關(guān)的課題,又成為大模型廣泛應(yīng)用的“仰望星空”前,首先需要“腳踏實(shí)地”解決的問(wèn)題。AI芯片核心技術(shù)自研箭在弦上
眾所周知,隨著“百模大戰(zhàn)”的局面已然形成,大模型設(shè)計(jì)和實(shí)現(xiàn)上取得了顯著進(jìn)展,參數(shù)規(guī)模增長(zhǎng)相關(guān)的計(jì)算資源需求的急劇增加,訓(xùn)練和推理所需的計(jì)算資源也呈指數(shù)級(jí)增長(zhǎng)。然而,算力作為人工智能發(fā)展的三要素之一,現(xiàn)實(shí)世界中有限的計(jì)算資源,訓(xùn)練和推理過(guò)程變得更加耗時(shí)和昂貴。
從技術(shù)架構(gòu)來(lái)看,AI芯片主要分為圖形處理器(GPU)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)四大類。其中,GPU是較為成熟的通用型人工智能芯片,作為重要的計(jì)算資源在人工智能領(lǐng)域中發(fā)揮著關(guān)鍵作用。特別是GPGPU技術(shù)的應(yīng)用,使得GPU在云端進(jìn)行大模型訓(xùn)練算法時(shí)能夠顯著縮短訓(xùn)練時(shí)長(zhǎng),減少能源消耗,降低人工智能的應(yīng)用成本。FPGA和ASIC則是針對(duì)人工智能需求特征的半定制和全定制芯片,原則上定制化程度越高,所能兼容的算法種類就越少,但進(jìn)行AI加速時(shí)擁有更好的性能與更低的功耗。

大模型之家在《人工智能大模型產(chǎn)業(yè)創(chuàng)新價(jià)值研究報(bào)告》中指出,在全球算力市場(chǎng)中,英偉達(dá)作為高算力芯片的龍頭企業(yè),占據(jù)著領(lǐng)先地位。其A100、H100顯卡適用于支持各種機(jī)器學(xué)習(xí)模型,具備強(qiáng)大的數(shù)據(jù)處理能力,使其成為目前主流的AI芯片。目前,全球GPU市場(chǎng)中英偉達(dá)占據(jù)近90%份額。
在生成式人工智能熱潮所引發(fā)的強(qiáng)勁需求下,英偉達(dá)第二季度營(yíng)收達(dá)135.1億美元,同比增長(zhǎng)101%,創(chuàng)下歷史新高,凈利潤(rùn)達(dá)61.88億美元,同比暴漲843%。此外,英偉達(dá)首席執(zhí)行官黃仁勛指出,全球已裝設(shè)價(jià)值約1兆美元的數(shù)據(jù)中心,包括云、企業(yè)等領(lǐng)域,這一兆美元的數(shù)據(jù)中心正逐漸轉(zhuǎn)向加速運(yùn)算和生成式AI,也讓數(shù)據(jù)中心業(yè)務(wù)收入103億美元,同比增長(zhǎng)170%,成為新的增長(zhǎng)引擎。
雖然亞馬遜、Meta、寒武紀(jì)、地平線等國(guó)內(nèi)外科技巨頭都推出過(guò)AI芯片,但從使用場(chǎng)景上更多是用于AI運(yùn)算加速,即推理方面,這種自研芯片的優(yōu)勢(shì)在于可以大幅降低算力成本。
而在AI訓(xùn)練方面,英偉達(dá)憑借CUDA生態(tài)優(yōu)勢(shì),在AI及高性能計(jì)算等核心技術(shù)領(lǐng)域,仍然具備一定的領(lǐng)先優(yōu)勢(shì)。
而AMD、谷歌等企業(yè)雖然分別采用兼容CUDA和自研TPU的方式切入AI芯片賽道,試圖從AI訓(xùn)練需求中分得一杯羹,但兩者本身性能相比于英偉達(dá)同時(shí)期GPU而言性能與功耗方面還有一定差距,因此在市場(chǎng)表現(xiàn)上只能算差強(qiáng)人意。
可以說(shuō),在英偉達(dá)因?yàn)锳I賺得盆滿缽滿的現(xiàn)狀之下,有的企業(yè)想要搶奪英偉達(dá)在AI算力上的蛋糕,也有的企業(yè)想要實(shí)現(xiàn)芯片自主,在實(shí)現(xiàn)軟硬協(xié)同的同時(shí),節(jié)約芯片成本。
在大模型技術(shù)的全球化競(jìng)爭(zhēng)面前,芯片也將成為核心競(jìng)爭(zhēng)力之一。10月18日,美國(guó)計(jì)劃進(jìn)一步收緊對(duì)華AI芯片出口管制,并將管制擴(kuò)大至更多國(guó)家。據(jù)稱,新規(guī)將取消芯片的通信速度限制,并將重點(diǎn)放在計(jì)算性能上,這將導(dǎo)致原本可以在中國(guó)市場(chǎng)銷售的英偉達(dá)A800和H800芯片停售(halting sales)。這兩款芯片是英偉達(dá)去年為符合美出口管制要求定制的產(chǎn)品。
而國(guó)內(nèi)在GPU領(lǐng)域,雖然在圖形處理性能上已經(jīng)快步縮小與頭部企業(yè)差距,但在GPGPU領(lǐng)域,在算力、端口性能、生態(tài)等方面仍然與巨頭有著一定的差距,雖然短期內(nèi),國(guó)內(nèi)AI芯片市場(chǎng)仍然需要奮力追趕,但從長(zhǎng)期看來(lái),這種競(jìng)爭(zhēng)將推動(dòng)我國(guó)積累和發(fā)展芯片核心技術(shù),促使我們?cè)谌蛐酒I(lǐng)域取得更大的成就。端側(cè)人工智能推動(dòng)芯片AI能力升級(jí)
大模型的“芯戰(zhàn)”,不僅體現(xiàn)在大模型本身的開(kāi)發(fā)上。隨著分布式計(jì)算技術(shù)需求的不斷普及,以及用戶對(duì)于個(gè)人數(shù)據(jù)隱私需求的不斷升級(jí)。如今,大模型在端側(cè)的部署,也推動(dòng)著智能設(shè)備在芯片方面擁有更高的AI能力。

在2023驍龍峰會(huì)期間,高通技術(shù)公司發(fā)布了驍龍 XElite、第三代驍龍8移動(dòng)平臺(tái)等芯片新品,驍龍X Elite是為AI專門打造的PC計(jì)算平臺(tái),支持在終端側(cè)運(yùn)行超過(guò)130億參數(shù)的生成式AI模型。而第三代驍龍8移動(dòng)平臺(tái)NPU相比前代有98%的性能提升,模塊支持獨(dú)立供電,達(dá)到40%的能效提升。得益于端側(cè)的算力提升,依靠本地大模型,就能進(jìn)行生成式AI的交互。

除此之外,聯(lián)發(fā)科也在近期與vivo共同宣布,在行業(yè)內(nèi)首次實(shí)現(xiàn)了手機(jī)上的10億和70億AI大語(yǔ)言模型,以及10億AI視覺(jué)大模型,共同為消費(fèi)者帶來(lái)行業(yè)領(lǐng)先的端側(cè)生成式AI應(yīng)用創(chuàng)新體驗(yàn),正是基于即將發(fā)布的天璣9300旗艦芯片和vivo X100系列。

在蘋果上個(gè)月發(fā)布的iPhone 15 Pro系列所搭載的A17 Pro芯片中,搭載了16核Neural Engine神經(jīng)網(wǎng)絡(luò)引擎,運(yùn)行速度比上代快2倍,每秒可處理多達(dá)35萬(wàn)億次運(yùn)算。這意味著A17 Pro能夠更有效地執(zhí)行復(fù)雜的AI任務(wù),如深度學(xué)習(xí)、語(yǔ)音識(shí)別和圖像處理等,從而提供更好的用戶體驗(yàn),為蘋果的產(chǎn)品帶來(lái)了更多的創(chuàng)新可能,如光線追蹤、ProRes視頻錄制等功能。
同時(shí),有消息稱蘋果公司也在擴(kuò)大其AI工程師的招聘力度,并計(jì)劃整合其各種服務(wù)和平臺(tái)中的人工智能元素。蘋果還同時(shí)在內(nèi)部構(gòu)建文本生成技術(shù)等任務(wù),如長(zhǎng)文本生成、摘要、問(wèn)答等。
不只是手機(jī)產(chǎn)品,在PC產(chǎn)品線上,AI能力也成為了打造差異化賣點(diǎn)的重要方式。在上個(gè)月微軟發(fā)布會(huì)上,不僅再次重提Copilot的無(wú)縫AI體驗(yàn),在Surface產(chǎn)品線更新中,全新的Laptop Studio 2還成為配備獨(dú)立英特爾NPU的Windows計(jì)算機(jī)。
可見(jiàn),大模型在端側(cè)的應(yīng)用,未來(lái)或?qū)⒊蔀槭謾C(jī)、PC等智能設(shè)備的標(biāo)配。一方面,本地部署的大模型,能夠有效提升大模型處理的速度;另一方面,模型無(wú)需聯(lián)網(wǎng)即可完成用戶數(shù)據(jù)的訓(xùn)練,大大提升了數(shù)據(jù)安全的防護(hù)能力,讓用戶在使用時(shí)減少隱私信息泄漏的隱患。
在大模型之家看來(lái),隨著大模型在產(chǎn)業(yè)中全面落地已經(jīng)成為不可阻擋的趨勢(shì),搭載大模型的智能設(shè)備將滲透你我工作與生活的方方面面。而作為算力的硬件載體,芯片必然將成為企業(yè)角力的焦點(diǎn)。
無(wú)論是在移動(dòng)設(shè)備上,還是在云端數(shù)據(jù)中心,高性能、低能耗的芯片將成為各類智能應(yīng)用的核心。面對(duì)日益龐大的大模型計(jì)算需求,各大科技企業(yè)紛紛亮出了自家芯片的底牌,希望在這場(chǎng)硬件競(jìng)賽中取得先機(jī),而那些能夠在芯片技術(shù)上取得突破的企業(yè),將在人工智能領(lǐng)域占據(jù)重要地位,引領(lǐng)產(chǎn)業(yè)未來(lái)的發(fā)展方向。