2025 年 7 月 16-19 日,第五屆 RISC-V 中國峰會在上海張江科學(xué)會堂拉開帷幕。這場匯聚全球芯片產(chǎn)業(yè)目光的盛會中,知合計算以 “多場主題演講 + 核心產(chǎn)品發(fā)布” 的強(qiáng)勢姿態(tài)登場 —— 不僅在主論壇、高性能分論壇、人工智能分論壇系統(tǒng)闡述技術(shù)理念,更正式公布新一代高性能 RISC-V 內(nèi)核進(jìn)展,并發(fā)布 “阿基米德” 系列通推一體 CPU 產(chǎn)品。這一系列動作,被業(yè)內(nèi)視為 RISC-V 架構(gòu)向高性能計算領(lǐng)域發(fā)起沖擊的 “沖鋒號”,也讓中國芯片企業(yè)在全球架構(gòu)競爭中的話語權(quán)再獲提升。
孟建熠博士在RISC-V中國峰會上演講
一、架構(gòu)變革臨界點(diǎn):RISC-V 為何成為 AI 時代新引擎?
全球芯片架構(gòu)的演進(jìn)始終與時代需求深度綁定:PC 時代 x86 以封閉生態(tài)壟斷市場,移動時代 ARM 靠 “公版授權(quán)” 降低設(shè)計門檻普及,而在 AI 與萬物互聯(lián)時代,RISC-V 正憑借開源、精簡、可擴(kuò)展的特性,成為重構(gòu)產(chǎn)業(yè)格局的新變量。
經(jīng)過十余年發(fā)展,RISC-V 已在物聯(lián)網(wǎng)、嵌入式領(lǐng)域?qū)崿F(xiàn)規(guī)?;涞?,但向高性能計算場景的突破卻始終面臨 “瓶頸”。知合計算 CEO 孟建熠博士指出:“當(dāng)前 RISC-V 陣營的第一梯隊(duì)產(chǎn)品,性能仍落后 ARM 與 x86 主流產(chǎn)品一個身位,且國內(nèi)真正量產(chǎn)的高性能 RISC-V 芯片尚未落地?!?這種性能滯后引發(fā)的 “惡性循環(huán)” 尤為明顯 —— 硬件性能不足導(dǎo)致操作系統(tǒng)、商業(yè)軟件適配動力下降,軟件生態(tài)薄弱又讓企業(yè)客戶持觀望態(tài)度,最終壓縮硬件廠商商業(yè)化空間。
而打破循環(huán)的關(guān)鍵,在于打造 “標(biāo)桿產(chǎn)品”。正如孟建熠所言:“只有先在性能上追上主流架構(gòu),才能讓開發(fā)者和客戶看到潛力,以標(biāo)桿帶動上下游聯(lián)動,形成生態(tài)正向循環(huán)。” 這一背景下,RISC-V 的 “開源基因” 與 AI 時代的計算需求形成了奇妙的契合 ——AI 推理場景對算力、能效、成本的平衡要求,恰好撞上了 RISC-V “由外而內(nèi)” 的架構(gòu)優(yōu)勢:不同于 x86 和 ARM “從架構(gòu)定義需求” 的傳統(tǒng)模式,RISC-V 能從應(yīng)用場景出發(fā)靈活擴(kuò)展,開發(fā)者甚至無需掌握 CPU 設(shè)計知識即可優(yōu)化軟件,這種 “需求導(dǎo)向” 的特性,為 AI 原生芯片提供了無限可能。
二、通推一體:架構(gòu)創(chuàng)新破解 AI 計算核心矛盾
在峰會主論壇上,知合計算在峰會現(xiàn)場還公布了其首代通推一體CPU產(chǎn)品“阿基米德”系列,以及阿基米德系列中針對邊緣服務(wù)器場景的A210芯片產(chǎn)品。
據(jù)了解,阿基米德系列創(chuàng)新性采用了UCA統(tǒng)一計算架構(gòu),實(shí)現(xiàn)了統(tǒng)一內(nèi)存和統(tǒng)一算子,有助于提高計算效率和性能,為用戶提供更強(qiáng)大的計算能力和更優(yōu)化的使用體驗(yàn)。“通推一體”架構(gòu)則實(shí)現(xiàn)了SoC層面高性能通用計算和AI推理能力的高效融合,相較于目前業(yè)界主流的傳統(tǒng)GPU/GPGPU方案,高性價比成為其核心優(yōu)勢。該系列首次亮相的A210,則是一款8核CPU,并配備了12 TOPS(INT8)的AI推理算力。
孟建熠表示,阿基米德系列在AI推理場景中的高性價比優(yōu)勢,源于其對不同大模型架構(gòu)需求的精準(zhǔn)適配,以及對傳統(tǒng)方案成本痛點(diǎn)的針對性突破。
當(dāng)前,基于Transformer架構(gòu)的傳統(tǒng)大語言模型,因模型參數(shù)規(guī)模龐大、計算過程中存在大量矩陣運(yùn)算與特征交互,對算力密度和內(nèi)存帶寬提出了極高要求。為滿足這類需求,GPU/GPGPU等并行計算卡普遍采用HBM作為存儲方案。但HBM的技術(shù)特性也帶來了顯著弊端:一方面,HBM制造工藝復(fù)雜、產(chǎn)能有限,導(dǎo)致其成本居高不下;另一方面,受限于堆疊技術(shù)和功耗控制,單顆GPU能搭載的HBM容量通常有限,難以滿足超大規(guī)模模型的全量參數(shù)加載需求。而若通過“多GPU互連”來擴(kuò)展內(nèi)存容量,又會帶來設(shè)備間通信開銷增加、算力利用率下降和浪費(fèi)等新問題。
這種“高帶寬依賴-HBM綁定-成本飆升+容量受限”的鏈條,使得傳統(tǒng)方案在AI推理場景中性價比偏低。
與傳統(tǒng)方案不同,知合計算的阿基米德系列選擇傳統(tǒng)CPU中的DDR內(nèi)存作為存儲方案。盡管DDR的帶寬和傳輸速度低于HBM,但其核心優(yōu)勢恰好匹配了以DeepSeek為代表的新興MoE架構(gòu)大模型的需求:MoE架構(gòu)的核心特點(diǎn)是模型參數(shù)規(guī)模極大,但實(shí)際推理時僅激活部分“專家模塊”,這對內(nèi)存的“容量”要求遠(yuǎn)高于“帶寬”,且單次計算的數(shù)據(jù)流并不大。此時,DDR內(nèi)存的“大容量”和“擴(kuò)容成本低”成為關(guān)鍵優(yōu)勢,既能滿足MoE模型的海量參數(shù)存儲需求,又能顯著降低硬件成本。
基于上述場景需求和RISC-V架構(gòu)的靈活設(shè)計,A210芯片無需盲目追求高帶寬和大算力,而是通過內(nèi)存架構(gòu)優(yōu)化與MoE模型的特性適配,在“算力供給-帶寬需求-內(nèi)存容量”之間找到了更優(yōu)平衡點(diǎn),同時避免了效率損耗和冗余成本。這種按需匹配的設(shè)計,能夠?qū)崿F(xiàn)AI推理場景下的高性價比優(yōu)勢——以更低成本提供滿足實(shí)際需求的推理能力。
當(dāng)前A210芯片已完成回片和內(nèi)部測試,即將對開發(fā)者、合作伙伴和客戶提供樣片測試申請,后續(xù)將繼續(xù)推進(jìn)其商業(yè)化落地和實(shí)際應(yīng)用場景的部署。
三、技術(shù)突圍背后:從架構(gòu)到生態(tài)的全鏈條創(chuàng)新
知合計算的突破并非偶然,而是建立在 “芯片架構(gòu) - 軟件算法 - 生態(tài)協(xié)同” 的全鏈條創(chuàng)新之上。這種系統(tǒng)性能力,正是 RISC-V 向高性能領(lǐng)域突圍的核心支撐。
知合計算雖非最早入局者,卻憑借對“商業(yè)化落地”的極致聚焦,走出了一條“后發(fā)先至”的差異化路徑。知合計算從成立之初便將重心鎖定在產(chǎn)品的實(shí)際落地能力上。其團(tuán)隊(duì)在芯片外圍設(shè)計、互連技術(shù)、緩存優(yōu)化等底層細(xì)節(jié),以及調(diào)試工具包、軟硬件交付配套工具鏈等生態(tài)支撐環(huán)節(jié)持續(xù)深耕,構(gòu)建起從CPU核到終端產(chǎn)品的完整技術(shù)鏈條。
眾所周知,RISC-V 生態(tài)建設(shè)的難點(diǎn),在于如何在軟件積累不足的情況下實(shí)現(xiàn)商業(yè)化落地。知合計算選擇了 “避實(shí)就虛” 的場景化策略 —— 聚焦對軟件生態(tài)依賴度較低的領(lǐng)域率先突破。
以大模型推理為例,主流算法核心算子僅需適配十余個,知合計算完成對滿血版 DeepSeek 等模型的適配后,即可直接應(yīng)用于一體機(jī)場景,無需大規(guī)模投入軟件適配。孟建熠解釋:“這是一種‘以點(diǎn)帶面’的生態(tài)建設(shè)思路 —— 先通過標(biāo)桿場景落地建立信心,再吸引更多開發(fā)者加入,形成滾雪球效應(yīng)?!?/p>
這種策略已初見成效:目前其 CPU 核已實(shí)現(xiàn)對 RISC-V 系統(tǒng)平臺規(guī)范關(guān)鍵子項(xiàng)的高支持率,SoC 和上層軟件棧原生兼容數(shù)十個平臺規(guī)范;同時與多家一線云廠商協(xié)作,在 IP 層面與合作伙伴深度聯(lián)動,構(gòu)建起 “硬件 - 軟件 - 應(yīng)用” 的協(xié)同網(wǎng)絡(luò)。
孟建熠對 RISC-V 的未來充滿信心:“如果 x86 像是占領(lǐng)了幾座主要島嶼,RISC-V 的未來可能是一片大海?!痔煜隆潜厝悔厔荩芸赡茉谖磥?5-10 年內(nèi)實(shí)現(xiàn)?!?但他也強(qiáng)調(diào),這需要全行業(yè)的協(xié)同 ——“國內(nèi)廠商要抱團(tuán)取暖,提升國際標(biāo)準(zhǔn)話語權(quán);通過‘競合共生’加速技術(shù)迭代,讓 RISC-V 從‘概念驗(yàn)證’走向‘規(guī)模商用’?!?/p>
結(jié)語:從 “星星之火” 到 “星辰大?!?/p>
當(dāng) “阿基米德” 系列的樣片即將交付測試,當(dāng)高性能內(nèi)核的軟件適配申請持續(xù)涌入,RISC-V 在高性能計算領(lǐng)域的突圍已從 “可能性” 變?yōu)?“進(jìn)行時”。知合計算的實(shí)踐表明:中國芯片企業(yè)不僅能在架構(gòu)創(chuàng)新中跟上全球節(jié)奏,更能通過場景化創(chuàng)新與生態(tài)協(xié)同,成為規(guī)則制定的重要參與者。
從物聯(lián)網(wǎng)的 “輕量級玩家” 到高性能計算的 “挑戰(zhàn)者”,RISC-V 的成長軌跡,恰是中國芯片產(chǎn)業(yè)從 “跟隨” 到 “引領(lǐng)” 的縮影。隨著 “通推一體” 架構(gòu)的普及、“阿基米德” 系列的落地,以及全行業(yè)的協(xié)同發(fā)力,RISC-V 正從過去的 “點(diǎn)點(diǎn)繁星”,走向 AI 時代的 “星辰大?!?。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。