最近,市場關注的兩家ASIC企業都發布了自家的財報。
博通2025財年第一季度財報顯示,營收149.16億美元,同比增長25%,凈利潤55.03億美元,同比增長315%。其中,第一季度與AI有關的收入同比增長77%至41億美元。
Marvell預計第一財季銷售額約為18.8億美元,同比增長27%。其中,AI業務收入達7億美元左右,主要是亞馬遜等客戶定制ASIC等產品需求增長的帶動。
擁擠的ASIC賽道
3nm ASIC芯片的賽道上擠滿了大廠。
亞馬遜一直在致力于自研芯片以降低數據中心成本。
2022年,AWS發布了Trainium 1和 Inferentia 2芯片。當時,Trainium1在訓練方面表現不是很好,更加適合AI推理工作。
之后,AWS又發布了當前的Trainium 2,采用5nm工藝。單個Trainium 2芯片提供650 TFLOP/s的BF16性能。Trn2實例的能效比同類GPU實例高出25%,Trn2 UltraServer的能效比Trn1實例高三倍。
去年12月,亞馬遜宣布要推出全新 Trainium3,采用的是3nm工藝。與上代 Trainium2 相比,計算能力增加2倍,能源效率提升40%,預計2025年底問世。
據了解,在AWS的3nm Trainium項目中,世芯電子(Alchip)和Marvell展開了激烈的競爭。
世芯電子(Alchip)是第一家宣布其3nm設計和生產生態系統準備就緒的ASIC公司,支持臺積電的N3E工藝。Marvell則在Trainium 2項目中已經取得了顯著進展,并有望繼續參與Trainium 3的設計。
當前的競爭焦點在于:后端設計服務和CoWoS產能分配上。看誰能夠在Trainium項目爭取到更多的份額。
之前我們提到的TPU,以谷歌的TPU最具有代表性。谷歌的TPU系列芯片從v1到最新的Trillium TPU。TPU為Gemini 2.0的訓練和推理提供了100%的支持。據谷歌這邊說,Trillium 的早期客戶AI21 Labs認為是有顯著改進的。AI21 Labs首席技術官Barak Lenz表示:“Trillium在規模、速度和成本效益方面的進步非常顯著。”現在谷歌的TPU v7正在開發階段,同樣采用的是3nm工藝,預計量產時間是在2026年。
據產業鏈相關人士透露,谷歌TPU芯片去年的生產量已經達到280萬到300萬片之間,成為全球第三大數據中心芯片設計廠商。從合作對象來說,谷歌和博通始終是在深度合作的。谷歌從TPU v1開始,就和博通達成了深度合作,它與博通共同設計了迄今為止已公布的所有TPU,而博通在這方面的營收也因谷歌水漲船高。
微軟在ASIC方面也在發力。Maia 200是微軟為數據中心和AI任務定制的高性能加速器,同樣采用3nm工藝,預計在2026年進入量產階段,至于現在Maia 100,也是專為在Azure中的大規模AI工作負載而設計。支持大規模并行計算,特別適合自然語言處理(NLP)和生成式AI任務。從現在的信息來看,這款產品微軟選擇和Marvell 合作。
早在今年1月就有消息傳出,美國推理芯片公司Groq已經在自己的LPU芯片上實機運行DeepSeek,效率比最新的H100快上一個量級,達到每秒24000token。值得關注的是,Groq曾于2024 年12月在沙特阿拉伯達曼構建了中東地區最大的推理集群,該集群包括了19000個Groq LPU。
Open AI首款AI ASIC芯片即將完成,會在未來幾個月內完成其首款內部芯片的設計,并計劃送往臺積電進行制造,以完成流片(taping out)。最新消息是,OpenAI會在2026年實現在臺積電實現量產的目標。
算力走向推理,ASIC的需求只多不少
在溫哥華NeurIPS大會上,OpenAI聯合創始人兼前首席科學家Ilya Sutskever曾作出“AI預訓練時代將終結”的判斷。
巴克萊的一份報告預計,AI推理計算需求將快速提升,預計其將占通用人工智能總計算需求的70%以上,推理計算的需求甚至可以超過訓練計算需求,達到后者的4.5倍。
英偉達GPU目前在推理市場中市占率約80%,但隨著大型科技公司定制化ASIC芯片不斷涌現,這一比例有望在2028年下降至50%左右。
不過,在博通的觀察中,AI訓練仍然是會占據主流。博通CEO陳福陽最近表示:“公司把推理作為一個獨立的產品線,推理與訓練芯片的架構非常不同。公司預計三個客戶未來需求市場總量將達600億~900億美元,這個需求總量既包含了訓練,又包含了推理,但其中訓練的部分更大。”
對于第二季度來講,博通對于ASIC的預期仍舊保持樂觀。預計第二季度博通的AI半導體收入將繼續保持強勁增長勢頭,達到44億美元。
Marvell在電話會議上,同樣也展示了對于ASIC的信心。透露其定制的ARM CPU,將在客戶的數據中心中得到更廣泛的應用。并且定制的人工智能 XPU,其表現也非常出色,未來將有大量的量產。