Taalas HC1關鍵技術與未來Inference晶片架構解析
摘要
Taalas HC1關鍵技術與未來Inference晶片架構解析 2026年2月20日加拿大AI晶片新創廠商Taalas發布可在Llama 3.1 8B模型實現16,960Tokens/s/user速率的AI晶片Taalas HC1,且不需使用HBM、CoWoS,單一晶片TDP僅約250W;不僅如此,其他Inference晶片新創廠商也在2026年積極推出新品,例如2026年2月24日SambaNova、MatX緊接著分別推出SN50、MatX One晶片,Axelera AI、Positron AI也預計在2026年分別推出Europa、Asimov晶片。
本篇報告主要深度解析:(1)記憶體內運算vs.馮.諾依曼架構;(2) Taalas HC1技術背景;(3)高效率Inference晶片新創廠商比較。期能解析CIM技術與Taalas實現高效率運算的原理、Inference晶片新創廠商的競爭態勢,與Inference晶片的未來可能發展。
一. 記憶體內運算vs.馮.諾依曼架構
二. Taalas HC1技術背景
三. 高效率Inference晶片新創廠商比較
四. 拓墣觀點
圖一 CIM vs. von Neumann Architecture
圖二 Taalas HC1 Card
圖三 Taalas HC1 Tokens/s/user
圖四 各類型AI晶片Inference適用性比較
圖五 Taalas HC1 block diagram
圖六 Taalas HC1運算過程
圖七 Taalas HC1運算過程實例
圖八 Three Scaling Laws
圖九 Tenstorrent Blackhole晶片架構
圖十 Groq LPU晶片架構
圖十一 Cerebras WSE-3晶片結構
圖十二 SambaNova SN50晶片結構
圖十三 Etched Sohu晶片示意圖
圖十四 d-Matrix Corsair晶片結構
圖十五 Untether AI Boqueria晶片結構
圖十六 Positron Atlas Server
圖十七 Axelera AI Metis AIPU晶片結構
圖十八 FuriosaAI TCP晶片結構
表一 CIM技術類型
表二 各AI新創廠商的高效率Inference晶片規格比較
