
Na konferenci Google Cloud Next 25 společnost Google oznámila Ironwood — Tensor Processing Unit (TPU) sedmé generace, vytvořený speciálně pro inferenci (inferenci modelu umělé inteligence). Je to dosud nejvýkonnější a nejškálovatelnější akcelerátor umělé inteligence od Googlu, který poskytuje bezprecedentní výkon a energetickou účinnost.
Od reaktivní k proaktivní umělé inteligenci
TPU od Googlu se používají k trénování a obsluze komplexních modelů umělé inteligence již více než deset let, a to jak interně, tak v Google Cloudu. Podle společnosti však. Ironwood — nejedná se pouze o vývoj produktu TPU, ale o plnohodnotný posun paradigmatu.
Moderní umělá inteligence se mění z modelů tryskových letadel (které jednoduše poskytují informace) k proaktivním systémům, schopen samostatně analyzovat data, generovat poznatky a činit rozhodnutíGoogle to nazývá „věkem inference“ – kdy umělá inteligence nejen zpracovává dotazy, ale předvídá potřeby a navrhuje řešení.
Rozsah a výkon Ironwoodu
Ironwood – Je revoluce v hardwaru pro umělou inteligenci:
- Škálovatelné na 9 216 žetonů s kapalinovým chlazením.
- Celkový výkon takového clusteru je 42,5 exaflopů (24krát více než nejvýkonnější superpočítač El Capitan, o kterém jste pravděpodobně slyšeli). Srovnání s maximálním výkonem předchozích generací TPU je uvedeno níže:
<img data-src=»https://servermall.ru/upload/resize_cache/format_converted/17060db28fd87a1e08ee030d2a1acd67.webp» />
- Každý čip poskytuje 4 614 TFLOPS a vybavené 192GB HBM paměť (6krát více než Trillium TPU šesté generace).
- Vylepšená mezičipová síť (ICI) s propustností 1,2 Tbps (1,5x rychlejší než TPU v6 Trillium).
Tato úroveň výkonu vám umožňuje vypouštět super velké Modely LLM a MoE, včetně Gemini 2.5 a AlphaFold, s minimálním zpožděním.
Energetická účinnost
Jedním z klíčových problémů moderních systémů umělé inteligence je obrovská spotřeba energieIronwood řeší tento problém takto:
- 2x lepší výkon na watt oproti Trillium (TPU v6).
- Kapalinové chlazení, které umožňuje dvojnásobnou účinnost ve srovnání s chlazením vzduchem.
- 30násobné zlepšení energetické účinnosti oproti prvnímu cloudovému TPU, který byl vydán před sedmi lety v roce 2018.
Máme k dispozici také schéma, které demonstruje hodnota TDP ve srovnání s předchozími modely procesorů Google AI:

Další vlastnosti železného dřeva
Ironwood také zahrnuje pokročilý Řídké jádro — specializovaný akcelerátor pro zpracování extrémně velkých vnoření typických pro komplexní problémy s hodnocením a doporučováním. Rozšířená podpora SparseCore společností Ironwood umožňuje akceleraci širší škály úloh, které sahají nad rámec tradičních úloh umělé inteligence do finanční a vědecké oblasti.
Cesty, proprietární běhové prostředí strojového učení od Google DeepMind, umožňuje efektivní distribuované výpočty napříč více TPU. Pathways v Google Cloudu usnadňuje škálování nad rámec jednoho clusteru Ironwood a umožňuje propojení stovek tisíc čipů Ironwood a rychlý rozvoj generativních schopností umělé inteligence.
Závěr
Ironwood je víc než jen nový procesor, je to základ pro novou generaci umělé inteligence. S ním Google Cloud umožní vývojářům a firmám vytvářet chytřejší, autonomnější a škálovatelnější systémy umělé inteligence.
Očekává se, že Železné dřevo bude k dispozici později v tomto roce. A pokud současné modely jako dříve zmíněné Gemini a AlphaFold již mění svět, pak s Ironwoodem můžeme očekávat ještě větší průlomy v oblasti umělé inteligence.