Kontaktiere uns

Kühlung neuester KI-Chips mit Flüssigkeiten

Veröffentlicht am
4. September 2024

Flüssigkeitskühlung ist die einzige praktische Lösung bei hoher Leistung

Die Wärmeübertragung durch die Bewegung einer bestimmten Flüssigkeitsmenge ist weitaus effizienter als durch die gleiche Luftmenge – bei Wasser etwa um den Faktor 3.600.

Kühlung neuester KI-Chips mit Flüssigkeiten

Dies macht die Flüssigkeitskühlung durch den Wärmeverteiler des Chips zu einer äußerst effektiven Methode. Sie ist im Allgemeinen erforderlich, wenn die Wärmeableitung etwa 50 W pro cm überschreitet.2 der Chipfläche. Da der GB200 eine geschätzte Fläche von ca. 9cm hat2, jede Verlustleistung über 450 W weist auf die Notwendigkeit einer Pumpenflüssigkeitskühlung hin.

Bei der „Direct-to-Chip“-Kühlung wird die Flüssigkeit durch Kanäle in einer Kühlplatte geleitet, die über eine thermische Schnittstelle mit dem Wärmeverteiler des Chips verbunden ist. Wenn die Flüssigkeit während des Vorgangs nicht verdunstet, spricht man von einem „einphasigen“ Betrieb, bei dem das Medium, normalerweise Wasser, durch einen von Lüftern gekühlten Wärmetauscher gepumpt wird.

Alternativ kann die Wärme an einen zweiten Flüssigkeitskreislauf übertragen werden, der das Gebäude und möglicherweise lokale Verbraucher mit Warmwasser versorgen kann. Ein Zweiphasenbetrieb bietet eine bessere Wärmeübertragung, indem die Flüssigkeit, normalerweise ein Fluorkohlenwasserstoff, beim Aufnehmen der Wärme verdunstet und dann am Wärmetauscher wieder kondensiert. Diese Methode kann eine dramatische Leistungssteigerung bringen. Allerdings werden weiterhin Systemlüfter zur Kühlung anderer Komponenten benötigt, obwohl einige, wie die DC/DC-Wandler, mithilfe ihrer eigenen Grundplatten in den Flüssigkeitskühlkreislauf integriert werden können. Dies entspricht dem Konzept der „vertikalen Stromversorgung“, bei dem DC/DC-Wandler direkt unter dem Prozessor positioniert werden, um Spannungsabfälle zu minimieren. Eine praktische Einschränkung des Direct-to-Chip-Ansatzes ist der Wärmewiderstand der Schnittstelle zwischen dem Chip und der Kühlplatte. Präzise Ebenheit der Oberflächen und Hochleistungspaste sind erforderlich, aber auf dem Multi-Kilowatt-Niveau kann der Temperaturunterschied immer noch problematisch sein.

Diese Einschränkung scheint eine drohende Grenze für die Wärmeableitung und damit für die Leistung zu sein. Als Lösung kann die Immersionskühlung in Betracht gezogen werden. Dabei wird der gesamte Server in ein offenes Bad aus dielektrischer Flüssigkeit gestellt, die über einen Behälter durch eine Schleife zu einem Wärmetauscher gepumpt wird. Auch hier ist für die beste Leistung ein Zweiphasenbetrieb möglich.

Die Intel-Ingenieure von 1971 wären erstaunt gewesen über die Leistungsniveaus, die 2024 in Rechenzentren erreicht werden. Aber steht uns jetzt ein Abgrund bevor? Es gibt praktische Grenzen für die Größe der Chips und den Temperaturanstieg, aber auch Einschränkungen bei der Energieversorgung und den Umweltauswirkungen, insbesondere wenn die Leistung weiterhin von der bloßen Replikation der Hardware abhängt.

Letztlich wollen Investoren eine Rendite ihrer Investitionen. Angesichts der extremen Komplexität der Kühlung, der hohen Energiekosten und der teuren Chipanschaffung – wie zum Beispiel der GB200-Chip, der Berichten zufolge bis zu $70.000 pro Stück kostet – könnte die kommerzielle Rentabilität bald zu einem dringenden Problem werden. Vielleicht wird uns die KI sagen, was die Lösung ist.