Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September letztes Jahr offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die im Dezember 2020 präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet.
Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führte Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich. Seit wenigen Wochen umfasst die GPU-Familie auch zwei neue Ti-Versionen: GeForce RTX 3070 Ti und RTX 3080 Ti. Das neue 3070er-Modell basiert auf dem GA104-400 Chip, bei der 3080 Ti handelt es sich um eine weitere GA102-Variante, nämlich den GA102-225. Ingesamt gehören nun sieben unterschiedlichen Ausführungen zur GeForce-RTX-3000-Familie: RTX 3060 (Ti), RTX 3070 (Ti), RTX 3080 (Ti) sowie RTX 3090.
Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.
Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)
Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.
Die GeForce RTX 3080 ordnet Nvidia zwischen den beiden jüngsten Modellen GeForce RTX 3070 Ti und GeForce RTX 3080 Ti ein. Dabei darf sich die 3080 über einen GA102-Grafikchip (GA102-200-KD-A1) freuen, der jedoch gegenüber dem Flaggschiff etwas beschnitten wurde. Die 28 Mrd. Transistoren verhelfen dem GeForce-Modell zu 68 Streaming Multiprocessors, was wiederum gleichbedeutend mit in Summe 8.704 ALUs ist („CUDA-Cores“). Zum Vergleich: Das Flaggschiff alias RTX 3090 kann auf insgesamt 10.496 Einheiten zurückgreifen. Die Anzahl der RT-Kerne entspricht 68, die Tensor-Kerne sind mit 272 ebenfalls leicht gegenüber der GeForce RTX 3090 reduziert.
Ergänzt wird diese GeForce-RTX-3000-Variante durch ein 320 Bit breites Speicherinterface zur Anbindung von GDDR6X-Speicher, der mit 10 GB in der Founders Edition eine solide Größe aufweist und daher auch für hohe Auflösungen Potenzial bietet. Dennoch ist die RTX 3090 mit satten 24 GB eine ganz andere Hausnummer und auch die RTX 3080 Ti hat mit 12 GB nochmals zwei GB mehr zu bieten. Im Vergleich mit der Turing-basierten GeForce RTX 2080 Ti muss die neue RTX 3080 auf ein Gigabyte Speicher verzichten, arbeitet bei 760 GB/s aber mit deutlich höherem Speicherdurchsatz als ihre Vorgänger (RTX 2080 Ti: 616 GB/s). Der Vergleich der technischen Daten befindet sich am Ende dieser Seite.
Drei 90-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.
Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 320 Watt an, was lediglich 30 Watt weniger sind als bei der momentan maximalen Ausbaustufe. Diesen Wert hebt Board-Partner ZOTAC für seine AMP-Holo-Version auf 340 Watt an. Die Karte wird über zwei 8-Pin-PCIe-Anschlüsse mit Leistung versorgt und hat somit 375 Watt zur Verfügung hat (75 Watt PCIe Slot + 2 x 150 Watt 8-Pin Anschluss). Den Boost-Takt hat der Hersteller ab Werk bereits um satte 60 MHz auf 1.770 MHz angehoben (+3,5%), der Speichertakt ist unverändert. Mehr zur Leistungsaufnahme lesen Sie auf Seite 18 des Artikels.
Die Karte belegt 2,5 Slots Bauhöhe und kommt im ausgefallenen HoloBlack-Kühlerdesign.
Das HoloBlack-Kühlerdesign der AMP-Grafikkarte von ZOTAC ist insgesamt 2,5 Slots hoch und mit einer RGB-LED-Beleuchtung (SPECTRA 2.0 RGB Lighting) versehen. Die Beleuchtung kann mithilfe des FireStorm Utility (Download) personalisiert werden ‒ die Backplate ist mit entsprechenden RGB-LEDs versehen. Die verbesserte IceStorm 2.0 Kühlung basiert auf sieben Kupfer-Heatpipes, die für einen effizienten Wärmetransport zuständig sind. Drei 90-mm-Lüfter mit jeweils elf Lüfterschaufeln erreichen einen bis zu zehn Prozent höheren Luftdurchsatz als die Vorgänger-Generation. Active Fan Control mit FREEZE Fan Stop sorgen dafür, dass die Lüfter stets mit der optimalen Drehzahl drehen und im lastfreien 2D-Betrieb sogar vollständig gestoppt werden. Per FireStorm Utility kann unter anderem auch auf die Lüfterregelung des Boliden Einfluss genommen werden. Mehr zur Temperatur- und Geräuschentwicklung erfahren Sie auf Seite 18 des Tests.
Über zwei integrierte 8-Pin-PCIe-Anschlüsse wird der Bolide mit ausreichend Leistung versorgt.
Am Slot-Bracket der Karte sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.
NVLink ist bei der GeForce RTX 3080 kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.
Folgend die technischen Eckdaten im Vergleich mit GeForce RTX 3080 Ti und RTX 3090.
Hersteller | Nvidia | ||
Produktbezeichnung | GeForce RTX 3080 | GeForce RTX 3080 Ti | GeForce RTX 3090 |
Logo | ![]() |
![]() |
![]() |
Architektur | Ampere | ||
Grafikchip | GA102 | ||
Fertigung | 8 nm | ||
Transistoren | ca. 28,0 Mrd. | ||
CUDA-Cores | 8.704 | 10.240 | 10.496 |
Tensor-Cores | 272 (3. Gen) | 320 (3. Gen) | 328 (3. Gen) |
Raytracing-Cores | 68 (2. Gen) | 80 (2. Gen) | 82 (2. Gen) |
Basistakt | 1.440 MHz | 1.365 MHz | 1.400 MHz |
Boosttakt | 1.710 MHz | 1.665 MHz | 1.700 MHz |
FP32-Rechenleistung | 29.768 GFLOPS | 34.099 GFLOPS | 35.686 GFLOPS |
FP16-Rechenleistung | 29.768 GFLOPS | 34.099 GFLOPS | 35.686 GFLOPS |
ROPs | 96 | 112 | |
TMUs | 272 | 320 | 328 |
Speichertakt | 9.504 MHz | 9.752 MHz | |
Speicherinterface | 320 Bit | 384 Bit | |
Speicherbandbreite | 760.320 MB/s | 912.384 MB/s | 936.192 MB/s |
Speichermenge | 10 GB GDDR6X | 12 GB GDDR6X | 24 GB GDDR6X |
Interface | PCIe 4.0 | ||
Leistungsaufnahme | 320 Watt | 350 Watt |
Auf der Rückseite befindet sich eine große Backplate mit RGB-LEDs.
#AMD #Benchmark #DLSS #Gaming #GeForce #Gigabyte #Grafikchip #Grafikkarte #INNO3D #KFA2 #Kühlung #Lüfter #Monitor #MSI #Netzteil #Nvidia #Overclocking #PCI #PCIe #Raytracing #Samsung #Sapphire #SMS #Software #Technologie #Turing #ZOTAC
MSI stellt seine neuen Grafikkarten auf Basis der GeForce RTX 5070 Ti GPU vor. Dazu gehören die Serien VANGUARD, GAMING...
KIOXIA Corporation und SanDisk Corporation haben eine hochmoderne 3D-Flash-Speichertechnologie entwickelt, die mit einer NAND-Schnittstellengeschwindigkeit von 4,8 Gbit/s, überlegener Energieeffizienz und...
Betmatch bleibt weiterhin führend bei der Entwicklung des Sportwettensektors. Es bietet Wettenden eine große Vielfalt an Märkten und modernste Taktiken...
Bereits zur CES in Las Vegas präsentierte Nvidia seine neue RTX-50-Familie auf Basis der KI-optimierten Blackwell-Architektur. Die neue GeForce-RTX-5000-Generation, die...
Unter dem Motto „FRITZ! Connects“ zeigt AVM vom 3. bis 6. März auf dem MWC 2025 die neuesten FRITZ!-Produkte für...
Mit der GeForce RTX 5080 X3 OC von INNO3D haben wir ein weiteres Custom-Design auf Basis der neuen Blackwell-Architektur im Testlab empfangen. Mehr zum Praxistest des Boliden in unserem Artikel.
Nachdem wir vor ein paar Tagen und pünktlich zur Marktverfügbarkeit die RTX 5080 1-Click OC von KFA2 angetestet haben, folgt nun der gewohnt ausführliche Review des Blackwell-Boliden.
Am heutigen Tag endet die Sperrfrist für Benchmarks und Reviews für die neuen GeForce RTX 5080 Custom-Modelle. Wir durften vorab einen Blick auf die KFA2 GeForce RTX 5080 1-Click OC werfen.
Mit der ROG Strix RTX 4090 bietet ASUS eine ab Werk übertaktete GeForce an, die mithilfe einer wuchtigen Quad-Slot-Kühlung eine überragende Kühlleistung bietet. Wir haben den Boliden in der Praxis ausgiebig begutachtet.