Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der neuen Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die erst im Dezember präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet. Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führt Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich.
Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.
Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)
Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.
Die GeForce RTX 3060 ist der jüngste Sprössling in der GeForce-RTX-3000-Familie und basiert auf der GA106-GPU, die gegenüber den größeren Modellen deutlich abgespeckt wurde. Von den ursprünglich ca. 28 Mrd. Transistoren sind beim GA106 derer noch ca. 12 Mrd. übrig geblieben. Daraus resultieren drei GPCs ‒ eine RTX 3070 basiert z.B. auf fünf GPCs. Entsprechend umfasst die neue GeForce in Summe 28 SMs mit 3.584 ALUs („CUDA-Cores“), 48 ROPs sowie 112 TMUs. Die Anzahl der RT-Kerne entspricht 28, die Tensor-Kerne sind mit 112 ebenfalls ebenso etwas weniger als bei dei anderen Modellen. Ergänzt wird die 3060 durch ein 192 Bit breites Speicherinterface zur Anbindung von GDDR6-Speicher, der mit 12 GB in der Founders Edition sehr üppig ausfällt und mit flotten 15 Gbps bzw. 7.500 MHz betrieben wird (360 GB/s).
Der satte Speicherausbau hat dabei einen guten Grund, denn die GeForce RTX 3060 ist die erste Nvidia-GPU, die Resizable BAR unterstützt. Dieses Feature gewährt der CPU Zugriff auf den GPU-VRAM, was eine Vielzahl von Anwendungsfällen beschleunigen kann. Bei Resizable BAR handelt es sich um eine Funktion im PCI Express Protokoll, das z.B. AMD bei seinen Radeon RTX 6000 Grafikkarten unter der Bezeichnung „Smart Access Memory“ (SAM) bewirbt. Verschiedene Mainboard-Hersteller haben in den vergangenen Wochen bereits entsprechende BIOS-Updates für ihre Platinen bereitgestellt, so dass eine Nutzung des VRAMs durch die CPU möglich wird. Für Gaming bei hohen Auflösungen dürfte die Speichermenge wenig Vorteile bringen, da der GPU ohnehin die Luft ausgehen wird.
Zwei 102-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.
Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 170 Watt an. Diese Angabe übernimmt auch Board-Partner KFA2 für seine EX-Variante, die über einen einzelnen 8-Pin-PCIe-Anschluss mit Leistung versorgt wird und somit 225 Watt zur Verfügung hat (75 Watt PCIe Slot + 150 Watt 8-Pin Anschluss). Mehr zur Leistunsaufnahme gibt es auf Seite 18 des Tests. Den Boost-Takt hat der Hersteller ab Werk um 42 MHz auf 1.822 MHz angehoben (+2,4%), der Speichertakt ist unverändert. Der höhere Boost-Takt setzt allerdings die Installation der Xtreme Tuner Plus Software und anschließender Aktivierung des OC Mode voraus. KFA2 bezeichnet dies als 1-Click OC, was der Bolide auch entsprechend mit im Namen trägt. Ohne weiteres Zutun des Nutzers arbeitet die Karte mit den üblichen 1.780 MHz der Founders Edition.
Die Karte im Custom-Design belegt knapp drei Slots Bauhöhe.
Die KFA2 GeForce RTX 3060 EX (1-Click OC) wird durch ein wuchtiges Custom-Kühler-Design gekühlt. Integriert in den Kühler sind zwei 102-mm-Axial-Lüfter, die im 2D-Betrieb zum Stillstand kommen und so die Geräuschkulisse im Desktop-Betrieb minimieren. Das Kühlerdesign basiert auf zwei Heatpipes, ist mit einer schwarzen Kunststoffabdeckung versehen und insgesamt etwas mehr als zwei Slots hoch, was aber in jedem Fall drei freie Steckplätze erfordert. Auf der Rückseite befindet sich eine schwarze Aluminium-Backplate, deren Oberfläche mit einem großen GeForce-Schriftzug versehen ist. Die RGB-Beleuchtung der beiden Lüfter sowie des seitlichen GeForce-RTX-Schriftzugs kann per Xtreme Tuner Plus Software gesteuert oder über das Mainboard mit weiteren Sync-fähigen Komponenten gekoppelt werden. Für letzteren Fall legt der Hersteller ein passendes Verbindungskabel bei.
Das Kühlerdesign kennen wir bereits von anderen EX-Grafikkarten des Herstellers.
Am Slot-Bracket sind insgesamt drei DisplayPort-Anschlüsse und ein einzelner HDMI-Port vorhanden.
NVLink ist bei der GeForce RTX 3060 kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.
Folgend die technischen Eckdaten im Vergleich mit der GeForce RTX 2070 SUPER.
Hersteller | Nvidia | ||
Produktbezeichnung | GeForce RTX 2070 SUPER | GeForce RTX 3060 | GeForce RTX 3060 Ti |
Logo | |||
Architektur | Turing | Ampere | |
Grafikchip | TU104 | GA106 | GA104 |
Fertigung | 12 nm | 8 nm | |
Transistoren | ca. 13,6 Mrd. | ca. 12,0 Mrd. | ca. 17,4 Mrd. |
CUDA-Cores | 3.072 | 3.584 | 4.864 |
Tensor-Cores | 384 (2. Gen) | 112 (3. Gen) | 152 (3. Gen) |
Raytracing-Cores | 48 (1. Gen) | 28 (2. Gen) | 38 (2. Gen) |
Basistakt | 1.650 MHz | 1.320 MHz | 1.410 MHz |
Boosttakt | 1.815 MHz | 1.780 MHz | 1.665 MHz |
FP32-Rechenleistung | 11.151 GFLOPS | 12.759 GFLOPS | 16.197 GFLOPS |
FP16-Rechenleistung | 22.302 GFLOPS | 12.759 GFLOPS | 16.197 GFLOPS |
ROPs | 64 | 48 | 80 |
TMUs | 192 | 112 | 152 |
Speichertakt | 7.000 MHz | 7.500 MHz | 7.000 MHz |
Speicherinterface | 256 Bit | 192 Bit | 256 Bit |
Speicherbandbreite | 448.000 MB/s | 360.000 MB/s | 448.000 MB/s |
Speichermenge | 8 GB GDDR6 | 12 GB GDDR6 | 8 GB GDDR6 |
Interface | PCIe 3.0 | PCIe 4.0 | |
Leistungsaufnahme | 250 Watt | 170 Watt | 200 Watt |
Auf der Rückseite befindet sich eine große Backplate.
#AMD #Benchmark #BIOS #DLSS #Gamer #Gaming #GeForce #Gigabyte #Grafikchip #Grafikkarte #INNO3D #KFA2 #Kühlung #Lüfter #Mainboard #Monitor #MSI #Netzteil #Nvidia #Overclocking #PCI #PCIe #Prozessor #Radeon #Raytracing #Samsung #Sapphire #SMS #Software #Technologie #Turing #ZOTAC
Die T9 ist die neueste Generation an externen SSDs aus dem Hause Samsung. Die für professionelle Anwender:innen entwickelte Serie portabler...
Mit der Präsentation der Watch Series 10 präsentiert Apple das neue Smartwatch-Modell zum 10. Jubiläum der Produktreihe. Passend dazu, gibt...
Micron Technology gab heute die Markteinführung seines Crucial DDR5 Pro Overclocking (OC) Gaming-RAM bekannt, der mit Geschwindigkeiten von 6.400 Megatransfers...
Wer auf der Suche nach einem neuen Headset ist, wird vermutlich bereits schon nach kurzer Zeit feststellen, dass es aufgrund...
KIOXIA Europa stellt mit der EXCERIA PLUS G2 Portable SSD Serie einen neuen externe Speicher vor. Bei der EXCERIA PLUS...
Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.
Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.
ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.
Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.