ZEN zu ZEN+ und ZEN2 im Vergleich
ZEN, die erste Generation setzt auf bis zu zwei CoreCompleX CCX. Diese beinhalten jeweils vier x86 Integer-Kerne mit jeweils einer Floating-Point-Unit (FPU) pro Kern sowie einen gemeinsam von allen 4 Kernen verwendeten L3-Cache. Dieser ist jedoch in 4 gleich große Stücke aufgeteilt. Jeder Kern unterstützt SMT (Simultaneous Multithreading) und kann pro Taktzyklus bis zu zwei Operationen über den Kern schleusen und berechnen lassen. Der AMD Summit Ridge mit der ZEN-Architektur ist in 14 nm gefertigt. ZEN+ ist die überarbeitete Architektur des Vorgängers ZEN. Hier wurde im Bereich der Cache-Anbindung den einen und anderen Flaschenhals beseitigt, der die IPC im Vergleich zum Vorgänger um 3% anhebt. In Verbindung mit dem 12 nm Verfahren konnte zudem eine leicht höhere Taktfrequenz erreicht werden. Die Fläche des Zeppelin-Dies wurde jedoch nicht kleiner, da AMD bei dem Prozess aus Kostengründen nur den Vorteil der kleineren Transistoren und Leckströmen nutzen wollte. Dadurch ergibt sich eine geringere Packungsdichte, die dann wiederum mit Füllstoff versehen wurde. So musste man den laufenden Prozess der Fertigung des Dies nicht umlegend neu designen und konnte so Zeit und Geld sparen.
ZEN2 setzt weiterhin auf zwei CoreCompleX die hinsichtlich der Anordnung überarbeitet worden sind. Anders als beim Vorgänger, wurde der fiktive L0-Cache verdoppelt und die Sprungvorhersage massiv optimiert. Integer und Fließkommaeinheiten wurden ausgebaut und mit einer zusätzlichen Adress Generating Unit (AGU) versehen. Die FPU kann nun eigenständig auf 256 Bit-Leitungen zugreifen. Bei ZEN und ZEN+ mussten für diesen Fall zwei Rechenkerne für die Ausführung der AVX-256 zusammengeschaltet werden, was Performance kostet.
Bild vom CoreComplexDie von "OC_Burner" von Flickr
Mit dabei ist ein doppelt so großer L3-Cache, der gerade in Spielen einen unverzichtbaren Vorteil ermöglicht. AMD nennt diesen auch als Game-Cache. Dieser ist pro CoreCompleX 16 Mbyte groß. Auch hier können alle vier Kerne vom Cache aus gemeinsam zugreifen. Hergestellt werden die CoreCompute-Dies bei TSMC in 7 nm Fertigung.
Alle UnCore-Komponenten die also nicht direkt an der Berechnung im Prozessor beteiligt sind, wurden in einen I/O-Die ausgelagert. Darin enthalten sind der Speichercontroller, PCI-Express-Schnittstellen, USB-Schnittstellen sowie der Security-Prozessor, den es seit wenigen Jahren mit an Board eines Prozessors befindet. Der I/O-Die wird bei GlobalFoundries in 12 nm hergestellt.
Bild vom I/O-Die von "OC_Burner" von Flickr
Änderungen am Speichercontroller
Die erste Ryzen-Generation hat sich mit der Kompatibilität des Arbeitsspeichers schwer getan. Unterstützt werden offiziell DDR4 1866 Module bis DDR4 2666. Wurden Dual-Rank-Module eingesetzt, verringert sich der effektive Takt auf DDR4 2400. Nur mit Single-Rank-Modulen konnte der Arbeitsspeicher mit vollem Takt fahren. Inoffiziell war es auch möglich jenseits der JEDEC-Spezifikation auch Performance-Module einsetzen, die einen effektiven Takt von 3200 MHz und mehr besitzen. Die Kompatibilitätsliste deren Module wurde kürzer. Lediglich Speicherchips mit den Samsung B-Dies waren in dieser Klasse kompatibel, auf dem Markt relativ schwer zu bekommen und auch sündhaft teuer. Die ZEN+-Generation alias Pinnacle Ridge unterstützt auch DDR4 2933 MHz. Bei Vollbestückung aller 4 Steckplätze auf dem Mainboard sinkt die effektive Taktrate auf DDR4 2133 bei Single-Rank-Modulen und 1866 bei Dual-Rank-Modulen ab.
Sowohl bei ZEN als auch bei ZEN+ ist die Taktrate des Infinity-Fabric vom Speichertakt abhängig und sorgt so bei schnelleren Speichermodulen für einen höheren Datensatz zwischen den beiden CoreCompleX Bei ZEN2 mit dem optimierten Speichercontroller in dem I/O-Die sind Taktraten bis DDR4 5000 MHz möglich. Größer DDR4 3600 wird der RAM-Teiler aktiv. Das heißt, dass der Datendurchsatz größer DDR4 3600 auf 1800 MHz sinkt. Eine Latenz von 9 ns kommt zustande. Vernünftigerweise setzt man bei ZEN2 maximal DDR4 3600 Module ein, da diese den Kompromiss aus Kosten und Leistung sind. AMD nennt es auch als „Sweet Spot“.
Anzahl Module | Modul-Typ | maximaler Takt |
---|---|---|
2 von 2 | Single Rank | DDR4-3.200 |
2 von 2 | Dual Rank | DDR4-3.200 |
2 von 4 | Single Rank | DDR4-3.200 |
2 von 4 | Dual Rank | DDR4-3.200 |
4 von 4 | Single Rank | DDR4-2.933 |
4 von 4 | Dual Rank | DDR4-2.667 |
Thermal Design Power
Die TDP bei AMD Prozessoren soll theoretisch die Wärmeverlustleistung darstellen, also im Prinzip die Wärmegröße, die ein Kühler vom Prozessor fähig sein sollte, abzuführen. Die TDP Klassen aller AM4-Prozessoren beziffern sich auf 35, 45, 65, 95, und 105 Watt. Das die aufgenommene Leistung tatsächlich im Spot auch höher als diese sein kann, war schon längst zu vermuten. Dieses sollte man bei der Betrachtung der Effizienz der Prozessoren sowie bei der Auslegung des Mainboards, Netzteil und CPU-Kühler durchaus beachten. AMDs Ryzen 7 1800X, der erste unser Testprobanden hat eine TDP von 95 Watt. Vermutlich wird dieser Prozessor unter voller Auslastung auch 125 Watt und mehr überschreiten können. Unser zweiter Proband, der Ryzen 7 3600X kommt mit einer TDP von 65 Watt dabei. Auf dem Prospekt klingt dieser Wert erstmal phänomenal. In Wirklichkeit genehmigt sich der Prozessor laut Aussage von AMD bis zu 88 Watt. Der größere Ryzen 7 3800X sowie die Ryzen 9 3900X und 3950X besitzen eine TDP von 105 Watt. Hier gibt AMD als maximale Leistungsaufnahme von 144 Watt an.
Feature-Set
Die Ryzen der ersten Generation kam mit Sense-MI daher, ein Paket bestehend aus AMDs Precision Boost, Extended Frequency Range (XFR) und PurePower daher. Die ersten beiden gehören dem eigentlichen Turbo zu und steuern das Taktverhalten des Prozessores. Precision Boost steuert das allgemeine Taktverhalten im Betrieb, wie man es vor den Ryzen-Generationen als Turbo-Modus kennt. XFR gestattet bei guter Kühlung und sämtlichen spezifizierten Bedingungen von AMD die Übertaktung des Prozessors über die üblichen Grenzen hinaus. Der Prozessor kann so im Rahmen von AMD bis ans Limit gehen, ohne direkt Schaden davon zu tragen.Mit der zweiten Generation Ryzen hat AMD zusätzlich noch Precision Boost Overdrive eingeführt, wo die TDP des Prozessors vollständig ausgehebelt wird und der Prozessor über die Belastungsgrenze hinaus übertaktet werden kann. Ob das Sinn macht, sei erstmal dahin gestellt. Die Lebensdauer stark übertakteter Prozessoren kann erheblich sinken.
PurePower ist im Prinzip die gute alte Cool & Quiet Funktion, wo zusätzlich noch Stromkreise, die nicht temporär verwendet, abgeschaltet werden. Zudem regelt PurePower die Spannung in den einzelnen Bauteilen und verringert diese automatisch bei gleichbleibender Leistung des Prozessors.
PCIe Protokoll
Setzt AMD Ryzen 1000 und 2000 noch auf ein Mischmasch aus PCI Express 3.0 und 2.0, befindet sich in den Matisse Prozessoren der dritten Generation das PCIe-Protokoll 4.0. PCIe 4.0 wird offiziell nur unterstützt, wenn der auf dem Mainboard verbaute I/O-Hub auch PCIe 4.0 unterstützt. So die Theorie. Sämtliche Mainboard-Hersteller haben BIOS-Versionen auf den Markt gebracht, wo PCIe 4.0 sogar auch vom 2 ½ Jahre alten X370 und B350 Chipsatz unterstützt wird. Die Hersteller wurden dazu verpflichtet, dieses Feature in ihren BIOS-Versionen wieder zu deaktivieren. Kommt man aber mit der entsprechenden BIOS-Version auf dem älteren Mainboard mit B350 / X370 oder B450 / X470 Chipsatz und dem Ryzen 3000 zurecht, spricht im Prinzip nichts gegen die Verwendung von PCIe 4.0.
I/O-Hubs
Mit der Ryzen 3000 hat AMD zusätzlich einen neuen I/O-Hub auf den Markt gebracht. Dieser X570 I/O-Hub ist mit Ausnahme des deaktivierten Speichercontrollers und der Fertigungsstruktur von 14 statt 12 nm mit dem I/O-Die identisch. Sowohl der X570 I/O-Hub sowie der I/O-Die werden bei GlobalFoundries hergestellt. Der neue I/O-Hub unterstützt offiziell PCIe 4.0 und stellt im Vergleich zu den Vorgängern 16 PCIe 4.0 Lanes anstatt 8 PCIe 2.0 Lanes zur Verfügung. Die Anzahl der S-ATA-Ports belaufen sich auf 12 statt in der Regel 4 Stück. Die Anzahl der USB 3.0 und 3.1 Ports bleiben in Summe identisch. Die Anzahl der USB 2.0 Ports sinkt von 6 auf 4 ab, was aber nicht weiter tragisch ist, da die Ports neueren USB-Ports abwärtskompatibel sind. Der X570 hat im Vergleich zu den Vorgängern eine Leistungsaufnahme von 15 Watt, während sich der Vorgänger X470 mit 4,8 Watt, der X370 mit 6,8 Watt zurecht kam. Der Hintergrund könnte die erforderliche Signalqualität von PCIe 4.0 sein. In naher Zukunft wird sich neben dem X570 I/O-Hub noch ein B550 I/O-Hub gesellen. Dieser wird nach heutiger Kenntnis auf PCIe 4.0 verzichten und von ASMedia bereitgestellt. ASMedia hat auch schon die Vorgänger-Chips für die ersten beiden Ryzen-Generationen geliefert.