ARM kündigt die Mali-G77-GPU mit neuer „Valhall“ -GPU-Architektur und 1,4-facher Leistungsverbesserung an

ARM hat die Mali-G77-GPU zusammen mit der Cortex-A77-CPU auf seinem jährlichen TechDay vorgestellt. Während der Cortex-A77 eine bedeutende Weiterentwicklung gegenüber seinem Vorgänger, dem Cortex-A76, darstellt, ist die Mali-G77-GPU etwas ganz anderes. Es ist die erste GPU in der ARM-Reihe in Mali, die seit dem Mali-G71, der 2016 die Bifrost-Architektur eingeführt hat, eine neue GPU-Architektur eingeführt hat. Der Mali-G77 bringt die brandneue „Valhall“ -Architektur mit.

Obwohl das CPU-IP von ARM in der Vergangenheit in der breiteren Smartphonelandschaft durchaus wettbewerbsfähig war, hat die GPU-Reihe des Unternehmens in Mali im Laufe der Jahre Probleme, mit den branchenführenden Lösungen mitzuhalten. Immer wieder hat sich gezeigt, dass die Mali-GPU-Serie den PowerVR-GPUs von Adreno and Imagination Technologies in Bezug auf Leistung und Energieeffizienz unterlegen ist. Die Bifrost-Architektur folgte der Midgard-Architektur und wechselte von einem Vektortyp zu einem Skalartyp. Leider führte dies nicht zur Überwindung der scheinbar größeren Lücke in Bezug auf Leistung und Energieeffizienz. Der Mali-G71 und der Mali-G72 litten unter übermäßig hohem Stromverbrauch und Drosselung, wodurch sie den Adreno-GPUs von Qualcomm und der benutzerdefinierten GPU von Apple (beginnend mit dem Apple A11) unterlegen waren.

Die schlechte GPU-Leistung wurde zu einem so bedeutenden Problem, dass die Anbieter die Aussicht auf geringfügige GPU-Zuwächse nach einer Generation abschätzten. Die Mali-G72MP18-GPU des Exynos 9810 war zum Beispiel eine leichte Verbesserung gegenüber dem Vorgänger. Die HiSilicon Group von Huawei kämpfte viel stärker mit den Mali-GPUs. Das HiSilicon Kirin 960 und das Kirin 970 wurden von GPUs enttäuscht, die ungewöhnlich viel Strom verbrauchten und gleichzeitig relativ wenig Leistung lieferten. Dies führte dazu, dass Huawei gezwungen war, einen unkonventionellen Drosselmechanismus einzuführen, der dazu führte, dass bei mehreren Huawei-Handys Benchmark-Betrug festgestellt wurde vergangenes Jahr.

Der Mali-G76 hat im vergangenen Jahr dankenswerterweise erhebliche Verbesserungen in Bezug auf Leistung und Energieeffizienz erzielt. Mit einer 10-Core-Version des Mali-G76 konnte HiSilicon eine Leistungsverbesserung von 46% versprechen, und obwohl das Unternehmen die Leistungszahlen erreichte, war es immer noch nicht in der Lage, die GPU-Leistung (sowohl Spitzenleistung als auch anhaltende Leistung) zu erreichen. sowie Energieeffizienz Krone. Samsung Systems LSI hat beim Exynos 9820 eine 12-Core-Version der GPU implementiert und damit den Abstand zur Adreno 640-GPU des Qualcomm Snapdragon 855 verringert. Die Adreno-GPUs von Qualcomm sind nach wie vor die Klassenführer im Android-Markt, aber Apple hat sich im vergangenen Jahr mit der benutzerdefinierten GPU des Apple A12 verbessert. Apple konnte Qualcomm sowohl in Bezug auf Spitzenleistung als auch in Bezug auf nachhaltige Leistung schlagen, und das Unternehmen zeigte auch eine wettbewerbsfähige Energieeffizienz. Derzeit liegt die GPU des A12 weiterhin an der Spitze, während die Adreno 640-GPU des Snapdragon 855 bei den meisten Benchmarks an zweiter Stelle liegt.

Angesichts dieses Wettbewerbsumfelds musste sich ARM der Herausforderung stellen.

Das Ergebnis war der Mali-G77 und die neue Valhall-Architektur. Laut ARM wird die Leistungsdichte um 30% gesteigert, die Energieeffizienz um 30% und das maschinelle Lernen (ML) um 60% verbessert. ARM erwartet von Mali-G77-basierten Geräten eine 40% bessere Grafikleistung auf Mobilgeräten.

Das Unternehmen geht davon aus, dass der Mali-G77 mehr High-End-Gaming für Mobiltelefone bringen wird, und stellt fest, dass 2018 die Einnahmen aus dem mobilen Gaming erstmals die Einnahmen aus dem Konsolen- und PC-basierten Gaming übertrafen.

In Bezug auf ML gibt ARM an, dass der Mali-G77 Geräte mit der Fähigkeit ausstattet, „zunehmend komplexere“ ML-Aufgaben schneller auf dem Gerät auszuführen und dabei die Leistungsdichte um 60% zu verbessern. Dies ist besser, als sie zur Verarbeitung an die Cloud zu senden, was zu mehr Sicherheitsbedenken und einer geringeren Leistung sowie einer höheren Latenz führt.

Die neue Valhall-Architektur ist die Basis für die Mali-G77- und zukünftigen Mali-GPUs. Laut ARM handelt es sich bei Valhall aufgrund der folgenden Merkmale um eine „neuartige Architektur“:

  • „Ein neuer Superskalarmotor, der einen weiteren Sprung in Energieeffizienz und Leistungsdichte liefert
  • Eine vereinfachte skalare ISA mit einem neuen Befehlssatz, der kompilerfreundlicher ist
  • Neue dynamische Befehlsplanung
  • Überarbeitete Datenstrukturen, die besser auf moderne APIs wie Vulkan abgestimmt sind.
  • Obwohl es viele verschiedene Verbesserungen und neue Funktionen gibt, sind die beiden wichtigsten die Ausführungs-Engine und der Textur-Mapper in Mali-G77. “

Die Wide-Execution-Engines des Mali-G77 verbessern laut ARM die Leistungsdichte, indem sie die Kontrolle über eine große Anzahl von Spuren teilen. Das Mali-G76 verfügt über 8-breite Warps und insgesamt 24 FMA-Lanes pro Shader-Core, während das Mali-G77 über 16 Wide-Warps, 32 Lanes (zwei Cluster mit 16 FMA pro Execution-Engine) und eine Engine pro Shader-Core verfügt. Dies führt zu einer um 33% höheren Rechenleistung im selben Bereich im Vergleich zum G76, so das Unternehmen.

ARM gibt auch an, dass die verbesserte Spieleleistung des Mali-G77 mit dem Quad-Texture-Mapper zusammenhängt, der vier Texel / Zyklus liefert, was einem zweimal besseren Durchsatz als der Mali-G76 und einem viermal höheren Durchsatz als der G72 entspricht. Es wird gesagt, dass es Verbesserungen für High-Fidelity- und Gelegenheitsspiele bietet, aber es wird einen besonders großen Einfluss auf texturintensive Spiele haben. Die Rechenkapazität der G77 wurde erhöht, sodass laut ARM auch die Texturkapazität erhöht werden musste, um die Maschine im Gleichgewicht zu halten. Das Endziel? Liefern Sie mehr Leistung pro Quadratmillimeter als zuvor.

Der Mali-G77 wurde optimiert, um mit den neuen 16-Wide-Ausführungs-Engines und dem Quad-Texture-Mapper übereinzustimmen. Diese Optimierung umfasst eine Neugestaltung der LSC und der Attributleitung mit Schwerpunkt auf Leistungsdichte und Energieeffizienz.

Laut ARM liegt der Schwerpunkt auf der Verbesserung der Energieeffizienz und es wird dafür gesorgt, dass der Mali-G77 in 50% der Energie des Mali-G72 von vor zwei Jahren die gleiche Leistung erbringen kann. Laut Angaben des Unternehmens steigern die Valhall-Architektur und der Mali-G77 die Energieeffizienz bei allen Workloads. Dies führt zu einer 1, 3-fachen Verbesserung bei „einer breiten Palette von Inhalten“, was bedeutet, dass Benutzer bei Premium-Geräten eine längere Akkulaufzeit erzielen.

ARM gibt an, dass die dynamische Befehlsplanung jetzt in der Hardware ausgeführt wird, um eine bessere Leistung zu ermöglichen. Der dynamische Scheduler soll entscheiden, welche Befehle von welchen Warps ausgeführt werden sollen, und die Arbeit wird dann in superskalarem Stil an unabhängige parallele ALUs ausgegeben.

Schließlich stellt ARM fest, dass die Valhall-Architektur die Weiterentwicklung der ARM-Frame-Buffer-Komprimierung durch AFBC 1.3 fortsetzt. Es enthält einige neue Funktionen, die im Blog-Beitrag von ARM zu lesen sind.

ARM verspricht dem Mali-G77 große Fortschritte und verspricht signifikante Leistungsverbesserungen bei komplexen AR- und ML-Anwendungen sowie eine „kompromisslose Grafikleistung und gesteigerte Effizienz“. Wenn sich die Behauptungen bewähren, sehen wir möglicherweise endlich eine ARM Mali-GPU Die Adreno-GPU einer bestimmten Generation wird weiterentwickelt oder sogar verbessert, und der Markt für mobile GPUs wird um einiges wettbewerbsfähiger.

Quelle : ARM

Via : AnandTech