ROCm vs. RustiCl
System: Asus Z13 32GB (2025) – AMD Ryzen AI 395+ Max mit 8060S iGPU
Active Modules
Select Runs to Compare:
Click to select runs...
Drop your log files here
Supports multiple dt_bench.txt files at once.
Module Processing Time Comparison
Zusammenfassung der Performance
Die Daten zeigen einen deutlichen Performance-Vorteil für ROCm gegenüber RustiCL bei der Verarbeitung des Testbildes (DSC07828.ARW). Die schnellste ROCm-Konfiguration ist etwa 36% schneller als die schnellste RustiCL-Konfiguration.
1. ROCm Performance (Spitzenreiter)
- Bestwert: 3,852 Sekunden (Version 5.5.0).
- Skalierung: Es gibt einen signifikanten Sprung zwischen den Versionen. Während die Version 5.5.0 unter 4 Sekunden bleibt, benötigen die Versionen 5.4.1 und 5.4.0 zwischen 5,29 und 5,80 Sekunden.
- Effizienz: ROCm nutzt in den Top-Runs ca. 10,4 GB des verfügbaren Speichers aus, was auf eine gute Auslastung der Ressourcen hindeutet.
2. RustiCL Performance
- Bestwert: 5,633 Sekunden (Version 5.4.1).
- Vergleich: Selbst der beste RustiCL-Wert liegt noch hinter dem zweitbesten ROCm-Wert (5,29s).
- Speichernutzung: RustiCL nutzt konstant weniger Speicher (ca. 7 GB) im Vergleich zu den erfolgreichen ROCm-Runs, was ein limitierender Faktor für die Verarbeitungsgeschwindigkeit sein könnte.
3. Versionsvergleich (5.5.0 vs. 5.4.x)
- Bei ROCm brachte der Wechsel von 5.4.1 auf 5.5.0 einen massiven Performance-Schub von ca. 27% (von 5,29s auf 3,85s).
- Bei RustiCL hingegen scheint die neuere Version 5.5.0 (6,046s) sogar etwas langsamer zu sein als die Version 5.4.1 (5,633s).
Technische Beobachtungen
- Gerätebezeichnung: Das System erkennt die Hardware entweder als
gfx1151(typischerweise unter ROCm) oder explizit alsRadeon 8060S Graphics(unter RustiCL). - Optimierungen: Alle Runs wurden mit den Optionen
-cl-fast-relaxed-mathdurchgeführt. - Tiling/Module: Die langsameren Runs (Platz 4 bis 6) zeigen spezifische Modul-Informationen wie
denoiseprofile,exposureundatrous, was darauf hindeutet, dass hier komplexe Bildverarbeitungsschritte aktiv waren, die bei den Top-Runs eventuell effizienter durch den Compiler optimiert wurden.
Fazit
Für das System (Asus Z13 mit Ryzen AI 395+ Max) ist ROCm in der Version 5.5.0 die mit Abstand effizienteste Wahl für diese Art der Workloads. RustiCL ist zwar eine solide Open-Source-Alternative, erreicht aber momentan nicht die Optimierungshöhe von ROCm auf dieser spezifischen AMD-Hardware.
Fragen zu diesem Thema? Diskutiere mit uns im Forum!
Letzes Update: Februar 14, 2026
