ROCm vs. RustiCl

System: Asus Z13 32GB (2025) – AMD Ryzen AI 395+ Max mit 8060S iGPU

Darktable Benchmark Report + Module Filter Darktable Benchmark Visualizer
Active Modules
Select Runs to Compare:
Click to select runs...

Drop your log files here

Supports multiple dt_bench.txt files at once.

Module Processing Time Comparison

Zusammenfassung der Performance

Die Daten zeigen einen deutlichen Performance-Vorteil für ROCm gegenüber RustiCL bei der Verarbeitung des Testbildes (DSC07828.ARW). Die schnellste ROCm-Konfiguration ist etwa 36% schneller als die schnellste RustiCL-Konfiguration.

1. ROCm Performance (Spitzenreiter)

  • Bestwert: 3,852 Sekunden (Version 5.5.0).
  • Skalierung: Es gibt einen signifikanten Sprung zwischen den Versionen. Während die Version 5.5.0 unter 4 Sekunden bleibt, benötigen die Versionen 5.4.1 und 5.4.0 zwischen 5,29 und 5,80 Sekunden.
  • Effizienz: ROCm nutzt in den Top-Runs ca. 10,4 GB des verfügbaren Speichers aus, was auf eine gute Auslastung der Ressourcen hindeutet.

2. RustiCL Performance

  • Bestwert: 5,633 Sekunden (Version 5.4.1).
  • Vergleich: Selbst der beste RustiCL-Wert liegt noch hinter dem zweitbesten ROCm-Wert (5,29s).
  • Speichernutzung: RustiCL nutzt konstant weniger Speicher (ca. 7 GB) im Vergleich zu den erfolgreichen ROCm-Runs, was ein limitierender Faktor für die Verarbeitungsgeschwindigkeit sein könnte.

3. Versionsvergleich (5.5.0 vs. 5.4.x)

  • Bei ROCm brachte der Wechsel von 5.4.1 auf 5.5.0 einen massiven Performance-Schub von ca. 27% (von 5,29s auf 3,85s).
  • Bei RustiCL hingegen scheint die neuere Version 5.5.0 (6,046s) sogar etwas langsamer zu sein als die Version 5.4.1 (5,633s).

Technische Beobachtungen

  • Gerätebezeichnung: Das System erkennt die Hardware entweder als gfx1151 (typischerweise unter ROCm) oder explizit als Radeon 8060S Graphics (unter RustiCL).
  • Optimierungen: Alle Runs wurden mit den Optionen -cl-fast-relaxed-math durchgeführt.
  • Tiling/Module: Die langsameren Runs (Platz 4 bis 6) zeigen spezifische Modul-Informationen wie denoiseprofile, exposure und atrous, was darauf hindeutet, dass hier komplexe Bildverarbeitungsschritte aktiv waren, die bei den Top-Runs eventuell effizienter durch den Compiler optimiert wurden.

Fazit

Für das System (Asus Z13 mit Ryzen AI 395+ Max) ist ROCm in der Version 5.5.0 die mit Abstand effizienteste Wahl für diese Art der Workloads. RustiCL ist zwar eine solide Open-Source-Alternative, erreicht aber momentan nicht die Optimierungshöhe von ROCm auf dieser spezifischen AMD-Hardware.

Fragen zu diesem Thema? Diskutiere mit uns im Forum!

Letzes Update: Februar 14, 2026