Januar 26, 2026
CPU vs. ROCm vs. RustiCl
System: Asus Z13 32GB (2025) – AMD Ryzen AI 395+ Max mit 8060S iGPU
Drop your log files here
Supports multiple dt_bench.txt files at
once.
Überraschender Sieg für RustiCL auf der APU
Im Gegensatz zum Benchmark AMD RX 9060XT 8GB (bei der eine dedizierte Grafikkarte genutzt wurde), sehen wir hier eine integrierte Grafikeinheit (iGPU) aus der neuen AMD Ryzen AI 300 Serie („Strix Point“). Das Ergebnis dreht sich hier um: Der Open-Source-Treiber schlägt die offizielle Lösung deutlich.
Die Ergebnisse im Detail:
Platz 1: RustiCL (Mesa OpenCL)
- Zeit: 3,560 Sekunden
- Analyse: RustiCL liefert hier eine hervorragende Performance ab. Es ist ca. 65% schneller als die ROCm-Implementierung auf derselben Hardware. Das deutet darauf hin, dass der Mesa-Treiber für diese sehr neue integrierte RDNA 3.5 Architektur (Radeon 8060S) bereits sehr gut optimiert ist oder effizienter mit dem geteilten Speicher (Shared Memory) der APU umgeht.
Platz 2: ROCm (gfx1151)
- Zeit: 5,883 Sekunden
- Analyse: ROCm enttäuscht hier etwas. Mit fast 6 Sekunden ist es kaum schneller als die reine CPU-Berechnung. Ein möglicher Grund könnte der Overhead des ROCm-Stacks sein, der bei kleineren, integrierten GPUs stärker ins Gewicht fällt als bei großen dedizierten Karten. Zudem sehen wir im „Tiling“-Bereich, dass ROCm hier Kacheln (Tiling) verwendet (
denoiseprofile: 2x1,atrous: 2x1), während RustiCL das Bild anscheinend in einem Rutsch verarbeiten kann. Dieses Tiling kostet oft Zeit.
Platz 3: CPU Only (Ryzen AI 9 365 / „395-Max“)
- Zeit: 6,393 Sekunden
- Analyse: Die CPU-Leistung ist für einen mobilen Chip sehr schnell und liegt gefährlich nah an der ROCm-Performance. Das zeigt, wie ineffizient ROCm in diesem speziellen Szenario arbeitet – es bringt kaum einen Vorteil gegenüber dem Prozessor selbst.
Fazit
Bei dieser modernen AMD APU (Ryzen AI 300 Serie) ist RustiCL derzeit die klar bessere Wahl für Darktable.
- RustiCL nutzt die Hardware effizient und vermeidet unnötiges Tiling.
- ROCm scheint auf dieser spezifischen integrierten Architektur (noch) Probleme zu haben, sei es durch Treiber-Reife oder ungünstiges Speichermanagement, was zu unnötigem Tiling und schlechterer Performance führt.
