Januar 20, 2026

Von 32GB System-RAM wird über das BIOS 4GB fest als VRAM für die iGPU eingestellt. Das hat Auswirkungen darauf, wie die OpenCl-Treiber den Speicher an darktable melden:

  • Rusticl (Mesa): Hält sich strikt an die BIOS-Reservierung. Es meldet nur die 4 GB als maximal verfügbaren Speicher. Darktable muss daher mit wenig Speicher haushalten, was zu Tiling (3×3) und längeren Rechenzeiten führt (9.43s).
  • ROCm: Nutzt den Vorteil der Unified Memory Architecture (UMA) voll aus. Es ignoriert die künstliche 4-GB-Grenze des BIOS und greift flexibel auf den freien System-RAM zu (13.8 GB erkannt). Dadurch kann darktable größere Bildteile am Stück verarbeiten, das Tiling wird minimiert und die Performance steigt deutlich (5.88s).

Warum ist das wichtig?

Die verwende APU ist ein AMD Ryzen AI Max 395+ mit einer 8060S iGPU die sich den Speicher mit der CPU teilt (Unified Memory).

Im Normalfall teilen sich CPU und GPU den Speicher intelligent, d.h. die iGPU reserviert sich genau den Speicher den sie gerade benötigt (bis zu einer möglichen Obergrenze). Der restliche Speicher steht der CPU zur Verfügung.

In unserem Beispiel stehen der iGPU mindestens 4GB zur Verfügung, diese sind fest reserviert. Der CPU bleiben rund 28GB Ram übrig.

Starten wir den Export mit RustiCl, dann werden nur die 4GB erkannt, das System könnte aber mehr Speicher an die iGPU weitergeben. Es kommt zum Tiling: 🧩 denoiseprofile: 3×3 🧩 exposure: 1×1 🧩 atrous: 3×4 und die Verarbeitung ist langsamer.

Jetzt starten wir den Export mit ROCm. DT bekommt die Information vom Treiber das es bis zu 14GB des Speichers verwenden darf. Das reicht zwar nicht ganz aus um ein Tiling zu verhindern, allerdings ist es deutlich geringer: denoiseprofile: 2×1 🧩 atrous: 2×1 und die Verarbeitung ist schneller.

Und warum nicht einfach mehr Speicher für die iGPU einstellen, z.B. 16GB? Bei gleichem Speicher ist RustiCl tatsächlich schneller als ROCm (in diesem Beispiel, das ist nicht bei jeder (i)GPU so), allerdings steht dann der CPU nur noch maximal 16GB zur Verfügung, statt 28GB.