Harwell-Boeing-Format

Das Harwell-Boeing-Format (auch Compressed Column Storage, deutsch komprimierte Spaltenspeicherung, kurz CCS-Format) ist eine Datenstruktur, die beim Speichern von dünnbesetzten Matrizen verwendet wird.

Hintergrund

Die Elemente einer Matrix, die nicht Null sind, werden dabei spaltenweise von links nach rechts abgelegt. Insgesamt werden drei Speicherarrays benötigt (im Folgenden ist , also eine Matrix mit m Zeilen und n Spalten, nnz bezeichnet die Anzahl der Nichtnulleinträge):

  • value (real): Hier stehen die Nichtnulleinträge der Matrix; die Größe des Arrays ist nnz.
  • row_ind (int): Zu jedem Element von value steht hier der zugehörige Zeilenindex zur Matrix ; die Größe des Arrays beträgt ebenfalls nnz.
  • col_ptr (int): Beginn jeder Matrixspalte von in value bzw. row_ind. Die Größe ist , wobei im letzten Eintrag der Wert nnz gespeichert wird (sofern die Zählweise bei 0 beginnt). Insbesondere beschreibt col_ptr[i+1] - col_ptr[i] die Anzahl der Nichtnulleinträge in Spalte i.

Die Vorteile des Formates liegen dabei in einem vergleichsweise geringen Speicherplatzbedarf, da die Nullelemente einer Matrix nicht gespeichert werden. Insbesondere dient diese Art der Speicherung dem schnellen Zugriff auf eine Spalte von . Wenn ein schneller Zugriff auf Zeilen benötigt wird, bietet sich stattdessen das CRS-Format an, bei dem die Einträge zeilenweise erfasst werden, das ansonsten aber dem CCS-Format entspricht. Angewendet wird das Harwell-Boeing-Format z. B. bei der Diskretisierung von partiellen Differentialgleichungen im Bereich von Finite-Elemente-Methoden, wo die Steifigkeitsmatrizen häufig in dieser Datenstruktur gespeichert werden.

Beispiel

Gegeben sei die Matrix mit nnz = 8 Nichtnulleinträgen. Für den Fall, dass die Zählweise der Speicherung von Elementen ab 0 beginnt, ergeben sich für die Speicherung im CCS-Format folgende Werte:

  • value =
  • row_ind =
  • col_ptr =