Montag, September 26, 2016

Histogramme für Spalten mit PK/UK

Jonathan Lewis hat dieser Tage in einer Diskussion der Oracle-L Mailing-Liste darauf hingewiesen, dass auch eine Spalte mit einem PK oder UK von einem Histogramm profitieren kann - und diese Aussage jetzt in seinem Blog erläutert und mit einem Beispiel versehen. Interessant ist ein solches Histogramm dann, wenn die Werteverteilung zwischen Minimum und Maximum sehr uneinheitlich ist, so dass sich große Bereiche ergeben, in denen fast keine Daten existieren, während in anderen Bereichen gleichen Umfangs sehr viele Ergebnisse zu finden sind. In seinem Beispiel erfolgt eine Abfrage auf einen solchen sparse-besetzten Bereich und Oracle erkennt anschließend bei der Statistikerfassung (mit Standardeinstellungen), dass hier ein Histogramm nützlich ist. Das die Anlage von Histogrammen begründende Phänomen "data skew" (sprich: Ungleichverteilung) betrifft also nicht nur das Auftreten ungleichmäßig vieler Datensätze für einen gegebene Wert, sondern auch die ungleiche Verteilung in bestimmten Wertebereichen für eindeutige Werte.

Keine Kommentare:

Kommentar veröffentlichen