Die Idee des B-Baums
Zum Anfang
Vollbild
Datenbanksysteme kommen ohne B-Bäume gar nicht mehr aus. Damit Anwender*innen Informationen in Echtzeit auf Knopfdruck auf ihre Bildschirme bekommen, sind B-Bäume unerlässlich. Denn diese spezielle Daten- und Indexstruktur sorgt dafür, dass die gesuchten Informationen aus riesigen Datenmengen in wenigen Millisekunden, Sekundenbruchteilen also, herausgesucht werden können.
Wenn wir zum Beispiel die Namen, Telefonnummern und Mail Adressen der gesamten Weltbevölkerung unter Zuhilfenahme eines B-Baums speichern und dann
aus dieser riesigen Datenmenge von ungefähr zehn Milliarden Datensätzen
eine bestimmte Telefonnummer suchen, dann findet unser mit dem B-Baum arbeitendes Datenbanksystem diesen einen von uns gesuchten Datensatz mit der richtigen Telefonnummer innerhalb von zehn Sekunden. Solche Suchen sahen im Jahr 1969, als sich Rudolf Bayer an die Arbeit machte, um eine effiziente Indexstruktur zu entwickeln, noch ganz anders aus.
Zum Anfang
Zum Anfang
Hierarchie beschleunigt
Vollbild
Google hätte kein Geschäftsmodell ohne B-Baum. Denn die Suche in den riesigen Datenmengen würde viel zu lange dauern. Das ist bei anderen Suchmaschinen wie Bing, DuckDuckGo, Yandex, Ecosia, Metager oder Startpage auch nicht anders.
Auch im iPhone finden wir B-Bäume und Fachinformationen in umfangreichen Datenbanken nutzen sie ebenfalls. Der Grund: B-Bäume helfen dabei, dass Informationen blitzschnell aufgefunden werden können. Wie sie das machen, das ist hochinteressant.
Zum Anfang
Zum Anfang
Der B-Baum in kommerziellen Datenbanken
Vollbild
Larry Ellison, der umtriebige Gründer des Datenbankhersteller Oracle, hat schon früh erkannt, welch ein starkes Tool B-Bäume für eine schnelle und effiziente Indexierung sind. Er hat bei den ansonsten eher mit einer gewissen Schlichtheit programmierten Datenbanksystemen seines Hauses sofort darauf gesetzt. Und das brachte andere IT-Unternehmen ganz schön ins Schwitzen, zum Beispiel die IBM.
Zum Anfang
Zum Anfang
Der B-Baum in der Industrie
Vollbild
Industriebetriebe haben vom B-Baum ganz erheblich profitiert, insbesondere Unternehmen der High-Tech-Industrie. Ohne B-Bäume könnten moderne Flugzeuge zum Beispiel gar nicht produziert werden. Denn die Verwaltung der einzelnen Vorprodukte, Bauteile und ihrer Zertifikate, die zur Produktion in sicherheitskritischen Bereichen notwendig sind, würde viel zu viel Bearbeitungszeit kosten. Die eigentliche Produktion müsste nämlich immer wieder unterbrochen werden, um herkömmliche hierarchische Indexstrukturen auf den aktuellen Stand zu bringen.
Mit B-Bäumen können auch die riesigen Datenmengen zum Beispiel für eine Raumfähre in Echtzeit verwaltet werden. Der Trick dabei: Die Daten, die nicht mehr in den Arbeitsspeicher eines Rechners passen, sind auf einer Festplatte ausgelagert und werden blockweise wieder eingelesen. Ein Knoten des B-Baumes entspricht dabei einem Block. Davon hat nicht nur die Luft- und Raumfahrtindustrie enorm profitiert.
Zum Anfang
Zum Anfang
Der B-Baum in den Geisteswissenschaften
Vollbild
„Digital Humanities“ – Digitale Geisteswissenschaften etablierten sich seit den 1980er Jahren
zögerlich
in Deutschland. Es ging dabei in erster Linie um Datenbanken zur Literaturverwaltung und für die autoptische Suche und Fundstellenverwaltung. Das war nicht nur für die Erstellung von Werkausgaben bedeutender Denker wichtig, sondern auch, um einen Überblick über die Literaturlage eines Jahrhunderts oder eines bestimmten Themas zu erhalten. Hier spielen dann auch volldigitalisierte Schriften und Bücher eine wichtige Rolle.
Einer der Pionier*innen auf diesem Gebiet war der Philosophie-Professor Gert König, an dessen Lehrstuhl für Wissenschaftstheorie an der Ruhr-Universität Bochum die ersten Literaturdatenbanken mit dem noch auf Lochkarten angelieferten Datenbanksystem „Famulus“ entstanden. Doch Suchläufe erforderten Geduld. Immer wieder mussten die Indizes neu aufgebaut werden. Die Dauer eines Suchlaufs war davon abhängig, wie schnell die dann indizierten Daten von den jeweiligen Datenträgern eingelesen werden konnten. Selbst mit Supercomputern wie der CDC Cyber 175 dauerten Suchläufe mehrere Minuten. Das war enervierend.
Die Lösung brachte der Einsatz von B-Bäumen, die beim Projekt „VD17“ in voller Pracht zeigten, was sie leisten können. Das Kürzel „VD17“ steht für „Verzeichnis der im deutschen Sprachraum erschienenen Drucke des 17. Jahrhunderts“. Das Projekt startete am 1. Juli 1996. Alle namhaften Universitätsbibliotheken in diesem Bereich nahmen teil. Bis heute umfasst die VD17-Datenbank mehr als 300.000 Titel mit über 800.000 Exemplaren. Für den schnellen Zugriff und die rasche Arbeit mit diesen digitalisierten Drucken sorgen B-Bäume.
Zum Anfang
Zum Anfang
Das Geheimnis des B-Baums
Vollbild
Ein Geheimnis des B-Baums ist bisher noch immer nicht gelüftet. Wie lautet die Langfassung von B-Baum? Oder anders gefragt:
Wofür steht eigen eigentlich das B in B-Baum?
Zum Anfang
Zum Anfang
Scrollen, um weiterzulesen
Wischen, um weiterzulesen
Wischen, um Text einzublenden