archive.org: die Bibliothek des Internets

Das Internet Archive erweist sich als Gedächtnis des World Wide Web. Wir erklären, wie umfangreich das Portal ist.

Schon immer war es Menschen wichtig, Erlebnisse, Wissen und Erinnerungen zu archivieren und für die Zukunft zu bewahren. Was der Steinzeit die Höhlenmalereien, waren den Völkern späterer Epochen Geschichten, Theaterstücke, Bücher, Tagebücher und Fotoalben. Bereits die alten Ägypter besaßen als eine der ersten Zivilisationen große Büchersammlungen. Ebenso kulturell bedeutend waren die alexandrinischen Bibliotheken, die Bibliothek von Pergamon und die öffentlichen Schriftenausstellungen der Römer. Johannes Gutenberg löste schließlich mit seiner Erfindung des mechanisierten Buchdrucks eine Medienrevolution aus.

 

Die Medienlandschaft hat sich stetig weiterentwickelt

Es kamen Fotografie sowie Audio- und Videoinhalte, später dann kombinierte audiovisuelle Medien hinzu. Wichtige Werke fanden auf Videokassetten, CDs, DVDs, Blu-Rays und weiteren Speichermedien ihren Weg in die Bibliotheken dieser Welt.

 

Das Internet jedoch erwies sich als inkompatibel mit den Jahrtausenden alten Konzept der klassischen Bibliothek. Zwar konnten und können Bibliotheksbesucher über Bibliotheksrechner auf das Internet zugreifen und Themen recherchieren. Insofern ist das Internet fast schon seine eigene Bibliothek mit Millionen von Schrift-, Wort-, Bild- und Videobeiträgen. Allerdings eine vergessliche: Die durchschnittliche Lebensspanne einer Website währt nach Einschätzung von Experten zwischen 30 Tagen und zwei Jahren. Inhalte verändern sich dynamisch – sie werden gelöscht, ergänzt, erweitert, überschrieben und erneuert.

 

Eine Antwort auf die Frage nach der Beständigkeit des World Wide Web stellt das sogenannte Internet Archive dar.

 

Das Internet Archive: das digitale Gedächtnis

Der US-amerikanische Informatiker und Aktivist Brewster Kahle rief das Internet Archive 1996 als gemeinnütziges Projekt ins Leben. Basierend auf der Idee eines reinen Webarchivs gestartet, kamen in den Jahren nach der Gründung weitere Medienarchive hinzu. Seit 2007 hat das Portal den offiziellen Status einer Bibliothek. Heute umfasst die größte digitale Bibliothek der Welt breite Sammlungen an Texten, Büchern, Bildern, Videos und sogar Software.

 

Die Wayback Machine archiviert Milliarden alter Websites

Ursprünglicher – und wohl interessantester – Aspekt des Portals ist die sogenannte Wayback Machine. Sie erlaubt einen Blick in die Vergangenheit: Nutzer finden hier historische Momentaufnahmen von über 424 Milliarden seit 1996 archivierten Websites. Du möchtest dir noch einmal ansehen, wie dein erster Webdesign-Versuch von 1997 aussah? Oder mit welchen Websites heute riesige Internetkonzerne wie eBay, Amazon und Google ihre Gehversuche im World Wide Web starteten? Gib die gesuchte Internetadresse in das entsprechende Suchfeld ein, wähle ein verfügbares Datum aus, an dem einer der regelmäßigen sogenannten Snapshots erstellt wurde – und das Archiv zeigt dir, wie die jeweilige Website zu diesem Zeitpunkt aussah.

 

Komplett fehlerfrei funktioniert das zwar nicht. Hier und da fehlen einzelne Elemente wie Bilder, eingebettete Videos oder die in den 1990er-Jahren weitverbreitete Midi-Hintergrundmusik. Das Suchergebnis vermittelt in der Regel aber einen guten Eindruck des grundlegenden Webdesigns und aller Inhalte.

 

Weitere Archivfunktionen

Neben den Milliarden an Websites finden Nutzer im Internet Archive mehr als

 

  • 25 Millionen Bücher
  • 5,7 Millionen Filme und Videos
  • 9,7 Millionen Audiodateien
  • 2 Millionen Fernsehbeiträge
  • 529.000 Softwareprogramme
  • 3,4 Millionen Fotos
  • 215.000 Konzertaufnahmen
  • 796.000 Sammlungen mit archivierten Medien von Museen, Bibliotheken, Patentämtern und so weiter

 

Alle diese Inhalte sind frei zugänglich, kostenlos und weitestgehend barrierefrei abrufbar. Die einzelnen Medien sind ihren Oberkategorien (Websites, Bücher, Software etc.) zugeteilt. Innerhalb der Kategorien hilft eine gut funktionierende Suchmaschine dabei, den passenden Content zu finden. Darüber hinaus gibt es von den Mitarbeitern des Internet Archive kuratierte Inhalte, die als „Featured“ besonders hervorgehoben sind. Die Video-Kategorie ist der Übersichtlichkeit halber noch einmal in Top-Kategorien wie Videospiel-Videos, Filme und Sport unterteilt.

 

Eine erweiterte Suchfunktion ermöglicht es versierten Nutzern, gezielter nach den gewünschten Inhalten zu suchen. Während das Archiv oberflächlich auch von Laien bedienbar ist, finden sich insbesondere aus wissenschaftlichen Bereichen stammende Nutzer durch exakt konfigurierbare Suchmasken in der riesigen Datenbank noch besser zurecht.

 

Vorbild für andere Wissensportale

Die Erfolgsgeschichte des Internet Archive kann als Vorbild für den allgemeinen Aufbau anderer Wissensportale und deren inhaltlicher Kategorisierung dienen. archive.org ist als Schlagwortdomain sinnvoll gewählt, leicht merkbar und beschreibt direkt, was Nutzer auf der dahinterliegenden Website vorfinden.

 

Wer das Portal nur oberflächlich und zu Unterhaltungszwecken nutzen möchte, findet sich trotz der über 18,5 Petabytes an Daten durch die intuitive Schlagwortsuche schnell zurecht. Wissenschaftlern und anderen versierten Nutzern stehen detaillierte Such- und Filterwerkzeuge für tief greifende Datenanalysen zur Verfügung. Die Wayback Machine unterstützt Websitebetreiber zudem bei suchmaschinenoptimierenden Maßnahmen. Rutscht deine Website zum Beispiel in den Suchmaschinenergebnissen ab, vergleiche einfach alten und neuen Code, um die mögliche Ursache dafür zu finden.

 

Übrigens: Wie du mit der richtigen Domain für dein Wissensportal mehr Umsatz, Besucher und Markenbekanntheit erreichst, verraten wir dir im umfangreichen PDF-Leitfaden zum Thema Domain-Marketing.