1. Juni 2023, 9:23 Uhr | Lesezeit: 5 Minuten
Ein „zipper“ bezeichnet im englischen Sprachraum einen Reißverschluss. An das Reißverschluss-Prinzip hat der US-amerikanische Programmierer Phil Katz gedacht, als er Ende der 1980er Jahre das Zip-Format entwickelt hat. Seine Idee, Dateien zu verdichten und damit Platz auf Computern zu schaffen, hat sich in der Folge zu einem weltweiten Standard für Datenkompression entwickelt.
Die Geschichte der Datenkompression beginnt nicht mit der Zip, sondern im Grunde genommen bereits Mitte des 19. Jahrhunderts. Im Jahr 1838 entwickelt der US-Amerikaner Samuel Finley Breese Morse das Morse-Alphabet. Dieses beschleunigt die Übermittlung von Nachrichten per Telegrafie erheblich. Beim Morse-Alphabet ist jedem Buchstaben eine bestimmte Folge von kurzen und langen Tönen zugeordnet. Bei der Codierung hat der Entwickler Morse berücksichtigt, wie häufig ein Buchstabe im täglichen Sprachgebrauch vorkommt. Besonders häufig genutzte Buchstaben bestehen deswegen aus kurzen Tönen, seltener verwendete Buchstaben aus längeren Tönen.
Übersicht
Auf diesem Prinzip basiert knapp 150 Jahre später auch das von Programmierer Phil Katz erfundene Zip-Format, grob betrachtet. Der US-Amerikaner ist nicht der erste Mensch, der an einem Format arbeitet, um Daten zu verdichten. Wie so oft in der Computer-Geschichte erwischt Phil Katz einfach den richtigen Zeitpunkt, um sein Zip-Format zu vermarkten.
Zip-Format entsteht aus einem Streit
Allerdings geht die Entwicklung nicht ganz geräuschlos über die Bühne. Mitte der 1980er Jahre hat bereits das Unternehmen System Enhancement Associates (SEA) mit ARC ein erfolgreiches Format zur Kompression von Daten auf dem Markt. Dieses Format nutzt Phil Katz und programmiert auf Basis des ARC-Codes sein eigenes Format PKArc. PK steht dabei für Phil Katz. Das Format und das dazu notwendige Programm verbreitet er per Shareware. Von den Einnahmen aus dem Vertrieb gründet der Programmierer seine eigene Firma PKWare.
Klingt alles nach einer klassischen Aufsteiger-Geschichte. Allerdings meldet sich nun SEA bei Phil Katz. Die ARC-Erfinder behaupten, der Programmierer habe den Quelltext von SEA gestohlen. Beide Parteien treffen sich vor Gericht wieder. Phil Katz einigt sich schließlich mit SEA und verspricht, PKArc nicht weiter zu vertreiben.
Doch Phil Katz bleibt nicht untätig, sondern entwickelt ein Kompressionsprogramm, welches die ARC-Kompression in den Schatten stellen wird. PKZIP heißt das neue Baby. Es erblickt im Jahr 1989 das Licht der Welt und landet – wegen der raschen Verbreitung über bekannte Shareware-Plattformen – schon bald auf unzähligen Rechnern weltweit.
Zip schnürt Datenbündel aus Zahlencodes
Beim von Phil Katz entwickelten Zip-Format handelt es sich um eine verlustfreie Datenkompression. Das bedeutet, die verdichteten Daten landen nach dem Dekodieren im Original auf dem Rechner. Wie das funktioniert? Zip komprimiert die Daten ähnlich wie der Morse-Code und nutzt dafür die sogenannte Redundanzreduktion.
Bei der Redundanzreduktion scannt das Kodierprogramm Dateien nach sich wiederholenden Zeichen. Beispiel: In einem Word-Text kommt 500-Mal der Artikel „die“ vor. Das Zip-Format vergibt für das Wort einen Code, beispielsweise „1“. So entsteht aus einem langen Text ein Code aus Zahlen, wodurch sich der verwendete Speicherplatz erheblich reduziert. Allerdings funktioniert das Prinzip auf einer viel tieferen Ebene, nämlich im Bereich von Bits und Bytes.
Bei der Datenkompression gibt es auch noch die sogenannte Irrelevanzreduktion. Diese Methode eignet sich vor allem bei Bildern, Liedern und Videos. Bekannte Formate, die auf diese Weise Daten verkleinern, heißen JPG oder MP3. Auch Fotos, Musiksammlungen oder Video-Archive lassen sich per Zip verkleinern. Allerdings schafft das Format bei digitalen Medien nur wenig Platz auf dem heimischen Computer. Die Stärken von Zip liegen eher bei der Kompression von textbasierten Dateien.
Dennoch kann es ein Vorteil sein, Texte, Bilder, Musik und Videos in eine einzige Zip-Datei zu packen. Gerade wenn verschiedenen Dateien per Mail verschickt werden müssen, geht das schneller, wenn alles in einem Zip-Datencontainer zusammengeschnürt auf den digitalen Weg gebracht wird.
Lesen Sie auch: Die Bedeutung von CC und BCC in einer E-Mail
E-Mail organisieren Was tun, wenn das E-Mail-Postfach voll ist
Beliebte Archiv-Software WinRAR: 500 Millionen Nutzer von Sicherheitslücke betroffen
20 Jahre vor Erfindung des Internets Die Geschichte von Ray Tomlinson und der ersten E-Mail
Erfinder des Zip-Formats leidet unter dem Ruhm
In den frühen Jahren des Internets hält sich lange Zeit der Begriff „zippen“ als Synonym für das Verkleinern von Daten, um sie anschließend per Mail zu verschicken. Heutzutage verfügen die Betriebssysteme der beiden großen Anbieter Microsoft und Apple über hauseigene Komprimierungsfunktionen. Häufig fällt dann immer noch der Begriff „zippen“, obwohl dahinter möglicherweise ein ganz anderes Format steckt. Bekannte Komprimierungsformate und -programme lauten ARC, RAR, TAR oder WinZip. Jedes der unzähligen Formate hat eigene Vorzüge. Daher lohnt es sich zu schauen, welches Format am besten geeignet ist, um auf dem eigenen Rechner Platz zu schaffen.
Phil Katz hat von der weiteren Entwicklung seines Zip-Format leider nicht mehr viel mitbekommen. Sein Unternehmen PKWare entwickelt sich in den 1990er Jahren zwar beachtlich. Mit dem Erfolg steigt allerdings auch der Alkoholkonsum des Firmengründers. In seiner Firma taucht Phil Katz irgendwann nur noch selten auf. Stattdessen verbringt er den Großteil seines Lebens in Motels. In einem Motelzimmer wird am 14. April 2000 sein lebloser Körper gefunden. Als Todesursache stellen die Gerichtsmediziner später eine Blutung der Bauchspeicheldrüse fest, hervorgerufen durch eine akute Alkoholvergiftung. Phil Katz wird nur 37 Jahre alt.