Wie Software versagt: Ein Leitfaden zum Verstehen komplexer Systemkatastrophen
Warum Systeme auf Arten versagen, die ihre Schöpfer nie für möglich hielten.
Softwareausfälle sind keine Zufälle, sie sind Unvermeidlichkeiten. In einem Universum, das eher von Wahrscheinlichkeit als von Gewissheit regiert wird, können sogar kosmische Strahlen ferner Sterne Bits im Computerspeicher umkehren und dadurch Wahlmaschinen dazu bringen, Stimmen falsch zu zählen oder Videospiel-Charaktere unmöglich hoch springen zu lassen. Doch kosmische Interferenz ist nur der Anfang dessen, wie unsere kritischsten Systeme auf spektakuläre und unvorhersagbare Weise versagen.
Anhand packender Real-World-Fallstudien enthüllt dieser Leitfaden die verborgenen Gesetze, die komplexe Systemkatastrophen regieren. Entdecken Sie, wie Knight Capital aufgrund einer einzigen falsch platzierten Software-Flag 460 Millionen Dollar in 45 Minuten verlor. Erfahren Sie, warum die Bestrahlungsmaschine Therac-25 Patienten tötete, obwohl sie jeden Sicherheitstest bestanden hatte. Verstehen Sie, wie eine 40-Kilobyte-Konfigurationsdatei 8,5 Millionen Computer weltweit zum Absturz brachte, Flüge stornierte und Krankenhäuser rund um den Globus lahmlegte.
Was Sie lernen werden
Basierend auf den bahnbrechenden Prinzipien des Komplexitätstheoretikers Richard Cook werden Sie entdecken:
- Warum Testen niemals Perfektion garantieren kann und was stattdessen zu tun ist
- Wie sich "vernünftige" Entscheidungen zu unvernünftigen Katastrophen verbinden
- Warum komplexe Systeme immer im degradierten Modus laufen und warum das eigentlich normal ist
- Wie Skalierung seltene Unmöglichkeiten in tägliche Gewissheiten verwandelt
- Warum die Suche nach "Grundursachen" uns konsequent in die Irre führt
Vom Verstehen zum Handeln
Aber es geht nicht nur darum, Versagen zu verstehen, sondern Widerstandsfähigkeit aufzubauen. Erkunden Sie praktische Strategien von Organisationen, die gelernt haben, im Chaos zu gedeihen:
- NASAs Mars-Rover, die sich an Komponentenausfälle anpassen und daraus lernen und jahrzehntelang über ihre geplante Lebensdauer hinaus funktionieren
- Die Routing-Protokolle des Internets, die sich automatisch selbst heilen, wenn sie beschädigt werden
- Netflix' Chaos Engineering, das absichtlich ihre eigenen Server kaputtmacht, um antifragile Systeme zu bauen
- Die ethischen Rahmenwerke für die Entscheidung, welches Maß an Versagen akzeptabel ist, wenn Leben auf dem Spiel stehen
Für wen dieses Buch ist
Ob Sie ein Software-Ingenieur sind, der Produktionsprobleme debuggt, ein Manager, der die nächste katastrophale Störung verhindern möchte, oder einfach nur neugierig darauf sind, warum Technologie auf unmögliche Weise versagt – dieses Buch wird für immer verändern, wie Sie über die komplexen Systeme denken, die unsere Welt am Laufen halten.
The initial translation of this book is done by an AI; editing is done by an actual human being who needs coffee and food to survive.