Ein Serverkrimi in 6 Akten!
Akt 1: Der Absturz
Bis zum Halbjahreswechsel gab es keine Probleme. Alles lief ruhig und rund. Am Freitag der Zeugnisse fing es an: Erste Aussetzer. Die Protokolle ergaben keine Auffälligkeiten. Erstes Rätselraten begann.
Akt 2: Der Sturmmontag
Am Montag fiel in weiten Teilen Hessens durch den Sturm die Schule aus. Unsere Serverstruktur schloss sich an. Protokolle unauffällig, aber viele Lerngruppen-Importe gestartet. Spricht also sehr dafür, dass in Hessens Schulen die Zeit gefunden wurde, um Verwaltungsakte vorzunehmen.
Akt 3: Die Warteschlange und Auswertungs- und Protokollierungserweiterung
Als schnelle Maßnahme die Anzahl der gleichzeitig ablaufenden Schulen mit Lerngruppen-Importen auf eine Einzige begrenzt. Hoffnung in Sicht: Server läuft stabiler.
Gleichzeitig SQL-Verbindungsanzahl erhöht und versucht mehr Server-Performance zu bekommen. Trotzdem immer wieder Ausfälle. Weitere Protokolleinträge und testweise weitere Auswertungssoftware ergänzt.
Akt 4: Änderungen?
Die Änderungen der letzten Wochen erneut angeschaut: Wo haben wir Code geändert, wo könnten wir langsame Abfragen eingebaut haben, die zu lange brauchen und deshalb der Server nicht hinterher kommt und sich daher beim Lerngruppen-Import “verschluckt”.
Nichts gefunden. Weiterhin teilweise Ausfälle, wenn eine Schule importiert. Umzug auf stärkere Maschine?
Akt 5: Nachtschicht und Finale
Den am längsten am System arbeitenden Kollegen dazu geholt – mit der Bitte um gemeinsame Codedurchsicht und Überprüfung des Imports. Ergebnis der Tagschicht: Im Testsystem laufen auch 20 Schulimporte parallel stabil. Ergebnis der drangehangenen Nachtschicht: Online eine allein nicht!
Jedes SQL-Statement beim Import einzeln ausgewertet … erst im Testsystem, dann online – und Ursache der Zeitverzögerung gefunden: Die Lernendentabelle mit den mehreren 100.000 Einträgen braucht zu lange, um Lernende aus der Importdatei zu identifizieren. Weiteren Index auf der Tabelle passend zur Filterung in der Abfrage ergänzt: Beschleunigung massiv messbar (bspw. von 14 auf 0,07 Sekunden zur Abarbeitung einer Lerngruppe).
Ursache für die Zeitverzögerung war also nichts, was wir gemacht haben, sondern einfach nur das Unterschätzen der Zeitveränderung für die Abfrage bei angestiegenen Einträgen in der Tabelle.
Akt 6: Danach
Ein ruhiger Tag ohne Serverausfall – ohne Probleme beim Lerngruppenimport, aber mit Nachfragen zum Lerngruppenimport, ob der “kaputt” sei, weil er jetzt “so schnell” arbeitet. Ja, den Eindruck kann man haben.
Wir hoffen damit die aktuellen Schwierigkeiten gelöst zu haben. Ob dem so ist, wird sich nächste Woche zeigen.
Wir bitten alle um Entschuldigung und Verständnis für die Ausfälle, aber manchmal braucht es etwas länger, bis man die tatsächliche Ursachen findet. Gleichzeitig wussten wir zwischendrin nicht, was wir kommunizieren hätten sollen.
Alle Schulen, die sich mit einem Teilimport (anstatt dem Gesamtimport) zufrieden gegeben haben, bitten wir, jetzt einen Gesamtimport durchzuführen, damit die Abschlussarbeiten beim Import vollumfänglich ausgeführt werden können.
Ich kann mich nur anschließen! Vielen Dank für Eure Arbeit und vor allem das Herzblut, welches ihr ganz offensichtlich in Lanis bzw. das Schulportal investiert.
Und dann das ganze auch noch ausführlich dokumentiert und transparent gemacht.
Vielen Dank!
Ich möchte und muss mich den Vorrednern anschließen. Erstklassige Arbeit!
Danke für eure Arbeit und Daumen hoch! Das was ihr hier auf die Beine stellt ist großartig. Danke auch für euren klasse Support rund um die Uhr!
Vielen Dank für dieses sehr umfängliche Lob!
Ich kann mich Herrn Rhöse nur anschließen. Auch diese Geschichte in 6 Akten ist eine Art mit Sorgen und Problemen umzugehen, die seinesgleichen sucht. Vielen lieben Dank für eure tolle Arbeit!
Liebes Team von SPH-paedOrg,
jetzt mal ehrlich – ihr macht das alle in Abordnung und wie man an einzelnen Antworten auf Tickets sehen kann auch manchmal zu ungesunden Zeiten. Trotzdem bietet ihr ein System, dass sich vor „professionell“ – also mit Gewinnerzielungsabsicht – erstellten nicht nur nicht zu verstecken braucht, sondern Maßstäbe setzt in Bezug auf Anwenderfreundlichkeit, Zuverlässigkeit und Brauchbarkeit für die meisten Szenarien in Schule. Dass Fehler auftreten, weiß jeder, und dass Sie oft eine lange Haltbarkeit haben jeder, der mit anderen Systemen arbeiten darf. Ihr macht eine tolle Arbeit.
Macht so weiter!
Ingo Rhöse
Lieber Herr Rhöse,
vielen, lieben Dank für diese sehr positiven und motivierenden Worte. Vor allem freut uns das “Maßstäbe setzen” – denn das ist ein wichtiger Teil unserer Grundmotivation.
Grüße
Christian Mehler
Ihr seid klasse!
Vielen Dank. Es freut sehr das auf solch einen Artikel uneingeschränkt zu hören.