Gute Tests oder wie man den Fehlerteufel findet

Niemand ist perfekt, wir machen alle Fehler. Umso wichtiger ist es, Fehler zu erkennen, sie zu korrigieren und zukünftig zu meiden. Aus dem Grund überprüft jeder Mensch die Ergebnisse seiner Arbeit. Sei es der Maurer, der sein Lot an die Wand hält oder der Schüler der noch einmal seine Arbeit durchliest bevor er sie abgibt. Genauso handhabt es jeder Hersteller, der seine Produkte testet, ob nur durch Stichproben oder lieber durch ein vollständige Kontrolle - das hängt von seiner Risikoanalyse und geschäftlichen Überlegungen ab.

Und genauso handhaben wir es, denn ein Computer setzt sich aus vielen Einzelkomponenten zusammen, die alle selbst fehlerhaft sein können. Dazu kommen Fehler, die durch die Montage, das Zusammenspiel der Komponenten oder durch die Software bedingt sein können: Man merkt recht schnell, das Fehlerpotenzial jedes Rechners ist sehr hoch. Deshalb sind wir zu dem Schluss gekommen, dass wir alles, was unser Haus verlässt vorher testen, sei es ein vollständiger Rechner, das Einzel- oder Ersatzteil.

Wer misst, misst Mist

Es gibt allerdings nicht viele Programme, die einen Rechner wirklich auf Herz und Niere testen können. Die meisten Mess-Programme eigenen sich vielmehr als Basis und genau dafür setzten wir solche, sich ständig aktualisierende Programme auch ein: Zum ersten Prüfen von Festplatten, Schnittstellen, Arbeitsspeicher und Festplatten.

Diese Programme haben aber trotzt ihrer Aktualisierung einen enormen Nachteil: Sie sind standardisiert: Fehler jedoch haben diese unbequeme Eigenschaft außerhalb von Standards zu entstehen und genau diese Fehler erkennt solch ein Programm nicht.

So berichtete uns ein Kunde, das immer wieder einzelne Rechner in der Produktion abstürzen. Dabei haben wir diese Rechner vor der Auslieferung standartmäßig getestet, sie waren alle fehlerfrei. Natürlich tauschten wir diese Rechner aus und analysierten sie, immer noch konnten wir mit unseren bekannten Testprogrammen den Fehler nicht reproduzieren. Sowas lässt uns allerdings keine Ruhe, also versuchten wir es mit jenem kleinen selbstgeschriebenen Programm, welches im Wesentlichen nur Daten zwischen zwei Rechnern hin und her kopiert. Nach bereits 6 Stunden konnten wir den Fehler reproduzieren. Wir testeten fortan alle Rechner für diesen Kunden auf diese Art und Weise und konnten schließlich zusammen mit den Motherboard Hersteller, Qualitätsschwankungen in den Bauteilen auf dem Motherboard als Schuldigen identifizieren.

Aus diesem Kundenfall haben wir eine Methode entwickelt, Fehler zu minimisieren und sie frühzeitig zu erkennen. Dafür bedarf es 2 Komponenten, die dafür unabdingbar sind: Zum einem den wachen Geist des Testenden zum andern eine sehr gute Kommunikation.

Der Weg zum erfolgreichen Testen

Wie so oft klingt die Lösung zu einfach, um wahr zu sein. Aber in der Realität scheitert es oft genau daran:

Es hilft zum Beispiel nicht, wenn den Technikern in einem Unternehmen auffällt, dass ein bestimmtes Bauteil immer wieder einen bestimmten Fehler aufweist, aber die Wareneingangskontrolle – oder noch schlimmer, das Qualitäts-Management nichts davon wissen. Hätte uns der Techniker unseres Kunden nicht über die häufigen Abstürze informiert, dann wären Sie uns schlicht nicht bekannt.

Dann hat man die erste Möglichkeit zur Fehler Entdeckung und Vermeidung verschenkt. Werden fehlerhafte Komponenten nicht direkt bei der Wareneingangskontrolle entdeckt, bedeutet das im Zweifelsfall, dass der fertige Rechner noch mal zerlegt und neu aufgebaut werden muss.

Schlimmer ist es, wenn der Techniker das Fehlerbild auch nicht kennt und der Rechner ausgeliefert wird. Im Anschluss ist dieser fehlerhafte Rechner für den Ausfall einer kompletten Produktionslinie verantwortlich ist. Anlagen stehen still, Aufträge werden nicht fristgemäß fertig: Die Kosten und entgangenen Umsätze eines solchen Ausfalls sind enorm – und das alles nur aufgrund mangelnder Kommunikation.

Was wir anders machen

Unsere täglichen kleinen Besprechungen regelmäßigen große Besprechungen haben sich als wirksames Mittel gegen diesen Informationsverlust erwiesen. Hier planen wir auch organisatorische Maßnahmen und Testabläufe und passen diese an.

/ Organisatorischen Maßnahmen zur Fehlervermeidung
/ schriftliche Arbeitsanweisungen
/ Checklisten anhand ISO9001
/ außerordentliche Fehlersensibilität jedes Mitarbeiter

sind Wege und entscheidende Faktoren zu guten Test und der Minimalisierung von Fehlern. Im Laufe der Zeit haben wir auf diesem Weg eine große Datensammlung über mögliche Fehlerursachen und Testmethoden zusammengetragen. Wo immer es keine fertige Lösung gab, haben wir, wenn nötig, sogar eigene Test Programme geschrieben. Auch auf den ersten Blick skurrile Testmetoden werden eingesetzt und der Erfolg und unsere geringe Fehlerquote geben uns recht.

Wo immer möglich beziehen wir unsere Kunden mit in diese Kommunikation ein. Unsere Techniker kennen oft die Techniker unserer Kunden und die Probleme die bei denen auftreten. So entwickeln wir auch immer wieder kundenspezifische Tests, die dann manchmal auch zu einem Teil des regulären Test Ablaufs geworden sind.

Nicht perfekt, aber fehlerarm in die Zukunft

So wie die Mitarbeiter eines großen Lebensmitteldiscounters Lebensmittel lieben, können wir von uns sagen: Wir lieben Computer - vor allem perfekt arbeitende Computer. Es erfüllt uns immer wieder mit Stolz, wenn uns Kunden 10 Jahre alte Rechner einschicken, bei denen lediglich ein Lüfter ausgetauscht werden muss, die aber ansonsten immer noch perfekt arbeiten. Dies spornt uns immer wieder an, unsere Arbeit gewissenhaft auszuführen und Fehler durch entsprechende Kommunikation zu vermeiden und zu erkennen, denn wir möchten auch in Zukunft unsere Qualität sicherstellen und noch weiter zu steigern.