Eine klassische Fehlerquelle in BI-Projekten, die manchmal schwer zu entdecken ist, sind SQL-Abfragen, bei denen LEFT und INNER JOINs beim Laden von Daten eine Rolle spielen. Manchmal dürfen nur genau passende Datensätze geladen werden, manchmal soll jede Ausprägung gültig sein. Beides kann seine Berechtigung haben, solange der Umsatz im operativen System mit dem Analysesystem übereinstimmt!
Wie schnell passiert es, dass ein INNER JOIN dafür sorgt, dass Umsätze verschwinden? Je größer die Differenzen, desto leichter ist der Fehler zu entdecken. Aber besonders nervenaufreibend können kleine Abweichungen sein: Von 2 Mio. EUR Umsatz fehlen im Analysesystem 400 EUR. Aber vor 5 Wochen hat doch noch alles gepasst!? Der Controller oder Chef verliert schnell das Vertrauen in das BI-System, wenn sich solche Abweichungen nicht erklären lassen!
Das ist nur ein winziges, plakatives Beispiel für viele mögliche Ursachen von Datenfehlern nach Transformationen. Es soll klar machen, wir schnell Fehler unbemerkt in Datenanalysesystemen entstehen.
Im schlechtesten Fall haben Sie 5 Wochen Ihre Weiterentwicklung auf einem Bug aufgebaut, der nun viele weitere nach sich ziehen kann. Testen Sie automatisiert mit NBi, minimieren Sie dieses Risiko. Mit unserem Framework geben wir außerdem technisch affinen Fachanwendern die Möglichkeit an die Hand, Tests einfach selbst zu definieren. Ihre Entwickler haben wegen der einfachen Bedienbarkeit eine Hemmschwelle weniger, Tests aufzuschreiben: Es kostet kaum noch Zeit.
Mit Hilfe des automatisierten Testens merken Sie am gleichen Tag, dass es auf einmal Unterschiede zwischen beiden Datenbanken gibt und können den Fehler leichter entdecken und sofort beheben. Der Berichtempfänger muss den Fehler also nicht merken, weil Sie ihn bis dahin schon behoben haben.
In den Folgenden Blogeinträgen beschreibe ich das Framework, das Vorgehen, um Tests zu finden und mögliche Testarten in unserem Test-Framework.
Weitere Teile der Blogserie:
Automatisiertes Testen von BI-Projekten Teil 1: Warum testen?
Automatisiertes Testen von BI-Projekten Teil 3: Testframework mit NBi
Automatisiertes Testen von BI-Projekten Teil 4: Sinnvolle Tests erstellen
Automatisiertes Testen von BI-Projekten Teil 5: Ergebnisse zweier Abfragen müssen gleich sein
Automatisiertes Testen von BI-Projekten Teil 6: Ergebnisse zweier Abfragen dürfen innerhalb bestimmter Toleranzen abweichen
Automatisiertes Testen von BI-Projekten Teil 7: Performancetests
Automatisiertes Testen von BI-Projekten Teil 8: Felder sollen nicht mehr als einen bestimmten Anteil eines Werts enthalten
Automatisiertes Testen von BI-Projekten Teil 9: Die referentielle Integrität ist immer gegeben
Automatisiertes Testen von BI-Projekten Teil 10: Namenskonventionen prüfen