Datenbanken

Eine Datenbank, auch Datenbanksystem genannt, ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe einer Datenbank ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern und benötigte Teilmengen in unterschiedlichen, bedarfsgerechten Darstellungsformen für Benutzer und Anwendungsprogramme bereitzustellen. Quelle: https://de.wikipedia.org/wiki/Datenbank

Es gibt die unterschiedlichsten Kriterien

nach denen man Datenbanksysteme kategorisieren kann. Klassischerweise sind das z.B. das Datenbankmodell (hierarchisch, netzwerkartig, relational, objektorientiert, dokumentenorientiert), die „funktionale“ Ausrichtung (OLTP, OLAP) und etliche andere eher technische Unterscheidungen.

Nach der 40-jährigen Erfolgsgeschichte der relationalen Datenbanken treten seit einigen Jahren nun erfolgreich einige „moderne“ Konzepte mit klarem Fokus auf das Zauberwort „Big Data“ in den Ring.

Man hört von Hadoop-Systemen, massiv parallelen Systemen, Hybridsystemen, …
Für uns als BI-Company ist natürlich vor allem der Fortschritt auf dem Gebiet des Data Warehousing interessant.
Und auch hier geht es ganz eindeutig in die Richtung „Big Data“ und „Cloud“!

All diese Entwicklungen versprechen vor allem bei den Kosten und der Performance, aber auch bei der Funktionalität Vorteile gegenüber klassischen Ansätzen.

Ein ganz heißer Kandidat ist hier

Ein System, das für sich in Anspruch nimmt, als komplettes SQL Data Warehouse speziell für die Anforderungen und Möglichkeiten der Cloud entwickelt worden zu sein. Ein riesiger Vorteil in der Welt von „Multi-Clouds“ ist, dass Snowflake sowohl im Amazon Web Services-Universum als auch in der Microsoft Azure Umgebung genutzt werden kann!
All diese Entwicklungen versprechen vor allem bei den Kosten und der Performance, aber auch bei der Funktionalität Vorteile gegenüber klassischen Ansätzen.

Wie ist das erreicht worden?

Es wurde eine patentierte, rein cloudbasierte 3-Schichten-Architektur entwickelt, um nicht in den Begrenzungen existierender Architekturen und Softwarelösungen gefangen zu sein.

Das gesamte System ist als „data warehousing as a service“ implementiert und erfordert im Gegensatz zu klassischen, im eigenen Rechenzentrum betriebenen Systemen nur minimale Konfiguration, Tuning und Management.
Dabei werden natürlich traditionelle Datenquellen wie Datenbanken oder CSV-Dateien unterstützt, aber auch das native Abfragen und Laden von unstrukturierten Daten wie JSON, XML oder Avro ist sehr einfach und elegant möglich.
Snowflake bietet diverse native Konnektoren für z.B. ODBC, JDBC, Javascript, Python, Spark oder R an. Eine wachsende Anzahl an Drittanbietern integrieren aber auch innerhalb ihrer Tools (ETL, Reporting u.a.) einen direkten Zugriff auf Snowflake Data Warehouses.

Als neu entwickeltes System enthält Snowflake selbstverständlich fortschrittliche Industriestandards für Data Warehouse Sicherheit – ein must-have für Cloud-Datenbanken:

  • feingliedrige, rollenbasierte Zugriffskontrolle
  • always-on Verschlüsselung sämtlicher in Snowflake gespeicherter Daten
  • automatischer Schutz gegen Datenverlust

Ein weiteres spannendes Feature ist das „Snowflake Data Sharing“, das es ermöglicht, ohne Kopieren (d.h. ohne Email-Versand oder FTP-Transfer) interessierten Partnern, Kunden oder anderen Interessenten abgesicherte read-only Zugänge auf Teile von Daten zu gewähren.

Und was sagen die Experten?

Als vergleichsweise junges System sieht Gartner Snowflake bereits heute als Leader:

Und die Dresner Advisory Services ordnen Snowflake sogar als best-in-class bei allen Kennzahlen in den Bereichen Verkauf, Wert, Produkt/Technologie, technischen Support und Beratung ein:

Ist die Zeit reif für einen neuen Spieler im Data Warehouse Markt?

Wie unsere eigenen Untersuchungen und Tests ergeben haben, zeichnet sich Snowflake tatsächlich dadurch aus, dass die überragende Performance komplett ohne aufwändige Tuningmaßnahmen wie Indexierung oder Partitionierung erreicht wird. Und wenn wirklich mal noch mehr Power benötigt wird, kann eine sekundenschnelle bedarfsorientierte lineare Skalierung jederzeit noch einen Turbo zünden.
Wenn Sie jetzt neugierig geworden sind, bietet das verbrauchsbasierte Preissystem einen einfachen Einstieg, der durch eine 30 tägige „Start for Free“ Testphase mit einem 400$ Guthaben noch einmal gesenkt wird.

snowflake4

Informieren Sie sich selbst: https://www.snowflake.com/ oder fragen Sie uns https://www.ceteris.ag/!