BigData ist in aller Munde, aber tatsächlich rockt das PDW. Microsofts Parallel Datawarehouse, kurz PDW, ist ein riesiges, unglaublich schnelles Datenloch.

Wir sind ja durchaus große Serverinfrastrukturen gewohnt. Aber seit wir in unseren Projekten mit dem PDW zu tun haben, sieht man unsere ETLer (das sind diejenigen, die die Daten in das PDW schaufeln) mit einem kaum zu unterbindenden Grinsen im Gesicht herumlaufen.

pdw-geht-viel-rein

Das Grinsen über die reinen Kapazitäten des PDW wird dann noch durch ein Leuchten in den Augen ergänzt, wenn Abfragen über wirklich große Datenmengen gestartet werden.

So dauert z.B. ein select into EINE_NEUE_TABELLE * from EINE_TABELLE mit knapp über 45 Millionen Datensätzen etwa zwei Sekunden.

Macht man sich bewusst, was diese Geschwindigkeit wirklich bedeutet, wird schnell klar: Cubes können mit ROLAP direkt auf die Daten zugreifen. Und schon ist man ein ganz deutliches Stück näher an Realtime dran.

Zusammengefasst: PDW rockt!