Ich befinde mich am Anfang meines People-Analytics-Abenteuers und sammle hier Infos, Notizen und Gedanken zum Thema. Und hoffentlich werde ich eines Tages etwas mehr zu Datenvisualisierung schreiben können 😅
Inhaltsverzeichnis
Excel – das Schweizer Sackmesser der Datenanalyse
Sehr praktisch, relativ einfach zu handhaben und extrem vielseitig einsetzbar.
Natürlich kommt Excel, genauso wie ein Taschenmesser, früher oder später an seine Grenzen. Dafür gibt es dann spezialisierte Werkzeuge.
Aber vor allem mit Power Query kommt man schon sehr weit, vor allem für den ETL-Prozess (Extract, Transform, Load). So kann man
- auf externe Datenquellen zugreifen und/oder Daten einlesen, z.B. Excel- oder csv-Dateien, Datenbanken, Webseiten, usw. (extract)
- Daten bereinigen und verändern (transform) und
- diese Daten dann in Excel zur Verfügung stellen, z.B. für Pivot-Tabellen (load)
Und wahrscheinlich der grösste Vorteil von Power Query: man kann solche Operationen stark automatisieren.
Datenbanken und SQL
Mit zunehmenden Datenmengen kommt Excel irgendwann nicht mehr nach. Dann kommen Datenbanken zum Zug. Diese können sehr viele Rohdaten speichern und organisieren. Die Vorteile sind:
- relativ kleiner Bedarf an Speicherplatz
- schneller Zugriff auf die Daten
Am üblichsten sind relationale Datenbanken. Diese bestehen aus mehreren, miteinander verbundenen Tabellen.
Mit Power Query kann man zwar auf Datenbanken zugreifen und die Daten bis zu einem gewissen Grad bearbeiten. Allerdings braucht es ein Datenbankmanagementsystem, um die Daten selbst an der Quelle zu verändern. Verbreitete Systeme sind:
- SQL Server Management Studio für MS SQL Server (Microsoft)
- pgAdmin für PostgreSQL (Open-Source)
- phpMyAdmin für MySQL (Open-Source)
Mit der Datenbanksprache SQL kann man diese Datenbanken organisieren und die Daten manipulieren (ändern, einfügen, löschen) sowie lesen. SQL steht für Structured Query Language und wird oft auch als «Sequel» ausgesprochen.
Datenvisualisierung
Auch hier kommt Excel früher oder später an seine Grenzen. Vor allem, wenn es darum geht komplexe und interaktive Dashboards zu erstellen.
Spezialisierte Tools sind:
- Tableau
- Power BI von Microsoft
Ich habe es nicht so mit grafischen Dingen und das ganze Thema ist für mich noch recht neu. Deshalb kann ich im Moment nicht viel dazu sagen. Aber ich arbeite daran 😉
Programmiersprachen
Wenn man noch weitergehen will, kommen Programmiersprachen ins Spiel, z.B. R oder Python.
R (Open-Source):
- Spezialisiert auf statistische Berechnungen und Grafiken
- Es existieren tausende von Packages, z.B. für Datenmanipulation, Visualisierung und auch für People Analytics.
Siehe auch: R & RStudio, allererste Schritte
Python (Open-Source):
- Ist im Moment sehr verbreitet, u.a. in der Webentwicklung.
- Im Rahmen von People Analytics wird Python wohl spätestens dann interessant, wenn es um Künstliche Intelligenz inklusive Machine Learning geht.
Cloud Computing
Beim Cloud Computing werden Speicherplatz und Rechenleistung via Internet (also in der Cloud) angeboten und man kann dort auch direkt Applikationen laufen lassen.
In einem klassischen Modell muss die IT-Abteilung Server kaufen, installieren und betreiben. Dazu gehört die Wartung und oft auch ein Pikettdienst. Sie müssen ebenfalls die Kapazitäten rechtzeitig erweitern können, falls der Bedarf steigt. Zusätzlich müssen sie für eine schnelle Internetanbindung der Server sorgen (und bezahlen). Sonst schläft den Leuten das Gesicht ein, wenn sie remote arbeiten bzw. sich nicht am gleichen (Geschäfts-)Standort wie die Server befinden.
Mögliche Vorteile von Cloud Computing:
- keine Kosten für physische Server und Räumlichkeiten
- falls der Bedarf steigt kann das «Abo» erweitert werden
- je nach Modell: man bezahlt nur, was man auch tatsächlich braucht.
Falls man z.B. einmal pro Monat sehr viele Daten berechnen muss, bezahlt man nur für die benötigte Rechenleistung. Ansonsten würden leistungsstarke Maschinen die meiste Zeit vor sich hindösen, da sie nur einmal pro Monat wirklich gebraucht werden.
Bekannte Anbieter:
- AWS (Amazon Web Services
- Azure (Microsoft)
- Google Cloud
0 Comments
Trackbacks/Pingbacks