> Flowminder: Geographische Analyse von Anruferinformationen

Vertragstyp: freiberuflicher Mitarbeiter
Klient: Flowminder Stiftung
Funktion: Verantwortlicher für Maschinelles Lernen
Zeitraum: seit Jun 2016
Umfang: 40h/w, läuft

Data Science • Linux • Python • numpy • scipy • matplotlib • ipython • scikit-learn • PostgreSQL • NoSQL • Kyoto Cabinet • LevelDB

Im Zuge von Flowminders humanitärer Arbeit in einem Krisengebiet im mittleren Osten extrahierte ich deskriptive Statistiken und kreierte geographisch-räumliche Visualisierungen aus de-identifizierten Anruferinformationen (call data records) vom Betreiber eines Mobilfunknetzwerks.

Die Kerndatenquelle hatte eine Größenordnung im Terabytebereich und musste zunächst von uns für den Zweck der statistischen Analyse aufbereitet werden.  Die hauptsächlichen Anforderungen hierbei waren effiziente Berechnung und Integration von heterogenen Datenquellen.

Im Zuge meiner Analyse extrahierte ich deskriptive Statistiken und erstellte geographisch-räumliche Visualisierungen von verschiedensten Charakteristiken der Daten.

Das Projektteam war multidisziplinär zusammengesetzt aus Data Science Experten und Experten im Anwendungsbereich. Es gab eine starke Kultur, gewonnene Resultate durch Anwendungsexpertise zu kontextualisieren und anwendbare Einblicke (actionable insight) zu gewinnen.

Zusätzlich zu meiner Rolle im Projektteam, war ich auch Flowminders Themenverantwortlicher für maschinelles Lernen (machine learning), und konnte somit meine entsprechende Expertise über die Grenzen einzelner Projektteams hinweg einbringen.