Richard Bergmair's Mediathek

ML Vorlesung #8: Bayessche Entscheidungstheorie & Gauß-Modelle

Bayessche Entscheidungstheorie liefert ein Modell dafür, wie sich Entscheidungen auf Basis unsicherer Information aus a priori und a posteriori Wahrscheinlichkeiten ableiten. Sie ist daher eines der wichtigsten und vielseitigsten Werkzeuge des Data Scientist.

Wir wollen über eine Handlung entscheiden, bei der ein erhoffter Effekt entweder eintreten oder ausbleiben kann. Aus einer Bayesschen Perspektive besteht die Zielsetzung einer jeden Handlungsentscheidung darin, die Handlung zu unternehmen genau dann wenn der zu erwartende Nutzen der Handlung, im Falle des Eintretens des erhofften Effekts, größer ist als der zu erwartende Schaden, im Falle des Ausbleibens des erhofften Effekts. Ein solcher erhoffter Nutzen oder Schaden wird mathematisch erfasst als der Nutzen des erhofften Effekts, sofern er eintritt, multipliziert mit der Wahrscheinlichkeit dass der Effekt eintritt, abhängig davon dass die Handlung unternommen wurde. Diese Wahrscheinlichkeit kann in der Praxis oft nicht direkt beobachtet werden, kann aber aus der Bayesschen Regel aus beobachtbaren Größen berechnet werden.

Dazu sind zwei Zutaten nötig: einerseits das Verhältnis der Anzahl jener Fälle in denen die Handlung unternommen wurde, zur Anzahl der Fälle in denen der Effekt beobachtet wurde, i.e. die Wahrscheinlichkeit der Handlung, abhängig davon dass der Effekt eingetreten ist; andererseits das Verhältnis der Anzahl der Fälle in denen der Effekt eingetreten ist, zur Gesamtzahl der Beobachtung, i.e. die Unabhängige Wahrscheinlichkeit des Effekts.

Bei PANOPTICOM ist die Bayessche Entscheidungstheorie, neben weiteren theoretischen Werkzeugen, eine wesentlicher Baustein in unserer selbstlernenden Lösung zur Medienbeobachtung.

Auf Twitter, zum Beispiel, geht es in einer unverhältnismäßig großen Anzahl der Tweets um Justin Bieber, wobei diese von unseren Klienten noch nie als relevant eingestuft wurden. Im Rahmen einer Bayesschen Theorie würde die geringe a priori Wahrscheinlichkeit der Relevanz solcher Tweets schnell zum dominanten Entscheidungsfaktor. Wenn das Schlüsselwort “Bieber” in einem Tweet vorkommt, kommen wir schnell zur Schlussfolgerung, dass der Tweet irrelevant ist.