Forschungsarbeiten

Aktuelle Forschungsarbeiten

Projekt finanziert durch das Nationale Wissenschaftszentrum

Fortgeschrittene Methoden zur Modellierung von viralen Prozessen

Jeden Tag werden Milliarden von Nachrichten, Kommentaren, Artikeln, Blogbeiträgen, E-Mails, Tweets und anderen Arten von Informationen in verschiedenen Arten von sozialen Netzwerken ausgetauscht. Die Forschung zur Informationsverbreitung ist sehr fruchtbar geworden. Insbesondere findet sie Anwendung, um die Wirkung und Viralität von Gerüchten zu maximieren oder Routing-Algorithmen zu verbessern.

Es ist auch erwähnenswert, dass die Verbreitungsmuster auf klassischen epidemiologischen Modellen beruhen, etwa dem SIR-Modell. Sie wurden in den letzten Monaten häufig verwendet, um die Ausbreitung des COVID-Virus zu modellieren.

Daher ist das Verständnis viraler Prozesse zu einer wichtigen Forschungsrichtung geworden. Modelle, die diese Prozesse beschreiben, gehen normalerweise davon aus, dass sie stochastisch sind, wie beispielsweise das berühmte SIR-Modell. Dieses Modell scheint für den Fall richtig zu sein, für den es geschaffen wurde, d.h. um den Prozess der Ausbreitung einer Krankheit zu beschreiben. Wie wir jedoch in unserer früheren Arbeit (HT 2016) gezeigt haben, betrifft es nicht die Verbreitung von Informationen. Erstens berücksichtigt dieses Modell nicht die Tatsache, dass Informationen mit der Zeit an Relevanz verlieren und Menschen sie weniger aktiv teilen. Zweitens werden die Nachrichten über verschiedene Kanäle übermittelt. Wenn wir die Verbreitung von Informationen im Twitter-Netzwerk untersuchen wollen, müssen wir auch andere Medien, wie z. B. die Massenmedien, berücksichtigen.

 Insbesondere das Fehlen dieser Effekte führt dazu, dass das SIR-Modell die Wahrscheinlichkeit überschätzt, dass eine Information viral wird, d. h. fast das gesamte Netzwerk erreicht. Unsere Arbeit (HT 2016) erklärt die beobachteten Kaskadengrößen durch die Berücksichtigung dieser beiden Effekte:

  • eine exponentielle Abnahme der Wahrscheinlichkeit, dass sich das Gerücht weiter verbreitet,
  • die Multi-Source-Natur des Prozesses, der für die Verbreitung von Gerüchten über das Twitter-Netzwerk hinaus verantwortlich ist.

Eine weitere mögliche Erklärung findet sich in unserer Arbeit (WWW 2017), in der wir das erste theoretische Modell entwickelt haben, das erklärt, warum die Größenverteilung der Kaskade dem Potenzgesetz folgt.

Eine weitere mögliche Erklärung findet sich in unserer Arbeit (WWW 2017), in der wir das erste theoretische Modell entwickelt haben, das erklärt, warum die Größenverteilung der Kaskade dem Potenzgesetz folgt. In unserer Arbeit haben wir den Begriff der Richtung der Informationsausbreitung eingeführt, d. h. von Knoten mit hohem Grad und hohem Vertrauen. Die Motivation hinter dieser Annahme ist, dass Menschen eher dazu neigen, Informationen von Knoten zu teilen, die viele Freunde haben. Mit anderen Worten: es scheint, dass wir tatsächlich nicht weit von einem guten Verständnis des Mechanismus der Informationsverbreitung in sozialen Netzwerken entfernt sind.

Und das, obwohl in sozialen Netzwerken kaskadierende Prozesse sehr genau verfolgt werden können. Unser mangelndes Verständnis bedeutet, dass wir nicht in der Lage sind, die Risiken, die mit sehr seltenen Ereignissen verbunden sind, richtig einzuschätzen. Insbesondere ist unsere Arbeit (HT 2016) unseres Wissens nach der einzige Fall, der ein Maß verwendet, das seltene Ereignisse korrekt berücksichtigt. 

Dies wirft die Frage auf, ob bei epidemiologischen Anwendungen solcher Modelle seltene Ereignisse, wie z. B. bei der Ausbreitung der COVID-Pandemie, korrekt beschrieben werden. Eine weitere Forschungsrichtung im Bereich der viralen Prozesse ist die Vorhersage der Popularität einer bestimmten Information. Es ist zu beachten, dass diese Modelle mit einem ganz anderen Ansatz erstellt werden als in unserer Arbeit angenommen.

Ein typischer Ansatz besteht darin, ein Regressionsmodell zu erstellen, das auf der Grundlage der beobachteten Merkmale des Prozesses dessen weitere Entwicklung vorhersagt. Diese Modelle sind jedoch nur begrenzt wirksam, da sie implizit davon ausgehen, dass der Prozess deterministisch ist, obwohl er von Natur aus stochastisch ist und seine Entwicklung nicht vorherbestimmt ist.

Die Herausforderung besteht also darin, Modelle zu entwickeln, die alle möglichen Fortsetzungen der als Verteilung beschriebenen Entwicklung vorhersagen.

Die Herausforderung besteht also darin, Modelle zu entwickeln, die alle möglichen Fortsetzungen der als Verteilung beschriebenen Entwicklung vorhersagen. Nur ein solcher Ansatz kann zu statistisch korrekten Ergebnissen führen, die die Chancen vorhersagen, dass ein Prozess das gesamte Netzwerk erreicht. Die daraus resultierenden Forschungsherausforderungen prägen die Aufgaben dieses Projekts:

  • Identifizierung der Mechanismen, die für das Verschwinden der Wahrscheinlichkeit eines weiteren Informationsaustauschs verantwortlich sind.
  • stochastische Modellierung des Risikos, dass sich ein viraler Prozess auf das gesamte Netzwerk oder seinen signifikanten Teil ausbreitet.
  • Arbeit an Modellen zur Vorhersage der Entwicklung eines bestimmten Gerüchts.
  • Ableitung der Parameter und Arten der Übertragung des viralen Prozesses aus indirekten Beobachtungen.
  • Prüfung, ob die Natur des Virus erkannt werden kann, z. B. ob es sich um ein reales Ereignis, eine Fake News oder einen wissenschaftlichen Artikel handelt.
  • Anwendung der in diesem Projekt entwickelten Methodik auf die Modellierung der COVID-Epidemie. Unsere Arbeit wird Aufschluss über die korrekte Beschreibung der Risiken dieses Prozesses geben.

Die Modellierung stochastischer Prozesse ist unsere Spezialität. Wir betreiben auf diesem Gebiet Forschung von Weltrang.

Schneller Kontakt

Wenn Sie mehr darüber erfahren möchten, wie MIM Solutions Ihnen helfen kann, das Potenzial von KI in Ihrem Unternehmen zu erschließen, kontaktieren Sie uns bitte.