Tag Archives: Deep Learning

Consim: Ähnliche Texte finden

Consim ist ein Matching-System für Text. Mit Consim lassen sich Texte identifizieren, die ähnliche Themen behandeln. Consim erkennt die Ähnlichkeit von Texten mit Hilfe von Machine Learning und Natural Language Processing rein auf inhaltlicher Basis. Es werden keine Besucher-Daten oder weitere Meta-Informationen benötigt.

Beispielsweise kann Consim in den Angeboten eines Nachrichten-Verbundes Texte zu ähnlichen Themen finden. Sogar dann, wenn Sie auf verschiedenen Portalen gehostet werden. Oder Consim kann mit den Gesetzestexten eines Rechtsgebietes trainiert werden und findet dann Gerichtsurteile, in denen die jeweiligen Themen behandelt werden.

Ähnlichkeit basiert auf dem Inhalt

Um Consim einzusetzen reicht es, Zugriff auf die Inhalte zu haben. Metadaten wie Kategorisierung, Quelle oder ähnliches können als zusätzliche Hilfestellung mit in den Matching-Prozess einfliessen, sind aber nicht nötig.

Das System basiert auch nicht auf der Auswertung von User-Daten. Es ermittelt also nicht – anders als der klassische Amazon-Recommender – dass ein User, der Produkt A mochte,  auch Produkt B angeschaut hat. Vielmehr identifiziert Consim Wortgruppen, die eine thematische Einordnung des Textcontents erlauben.

Dadurch, dass Consim nur den Inhalt in Betracht zieht, funktioniert das System auch direkt für neu eingestellte Texte – es gibt kein Cold-Start-Problem – und auch in Bereichen, in denen nur wenige oder gar keine User-Interaktionen statt finden.

Use-Cases

Consim kann beispielsweise für die folgenden Anwendungsfälle eingesetzt werden:

  • Online-Nachrichtenportale: Mehr und mehr Nachrichtenportale setzten auf einen Mix aus freien News und Premium-Inhalten, die hinter einer Bezahl-Schranke liegen. Mit Hilfe von Consim lassen sich thematische Verbindungen finden, die von den freien, hoch frequentierten Online-Angeboten auf die weniger oft aufgerufenen Bezahl-Inhalte führen. Klassische Recommender-Lösungen scheitern hier, weil die Bezahl-Inhalte zu wenig Reichweite haben, um von den statistischen Verfahren berücksichtigt zu werden.
  • In Matching – Szenarien, in denen individuelle, profil-basierte Vorschläge erstellt werden, läßt Consim sich ebenfalls einsetzen. Voraussetzung ist, dass die Informationen, die zur Identifikation von Interessen und zur Herausarbeitung eines Profils verwendet werden, in Textform vorliegen. Dazu können sowohl vom User generierte als auch von ihm konsumierte Inhalte verwendet werden. Ein Anwendungsfall ist das Matching von Studieninteressen mit Studiengangs-Beschreibungen. Ein anderer ist die Suche in Stellenangeboten, wo die  bereits besuchten und als interessant bewerteten Angebote das Profil ergeben, zu dem sich ähnliche Angebote finden lassen.
  • In Expertensystemen oder Fallsammlungen für Spezialisten lassen sich mit Consim ähnliche Fälle finden.  Bestehende Filtersysteme – wie zum Beispiel Kategorie-basierte Einordnungen – lassen sich somit ergänzen  und Consim kann dem Benutzer den Zugang zu ähnlichen Fälle ebenen, die mit traditionelleren Ansätzen schwieriger zu finden wären. Beispiele für solche Anwendungen können juristische oder medizinische Fallsammlungen sein.

Funktionsweise

Das System extrahiert aus einer bestehenden Sammlung von Texte die Themengruppen, die in den Texten dieses Corpus behandelt werden.
Anschliessend werden die Texte eines zweiten Corpus analysiert, um zu ermitteln welche der erkannten Themen sie behandeln.
Je mehr übereinstimmende Themen zwei Texte behandeln, um so ähnlicher sind sie für das System.

Der Weg über zwei unterschiedliche Corpora eröffnet interessante Anwendungsfälle. So kann Consim beispielsweise mit Gesetzestexten trainiert werden, um anschließend ein Matching von Urteilen durchzuführen.

Technologie

Consim kombiniert Methoden der statistischen Textanalyse und des Deep Learning. Zu den verwendeten Machine Learning und NLP Methoden gehören insbesondere Topic Extraction und Algorithmen aus dem Text-Mining. Damit reiht sich Consim in eine Reihe von Anwendungen ein, die bei Folge 3 entwickelt wurden und Technologien aus der KI und dem Machine Learning in konkreten Szenarien nutzbar machen. Ein weiterer solcher Anwendungsfall ist unsere Vorhersage von Online Reichweiten mit Hilfe eines Neuronalen Netzes.

Wenn Sie Interesse an Consim oder ganz allgemein an unseren KI-basierten Anwendungslösungen haben, melden Sie sich gerne unter data@folge3.de

Neuronale Netze zur Prognose von Online-Reichweite

Mit Hilfe von Deep Learning und neuronalen Netzen hat Folge 3 ein Prognose-System realisiert, mit dem sich die Reichweite von Anzeigenschaltungen vorhersagen und steuern lässt.

Das System ist für unterschiedliche Arten von bezahlten Anzeigen nutzbar – beispielsweise für Stellenanzeigen, Werbeanzeigen oder für Premiumprofile. Sowohl für laufende als auch für zukünftige Schaltungen kann die wahrscheinliche Reichweite über die Laufzeit vorhergesagt werden.

Unterstützung im Geschäftsprozess

Das Prognose-System unterstützt den den Geschäftsablauf beim Kunden an mehreren Stellen:

Vertrieb: Der Verkäufer kann prognostizieren, welche Reichweite sich mit welchen buchbaren Optionen erzielen lässt. Er kann live verschiedene Optionen durchspielen und seinem Kunden demonstrieren, wie das Zubuchen von Sonderleistungen die Reichweite erhöhen kann. Gemeinsam mit dem Kunden kann er entscheiden, welche Optionen für den Kunden das optimale Ergebnis bieten.

Monitoring: Mit Hilfe der Prognose können die Sachbearbeiter während der Laufzeit erkennen, ob eine Anzeige Gefahr läuft, weniger Reichweite zu erreichen als vorhergesagt.
Für Anzeigen, für die das zutrifft, kann das System Alarm schlagen und Möglichkeiten zur Performance-Steigerung vorschlagen.

Steuerung: Wenn eine Anzeige weniger Reichweite erzielt als vorhergesehen, können Reichweiten-steigernde Maßnahmen aktiviert werden. Dabei kann die Vorhersage genutzt werden, um zu entscheiden, welche Maßnahme ausreichend viel zusätzliche Reichweite einbringt, so dass die zugesagte Performance am Ende der Laufzeit erzielt wird.

Training und Optimierung

Zum Training des Neuronalen Netzes werden Reichweite-Daten aus den letzen Jahren herangezogen. Um so mehr Daten zum Training zur Verfügung stehen, umso exakter werden die Vorhersagen sein, die das System erzeugt. Es reichen aber „handelsübliche“ Datenmengen“ wie sie heutzutage in mittleren Webangeboten erreicht werden. Das System benötigt kein „Big Data“ um verläßliche Prognosen zu erstellen.

Deep Learning bezeichnet einen Satz von Methoden, die gemeinsam haben, dass sie ein neuronales Netz mit realen Daten in vielen aufeinanderfolgenden Iterationen trainieren. Nach jeder Iteration wird die Qualität der Prognose gemessen und die Einstellungen werden für die nächste Runde angepasst. In dieser evolutionären Vorgehensweise werden Einstellungen, die schlechtere Ergebnisse erzielen, schnell als Sackgassen erkannt und das Modell kann schrittweise die Vorhersage-Qualität steigern.

Das Trainieren des Netzes beginnt man in der Regel mit Eigenschaften, die einen klaren Einfluss auf die prognostizierte Größe haben. Sobald die Prognosen ausreichend gut sind, können schrittweise weitere Einflüsse in das Training aufgenommen werden. So lassen sich auch zum Beispiel saisonale und / oder regionale Einflüsse kontrolliert mit in das Modell einbeziehen.

Vielfältige Anwendungsfälle

Prognosen mit neuronalen Netzen sind nicht auf den Anwendungsfall „Reichweite von Bezahlanzeigen“ beschränkt, sondern können vielfältig genutzt werden. Beispielsweise prognostiziert Folge 3 in einem anderen Projekt für einen Großhändler die Dauer, die für das Verpacken einer Bestellung benötigt wird. Diese Prognose hilft dabei, die Auslastung der Packtische zu optimieren.

Folge 3 unterstützt bei der Ideenfindung und der Bewertung der vorliegenden Daten, zum Beispiel im Rahmen eines Data Discovery Workshops. Wir übernehmen das Training des Systems und deployen es auf unseren oder auf Ihren Servern. Anschliessen können die Ergebnisse von Mensch und Maschine genutzt werden. Im Browser können Sie mit Hilfe von generischen oder eigens für Ihren Anwendungsfall erstellten Dashboards und Tools auf die Prognose zugreifen. Gleichzeitig können Sie die Vorhersagen auch über eine REST-API abrufen, um sie in maschinellen Abläufen einzusetzen.

Für genauere Auskünfte melden Sie sich gerne unter data@folge3.de