Über linguistische Analysen und maschinelles Lernen kann ein Text automatisiert verschlagwortet und einem Ressort zugeordnet werden.
Unterschiedliche Entitäten wie Personen, Orte und Organisationen werden über semantische Analysen und ein maschinelles Sequenz-Lernverfahren erkannt.
Durch Auswertung von Adjektiven und auf Grundlage eines maschinellen Lernverfahrens kann die inhaltliche Subjektivität eines Textes bewertet werden.
Identifizierte Begriffe werden mit einer eindeutigen URI verknüpft und können so mit zusätzlichen Informationen aus Wikidata ergänzt werden.
Aus dem Quelltext einer Online-Nachrichtenseite wird der Hauptartikel extrahiert. Fremde Elemente wie die Navigation oder Teaser-Texte werden aussortiert.
Das Tool kombiniert je nach Aufgabe unterschiedliche Techniken wie die Auswertung über maschinelles Lernen, automatische Mustererkennung oder vergleichende Techniken. Es ist flexibel einsetzbar.