Jump to content
Symbolfoto: Das AIT ist Österreichs größte außeruniversitäre Forschungseinrichtung

Semantische Annotation ohne die spitzen Klammern

Recogito (https://recogito.pelagios.org) ist eine open source Plattform zur semantischen Dokumenten-Annotation: d.h. für die Auszeichnung von Texten und Bildern mit Referenzen auf Ontologien und kontrollierte Vokabulare. Recogito bietet einen persönlichen Arbeitsbereich für Benutzer, um Materialien hochzuladen, zu organisieren und freizugeben; um Dokumente gemeinsam  zu Kommentieren; um strukturierte Inhalte zu extrahieren - z. B. eine Landkarte aus einem Zeitungsartikel oder ein soziales Netzwerk aus einem Roman; oder um Trainingsmaterial für Machine Learning Aufgaben zu erstellen.

Über eine einfach zu bedienende Benutzeroberfläche können Benutzer: digitalisierte Dokumente navigieren; persönliche Sammlungen anlegen; gescannte Bilder transkribieren; Karten aus ihren Quellen erstellen, indem sie Ortsreferenzen mit einem Gazetteer, einer integrierten geografischen Datenbank, verknüpfen; ihre Arbeit in eine Reihe von Datenformaten exportieren und ihre Ergebnisse auf interaktiven Karten anzeigen. Recogito bietet auch Unterstützung für allgemeinere Annotationsfunktionen, wie Freitextkommentare oder Tags zu Textpassagen oder Bildbereichen. Die Benutzer können entweder alleine in einem geschlossenen Arbeitsbereich arbeiten, in Gruppen zusammenarbeiten oder Recogito als öffentliche Crowdsourcing-Plattform nutzen. Recogito dokumentiert den Versionsverlauf und kann mit verschiedenen externen Geo- oder Ontologie-Datenbanken verknüpft werden. Es ist auch möglich, verschiedene Werkzeuge für die automatische Erkennung von Named Entities (Named Entity Recognition, NER) einzubinden.

 

Eine Flexible & Anpassbare Datenannotations-Plattform

Recogito bietet eine Reihe von Anpassungsmöglichkeiten. Darunter insbesondere Möglichkeiten für die nahtlose Integration in bestehende Systemlandschaften, die Anbindung an Dokumenten-Repositorien und Image Server, sowie die für Anpassung von Auswahlwerkzeugen und Annotationseditoren an unterschiedliche kundenspezifische Anforderungen und Workflows.

 

Facts

  • Project start: March 2016
  • Project duration: 4 years
  • Funding: Andrew W. Mellon Foundation
  • Coordination: Exeter University
  • Partners: Exeter University, Humboldt Institut für Internet und Gesellschaft, The Open University, University of London

 

Links: