Archiv der Kategorie: Neuigkeiten

Zweiter Daten-Dump: Beschriftete Referenzlisten für die Bildsegmentierung

Für unsere Linked Open Citation Database entwickeln wir neue Ansätze zur Extraktion von Referenzdaten aus Referenzlisten. Ein Schritt in diesem Prozess ist die Segmentierung solcher Listen in einzelne Referenzen, d.h. für jede Referenz wird eine Box bestimmt.

Für Trainings- und Evaluierungszwecke haben wir 2.402 zusätzliche Seiten mit Referenzen aus Büchern und Kapiteln gekennzeichnet.c

Die Koordinaten für das erste Feld sind:

<xmin>194</xmin>
<ymin>700</ymin>
<xmax>1758</xmax>
<ymax>800</ymax>

Sehen Sie hier das komplette XML dieser Seitendatei mit allen Boxen.

Der vollständige Datensatz kann zusammen mit den bibliographischen Angaben von MADATA heruntergeladen werden, damit Sie Datenzitate erstellen können: https://doi.org/10.7801/283

Präsentation auf dem EXCITE Workshop

Prof. Dr. Kai Eckert und Anne Lauscher, HDM Stuttgart, sowie Akansha Bhardwaj, DFKI werden im Zusammenhang mit dem Projekt LOC-DB eine Präsentation mit dem Titel: “Eine verknüpfte Open Citation Datenbank, die von Bibliotheken bereitgestellt wird – Motivation und Herausforderungen.” vorbereiten und dies auf dem EXCITE Workshop 2017: “Herausforderungen beim Extrahieren und Verwalten von Referenzen” am 30.03. – 31.3.2017 in Köln vorstellen.