In der siebten Lehrveranstaltung lagen die Schwerpunkte auf folgende Themen:

  • Metadaten modellieren und Schnittstellen nutzen (2/2)
  • Aufgaben

Heute haben wir uns hauptsächlich mit OpenRefine beschäftigt. Dies ist eine Benutzeroberfläche, welche an ein klassisches Tabellenverarbeitungssoftware ähnelt. Dadurch können Analysen, Bereinigungen, Konvertierungen und Anreicherungen von Daten durchgeführt werden. Dieses Tool haben wir installiert und sind die Basisfunktionen durchgegangen. Aufgerufen wird es wieder mit dem localhost aber mit dem Port 3333 aufgerufen. Nach dem entpacken des Ordners mit dem Befehl «./refine» wurde die Oberfläche sogar automatisch gestartet. Der nächste Schritt war Beispieldateien von Library Carpentry hineinzuladen. So haben wir bereits 1001 records bereits für Übungszwecken vorhanden. Durch die Änderung vom Seperator «l» in der Spalte Authors, ergaben sich danach 4009 records. Das bedeutet, dass es noch zusammengeführte Einträge gab und diese so richtig unterteilt wurden. Später machten wir eine Übung zu CSV nach MARCXML mit OpenRefine. OpenRefine verwendet eine eigene Template-Sprache und zwar GREL. Verglichen wurde die Ausgangsdaten vom Unterricht mit dem Ergebnis. Welche Transformationen für die jeweiligen Felder durchgeführt worden. Hierbei ist meine Gruppe auf folgende Lösung gekommen:

<datafield tag="100" ind1="0" ind2=" "> <subfield code="a"></subfield></datafield> 

-> mehrere Autoren werden durch den Seperator «l» in verschiedene Datenfelder “gesplitet”. Bsp.:

<datafield tag="100" ind1="0" ind2=" ">
<subfield code="a">Magali Troin</subfield>
</datafield>
<datafield tag="100" ind1="0" ind2=" ">
<subfield code="a">Xiaoxiao Qin</subfield>
</datafield>

Danach haben wir das Template ergänzt und eine geeignete Regel im Template, um die Daten der gewählten Spalten in MARC21 transformieren zu können, erstellt. Im Unterricht wurde alles Schritt für Schritt aufgezeigt, was mir einen guten Einblick ergab. Für die leeren Zellen, ergänzten wir noch folgende Funktion:

""

Danach exportierten wir das Gesamtergebnis als XML Datei und validierten es mit dem Programm xmllint. Dies ist von Ubuntu vorinstalliert. Für den Abgleich verwendeten wir wieder die Kommandozeile. Da ergab es bei mir zuerst einen Fehler. Ich habe aber gemerkt, dass die Datei nicht genau so hiess, wie in der Aufgabe. Als ich dies geändert habe, konnte ich es mit xmllint validieren. Während der Vorlesung habe ich parallel VuFind installiert mit allen angaben von GWDG, welches die Dozenten bereitstellten. Dies konnte ich einwandfrei durchführen und auch die Beispieldaten am Schluss importieren. Zuhause werde ich dann noch die Übung zu der Konfigurationssuche und Faccetten angehen.