In der sechsten Lehrveranstaltung lagen die Schwerpunkte auf folgende Themen:

  • Kommentare zu Lerntagebüchern
  • Metadaten modellieren und Schnittstellen nutzen (1/2)
  • Aufgaben

Heute ist Donnerstag und wir haben die abgesagte Lektion von der Blockwoche nachgeholt. Zuerst gab es wieder Feedback zu den Lerntagebüchern und danach nahmen wir das Schaubild des Kurses unter die Lupe. Links sieht man die Applikationen, welche wir bereits schon gemeinsam angeschaut haben wie Koha, DSpace, ArchivesSpace. Durch die Schnittstelle OAI-PMH können wir mit VuFindHarvest die Daten herausziehen. Bei Koha gibt es dann eine MARC-xml Datei, bei ArchivesSpace gibt es eine EAD Datei und bei DSpace eine DublinCore Datei. Um diese Dateien alle vereinheitlichen zu können in eine MARC XML Datei, kann die Applikation marcEdit verwendet werden. Diese Transformation werden wir nicht selber schreiben, sondern nehmen bereits vorhandene Skripte. (In der nächsten Vorlesung beschäftigen wir uns dann noch mit dem unteren Teil.) Weitverbreitete Übertragungsprotokolle:

  • Z39.50 (Library of Congress)
  • SRU - Search/Retrieve via URL (Library of Congress)
  • OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting (Open Archives Initiative)

Z39.50 (spezifische Applikation) und SRU (im Browser möglich) ist für Einzeldatenabruf oder eine Live Suche geeignet und OAI-PMH wirf für einen Gesammtdatenabzug oder tägliche Aktualisierung verwendet. Also eine tägliche Kopie der Daten. Danach habe ich in der Pause die Beispieldateien von Koha, ArchivesSpace und DSpace heruntergeladen. Der nächste Schritt war dann, ArchivesSpace über den localhost aufzurufen. Dafür musste ich nur meinen letzten Befehl wieder ausführen und habe parallel Koha gestartet. So ist nun fast alles bereit, jetzt fehlt nur noch die Installation von VuFindHarvest welches auf GitHub zur Verfügung gestellt wird. Die Schritte in der Kommandozeile wurden in der Vorlesung mitgeteilt. Diese habe ich wieder eins nach dem anderen Kopiert und ausgeführt. VuFindHarvest kann nur per Kommandozeile genutzt werden, dies hat keine eigene Benutzeroberfläche. Danach haben wir für Koha und ArchivesSpace die Daten mit

«php bin/harvest_oai.php --url=http://example.com/oai_server --metadataPrefix=oai_dc my_target_dir» 

geharvest. Es musste jeweils die URL angepasst werden, dass Dateiformat, sowie das Endziel. Da ich ArchivesSpace mit localhost8080 gestartet hatte, konnte ich den Auftrag zuerst nicht erfüllen. Als ich, wie vorgegeben den localhost mit Port 8082 gestartet habe, funktionierte es wie gewünscht. Ich hatte zwei Ordner im Verzeichnis von VuFindHarvest Koha und ArchivesSpace mit den Daten darin. Crosswalks bedeutet: Daten von einem Metadatenstandart in einen anderen Metadatenformat konvertieren. Dies geht leider nicht immer verlustfrei. Man muss die Felder zu dem anderen Feld jeweils zuordnen (mapping). Zum Beispiel zeigt man, dass in DC «title» in MARC21 das Feld 245a genommen werden soll. Hier ist dies nicht zu 100% korrekt, da der Untertitel im Feld 245b wäre. Die Library of congress haben Empfehlungen geschrieben, wie das mapping verwendet werden sollte. Um dies nicht selber erstellen zu müssen, verwenden wir im Unterricht MarcEdit. Dies haben wir installiert und danach gleich konfiguriert. Zuletzt gab es noch eine kurze Übung um MarcEdit einmal anwenden zu können. Für das haben wir die Beispieldateien von ArchivesSpace und DSpace nach MARC21XML konvertiert und die neuen Dateien abgespeichert.