Tag 5

Import und Export in ArchivesSpace

Nach einer kurzen Einführung starten wir gleich mit einer Übung und versuchen, Daten in ArchivesSpace im EAD-Format zu importieren und anschliessend im MARC/XML-Format wieder zu exportieren. Import und Export würde natürlich auch in anderen Formaten wie CSV funktionieren. Für ein Programm, das breit eingesetzt werden soll, ist es sicher wichtig, kompatibel mit vielen Datenformaten zu sein.

Als erstes muss ich aber bemängeln, dass der Import der ersten drei EAD-Dateien nicht funktioniert hat. Erst bei der vierten hats dann geklappt. Dies ist auch komisch, weil einige aus dem Kurs die gleichen Dateien genommen haben und der Import bei ihnen geklappt hat. Eigentlich haben wir alle die Testversion genutzt und nichts an den Einstellungen geändert, ich kann es mir nicht erklären… Der Import hat jedenfalls bei allen lange gedauert. Unter anderem, weil EAD ein komplexes Dateiformat ist, weil die Testversion von ArchivesSpace nicht automatisch auf eine SQL-Datenbank zugreift sondern eine eigene (weniger gute) Testdatenbank zur Verfügung stellt und weil ArchivesSpace nur 1 GB RAM benutzt (vorausgesetzt wir passen die Einstellungen nicht an).

Immerhin hat der anschliessende Export gleich geklappt. Beim Import hatte das EAD-File noch 1700 Zeilen, das MARC/XML hatte beim Export nur noch 250 Zeilen. Ich habe die Files zwar ein paar Minuten verglichen und auf Anhieb keine Verluste durch die Konvertierung feststellen können. Bei der Besprechung in der Klasse kommen wir aber zum Schluss, dass nicht alles verlustfrei exportiert wurde (was bei diesem Unterschied an Zeilen aber auch nicht erstaunt). Schlussendlich ist EAD auch nicht perfekt. Um zu gewährleisten, dass die Dateien sauber modelliert sind und beim Mapping keine Verluste passieren, kann man sich einem Schema für Dateiformate bedienen.

Eine grosse Hilfe für den Import und Export sind die Data Import and Export Maps, die auf der Seite von ArchivesSpace bereitgestellt werden:
https://archivesspace.org/using-archivesspace/migration-tools-and-data-mapping

Unterschiede von Bibliotheks- und Archivsystemen

Die meisten Unterschiede sind mir eigentlich schon klar, ich schreibe die wichtigsten aber der Vollständigkeit halber noch auf.
Bibliothekssysteme Sind auf Massenmedien ausgelegt und auch auf Interaktionen mit den Nutzer*innen ausgerichtet. Somit ist die Software auch auf die zu verwaltenden Medien ausgerichtet. Viele Medien sind mehrfach vorhanden. Das Metadatenformat ist bei den meisten momentan MARC21, zukünftig wird BIBFRAME aber einen wichtigeren Platz einnehmen.
Archivsysteme haben den Entstehungszusammenhang im Vordergrund und der Bestand bleibt meist vor Ort. Die Nutzung der Medien ist oft nur auf Anfrage möglich, wenn überhaupt. Die jeweiligen Medien sind im Normalfall auch nur 1x vorhanden. In Archiven ist das Metadatenformat EAD hoch im Kurs.

Open Access und Open Data

Diese Unterscheidung ist für mich neu: Open Access ist ein Begriff, der für Publikationen (Zweitverföffentlichungen) verwendet wird. Open Data bezieht sich hingegen auf Forschungsdaten (Primärdaten), die direkt bei der Forschung entstehen. Nochmal was anderes ist Open Source, was einfach bedeutet, dass der Quellcode offengelegt ist. Und auch nochmal was anderes sind die Forschungsinformationen, nämlich Infos über Forscher*innen, Drittmittelprojekte, Patente, etc. – Ziel der Erhebung von Forschungsinformationen ist, mehr über die aktuelle Forschung berichten zu können. Unter diesem Link sind die Unterschiede noch genauer aufgeführt.

DSpace

Nun kommen wir zu DSpace, dem Repository für Publikationen und Forschungsdaten – also sowohl ein Open Access als auch ein Open Data Repository. Für mich ist es bis hierhin noch sehr theoretisch, aber dafür starten wir erst mal mit einer Übung, um gleich in die Praxis einzusteigen. Installieren müssen wir nichts, es gibt eine Online-Testversion. Falls ich DSpace eines Tages selber irgendwo einführen möchte, könnte ich die Software Installieren und hier auf einen Blog mit den ersten Schritten zurückgreifen.

Zurück zur Übung – zuerst muss ich herausfinden was Communities und Collections sind:
Community: Die Institution, z.B. FH Graubünden
Collection: Die Sammlung, z.B. Dissertationen

Ich bin mal wieder überrascht, wie viele Auswahlmöglichkeiten und Felder es gibt. Das kann natürlich ein Vorteil sein, wenn eine Institution sehr präzise erfassen will. Nach dem Erstellen einer Community und einer Collection kann ich ein Dokument heraufladen. Es ist erstaunlich, wie schwer mir die Orientierung fällt, nachdem ich alles eingetippt und das Bild heraufgeladen habe. Von der Startseite aus brauche ich äusserst lange, um meine Daten wieder zu finden.

Die Daten vom Repository können am Ende heruntergeladen werden. Aus meiner Sicht ist die Navigation aber nicht sehr intuitiv und ich musste auch für diese Aufgabe mehrmals nachschauen, welche Menüpunkte ich für den richtigen Befehl (Datensatz herunterladen) auswählen muss.

Zum Schluss des Unterrichtsblocks werden uns noch zwei Schnittstellen für DSpace gezeigt. Die eine – OAI-PMH – kennen wir natürlich schon. Damit können die Metadaten von DSpace abgerufen werden. OAI-PMH scheint wirklich in extrem vielen Situationen ein hilfreiches Werkzeug zu sein. Mit SWORD können die DSpace-Datensätze auch auf anderen Webseiten publiziert werden.