Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

� in der reduzierten Inventarnummer ist ein nicht erlaubtes Zeichen und sollte unter Sonderzeichen nochmals auftauchenaufgelistet werden. Die Ausnahme sind die expliziten Verbotenen Zeichen; diese tauchen in der reduzierten Inventarnummer ebenfalls als � auf.

Sonderzeichen

Sonderzeichen können aus den verschiedensten Gründen in der Inventarnummern vorkommen und können harmlos sein oder unerwünscht. Aus Sicht der Medienbereitstellung verhindern sie jedenfalls die Zuordnung eines Medienobjekts zu eine Museumsobjekt mit dieser Inventarnummer.

Typisches Beispiel für eine Meldung in diesem Bereich:


Image Added


char="+" gibt hier das Sonderzeichen an, wobei "exotische" Zeichen u.U. nicht richtig angezeigt werden. Dann werden alle Inventarnummern aufgezählt, die dieses Sonderzeichen enthalten. Wenn dies sehr viele sind, lohnt es sich den <examples>-Tag zuzuklappen.

Hier wird das Plus-Zeichen offensichtlich für "NM01-710a und NM01-710b" sowie für "NM01-K134 und NM01-K135" benutzt. Im ersten Fall wäre (in diesem Museum) "NM01-710 a-b" korrekt, und der Datensazu sollte korrigiert werden. Für den zweiten Fall muss entschieden werden, wie solche Kombinations-Objekte benannt werden. Z.B. könnten sie als "NM01-K134; NM01-K135" erstellt (und Semicolon ; als Trennzeichen hinzugefügt), oder so wie vorhanden representiert (und Plus + als Trennzeichen hinzugefügt) werden.

Für jedes Sonderzeichen wird außerdem gemeldet, ob es zu Kollisionen kommen würde, wenn das Zeichen zu den Trennzeichen (if="replace") oder den Entfernten Zeichen (if="remove") hinzugefügt würde:

Image Added

Hier würde z.B. eine Kollision erzeugt, wenn der Unterstrich _ zu den Trennzeichen hinzugefügt würde. Als Entferntes Zeichen würde er keine Kollision erzeugen. Nachdem "I_1810 b" und "I/1810 b" aber vermutlich dasselbe Objekt sind, wäre es hier sinnvoller beide als Objekte mit doppelter Inventarnummer zu kennzeichnen (oder direkt eines davon zu entfernen, wenn offensichtlich).

Der Suffix "_2" könnte ebenfalls auf doppelte Inventarnummern hindeuten, oder einfach Teil des Inventarnummerschemas sein. Da es keine "_1" Objekte gibt, handelt es sich vermutlich um Duplikate, aber der Report versucht nicht, solche semantischen Entscheidungen zu treffen.

Klammern

Klammern werden meist in Paaren gemeldet, da von Menschen zumeist in Paaren benutzt. Ein typischer Fall ist "(?)" bei unsicheren oder unlesbaren Inventarnummern:

Image Added

Hier lohnt sich eventuell eine Überprüfung der entsprechenden Objekte, sofern praktikabel. Vor allem, weil diese "unsicheren" Inventarnummern in der Regel eindeutig sind, d.h. es gibt nur "ST 675 (?)", aber nicht "ST 675".

Bei Klammern werden in der Regel keine "was wäre wenn" Duplikate gefunden, weil der Report nur einzelne Zeichen betrachtet. Egal welches einzelne Zeichen von "(", "?" und ")" ersetzt wird, wären "ST 675 (?)" und "ST 675" aber immer noch verschieden ("ST 765 ?)", "ST 765 ()" sowie "ST 765 (?"). Hier lohnt es sich also den Report nochmal zu erzeugen, diesmal mit allen drei Zeichen als Entfernte Zeichen. Eventuelle Kollisionen werden dann ganz oben unter <duplicates> angezeigt.

Die Entstehung von "2008()029" ist kryptisch. Das Beispiel ist hier zur Illustration, dass nicht alle Anomalien in den Inventarnummern rational erscheinen müssen.


False Positives

Typisches Beispiel für harmlose Meldungen sind das "ö" in "löschen", oder andere Sonderzeichen in Objekten die offensichtlich gelöscht werden sollen:

Image Added

False Negatives (Dinge, die der Report nicht findet)

Unsinnige Verwendung von Trennzeichen

Wenn Trennzeichen in einer für Menschen unsinnigen Form benutzt werden, findet der Report das nur wenn das zu Duplikaten bei der reduzierten Inventarnummer führt.

"NM01--710a" (zwei Bindestriche hintereinander) wird z.B. nur gefunden, wenn es auch "NM01-710a" (nur ein Bindestrich) gibt. Ansonsten wird "NM01--710a" zu "nm01-710a" und ist verknüpfbar. Entsprechend sind "A 123 /- 5", "A 123 // 2" oder "A 123 (1" für Menschen offensichtlich merkwürdig, aber solange die reduzierten Inventarnummern "a-123-5", "a-123-2" sowie "a-123-1" eindeutig sind, findet der Report nichts.