Einleitung

Mit der Verwendung eines Thesaurus wird die Mehrdeutigkeit von Sprache reduziert, indem die einzelnen Begriffe durch ihre terminologische Verortung im Thesaurus eindeutig sind. Die genaue Verortung eines Begriffs wird durch die Beziehungen zwischen den Begriffen und ihren Bezeichnungen hergestellt. Eine klare hierarchische Ordnung wird durch die Verwendung von Unter- und Oberbegriffen vorgegeben, während die Verwendung von Synonymen ein Begriffsumfeld schaffen. Vorrangiges Ziel bei der Nutzung eines Thesaurus ist die Verbesserung der Dokumentation von Museumsobjekten und infolgedessen ein qualitätsvolleres Retrieval – sowohl institutionell wie auch museumsübergreifend in Internetportalen.

Gründe für die Verwendung von Thesauri

  • konsistente Dokumentation, da nur Begriffe verwendet werden, die im Thesaurus enthalten sind
  • Qualitätssicherung der Datenerfassung im Museum bzw. Museumsverbund, da terminologische Standardisierung und Verwendung von Normdaten
  • terminologische Standardisierung führt zu höherer Präzision in der Recherche
  • verlässlicher Datenaustauch von Objektdaten
  • verlässliches Retrieval in institutionellen Datenbanken und spartenübergreifenden Kulturgutportalen
  • Thesaurusbegriffe können zusätzlich mit Informationen angereichert werden - Begriffsdefinitionen, Quellenangaben oder Normdaten-Identnummern
  • Instrument des Indexierungssystems

Wo liegen die Probleme?

  • Uneindeutigkeit der natürlichen Sprache führt zu Terminologieproblem
  • Bezeichnungen und Begriffe stehen meist nicht in eindeutiger Beziehung zueinander
  • Benennungsvielfalt (Synonymie) z.B.: Photographie = Lichtbild, Aufnahme, Foto
  • Bedeutungsvielfalt
    • Homonymie (griech. ‚Gleichnamigkeit')
    • Polysemie (griech. ‚Vieldeutigkeit') z.B.: Pferd = Tier ; Pferd = Turngerät

Lösung: Vorzugsbegriffe (Deskriptoren) bestimmen.

Merkmale eines Thesaurus

Begriff vs. Bezeichnung

Ein Thesaurusbegriff soll treffend den Inhalt, die Bedeutung, die Referenz, das Signifikat beschreiben und bildet so die Vorzugsbenennung - Deskriptor - aus der Vielzahl an Bezeichnungen für ein Objekt, die in der Sprache vorkommen.

Terminologische Kontrolle

Durch die terminologische Kontrolle soll die Mehrdeutigkeit der Sprache aufgelöst werden und die losen Bezeichnungen in eine kontrollierte Struktur gebracht werden.

  • Synonymkontrolle
    • mehrere Bezeichungen werden zu einer begrifflichen Einheit zusammengefasst
  • Polysemkontrolle
    • Bezeichnungen, die mehrere begriffliche Einheiten beinhalten, werden aufgeteilt
  • Zerlegungskontrolle

Thesaurusdefinition nach DIN 1463, Teil 1

Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient. Begriff meint die gedankliche Vorstellung, die sich mit einem Wort verbindet und nicht identisch mit der (individuellen) Bezeichnung ist: z.B. kann die Vorstellung von einer Katze durch die Bezeichnungen Katze, cat, Stubentiger, Felis silvestris catus ausgedrückt werden. a) Begriffe und Bezeichnungen werden eindeutig aufeinander bezogen (terminologische Kontrolle), indem

  • Synonyme möglichst vollständig erfasst werden,
  • Homonyme und Polyseme besonders gekennzeichnet werden,
  • für jeden Begriff eine Bezeichnung (Vorzugsbenennung, Begriffsnummer oder Notation) festgelegt wird, die den Begriff eindeutig vertritt.

b) Beziehungen zwischen Begriffen (repräsentiert durch ihre Bezeichnungen) werden dargestellt.

Semantische Relationen nach DIN 1463, Teil 1

Äquivalenzrelation (5.2)

Eine Äquivalenzrelation ist die Beziehung zwischen gleichwertigen Bezeichnungen (bedeutungsgleich oder bedeutungsähnlich), die zu einer Äquivalenzklasse zusammengeführt werden.

  • Auflösung der Benennungsvielfalt (Synonymie)
  • Schema: Deskriptor BF Synonym
  • Beispiel:
    • Photographie benutzt für / benutze für Aufnahme <Photographie>
    • Photographie benutzt für / benutze für Foto
    • Photographie benutzt für / benutze für Fotografie
    • Photographie benutzt für / benutze für Lichtbild <Aufnahme>
    • Photographie benutzt für / benutze für Photo
    • Photographie benutzt für / benutze für Photographische Aufnahme

Hierarchierelation (5.3)

 Eine Hierarchierelation liegt vor, wenn zwei Begriffe zueinander in einem Verhältnis der Über- bzw. Unterordnung stehen.

  • Abstraktionsrelation (generische Relation)
    • Kennzeichen: Oberbegriff / Unterbegriff
    • Beispiel: Holz / Laubholz / Obstbaumholz / Kirschbaumholz
  • Bestandsrelation (partitive Relation)
    • Kennzeichen: Verbandsbegriff / Teilbegriff

Assoziationsrelation (5.4)

Eine Assoziationsrelation kennzeichnet eine als wichtig erscheinende Beziehung zwischen Begriffen, die weder eindeutig hierarchischer Natur ist, noch als äquivalent angesehen werden kann.

  • Nur angeben, wenn für Indexierung & Retrieval hilfreich
  • Schema: Deskriptor 1 VB Deskriptor 2 (…VB Deskriptor 3)
  • Beispiel: De Stijl ist ein verwandter Begriff zu Neoplastizismus

Auswahl und Bildung von Deskriptoren

Anforderung an Benennungen (nach DIN 2330)

Der Zweck von Benennungen ist es, den jeweiligen Begriff innerhalb seines Begriffssystems möglichst genau, knapp und am anerkannten Sprachgebrauch orientiert zu bezeichnen. Benennungen sollen also sprachlich richtig und treffend sein.

  • Genauigkeit durch terminologische Kontrolle
  • Knappheit: Sprechbarkeit, Merkbarkeit, Übersichtlichkeit
  • Sprachgebrauch: Benennungsbildung mit Hilfe von Lexika, Normen, Handbüchern, Wörterbüchern … auch Wikipedia etc.

Formale Festlegungen in der Wortform (nach DIN 1463, Teil 1)

  • Wortart: substantivische Form (außer Mehrwort-Deskriptoren)
  • Numerus: bevorzugt im Singular
  • Schreibweise: Photographie vs. Fotografie (evtl. als Synonym)
  • Fremdsprachige Bezeichnungen ggf. als Synonyme
  • Abkürzungen und Akronyme ggf. als Synonyme

→ Dokumentation (Einleitung/Infoblatt), die Zweck und Aufbau des Thesaurus und das erfasste Gebiet klar darlegt; auch die befolgten Regeln für die Erstellung; statistische Kennzahlen etc.

Vermeidung von Mehrdeutigkeit (nach DIN 1463, Teil 1)

  • Kennzeichnung von Homonymen (bzw. Polysemen)
    • Kiefer <Knochen> Kiefer <Nadelbaum>
    • Pferd <Tier> Pferd <Turngerät>

Begriffsdefinitionen sind erforderlich, wenn Begriffsinhalt und Begriffsumfang eines Deskriptors 1 nicht mit Hilfe der semantischen Relationen innerhalb eines Begriffssystems zur Abgrenzung von Deskriptor 2 ausreichend beschrieben werden kann. (Grundsätze für das Erstellen von Definitionen in DIN 2330 „Begriffe und Benennungen"): Erläuterungen (Scope Notes), auch redaktioneller Hinweis: kurze Erklärung des beabsichtigten Gebrauchs eines Deskriptors, um z.B.:

  • Anwendungsbereich einzuschränken,
  • Abkürzungen und Akronyme zu erklären,
  • Änderungen im Gebrauch der Bezeichnung festzuhalten,
  • Hinzufügungen / Eliminierungen von Bezeichnungen zu dokumentieren,
  • Hinweise der Thesaurusredaktion bei Begriffsansetzung entgegen gängiger Norm etc.
  • Quellenhinweise zum Deskriptor bzw. zur Definition

Thesaurusverweis vs. Thesaurusnotiz

Der Unterscheidung von „Thesaurusverweisen“ und „Thesaurusnotizen“ bei den BSZ-Thesauri (wie auch allgemein) liegt der folgende Ansatz zugrunde:

  • Unter Thesaurus- oder Begriffsverweisen sind die verschiedenen Thesaurusrelationen gemäß DIN 1463, Teil 1 abgebildet, die die Verortung des Deskriptors im semantischen Gefüge aufzeigen; des weiteren – mit entsprechenden Verweistypen – die Referenzierung des Thesaurusbegriffs in anderen Normdatensystemen, wie z.B. der GND, oder anderssprachige Benennungen.
  • Unter Thesaurus- oder Begriffsnotizen sind zusätzliche Begriffsinformationen als Volltext hinterlegt, wie z.B. Definitionen, Erläuterungen, redaktionelle Bemerkungen, die als Entscheidungshilfe für die Auswahl von Begriffen beim Indexieren hinzugezogen werden können.

Monohierarchie vs. Polyhierarchie

Der blaue Pfeil vor dem markierten Begriff, Spiegelteleskop, deutet auf Polyhierarchie hin, da er eine Verknüpfung anzeigt. D.h. der Begriff ist nicht nur durch eine bestimmte hierarchiche Ordnung (Monohierarchie) terminologisch verortet, sondern kann an mehreren Stellen im Thesaurus vorkommen (Polyhierarchie). Der Begriff markierte Begriff Spiegelteloskop wurde bspw. unter dem Pfad Instrument/Optisches Instrument/Fernrohr gefunden, ist dort jedoch mit dem blauen Pfeil gekennzeichnet. Dieser Pfad (grüne Pfeile) wird unter weitere Oberbegriffe angegeben, während die eigentliche Begriffshierarchie (rote Pfeile) Instrument/Astronomisches Instrument/Fernrohr/Spiegelteleskop ist. Mehr Informationen sowie Vorträ

  • Keine Stichwörter