Inhalt
Seitenhistorie
...
Vor einiger Zeit kam aus der Staatlichen Kunsthalle Karlsruhe der Vorschlag, mit der ExpoDB nach Sammlungsobjekten mit bestimmten Farben zu suchen. Leider kam es bislang lediglich dazu, dass wir uns dazu ein Konzept überlegt haben. Wir haben es noch nicht implementiert und insofern gesichert, dass es überhaupt funktioniert. Aber ich kann ja wenigstens mal dieses Konzept aufschreiben, zumal die Frage überhaupt Probleme des Indexieren und Suchens überhaupt verdeutlicht.
...
Ebenso ist es bei der Indexierung für die ExpoDB: Es ist nicht möglich zum Suchzeitpunkt den Datenbestand von ersten Datensatz bis zum letzten durchzugehen und den Suchbegriff mit den Datensatz zu vergleichen. Wir müssen vorab einen Index erstellen, der uns dann später einen schnellen Zugriff auf die relevanten Datensätze ermöglicht. Dabei ist hilfreich, nicht nur Indexe "mit allem" zu erstellen, sondern spezialisierte Indexe für spezifische Aufgaben. Und es ist sinnvoll, die Begrifflichkeit eine einer "Normalisierung" (von Rotkraut zu Rotkohl) zu unterziehen. Dies müssen wir dann bei Suchen auch mit den Suchbegriffen machen, damit wieder alles zusammenpasst.
...
Beim Suchen sind nicht die Treffer zu genau einer der 16 Mio. Farben relevant, sondern auch die zu ihr "ähnlichen" benachbarten Farben (Man sucht nicht nur genau nach Kobaltblau, sondern auch Dunkelblau, Himmelblau, Azurblau, Blau überhaupt ...) Wie können wir Farbähnlichkeit einbauen? Wir könnten statt alle Farbwerte zwischen 0 und 255 (als Hexadezimalzahlen 00 bis FF) nur noch jeden 16sten Wert berücksichtigen und alle dazwischen auf jene den nächsten von jenen 16 Werte abbilden. Das würde von Farbcodes in Hexadezimalschreibweise, z.B. A23B67 zu A36 führen, also zu kompakteren "Worten" mit 3 statt 6 Buchstaben. Es wäre auszuprobieren, ob diese Reduktion zu passenden Ergebnissen führt. Sonst wäre eine Strategie, jeden Farbwert nicht nur auf einen einzigen gemittelten Farbwert abzubilden, sondern zu mehreren in der Umgebung im Farbraum.
...