Archiv

Kategorien

Mehr als 0 und 1

Letzte Postings

für gesamten Blog
You are here: Beats Weblog » NichtErwaehnungen

Nichterwaehnungen im Biblionetz

Gestern habe ich mir die Zeit genommen, eine Idee zu Implementieren, die mir schon lange vorgeschwebt ist: Nichterwaehnungen. Beim ersten Hören tönt dies seltsam: Eine Liste mit Begriffen, die in einem Text nicht erwähnt werden. Im Biblionetz habe ich unterdessen für die meisten Biblionetzbereiche genügend Datenmaterial, um statistische Berechnungen durchführen zu können. Mit einer Abfrage selektiere ich nun diejenigen Begriffe, die aufgrund der erwähnten Begriffe mit hoher Wahrscheinlichkeit ebenfalls erwähnt werden müssten, aber im Biblionetz zu diesem Buch oder Text nicht erfasst sind.

nichterwaehnungen.jpg

Dass ein Begriff bei einem Buch/Text nicht erfasst ist, kann zwei Gründe haben:
  1. Er wird tatsächlich nicht erwähnt
  2. Ich habe übersehen, dass er erwähnt wird
Die zweite Funktion hilft mir somit, offensichtliche Erfassungsfehler zu erkennen und zu korrigieren. Damit wird das Biblionetz nun auch auf algorithmischer Ebene zu einem selbstbestätigenden System: Die Erwartung beeinflusst die Wahrnehmung (Biblionetz:a00001), Überraschendes wird von diesem Algorithmus nicht erkannt.

Apropos Zeit genommen: Proof of Concept war in einer Zugfahrt von Solothurn nach Zürich möglich (1h), danach funktionierte die textuelle Darstellung. Die Einbindung der nichterwähnten Begriffe als graue Objekte ins Begriffsnetz hat dann nochmals 2h verschlungen.
 
Zum Kommentieren ist eine Registration notwendig. Kategorien: IsaBlog, IsaBiblionetz

Kontakt

  • Beat Döbeli Honegger
  • Plattenstrasse 80
  • CH-8032 Zürich
  • E-mail: beat@doebe.li