Nichterwaehnungen im Biblionetz
Gestern habe ich mir die Zeit genommen, eine Idee zu Implementieren, die mir schon lange vorgeschwebt ist:
Nichterwaehnungen. Beim ersten Hören tönt dies seltsam: Eine Liste mit Begriffen, die in einem Text
nicht erwähnt werden. Im Biblionetz habe ich unterdessen für die meisten Biblionetzbereiche genügend Datenmaterial, um statistische Berechnungen durchführen zu können. Mit einer Abfrage selektiere ich nun diejenigen Begriffe, die aufgrund der erwähnten Begriffe mit hoher Wahrscheinlichkeit ebenfalls erwähnt werden müssten, aber im Biblionetz zu diesem Buch oder Text nicht erfasst sind.
Dass ein Begriff bei einem Buch/Text nicht erfasst ist, kann zwei Gründe haben:
- Er wird tatsächlich nicht erwähnt
- Ich habe übersehen, dass er erwähnt wird
Die zweite Funktion hilft mir somit, offensichtliche Erfassungsfehler zu erkennen und zu korrigieren. Damit wird das Biblionetz nun auch auf algorithmischer Ebene zu einem selbstbestätigenden System:
Die Erwartung beeinflusst die Wahrnehmung (
Biblionetz:a00001), Überraschendes wird von diesem Algorithmus nicht erkannt.
Apropos Zeit genommen: Proof of Concept war in einer Zugfahrt von Solothurn nach Zürich möglich (1h), danach funktionierte die textuelle Darstellung. Die Einbindung der nichterwähnten Begriffe als graue Objekte ins Begriffsnetz hat dann nochmals 2h verschlungen.
Zum Kommentieren ist eine Registration notwendig.
Kategorien:
IsaBlog,
IsaBiblionetz