Es gibt etliche Webkatalog-Skripte im Internet, die teil kostenlos heruntergeladen werden können, um  damit einen Webkatalog aufzubauen. Es handelt sich bei diesen Skripten im Grunde um spezialisierte Content Management Systeme (CMS), mit denen sich Links komfortabel eintragen, kategorisieren und verwalten lassen. Ihnen allen ist mehr oder weniger gemein, dass die Metadaten der Einträge viel Handarbeit erfordern.

Bei BeamMachine.net kommt kein solches Skript zur Anwendung, sondern wir verwenden eine selbst entwickelte Engine. Eine Besonderheit dieser Software ist, dass der Content intensiv ausgewertet wird, um Tags und Kollektionen gleichartiger Links zu erzeugen. Die normalerweise mühsam zusammengetragenen Metadaten der Linkeinträge werden vollständig automatisch erzeugt. Das erleichtert den Moderatoren die Arbeit und gestattet es uns, viele neue Links innerhalb kurzer Zeit zu prüfen und aufzunehmen.

Context-sensitive Klassifizierung

Neben der Zeitersparnis bei der Prüfung von Websites und Eintragstexten, hat die context-sensitive Klassifizierung der Einträge noch einen wichtigen Vorteil, der mehr Besucher als Betreiber interessieren wird. Denn jeder Eintrag wird durch automatische Tags, ähnliche Einträge und die Listung auf vielen verschiedenen Themenseiten (die oben bereits erwähnten Kollektionen) angereichert. Viele Besucher kommen daher zwar mit einem ganz bestimmten Interesse in unser Webverzeichnis, finden auf Ihrer Suche aber viele neue spannende Themen und Webseiten, die nur am Rande mit dem eigentlich gesuchten Thema zu tun haben.

Bei der Kategorisierung und „Tag-Findung“ geht BeamMachine aber noch ein bisschen weiter, denn es handelt sich um einen mehrstufigen Algorithmus. Zunächst werden alle Wörter aus der Beschreibung eines Eintrags extrahiert und gewichtet (nach Häufigkeit, Länge, etc.). Im Anschluss werden aufwendig Kombinationen aus diesen Begriffen gebildet und diese wiederum gewichtet. Dieser Prozess geht aktuell bis in die zweite Dimension, also werden maximal 2 Begriffe kombiniert, was jedoch nur eine künstliche Einschränkung des Algorithmus ist.

Sobald alle relevanten Tags und Tag-Phasen gefunden sind, werden diese so aufbereitet, dass sie für Menschen genießbar sind – von Groß- und Klein-Schreibung bis zu ganzen Satzteilen finden wir das heraus, was für Menschen am meisten Sinn ergibt. Auch hierbei wird wieder gefiltert, gewichtet und sortiert. Das Ergebnis dieser Tag-Generierung sind contextsensitive, themenrelevante Tag-Listen und Tag-Wolken, die unsere Besucher dabei unterstützen, möglichst viele hochwertige Websites aus dem gesamten Themenumfeld zu finden.

Beispiele

Hotel-Empfehlungen: Die ersten Hotel-Webseiten sind die beliebtesten Hotels. Wer weiterschaut, findet Hotels mit unterschiedlichen Ansprüchen, für Urlaub, mit Sternen oder in der Nähe von Sehenswürdigkeiten.

Sprüche-Webseiten: Wer Sprüche sucht, muss seine Suche definitiv verfeinern. Denn viele Anlässe und Verwendungen stehen zur Auswahl. Liebessprüche, Sprüche zum Schulabschluss, Spruchmotive als Deko oder Geschenk, Shirtsprüche und so weiter. Nur eine automatische Tag-Cloud und Themenübersicht kann dem Content und den Interessen der Besucher gerecht werden!

Vielfältige Spiele: Wer Spiele sucht, kann lange suchen, den es kommt darauf an, was einem gefällt. Deshalb bietet unsere Website jedem Besucher der Spiele-Übersichtsseite eine große Auswahl, von Online-Spielen über Spiele-Downloads bis hin zu gebrauchten Spielen.

Fische: Hätten Sie erwartet, dass dieses Thema so umfassend sein kann? Vielleicht ja, falls Sie selbst Aquarianer sind. Fischarten und verschiedene Haltungsweise (Teich, Aquarium). Dazu verschiedene Beziehungen – als Züchter oder gar als Angler. Die Tagging-Engine macht es den Besuchern leicht, das richtige Thema einzukreisen und die besten Fisch-Websites zu finden. Auch der Bezug zur Terraristik bleibt nicht auf der Strecke.

Möbel für jeden Zweck: Ein per Hand erstelltes Tag „Möbel“ hätte bestimmt nicht viel geholfen, denn auch bei Möbeln zählt in erster Linie der Verwendungszweck und viele Details. Von Gartenmöbeln über Büromöbel bis hin zum Kinder- oder Wohnzimmer. Dazu kommen Accessoires, Lampen und verschiedenste Materialien.

Ohne Handarbeit keine Qualität

So technisch und automatisch unser am Context orientierte Tag-Generator auch funktioniert, so wichtig ist auch die saubere und handgeprüfte Datenbasis. Die BeamMachine-Engine holt hinsichtlich der Navigation und Präsentation unserer Webkatalog-Datenbank sicherlich sehr viel aus den Einträgen heraus, ersetzt aber auf keinen Fall die regelmäßige – menschliche – Pflege und Ergänzung des Datenbestandes. Alle Einträge wurden bei Eintragung von einem Moderator geprüft und freigeschaltet. Dabei werden über 30% aller Einträge schon bei Eintrag verworfen!

Auch danach ist die regelmäßige Durchsicht aller Links ein absolutes Muss. Dabei fällt auf, dass im Internet wirklich viel in Bewegung ist. Sehr viele private Websites und Community-Sites, die häufig eher idealistisch und nichtgewerblich geprägt sind, verschwinden nach kurzer Zeit wieder. Aber auch gewerbliche Online-Shops verschwinden regelmäßig. Es erweckt den Eindruck, als seien die Märkte inzwischen von recht starken Websites besetzt und lassen neuen Unternehmern wenig Spielraum, um sich noch wirtschaftlich zu platzieren. Aber zurück zur Pflege unseres selbstentwickelten Link-Management-Systems (LMS, analog zum CMS ;)) …ohne regelmäßige Linkkontrolle per Auge und Hand verschlechtert sich die Qualität ständig. Automatische Link-Kontrollen können nur verschwundene Websites erkennen, nicht aber „geschlossene“ Site, die dem Besucher eine „Wir haben leider geschlossen“-Meldung zeigen, oder die im schlimmsten Falle auf eine hässliche Domain-Parking-Website führen.

Fast noch schlimmer, als tote Links und geparkte Domains sind jedoch die Fallen der menschlichen Sprache. Versuchen Sie doch einmal, aus diesem Text die wichtigsten Tags automatisch zu extrahieren. Zusammengesetzte Substantive sind das geringste Übel. Bindestrich oder Gedankenstrich, Abkürzungen und Füllwörter, Grußfloskeln, Schreibfehler und Präpositionen. Ganz zu schweigen von Singular und Plural. Das schlimmste lässt sich filtern – so zum Beispiel viele unflätige Begriffe, doch danach kommt es auf die Filter- und Verarbeitungs-Routinen an.

Die 3 C für den erfolgreichen BeamMachine-Eintrag

Ohne Content kein Context. Und ohne Context keine themenrelevante Classifikation… so einfach ist es nicht nur bei uns! Denn auch Suchmaschinen wie Google oder Bing verwursten im Prinzip auf eine ganz ähnliche Weise den Content, den ihnen die Webmaster anbieten. Seit Google seinen PR (PageRank-Algorithmus) eingeführt hat, konzentriert sich eine breite Masse im Internet auf Links. Der Content ist dabei immer weiter zurückgetreten. Das nimmt so absurde Züge wie Footerlinks (die kein Besucher zu sehen bekommt) oder Keyword-Domains (die eine Branding unmöglich machen) an. Doch glücklicherweise wird das Buzzword Semantische Suche mit dem Knowledge Graph allmählich von einer technischen Spinnerei und Marketing-Fantasie zur harten Realität.

Wir weisen daher schon lange bei Neueinträgen regelmäßig darauf hin, dass die Beschreibung das Thema treffen sollte und auf unwesentliche Nebensächlichkeiten (auch Grußformen, Versandhinweise, Lieferbedingungen) einfach zu verzichten ist. Je mehr themenrelevanten Text ein neuer Eintrag bekommt, desto leichter ist es für die automatische Klassifizierung und die Tagging-Engine, daraus Zusammenhänge abzuleiten und passende Tags und Kategorien zuzuordnen. Ausführliche Einträge werden in deutlich mehr Themenseiten und Link-Sammlungen integriert, weil die entsprechenden Begriffe in der Beschreibung der Website vorkommen.

Wer dagegen nur wenig Text für seine Website bei BeamMachine verfasst, hat keine allzu guten Chancen, auch von unseren echten Besuchern und den Suchmaschinen dafür mit Conversions – also Handlungen und Umsatz – belohnt zu werden. Man könnte anders herum feststellen, dass eine Website, über die der Inhaber selbst nicht viel interessantes berichten kann, wohl auch wirklich nicht sehr interessant ist. Genau diesem Fakt trägt BeamMachine durch seine automatische Themenbildung und viel händische Fürsorge Rechnung.