
Die letzte Suchmaschine, die ich 'damals' (in der Suchmaschinensteinzeit) jedem empfohlen habe, war 'Google'. Seitdem hab' ich immer mal wieder neue Maschinen ausprobiert. Weiterempfohlen habe ich keine. Nachdem mittlerweile zu einem 'gelungenem' Internetdesign die
Gooooooogle-Anzeigen-Blöcke dazuzugehören scheinen (und fast schon den selben Stellenwert haben wie Content, Header, Footer und Navigation), schau ich immer mal wieder nach Alternativen, die nicht ganz so 'mächtig' sind, das Internet mit 'Advertising' zu bestempeln wie 'Google' mitlerweile. Internet muss ja nicht so aussehen wie die Werbeblöcke bei VIVA oder wie die Einkaufszonen unserer Innenstädte.
Heute habe ich Clusty ausprobiert. Ich bin echt begeistert!
Die Ergebnismenge für alle Testbegriffe übertraf die 'google'-Menge. Das alleine kann natürlich kein Kriterium sein.
Allerdings wird die Ergebnismenge in 'Cluster' geordnet. Das scheint mir ein vielversprechendes Konzept zu sein. Die gefundenen Seiten werden nach dem Grad ihrer 'Ähnlichkeit' zueinander zu 'Klumpen' zusammengefasst. Eine Seite innerhalb eines 'Klumpens' ist zu den Seiten innerhalb dieses Klumpens ähnlicher als zu allen anderen Seiten in anderen Klumpen. Schade dass die Algorythmen nicht veröffentlicht vorliegen. Die dahinterstehenden Konzepte von textlicher Ähnlichkeit würden mich schon interessieren! Einiges dazu kann man
nachlesen.
Meine Zufriedenheit wäre noch viel viel größer, wenn ich wüsste, wie die 'Benennung' der Klumpen erfolgt und die Menge der Klumpen steuerbar wäre. Könnte ich die Toleranz, mit der 'Ähnlichkeit' definiert wird, selber regeln ... das wäre was! Zum Beispiel: Mach mir nicht 25 Cluster, sondern nur sieben. Oder: Seite A und Seite B sind nach meiner Ansicht sehr sehr ähnlich. Nun berechne mal die Klumpenbildung neu ...
Ich seh schon: Man hat mir den kleinen Finger gereicht, nun will ich auch die Hand!