Google und Co: Wie funktionieren Suchmaschinen?

Unser Kollege Sebastian aus der IT ist Experte in Sachen Suchmaschinen. Wir haben bei ihm nachgefragt, was man mit Google, Yahoo und Co außer dem Suchen nach Texten und Bildern sonst noch alles machen kann. Wer hat zum Beispiel schon einmal etwas von Lucene gehört?


Was sind eigentlich Suchmaschinen?

 
Zumindest eine kennt wahrscheinlich jeder: Google. Suchmaschinen sollen in riesigen Datenquellen bestimmte Inhalte finden und vielleicht sogar filtern und aufbereiten. Google zum Beispiel hat verschiedene Methoden, eine Suchanfrage zu interpretieren und versucht dann, dem Suchenden ein möglichst passendes Ergebnis zur Verfügung zu stellen.
 
Gib doch in der Suchmaske mal „emed“ ein. Schon wird dir eine großartige Agentur als Treffer vorgeschlagen!
 
Neben der Software von Google gibt es noch weitere. Manche sind dabei gar kein Mysterium im Sinne von „Wie werde ich Treffer Nummer 1?“, sondern komplett Open Source und somit frei und individuell nutzbar: Lucene.
 
Lucene ist von der Apache Software Foundation entwickelt worden. Auf Basis von Lucene gibt es zahlreiche Suchmaschinensoftware, zum Beispiel Solr oder Elasticsearch – um die wohl bekanntesten und bedeutendsten zu nennen.
 
Hast du einen Netflix-Account? Schonmal eine Serie gesucht? Lucene. Oder bist du auf Instagram aktiv? Die Geo-Suche dort: Lucene. Wenn du Instagram hast, dann wahrscheinlich auch ein Smartphone. Als du im Store nach der App gesucht hast, hat Lucene sie gefunden. Oder Facebook: Lucene. Du willst mehr über Lucene erfahren? Am besten guckst du bei Wikipedia. Du ahnst es sicher schon: Lucene.
 

Für wen sind solche Suchmaschinen interessant?

 
Nerds, haha. Spaß beiseite. Ich glaube, Suchmaschinen können jeden faszinieren. Innerhalb von Millisekunden können diese Dinger Inhalte in nahezu unendlich großen Quellen finden. Richtig spannend wird es, wenn du ganz konkrete Vorstellungen von Suchergebnissen hast, wie zum Beispiel das automatische Vervollständigen von Suchanfragen im Sinne von „meinst du vielleicht …“.
 
Aber werfen wir den Blick auf Suchmaschinen mal nicht aus Anwendersicht, sondern aus der Sicht eines Betreibers. Hast du große Datenmengen, musst du dir Gedanken machen, wie du sie speichern willst. Datenbank? Dateisystem? Suchmaschine? Alles kann Vor- und Nachteile haben. Pauschalisieren kann man das nicht. Jeder Fall ist anders.
 
Nehmen wir als Beispiel die Nordwest-Zeitung – einen unserer Kunden. Dort haben wir alle Artikel der vergangenen zwölf Jahre in einer Suchmaschine gespeichert. Aktuell sprechen wir von knapp 3 Millionen Objekten und etwa 5,5 Gigabyte Daten. Das wären ausgedruckt etwa 350.000 Din-A4-Seiten. Aneinandergelegt sind das mehr als 100.000 Kilometer Papier. Das ist über das Doppelte des Erdumfangs. Und die Suchmaschine findet darin jedes Wort, jeden Satz, in Bruchteilen einer Sekunde.
 

Was kann man über das Suchen hinaus damit machen?

 
Die Frage sollte eher lauten: Was für besondere Suchen kann man damit ausführen, die nicht auf der Hand liegen? Denk nochmal an die Zeitung. Ich kann zum Beispiel eine Suche ausführen, die mir sagt, über welche Person im Politikressort in den letzten sieben Tagen am häufigsten berichtet wurde. Angela Merkel? Martin Schulz? Donald Trump?
 
Oder ich gebe dem Vorkommen von Suchbegriffen an bestimmten Stellen eine Relevanz – ähnlich wie be Google. Taucht ein Begriff in der Überschrift auf, ist er wichtiger als im Text. So kann man Suchergebnisse bewerten, sortieren. Auch kannst du Listen hinterlegen, zum Beispiel für Synonyme. So findet die Suchmaschine – vorausgesetzt, es ist eingetragen – bei der Suche nach „emsn“ auch „eMedienservice Nord“.
 

Und wenn ich kein Zeitungsverlag bin? Wo kann mir eine Suchmaschine helfen?

 
Einige andere Beispiele habe ich ja eingangs schon genannt. Vielleicht hast du einen Onlineshop. Du kannst deine Produkte nach Preis oder Preisspanne, Kategorie oder Material durchsuchen. Du kannst sie mit jedem erdenklichen Attribut kennzeichnen, und die Suche filtert diese wieder heraus. Denk nur mal an Amazon. Wahrscheinlich auch Lucene … ich google das mal eben!


[addtoany]

Ein Kommentar zu “Google und Co: Wie funktionieren Suchmaschinen?”

  1. Knut Alboldt


    Danke für die super Einführung in SOLR heute (Workshop). Und dieser kleine BLOG-Eintrag trifft es auf den Punkt. Fasst den Tag gut zusammen. Bin gespannt, was wir dann (demnächst?) noch mit SOLR machen werden.

    Antworten

Hinterlassen Sie einen Kommentar

Das könnte Sie auch interessieren







Frage? Rufen Sie uns an oder nutzen Sie das Kontaktformular

+49 (0) 421 - 3636 5900

Die von Ihnen mitgeteilten persönlichen Daten und Informationen werden von uns zum Zweck der Kontaktaufnahme und zur Qualitätssicherung gespeichert und verarbeitet. Weitere Informationen finden Sie in unserer Datenschutzerklärung. Die Übertragung zwischen Browser und unserem Server ist mit TLS/SSL verschlüsselt, die Versendung an unsere Mitarbeiter erfolgt per E-Mail.