Im Inneren der Suchmaschine: Wie funktioniert Google?

Wir benutzen es täglich, ohne groß darüber nachzudenken. Manche glauben, Google sei das Internet (ist es nicht). Andere glauben, der Suchmaschine gehöre das Internet (tut es nicht). Also: Was ist Google und was tut es?

Das World Wide Web besteht derzeit aus rund 60 Billionen Webseiten (60.000.000.000.000) und es wächst. Suchmaschinen wollen uns helfen, in diesem Universum die besten Antworten auf unsere Fragen zu finden – vergleichbar mit dem Inhaltsverzeichnis einer riesigen Bibliothek. Um die Inhalte des World Wide Web zu erfassen, macht Google drei (sehr große) Schritte:

Schritt 1: Crawling

"to crawl" ist Englisch und heißt "kriechen", "krabbeln" oder "robben". Webcrawler (auch Spiders oder Searchbots genannt) krabbeln permanent durch das World Wide Web, sie gleiten durch die unendlichen digitalen Weiten. Googles bekanntester Webcrawler heißt Googlebot. "Bot" ist die Kurzform von "Robot".

Der Googlebot ruft Webseiten auf und analysiert ihre Verlinkungen. Er achtet besonders auf neue Websites, Änderungen bei ihm bekannten Websites und auf tote Links (= Verlinkungen, die nicht funktionieren). Alle Informationen, die der Bot über Webseiten im WWW sammelt, sendet er an die Google-Server.

Welche Websites der Bot wie oft und wie umfangreich crawlt, fällt sehr unterschiedlich aus. Ihr erleichtert Google die Arbeit immens, wenn ihr eine XML-Sitemap (ein Inhaltsverzeichnis) eurer Website bereitstellt. Wollt ihr vermeiden, dass bestimmte Seiten eurer Website gecrawlt werden, könnt ihr den Bot mittels einer robots.txt-Datei darüber informieren.

Wenn ihr tiefer in das Crawling-Thema einsteigen wollt, empfehle ich euch meinen Beitrag zum Thema Crawl-Budget.

Schritt 2: Indexierung

Indexierung meint hier nicht das Verbieten von Inhalten ("Das Buch steht auf dem Index"). Der Bot indiziert nicht, er indexiert. In unserem Fall bezeichnet der Begriff “Index” ein Register: Der Bot bringt die gecrawlten Webseiten in ein geordnetes Verzeichnis.

Startet ihr eine Suche bei Google, suchen seine Algorithmen im Index nach diesen Suchworten.


Das World Wide Web: unendliche Weiten.
Das World Wide Web: unendliche Weiten.
(Under the Cosmic Umbrella von jason jenkins unter CC BY-SA 2.0

Schritt 3: Ranking

Wie entscheidet Google, welche Webseite bei welcher Suchanfrage auf welcher Position in den Trefferlisten erscheint? Das übernehmen die Algorithmen: Rechenvorgänge, die einem bestimmten, sich wiederholenden Schema folgen. Sie sollen euch die Treffer anzeigen, die eure Suchanfrage (nach Meinung Googles) am besten beantworten.

Der Suchmaschinenriese kalkuliert mit rund 200 Rankingfaktoren. Einige davon sind bekannt, viele andere sind streng gehütete Geheimnisse. Google nennt einige in seiner "Einführung in die Suchmaschinenoptimierung". Regelmäßige Qualitäts-Updates wie Panda, Penguin oder Hummingbird sollen die Such-Algorithmen stetig verbessern.

Google legt sehr viel Wert auf die Spam-Bekämpfung: Darunter versteht es jegliche Tricks und Manipulationen, die Webseiten gute Rankings verschaffen sollen. An dieser Stelle nur soviel: Versucht es erst gar nicht – Gott Google kennt keine Gnade.

Et voilà: ein Suchergebnis!

Crawling, Indexierung, Ranking. Mit dieser 3-Schritt-Methode präsentiert euch Google die Suchergebnisse. Was ihr in Sekundenbruchteilen präsentiert bekommt, basiert auf einem riesigen Rechenprozess.

Zum Abschluss erklärt euch Matt Cutts nochmal die Suche im Video (English only). Matt leitet das Webspam-Team bei Google, die Qualitätssicherungstruppe des Suchmaschinenriesen. Er meldet sich regelmäßig via YouTube zu Wort, was für SEOs (Suchmaschinenoptimierer) wie mich einer Audienz bei Yoda gleichkommt.

Wenn der Meister spricht, hört die SEO-Gemeinde gebannt zu ... auch wenn der gute Matt manchmal an das Orakel von Delphi erinnert ("Wie könnte er das jetzt gemeint haben?"). ;-)

Vorhang auf:

Kommentare

Hier bloggt Mathias Sauermann:

NEWSLETTER:

Erhalte die besten Beiträge meines Blogs >gratis und freibleibend!

Vernetze dich mit mir auf LinkedIn Xing FacebookInstagram.

Weitere spannende Beiträge dieses Blogs findest du in den Rubriken:
Online-Marketing-Tipps
Digitalisierung

Meinung!
Onliner-Allerlei


Titelbild: Digital Art unter CC0 1.0