Grundlagen zu Google
Informationen darüber, wie Google Webseiten erkennt, crawlt und in Suchergebnisse aufnimmt
Wenn du an deinem Computer eine Google-Suche vornimmst, erhältst du fast unmittelbar eine Liste mit Ergebnissen aus dem gesamten Web. Wie sucht Google nach Websites, die mit deiner Suchanfrage übereinstimmen, und wie wird die Reihenfolge der Suchergebnisse bestimmt?
Vereinfacht ausgedrückt könntest du dir die Websuche wie ein sehr großes Buch mit einem umfangreichen Index vorstellen, in dem genau verzeichnet ist, was sich wo befindet. Sobald du eine Google-Suche ausführst, durchsuchen Googles Programme den Index und bestimmen die relevantesten Suchergebnisse, die angezeigt ("zurückgegeben") werden.
Die drei Hauptprozesse, die ausgeführt werden müssen, um dir die Suchergebnisse zu liefern, sind folgende:
- Crawling: Kennt Google deine Website? Kann Google sie finden?
- Indexierung: Kann Google deine Website indexieren?
- Bereitstellung: Enthält die Website guten und nützlichen Content, der für die Suche des Nutzers relevant ist?
Crawling
Crawling bezeichnet den Prozess, durch den der Googlebot neue und aktualisierte Seiten ermittelt, damit sie dem Google-Index hinzugefügt werden.
Google setzt eine gewaltige Anzahl von Computern ein, die täglich Milliarden von Webseiten durchsuchen ("crawlen"). Das Programm, das diese Seiten durchsucht, heißt Googlebot. Allgemeine Bezeichnungen für solche Programme sind Robot, Bot oder Spider. Googlebot verwendet einen algorithmischen Prozess. Durch Computerprogramme wird bestimmt, welche Websites wann und wie oft durchsucht werden und wie viele Seiten von jeder Website abgerufen werden.
Der Crawling-Prozess von Google beginnt mit einer Liste von Webseiten-URLs, die aus vorhergehenden Crawling-Prozessen generiert und mit den von den Webmastern bereitgestellten Sitemap-Daten vervollständigt wurde. Beim Besuch auf diesen Websites erkennt der Googlebot Links auf jeder Seite und fügt sie der Liste der zu crawlenden Seiten hinzu. Neue Websites, Änderungen an bestehenden Websites und veraltete Links werden ermittelt und zur Aktualisierung des Google-Indexes verwendet.
Google akzeptiert keinerlei Zahlungen, um bestimmte Websites häufiger zu crawlen. Außerdem hält Google die Suchaktivität seinesUnternehmens vom kommerziellen AdWords-Service getrennt.
Indexierung
Der Googlebot verarbeitet jede der gecrawlten Seiten und kompiliert einen umfangreichen Index aller Wörter, die auf den Seiten ermittelt wurden, sowie deren Position auf den einzelnen Seiten. Zusätzlich werden die Informationen in wichtigen Content-Tags und -Attributen wie Title-Tags und ALT-Attributen verarbeitet. Googlebot kann zahlreiche, jedoch nicht alle Content-Typen verarbeiten. Beispielsweise ist es Google nicht möglich, den Content einiger Rich Media-Dateien oder dynamischer Seiten zu verarbeiten.
Ergebnisse bereitstellen
Gibt ein Nutzer eine Suchanfrage ein, durchsuchen die Google Computer den Index nach übereinstimmenden Seiten und melden die Ergebnisse zurück, die Googles Meinung nach am relevantesten für den Nutzer sind. Die Relevanz wird mithilfe von über 200 Faktoren ermittelt. Einer dieser Faktoren ist der PageRank (Seitenrang) einer Seite. Der PageRank entspricht der Relevanz einer Seite. Er wird auf Grundlage der von anderen Seiten auf diese Seite verweisenden Links gemessen. Einfacher ausgedrückt erhöht jeder Link auf anderen Websites zu einer Seite deiner Website den PageRank deiner Website. Dabei sind nicht alle Links gleichwertig: Google bemüht sich, die Nutzererfahrung durch Identifizieren von Spamlinks und anderen, die Suchergebnisse negativ beeinflussenden Praktiken kontinuierlich zu verbessern. Die besten Linktypen sind daher solche, die aufgrund der hohen Qualität Ihres Contents auf deine Website verweisen.
Damit deine Website ein vorteilhaftes Ranking in den Suchergebnisseiten erzielt, ist es wichtig darauf zu achten, dass Google deine Website ordnungsgemäß crawlen und indizieren kann. In den Google Richtlinien für Webmaster findest du einige Best Practices, die dir dabei helfen sollen, häufig vorkommende Fallen zu vermeiden und das Ranking deiner Website zu optimieren.
Die Google-Funktionen Meinten Sie und Automatische Vervollständigung helfen Nutzern, Zeit zu sparen, indem ähnliche Suchbegriffe, die korrekte Schreibweise von Begriffen sowie beliebte Suchanfragen angezeigt werden. Wie bei den Suchergebnissen auf google.com werden die von diesen Funktionen verwendeten Suchbegriffe automatisch von den Google Webcrawlern und Suchalgorithmen generiert. Google zeigt nur dann Vervollständigungen an, wenn Google glaubt, dass die Nutzer damit Zeit sparen. Eine Website besitzt dann ein gutes Ranking für einen bestimmten Suchbegriff, wenn Google mithilfe seiner Algorithmen ermittelt hat, dass dein Content für die Suchanfrage von Nutzern eine hohe Relevanz aufweist.
*quelle: support.google.com