Inhalt

Ein Crawler, auch Web Crawler oder Suchmaschinen Crawler genannt, ist ein automatisiertes Softwareprogramm, das von Suchmaschinen zum systematischen Durchsuchen und Indizieren von Websites verwendet wird. Aber was ist ein Crawler? Vereinfacht gesagt ist ein Crawler ein Bot, der sich durch die Weiten des Internets bewegt, unermüdlich Websites durchsucht und Informationen sammelt. Seine Hauptaufgabe besteht darin, Daten zu sammeln, einschließlich HTML-Inhalte, Links und Metadaten von Webseiten, und diese an Suchmaschinen wie Google zu übermitteln. Diese kontinuierliche und umfassende Untersuchung ermöglicht es den Suchmaschinen, die Seiten zu indizieren und für die Suchergebnisse zu bewerten. Das Verständnis des Verhaltens und der Auswirkungen eines Crawlers ist ein entscheidender Aspekt der Suchmaschinenoptimierung (SEO) und ist für Website-Betreiber und digitale Vermarkter, die ihre Online-Sichtbarkeit verbessern wollen, unerlässlich.

In der Suchmaschinenoptimierung kommt ihnen eine besondere Bedeutung zu, sind sie es doch, die entscheiden, ob eine Seite indiziert wird oder nicht. In SEO Kreisen spricht man daher auch von „Crawling Friendly Websites“ – gemeint sind Seiten die Crawlern ein möglichst störungsfreies Abarbeiten ihrer Aufgaben ermöglichen.

Entstehung der ersten Crawler

Anfang der neunziger Jahre kam die Idee auf einen Crawler zu entwickeln, der im Stande war, das Wachstum des damals noch vergleichsweise überschaubaren Internets zu messen. Der daraus entstandene World Wide Web Wanderer erzeugte einen eigenen Index namens Wandex, eine Funktionsweise wie sie moderne Crawler heute noch aufweisen. Die aus diesem Prinzip entstandene erste Volltextindex-Suchmaschine Web Crawler war schließlich auch namensgebend für diese Art von Software.

Wie arbeiten Crawler?

Es mag inzwischen unzählige verschiedene Bots geben, ihre grundlegende Funktionsweise folgt jedoch stets dem selben Muster. Im Vorfeld wird definiert, welche Seiten oder Inhalte gecrawlt werden sollen, welchen Links der Spider folgen soll oder welche Zeitintervalle eingehalten werden sollen. Die zugrunde liegenden Logiken und Grundsätze werden in der sogenannten „Crawl Frontier“ definiert. Bei klassischen Suchmaschinen-Crawlern arbeitet sich der Web Crawler von URL zu URL, sofern er nicht durch vordefinierte Grenzen oder spezielle Maßnahmen (robots.txt, nofollow) davon abgehalten wird. Die dabei gefundenen Hyperlinks werden einer Liste von URLs hinzugefügt, die dabei gefundenen Inhalte werden indiziert (einem Index hinzugefügt).

Arten von Crawlern

Auch wenn sich die meisten Bots vom Grundprinzip her kaum unterscheiden, heute gibt es spezialisierte Spider für die unterschiedlichsten Aufgaben. Die gängigsten Crawler im Überblick:

Die Webcrawler der Suchmaschinen: der bekannteste unter ihnen ist wohl der Googlebot. Allerdings ist er nur einer von vielen die Google für seine verschiedenen Dienste nutzt. Weitere Beispiele sind Yahoos Slurp oder Microsofts Bingbot.
Focused Crawler: Focused Crawler oder auch fokussierte Webcrawler sind speziell auf ein Themengebiet zugeschnitten. Sie versuchen z.B. im Vorfeld zu antizipieren, ob ein Folgelink zum definierten Thema passt. Der Fokus kann sich dabei auf unterschiedlichste Vorgaben beziehen, z.B. Länderkennungen oder Seiten mit bestimmten Themen wie „SEO“.
Data Mining: hierbei werden gezielt Daten abgefragt, diese können unterschiedlicher Natur sein, und entsprechend auch für unterschiedliche Zwecke eingesetzt werden. Im Data-Mining eingesetzte Harvester (zu deutsch in etwa Erntemaschine) greifen z.B. gezielt auf im Internet zugängliche E-Mailadressen zu. Nicht selten werden diese dann für Spam-Versand verwendet. Versuche die Adressen im Quellcode vor den Harvestern zu verstecken können von den meisten modernen Bots umgangen werden. Sogenannte Facebook-Crawler greifen hingegen auf die öffentliche Daten von Facebook Profilen zu.

Weitere Spider-Bots

Auch bei der Suche nach Plagiaten im Internet kommen Bots zum Einsatz. Sie sind in der Lage große Datenmengen auf Plagiate zu untersuchen die womöglich sonst nie entdeckt würden. Ein bekannter Dienst der mittels Crawlern Plagiate entlarvt ist turnitin.com.
Heritrix ist ein Bot zur Webarchivierung unter der Free Software Licence.
Neben der Makrosphäre Internet können Bots auch kleine Aufgaben übernehmen. In CMS Systemen wie Typo3 können Bots spezielle Aufgaben wie eine verbesserte Such-Indexierung übernehmen.

SEOs und Bots

Für SEOs ist die Beschäftigung mit dem Thema „Suchmaschinen Crawler“ unausweichlich. Schließlich definiert der SEO-Experte die Bedingungen unter denen Suchmaschinenbots die eigene Website crawlen. Schlecht optimierte Seiten können dazu führen, dass Bots den Crawl vorzeitig abbrechen oder relevante Inhalte erst gar nicht Crawlen. Unter bestimmten Bedingungen kann es hingegen auch sinnvoll sein, bestimmte Seiten für Spider zu sperren oder gewisse Bots ganz auszuschließen. Bekanntestes Werkzeug für den Umgang mit Bots sind die Meta Tags noindex bzw. nofollow:

<meta name="robots" content="noindex, nofollow">

Diese simple Codezeile teilt den Bots mit, dass die Seite nicht in den Index aufgenommen werden soll (noindex). Außerdem sollen weiterführende Links ignoriert werden (nofollow). Diese Befehle stehen exemplarisch für den Umgang mit Crawlern. Sind sind jedoch nur die Spitze des Eisbergs. Versierte SEOs benutzen ihrerseits ebenfalls eine Vielzahl von Bots um Probleme auf ihrer Website zu identifizieren.

Bad Bots

Bad Bots sind Computerprogramme, die so konzipiert sind, dass sie bestimmte Aufgaben ohne die Erlaubnis oder das Wissen einer Person ausführen. Sie können zu böswilligen Zwecken eingesetzt werden, z. B. um persönliche Daten zu stehlen oder Spam zu verbreiten. Sie können aber auch für harmlosere Zwecke eingesetzt werden, z. B. zum Web-Scraping oder zur Erzeugung von gefälschtem Datenverkehr. Unabhängig von ihrem Zweck können Bad Bots negative Auswirkungen auf Websites und ihre Nutzer haben.

Fazit

Der Begriff Web Crawler steht heute für eine Vielzahl von Programmen die die unterschiedlichsten Aufgaben übernehmen können, viele davon definieren das Internet in seiner heutigen Form mit. Im SEO Bereich sind Bots allgegenwärtig. Ob in Form von Besuchen der Suchmaschinen-Spider, oder als praktisches Hilfsmittel bei der Optimierung von Webseiten. Nur wer versteht wie sie arbeiten, kann sie auch zu seinem Vorteil nutzen.

Weitere interessante Links zum Thema:

5.0

25 Bewertungen

Hannes Rahm

Echt wahnsinnig gute Dienstleistungen. Bin sehr zufrieden mit Vabelhavt.

Kathrin Riedmann

Es ist eine große Freude mit der Werbeagentur VABELHAVT zusammen zu arbeiten. Eigene Idee werden aufgenommen und mit Fachkompetenz zu einem perfekten Abschluss gebracht. Ob Homepage, Flyer, Türschild... man kann sagen von A - Z einfach perfekt und ganz speziell. Ich freue mich schon auf die weitere Zusammenarbeit und empfehle die Werbeagentur VABELHAVT mit bestem Gewissen weiter.

Nadine Schneider

Sehr zuverlässig und super Beratung. Kann diese innovative und kreative Agentur nur empfehlen!

Peter Basili

Sehr kompetente Agentur mit tollen Marketingstrategien und fundiertem Know-How in den Bereichen SEO, Web, Online Marketing, SEA / Ads aber auch Design, Branding und Videoproduktion. Perfekter "One-Stop Shop" für KMUs. Sehr gute Beratung, professionelle Kundenorientierung. Gerne wieder!

Bettina Hauser

Ich bin sehr zufrieden, meine Folder sowie die Website sind sehr ansprechend und hochwertig und heben sich durch das Design gegenüber anderen hervor. Bei Vabelhavt habe ich was Besonderes, Indivudelles bekommen und der Chef hat mich super beraten.

Carina Wahler

Ich wurde von der Firma VABELHAVT sehr gut und sehr kompetent betreut und beraten. Mit den Ergebnissen (Folder, Visitenkarten und Homepage), bei denen ich auch Mitspracherecht hatte, bin ich sehr zufrieden. Meine Wünsche wurden berücksichtigt und die Umsetzung verlief sehr zügig. Danke !

Philipp Koch

Da steht man vor einem Web-Problem und VABLHAVT hat dies in kürzester Zeit gelöst. Super Adresse wenn es um Onlinemarketing geht. Danke Lars!

Meinhard Ossberger

Meine Homepage funktionierte plötzlich nicht mehr, Vabelhavt hat das Problem sehr rasch und unkompliziert gelöst. Jetzt läuft's wieder ;)

urban Chili

Vielen Dank für die rasche und sehr kompetente Lösung unserer Google Fehler Meldungen. Durch deine gute Leistung sind wir gerne gewillt weiter Aufträge mit dir abzuwickeln.

Christina Ruh

Wir haben mit der Agentur Vabelhavt zwei Website Projekte umgesetzt und waren sehr zufrieden, sowohl mit dem Design als auch mit der technischen Umsetzung. Sehr hervorheben möchten wir auch die unkomplizierte und schnelle Hilfe bei Website Wartungen und Änderungen. Auch mit der Umsetzung von diversen Print Werbemitteln und Logoanpassungen waren wir super zufrieden.

Wolfgang Dabbert

Ich möchte mich nochmal recht herzlich für unsere neue Homepage und die Leistungen bedanken. Sehr sympathisch und verlässlich, wir freuen uns über das Ergebnis.

Markus Eberharter

Die Zusammenarbeit mit Lars ist immer top und unkompliziert. Er ist zuvorkommend und immer hilfsbereit. Seine Ideen für mein Logo waren sehr nah an meiner eigenen Vorstellung und es mussten nur mehr Kleinigkeiten ergänzt werden! Ebenso der Aufbau und das Design meiner HomePage (www.geschirrsucht.at) ist sehr gut geworden - das Design ist schwer zu beschreiben - dezente Eleganz mit ins Auge stechende Farben. Bekomme auch immer eine sehr positive Resonanz von meinen Kunden, dass ihnen das Design und der Aufbau der Seite sehr gut gefällt und auch übersichtlich ist. Das Arbeiten mit der Seite ist für mich sehr einfach - da ich selbst in diesem Bereich vorher kaum bis keine Erfahrung hatte. Lars hat mich gut angelernt und alles erklärt (manchmal auch öfters) - er ist sehr geduldig. Meine Seite existiert nun seit über drei Jahren und kann mich immer an Lars bei fragen oder Änderungen wenden, welche er mir erklärt oder auch selbst erledigt. Ich kann mich nur für die gut Zusammenarbeit mit Webdesign Vabelhaft vielmals bedanken und freue mich auf eine weitere langjährige Zusammenarbeit!! Lars ist sehr weiterzuempfehlen - er hat innovative Ideen und ist sehr kreativ!! Vielen Dank ! Markus Fa. geschirrsucht

Theresa Wolf

Wir arbeiten mit vabelhavt seit Jahren im Rahmen von neuen Website-Projekten aber auch in puncto laufende Betreuung von Websiten zusammen und sind sehr zufrieden!

Ing. Hans Lang GmbH

Gerne teilen wir hier unsere positive Erfahrung mit VABELHAVT. Wir sind langjährige Kunden und haben schon zum zweiten Mal eine unserer Websites in die Hände von VABELHAVT gelegt, und jedes Mal sind wir nicht nur mit dem Ergebnis zu 100 % zufrieden, sondern auch mit der gesamten Zusammenarbeit und dem laufenden Support. Die Zusammenarbeit war und ist immer sehr angenehm und unkompliziert. Auf individuelle Wünsche wird stets bestmöglich eingegangen, während dabei auch immer das Verhältnis von Kosten und Nutzen im Auge behalten wird. Was uns besonders gefällt, ist die transparente Kommunikation: Mögliche Mehrkosten, die aufgrund unserer Extrawünsche nach Angebotsfreigabe entstanden sind, wurden im Vorfeld ausführlich und transparent kommuniziert. Genau so soll es sein! Außerdem schätzen wir die Verlässlichkeit und Termintreue bei VABELHAVT, sowohl in Bezug auf Besprechungen als auch bei der Umsetzung unserer Projekte. Wir sind sehr froh, dass wir einen zuverlässigen Partner für unsere Online-Projekte gefunden haben und empfehlen die Agentur uneingeschränkt weiter. Wir freuen uns schon auf die weitere Zusammenarbeit und die nächsten Projekte! DANKE!

Nina Hoellwarth

Lars hat nicht nur ein besonderes Auge und einen guten Geschmack - man kann sich auf ihn auch zu 100 % verlassen! Für mich als Unternehmerin ist das besonders wichtig und heut zu Tage nicht mehr selbstverständlich! Schnelle und unkomplizierte Lösungen bei Problemen! Gute und innovative Ideen! Top!! Danke für die gute Zusammenarbeit!

Natascha Ampferer-van Leeuwen

Sehr professionelle Werbeagentur. Nimmt sich viel Zeit für Kunden, bringt tolle Ideen und setzt diese sehr kompetent um. Sehr hohes Level an Kreativität. Zusammen gestalteten wir ein unverkennbares Logo für mein Unternehmen. Auf all meine Wünsche bezüglich Webdesign meiner Homepage wurde Rücksicht genommen & durch die tolle Beratung entstand eine Homepage, die sich von den anderen abhebt. Ich bin mit der Arbeit von der Werbeagentur Vabelhavt vollends zufrieden. Vielen Dank dafür.

teamazing AT (teamazing)

Großartige Beratung bei der Implementierung von KI im Unternehmen. Keine 0815 Umsetzung, sondern individuelle Lösungen ohne unnötigen Ballast.

Hermann Sonntag

Es ist inzwischen meine vierte (!) Website, die Lars für und mit uns entwickelt und wir schätzen seine Kompetenz, seine Verlässlichkeit und auch sein ehrliches Feedback zu unseren Ideen. Ich kann ihn mit bestem Gewissen weiterempfehlen.

Alexandra Zingerle

Lieber Lars, ich möchte mich herzlich bei dir für deine hervorragende Betreuung unserer Homepage bedanken! Deine schnellen und kompetenten Antworten auf all unsere Fragen sind wirklich bemerkenswert. Besonders schätzen wir, dass du deinen Kunden kostenlose Plugins für Wordpress zur Verfügung stellst. Das ist ein echter Mehrwert und zeigt dein Engagement für exzellenten Service. Vielen Dank für deine Unterstützung! 🌟🌟🌟🌟🌟 Liebe Grüße Alex👏

Naturpark Karwendel

Wir waren und sind mit der schnellen und sehr kundenorientierten Abwicklung der Aufträge überaus zufrieden! Zudem ist die sehr transparente Abrechnung hervorzuheben. Gerne arbeiten wir weiterhin so gut zusammen!

Christopher Taferl

Unsere neue Firmenwebsite wurde sehr rasch und sehr gelungen von VABELHAVT umgesetzt. Die Zusammenarbeit und Kommunikation war sehr angenehm - gerne wieder!

Tammi

Wir sind bereits ein sehr langjähriger Kunde von Lars und dies nicht ohne guten Grund. Ob bei der Logo-Entwicklung oder der Erstellung und laufenden Verbesserung der Homepage - das Unternehmen Vabelhavt steht immer mit vollster Unterstützung zur Verfügung und beratet einen hervorragend. Selbst bei kurzfristig auftretenden Fragen findet Lars immer rasch Zeit uns zu helfen. Wir sind froh, unsere Homepageentwicklung in solch guten Händen zu wissen und schätzen die angenehme Zusammenarbeit sehr.

Entstehung der ersten Crawler

Wie arbeiten Crawler?