Suchmaschinenfreundlichkeit
Die wohl bekannteste Suchmaschine heute ist die Google Search Engine, aber es gibt natürlich eine Vielzahl anderer. Search Engines benutzen Robots - Crawlers, Bots, Skutters oder auch Spiders genannt - die mit verschiedenen Algorithmen das Web durchforsten und versuchen, die Informationen zu indizieren.
Wenn man gefunden werden möchte, sollte man seine Seite so gestalten, dass sie von Robots gut gelesen werden kann. Nur wenn ein Robot in der Lage ist, eine Seite richtig zu klassifizieren, also die Inhalte zu erkennen, wird die Seite später auch von den Leuten gefunden werden können, die einen dort vorhandenen Inhalt abfragen.
Die Schlüsselworte einer Seite sollten darauf auch als Text vorkommen, denn dann können sie umso besser von einer Maschine gesammelt werden. Bilder sollten immer mit alternativem Text versehen werden, wenn sie nicht nur Dekoration darstellen, sondern auch als Bild eine Information tragen.
Das Robots-File kann zusätzliche Informationen, die nur Maschinen betreffen, enthalten, also etwa bestimmte Verzeichnisse sperren, die dann von der Indizierung ausgenommen werden, oder explizit dazu auffordern, allen Links auf der Seite zu folgen und alle gefundenen Seiten mit zu klassifizieren. Nicht alle Bots halten sich allerdings an die Anweisungen, die sie erhalten.
Beispiel: Robots File von Treudata GmbH
User-agent: *
Disallow:/mandanten/
|
Metatags sind ebenfalls ein muss: Sie werden von einigen Spiders gelesen, und sollten mindestens die Seiten-Suchbegriffe und eine Beschreibung der Seite liefern. Metatags zu veröffentlichen hat auch den Vorteil, dass Besucher wesentliche Informationen zur Seite mit einem Blick in den Source Code sofort erfassen können.
Jede Website sollte eine XML-Sitemap besitzen, die von Google, Yahoo!, Ask und vielen anderen Search Engines gelesen werden kann. Typischerweise enthält die Sitemap auch Informationen zu Site-Änderungen, so dass die Seiten besonders einfach zu indizieren und auf Aktualität zu überprüfen sind.
Beispiel: Ausschnitt aus Google-Sitemap von Treudata GmbH
<urlset xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84 http://www.google.com/schemas/sitemap/0.84/ sitemap.xsd">
<url>
<loc>http://www.treudata-sb.de/</loc>
<lastmod>2008-03-06T18:22:12+00:00</lastmod>
</url>
<url>
<loc>http://www.treudata-sb.de/favicon.ico</loc>
<lastmod>2008-03-06T18:22:13+00:00</lastmod>
</url>
(...) (...)
</urlset>
|
Eine solche Sitemap erlaubt insbesondere auch, Files zu indizieren, die ansonsten von Maschinen nicht ohne weiteres gefunden werden können (also files aus dem "Deep (Invisible) Web").
Rein dynamische Seiten, Seiten mit Frames, vielen PDFs, bildbasierten Navigatoren und Flash-Dateien sind besonders suchmaschinenunfreundlich. Es empfiehlt sich, alternative Text-Informationen zu den Files mit abzulegen, wenn sie gefunden werden sollen.
Titel, Seitentitel und Seitennamen sind ebenfalls wichtig, denn auch diese werden eingelesen und insbesondere für die Einordnungen benutzt. Deshalb sollten die wichtigsten Keywords einer Seite auch im Seitentitel, idealerweise auch im Seitennamen, auftauchen.
Suchmaschinen bewerten bei der Relevanz einer Seite auch, wieviele Links von anderen Seiten auf diese Seite führen, und wie hoch der Traffic der Seiten ist, auf den diese Seite verweist. Deshalb ist es eine der Optimierungsstrategien, Links mit passenden und vor allem auch erfolgreichen Webseiten auszutauschen.
Suchmaschinen verändern ihr Verhalten beim Indizieren der Seiten regelmässig. Die Suchalgorithmen werden verändert, um sogenannte Suchmaschinen-Spammer, also Websitedeveloper, die die Suchmaschinen gezielt überlisten, um bessere Platzierungen bei Suchabfragen zu erreichen, wieder loszuwerden - ein ewiges Hin und Her wie auch bei Viren, Würmern und Trojanern.

|