Unter Indexierung versteht man eine Methode der Informationserfassung, bei der die Dokumente durch Stich- und Schlagwörter gesammelt und sortiert werden. Die Bezeichnung Indexierung steht für die Bildung eines Index, durch den Webdokumente aufgrund verschiedener Deskriptoren gesammelt, sortiert und für Suchanfragen verfügbar gemacht werden. Danach wird ähnlich einer Bibliothek ein Index gebildet. Die gesammelten Dokumente, die zum größten Teil aus Texten bestehen, werden für die Suche nach einem bestimmten Dokument oder einem Schlagwort aufbereitet und mit den Deskriptoren versehen. Werden von einem Nutzer ein bestimmtes Schlagwort und die damit verbundenen Dokumente gesucht, werden die relevanten Inhalte angezeigt. Die Deskriptoren sind innerhalb einer Bibliothek Daten, wie Autoren, Titel oder ISBN-Nummern.

Erfolgt eine Suchanfrage, werden schon vor Eingabe des Schlagwortes Prozesse in Gang gesetzt, die mit der Indexierung in Verbindung stehen. Es werden Webdokumente durchsucht und ausgelesen (Crawler, Spider und Bots). Diese Dokumente werden im Index zusammengetragen, sortiert und hierarchisiert, bevor sie von den Suchmaschinen in einer bestimmten Reihenfolge darstellbar sind. Google, Yahoo oder Bing versuchen ständig, ihre Indexierung von Webseiten zu optimieren, damit den Nutzern bestmögliche und relevante Inhalte geliefert werden können. Allerdings ist die Indexierung von Webdokumenten ein schwieriger Prozess, bei denen die Suchmaschinen sich verschiedener Methoden bedienen. Wichtig sind dabei das „Information Development“, das „Informationretrival“, was soviel wie „Informationsrückgewinnung bedeutet sowie das „Data Mining“, bei dem wertvolle Inhalte aus größeren Datenmengen herausgelöst werden.

Die Indexierung ist für die Suchmaschinenoptimierung (SEO) von großer Bedeutung und kann von Webmastern und Seitenbetreibern von Anfang an gesteuert werden. Dabei kann dafür gesorgt werden, dass Webseiten gecrawlt, indexiert und in den SERPs angezeigt werden. Allerdings muss beachtet werden, dass Google seine Algorithmen regelmäßig ändert, um Spam-Webseiten oder Link-Netzwerke auszuschließen.