Google comienza a rastrear los contenidos tras los formularios web

Hasta la fecha, el robot de Google solamente rastreaba e indexaba aquellos documentos que son enlazados desde páginas web o que son sugeridos a través de ‘Google Sitemaps’ (aunque algunos aseguran también que lo hace también con las páginas que se visitan con la ‘Google Toolbar’ instalada). Sin embargo, muchos sitios disponen de documentos web con multitud de información que, debido a que no cumplen las anteriores condiciones, nunca aparecen en el buscador web.

Es lo que se denomina la “Internet invisible”, y es un porcentaje de la WWW que Google quiere rastrear e indexar. Por ello, según se asegura en este post oficial, el robot de Google está comenzando a realizar pruebas para hacerse con los contenidos que existen detrás de los formularios web que nos encontramos muchas veces en los sitios web, y que generan páginas web con información realmente útil.

Cuando el robot de Google localice un formulario en sitios web “de alta calidad”, se realizarán varias consultas de prueba, insertando de manera automatizada palabras con cierto sentido en las cajas de texto, y realizando selecciones en los menús desplegables, radio buttons o check boxes. En caso de que la información que devuelva el formulario sea inédita para Google y “de interés”, pasará a formar parte del índice de su buscador web.

Eso sí, desde Google se quiere subrayar que en todo momento se respetarán las reglas ‘robots.txt‘ que se indiquen para cada sitio web, y que nunca se rastrearán formularios que incluyan campos de información personal (como passwords, nombre de usuario, contactos, etc.). Además, se asegura que la nueva información no afectará al posicionamiento del resto de las páginas de un sitio web.

Esta entrada fue publicada en Buscadores, Conocimientos, Google, Noticias, Posicionamiento Web, SEO. Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *