Google está actualizando la documentación de verificación de Googlebot

Google ha actualizado la Documentación de búsqueda central para la verificación de Googlebot, agregando documentación sobre las visitas de bots activadas por el usuario, información que faltaba en la documentación anterior de Googlebot, lo que ha causado confusión durante muchos años, con algunos editores bloqueando rangos de IP de visitas legítimas.

Contenido del Articulo

Documentación de bot actualizada recientemente

Google ha agregado nueva documentación que clasifica los tres tipos diferentes de bots que los editores deben esperar.

Estas son las tres categorías de Google Bots:

  • Googlebot: rastreador de búsqueda
  • Detectores de casos especiales
  • Receptores activados por el usuario (GoogleUserContent)

Este último, GoogleUserContent, es uno de los que ha confundido a los editores durante mucho tiempo porque Google no tenía documentación al respecto.

Esto es lo que dice Google sobre GoogleUserContent:

“Informes activados por el usuario

Herramientas y características del producto donde el usuario final desencadena una recuperación.

Por ejemplo, Google Site Verifier actúa sobre la solicitud de un usuario.

Debido a que la recuperación fue solicitada por un usuario, estos programas de recuperación ignoran las reglas de robots.txt”.

La documentación establece que la máscara DNS inversa mostrará el siguiente dominio:

“***-***-***-***.gae.googleusercontent.com”

En el pasado, algunos miembros de la comunidad de SEO me dijeron que la actividad del bot de las direcciones IP asociadas con GoogleUserContent.com se activaba cuando un usuario visitaba un sitio web a través de una función de traducción que estaba en los resultados de búsqueda, una función que no no existe ahora en Google SERPs.

No sé si es cierto o no. Bastaba saber que se trataba de una visita de Google, provocada por los usuarios.

La nueva documentación de Google explica que la herramienta Google Site Verifier puede activar la actividad de los bots de las direcciones IP asociadas con GoogleUserContent.com.

Sin embargo, Google no dice qué más podría activar un bot que las direcciones IP de GoogleUserContent.com.

El otro cambio en la documentación es una referencia a googleusercontent.com bajo las direcciones IP asignadas al nombre de dominio, GoogleUserContent.com.

Este es el nuevo texto:

“Verifique que el nombre de dominio sea googlebot.com, google.com o googleusercontent.com”.

Otra nueva adición es el siguiente texto ampliado de la página anterior:

“Alternativamente, puede identificar Googlebot por dirección IP haciendo coincidir la dirección IP del rastreador con las listas de rangos de IP de rastreador y portador de Google:

Robot de Google

Rastreadores especiales como AdsBot

Recuperaciones activadas por el usuario”

Documentación de reconocimiento de bots de Google

La nueva documentación finalmente tiene algo sobre los bots que usan direcciones IP asociadas con GoogleUserContent.

Los especialistas en marketing de búsqueda se confundieron con estas direcciones IP y asumieron que estos bots eran spam.

Un hilo de ayuda de Google Search Console de 2020 muestra cuán confundidas estaban las personas acerca de la actividad relacionada con GoogleUserContent.

Muchos en esa discusión concluyeron correctamente que no era un robot de Google, pero luego concluyeron erróneamente que era un bot falso que pretendía ser Google.

Un usuario publicó:

“El comportamiento que observo proveniente de estas direcciones es muy parecido (si no idéntico) al comportamiento legítimo de Googlebot y está afectando a muchos de nuestros sitios.

…Si no es así, eso parece indicar que hay una actividad generalizada de bots maliciosos de alguien que se esfuerza mucho por parecerse a Google en nuestros sitios, lo cual es preocupante”.

Después de varias respuestas, la persona que inició la discusión concluye que la actividad de GoogleUserContent era spam.

Ellos escribieron:

“…Estos Googlebots se hacen pasar por agentes de usuario oficiales, pero tal como está la evidencia muestra que son falsos.

Los bloquearé por ahora”.

Ahora sabemos que la actividad de los bots de las IP asociadas con GoogleUserContent no es spam ni bots de piratas informáticos.

En realidad es de Google. Los editores que actualmente bloquean las direcciones IP asociadas con GoogleUserContent probablemente deberían desbloquearlas.

La lista actual de direcciones IP de recuperación activadas por el usuario está disponible aquí.

Lea la documentación actualizada de Google:

Verificación de Googlebot y otros rastreadores de Google

Imagen destacada de Shutterstock/Asier Romero

Previous post 5 dilemas éticos comunes en la investigación de usuarios
Next post Cómo mejorar el servicio al cliente de tu marca

Deja una respuesta