El informe de spam web de Google explica el papel de SpamBrain

El informe anual de spam web de Google que cubre 2022 destacó todas las formas en que su sistema antispam SpamBrain se ha vuelto más hábil para detectar múltiples formas de spam. Si bien el informe se trata principalmente de informar cuánto más spam atraparon en comparación con el año pasado, los datos sobre cómo funciona SpamBrain parecían igual de importantes.

Contenido del Articulo

Plataforma SpamBrain de Google

SpamBrain es el nombre que Google le ha dado al sistema de aprendizaje automático que Google llama la plataforma desde la que lanzan algoritmos que detectan múltiples formas de spam.

El aprendizaje automático es una forma de inteligencia artificial que utiliza datos para aprender a ser cada vez más competente en la tarea para la que está diseñado.

No se sabe mucho sobre SpamBrain, aparte de que es una plataforma de aprendizaje automático y es “central” para las iniciativas de Google para evitar que el spam se clasifique.

El Informe de spam web de Google señala esto sobre SpamBrain:

“También hemos mejorado SpamBrain como una plataforma robusta y flexible, lanzando múltiples soluciones para mejorar la cobertura de diferentes tipos de abuso”.

Mejoras de SpamBrain

El informe Webspam señaló que las mejoras en el sistema dieron como resultado que se recopilaran un 500 % más de sitios de spam que el año anterior.

La capacitación adicional resultó en un aumento de diez veces en la capacidad de SpamBrain para detectar sitios web pirateados.

Enlace de detección de spam

El informe señaló que la capacitación específica sobre spam de enlaces resultó en la captura de cincuenta veces más sitios de spam de enlaces en comparación con el año anterior, citando la capacidad de aprendizaje de SpamBrain como la clave de su éxito.

“Gracias a la capacidad de aprendizaje de SpamBrain, detectamos 50 veces más sitios con enlaces no deseados en comparación con la actualización anterior de enlaces no deseados”.

Indexación del guardián

Un hecho interesante sobre SpamBrain es cómo identifica el spam en el momento de la detección.

Si se descubre que una página rastreada es spam, se bloquea de inmediato, lo que evita que ingrese al índice de búsqueda de Google y evita que los recursos se desperdicien rastreando spam.

El bloqueo de spam en el momento del rastreo es una función anunciada en 2021, que señaló que la indexación no solo se bloquea cuando se detecta spam, sino también cuando intenta colarse a través de la consola de búsqueda y los mapas del sitio.

Escribieron en 2021:

“…tenemos sistemas que pueden detectar spam cuando rastreamos páginas u otro contenido. El rastreo es cuando nuestros sistemas automatizados visitan el contenido y lo revisan para incluirlo en el índice que usamos para proporcionar resultados de búsqueda. Algunos contenidos identificados como spam no están indexados.

Estos sistemas también funcionan para el contenido que descubrimos a través de mapas de sitio y Search Console.

Por ejemplo, Search Console tiene una función de solicitud de índice para que los creadores puedan informarnos sobre las nuevas páginas que deben agregarse rápidamente. Hemos visto spammers irrumpir en sitios web vulnerables, pretender ser los propietarios de esos sitios web, verificarse en Search Console y usar la herramienta para pedirle a Google que rastree e indexe las muchas páginas de spam que han creado.

Usando inteligencia artificial, pudimos detectar verificaciones sospechosas y evitar que las URL de spam ingresen a nuestro índice de esa manera”.

Por lo tanto, es justo decir que una de las muchas funciones de SpamBrain es actuar como un guardián, bloqueando el spam antes de que pueda ingresar al índice de Google.

La protección contra el fraude ahora es multilingüe

Algo nuevo para SpamBrain es que el sistema de detección de fraude ahora es multilingüe, lo que reduce los clics en sitios fraudulentos en un 50 % en comparación con el año pasado.

¿Qué pasa con el contenido de spam?

El informe de este año se centró en la captura de enlaces de spam, la detección de sitios comprometidos y las mejoras en la detección de spam en el momento de la detección.

Lo que no mencionó fue que tenía que ver con la detección de spam.

¿Esto se debe a que el lado del contenido es administrado por el algoritmo de contenido útil y no por SpamBrain?

Lea el informe de spam de Google:

Cómo luchamos contra el spam en la Búsqueda de Google en 2022

Imagen destacada de Shutterstock/Asier Romero

Previous post Crear informes de investigación significativos y usar sus conocimientos | Pedro Caneña | marzo 2023
Next post Maneras de convertir video y audio a texto

Deja una respuesta