Bing está introduciendo el corrector ortográfico a gran escala en todo el mundo – Usabilidad web y seo

Bing está introduciendo el corrector ortográfico a gran escala en todo el mundo

Vistas: 72
0 0
Tiempo de lectura:4 Minutos, 23 Segundos

Los modelos de corrector ortográfico multilingüe a gran escala en Microsoft Bing, conocidos colectivamente como Speller100, se implementan en todo el mundo con alta precisión y memoria en más de 100 idiomas.

Bing dice que, alrededor del 15% de las consultas enviadas por los usuarios, contienen errores ortográficos que pueden generar respuestas incorrectas y resultados de búsqueda subóptimos.

Para resolver este problema, Bing creó el sistema de corrección ortográfica más completo jamás desarrollado.

En consultas de prueba A/B con y sin Speller100, Bing observó los siguientes resultados:

  • Páginas sin resultados reducidas hasta en un 30%.
  • La cantidad de veces que los usuarios tuvieron que reescribir manualmente su consulta disminuyó en un 5%.
  • Los clics de los usuarios en las sugerencias de ortografía aumentaron de un solo dígito al 67%.
  • Los clics en cualquier elemento de la página aumentaron de un solo dígito al 70%.

¿Cómo logró Bing esto? Siga leyendo para obtener más información sobre Speller100.

Corrección ortográfica mejorada en los resultados de búsqueda de Bing

La corrección ortográfica ha sido, durante mucho tiempo, una prioridad para Bing, y el motor de búsqueda va un paso más allá al incorporar más idiomas de todo el mundo.

«Para que Bing sea más inclusivo, hemos decidido ampliar nuestro servicio de corrección ortográfica actual a más de 100 idiomas, estableciendo la misma barra de alta calidad que establecimos para las dos docenas de idiomas originales».

El lanzamiento de Speller100, es un importante paso adelante para Bing y es posible gracias a los recientes avances en inteligencia artificial.

La tecnología detrás de Speller100 se explicó en una publicación de blog reciente de la compañía. Estos son algunos detalles clave sobre la nueva tecnología de corrección ortográfica de Bing.

Tecnología Microsoft Bing Speller100

El aprendizaje cero permite que un modelo de inteligencia artificial aprenda de forma precisa y correcta la ortografía sin ningún dato de entrenamiento adicional etiquetado para un idioma específico.

Esto contrasta con las soluciones tradicionales de corrección ortográfica que se basaban únicamente en los datos de entrenamiento para aprender la ortografía del idioma.

Confiar en los datos de entrenamiento es un desafío cuando se trata de deletrear idiomas con datos insuficientes. Este es el problema que se supone que resuelve el aprendizaje a cero.

“Imagínese si alguien le enseñara a deletrear en inglés y automáticamente aprendiera a escribir en alemán, holandés, afrikáans, escocés y luxemburgués.

Eso es lo que permite el aprendizaje cero y es un componente clave de Speller100 que nos permite expandirnos a idiomas con muy pocos o ningún dato «.

El corrector ortográfico no es un procesamiento del lenguaje natural

Bing distingue que, si bien se han logrado avances significativos en el procesamiento del lenguaje natural, corregir la ortografía es una tarea completamente diferente.

Todos los errores ortográficos se pueden dividir en dos tipos:

  • Error sin palabras: Ocurre cuando la palabra no está en el diccionario del idioma.
  • Error de palabra real: Ocurre cuando una palabra es válida, pero no encaja en un contexto más amplio.

Bing ha desarrollado un enfoque de aprendizaje profundo para corregir estos errores ortográficos, inspirado en el modelo BART de Facebook. Sin embargo, se diferencia de BART en que el corrector ortográfico se trata como un problema a nivel de personaje.

Funciones de ruido

Para resolver el problema a nivel de personaje, el modelo Speller100 de Bing se entrena utilizando mutaciones a nivel de personaje que imitan errores ortográficos.

Bing llama a estas «funciones de ruido»:

“Diseñamos las funciones de ruido para generar errores comunes al rotar, insertar, quitar y reemplazar.

El uso de la función de ruido ha reducido en gran medida nuestra necesidad de anotaciones de etiquetas humanas, que a menudo se requieren en el aprendizaje automático.

Esto es muy útil para los idiomas para los que tenemos pocos o ningún dato de entrenamiento «.

Las funciones de ruido permiten a Bing entrenar a Speller100 para corregir la ortografía de idiomas que no tienen una gran cantidad de datos de consulta mal escritos.

En cambio, Bing se ocupa de texto sin formato extraído de páginas web que se recopila durante la indexación web regular. Se dice que hay suficiente texto en la web para facilitar el aprendizaje de cientos de idiomas.

“Esta formación introductoria demuestra ser el primer paso sólido para resolver el corrector ortográfico multilingüe en más de 100 idiomas. Ayuda a lograr un recordatorio de revisión del 50% para los mejores candidatos en idiomas para los que no tenemos datos de capacitación. «

Si bien esta es una mejora significativa, Bing dice que el 50% de los recordatorios no son lo suficientemente buenos. Aquí es donde entra en juego la ciencia cero.

Para los idiomas sin datos de entrenamiento, Bing utiliza el aprendizaje cero para las familias de idiomas de destino. Esto se hace sobre la base de que la mayoría de los idiomas del mundo están relacionados con otros.

«Esta similitud ortográfica, morfológica y semántica, entre idiomas en el mismo grupo, hace que el modelo de error de aprendizaje de valor cero sea muy eficiente y efectivo…

El aprendizaje en modo cero permite la predicción ortográfica para estos idiomas de bajos recursos o sin recursos «.

El lanzamiento de Speller100 en Bing es el primer paso en un mayor esfuerzo para implementar esta tecnología en más productos de Microsoft.

Happy
Happy
0
Sad
Sad
0
Excited
Excited
0
Sleepy
Sleepy
0
Angry
Angry
0
Surprise
Surprise
0
Previous post Variantes posteriores cercanas a benignas
Next post Cómo hacer para que tu lugar de trabajo te ayude a ser más eficiente