¿Qué es un gráfico de conocimiento?

Vistas: 12
0 0
Tiempo de lectura:8 Minutos, 33 Segundos

No hay duda de que el SEO Semántico es el futuro del SEO.

¿Razón?

A medida que los motores de búsqueda evolucionan hacia la búsqueda semántica, su estrategia de SEO debería evolucionar con ellos.

El problema es que la barrera de entrada es alta. En otras palabras, para hacer SEO semántico, debe tener una comprensión básica de cómo funciona la búsqueda semántica.

Desafortunadamente, tal como están las cosas, si busca en Google recursos simples y fáciles de entender para un laico, es posible que se esté rascando la cabeza.

Para lidiar con esto, he intentado crear un recurso de SEO semántico que cualquiera pueda entender.

Esta publicación de blog y todas las demás de esta serie representan mi propia búsqueda para comprender el SEO semántico. Debo admitir que esta publicación proviene principalmente de la información recopilada del libro electrónico Búsqueda orientada a entidades de Krisztian Balog.

En este post, trataré la pregunta:

¿Qué es el gráfico de conocimiento de Google?

A 30,000 pies, Google Knowledge Graph es una base de conocimiento con unidades que están organizadas en un gráfico llamado Knowledge Graph.

Si no tienes idea de lo que esto significa, no tengas miedo, intentaré separarlos y explicar cada segmento por separado. Luego intentaré volver a poner todo junto en una oración coherente que un profano pueda entender.

Ciertamente me considero un laico, y eso significa que espero usar un lenguaje que sea fácil de entender.

Para empezar, primero debemos entender por qué los motores de búsqueda están evolucionando hacia la búsqueda semántica.


por GIPHY

búsqueda semántica

En pocas palabras, un motor de búsqueda semántica está diseñado para interactuar con personas que usan el idioma que usaría una persona determinada.

¿Por qué los motores de búsqueda están haciendo esto?

Bueno, si ha estado en esto por un tiempo, puede recordar cómo era ingresar una consulta de búsqueda hace quince o veinte años. Si recuerdas, era muy inexacto. Estaría tratando de encontrar las palabras correctas para escribir en un motor de búsqueda, y luego tendría que buscar el recurso que está buscando.

La razón de esto es que los motores de búsqueda en ese momento no tenían forma de entender su consulta. Tampoco pudieron sondear el significado del contenido en línea para responder a su consulta.

Compare eso con su experiencia usando los motores de búsqueda de hoy. ¿Ha notado que casi intuitivamente pueden proporcionarle contenido que no solo está relacionado con su consulta, sino que a menudo puede responder directamente a su consulta en las páginas de resultados?

Entonces cómo lo hacen?

Procesamiento del lenguaje natural (PNL).

El procesamiento del lenguaje natural es la capacidad de una máquina para “comprender” e interactuar con el lenguaje humano natural.

Y…

Para lograr el procesamiento del lenguaje natural, necesitan bases de datos de información legibles por máquina estructuradas de una manera que imite la forma en que los humanos organizan la información.

Con esta estructura de información, los motores de búsqueda pueden “comprender” la consulta de un usuario y proporcionar los recursos adecuados para responder a la consulta “entendiendo” el contenido en línea.

Aunque las máquinas no entienden realmente el lenguaje, pueden imitar la comprensión.

Ahora, para organizar la información de una manera que permita que las máquinas lo hagan, necesitan dividir las ideas y la información en unidades.

Bien, entonces, ¿qué son los seres?

¿Qué es una entidad de Google?

Google define una entidad de Google como “un elemento o concepto único, único, bien definido y distinguible”.

En pocas palabras, los motores de búsqueda tienen bases de datos de entidades, y estas bases de datos contienen información sobre entidades como nombre, tipo, atributos y cómo las entidades se relacionan con otras entidades.

Como mencioné anteriormente, la razón por la que los motores de búsqueda almacenan bases de datos de entidades es porque pueden organizar la información en una estructura que imita la forma en que las personas estructuran la información.

Las entidades son los bloques de construcción más pequeños necesarios para organizar la información de esta manera.

Bien, ahora que tenemos una comprensión básica de las entidades, pasemos a los gráficos de conocimiento.

Comprender el gráfico de conocimiento de Google

El gráfico de conocimiento de Google se compone de diferentes componentes. La razón de esto es que los motores de búsqueda responden a las consultas de los usuarios y deben:

  • Contar con una fuente confiable de información.
  • Organice esta información de manera que permita que el motor de búsqueda responda a sus consultas

Esto nos lleva a:

  • Repositorios de conocimiento (KR)
  • Bases de conocimiento (KB) a menudo denominadas gráficos de conocimiento (KG)

Profundicemos en ambos.

Repositorio de conocimientos (KR)

Los repositorios de conocimiento son fuentes de información que los motores de búsqueda utilizan para crear bases de conocimiento. Estos son directorios de unidades que organizan las unidades en tipos de unidades.

Opcionalmente, pueden contener descripciones de unidades, así como propiedades de unidades. Estos repositorios de conocimiento existen en formatos estructurados o semiestructurados.

Wikipedia es un excelente ejemplo de un depósito de conocimientos. Cada artículo de Wikipedia describe una entidad específica, convirtiéndolo en un directorio de entidades.

Además, cada artículo está asignado a una categoría y podemos ver estas categorías como tipos de unidades.

Entonces, en la captura de pantalla anterior, puede ver las categorías para la entidad “procesamiento del lenguaje natural”. Como puede ver, el procesamiento del lenguaje natural es una categoría de seres. Además, es una subcategoría de la lingüística computacional. La lingüística informática es una subcategoría del reconocimiento de voz, etc.

Los artículos de Wikipedia también muestran relaciones entre entidades al agregar hipervínculos entre los artículos. También contienen información sobre los atributos y relaciones de la entidad.

Toda esta información se encuentra en un formato semiestructurado.

Repositorios de conocimiento parcialmente estructurados

Los datos parcialmente estructurados simplemente se refieren a información que tiene alguna estructura, como etiquetas HTML, incluidos encabezados, párrafos y tablas.

En pocas palabras, Wikipedia es un repositorio de conocimiento parcialmente estructurado.

Repositorios de conocimiento estructurado

Por otro lado, los datos estructurados (o bases de datos relacionales) simplemente se refieren a datos que tienen una estructura o esquema predeterminado. Los datos estructurados generalmente se organizan en tablas. Esto significa que a cada campo especificado en el esquema se le debe dar un valor (permitido).

Una vez que los motores de búsqueda han obtenido esta información estructurada o semiestructurada, aún no está estructurada de manera que permita que los motores de búsqueda la utilicen para búsquedas semánticas.

Las bases de conocimiento (o gráficos de conocimiento) son el siguiente paso.

Base de conocimiento o gráficos de conocimiento

Es importante comprender que el software de IA necesita datos estructurados para realizar tareas complejas de PNL, como comprender las consultas de los usuarios.

En otras palabras, los datos tabulares estructurados o los datos semiestructurados, como las publicaciones de blog de Wikipedia, no proporcionan a los sistemas de IA lo que necesitan para procesar el lenguaje humano.

En cambio, la información debe estructurarse de manera similar a la forma en que las personas organizan la información en sus mentes.

Para hacer esto, las Bases de conocimiento deben recuperar información de los Repositorios de conocimiento y organizarla en afirmaciones sobre el mundo. Estas declaraciones describen a los individuos y sus relaciones entre sí. Describiré esto con más detalle más adelante.

Para hacer esto, los motores de búsqueda necesitan un modelo de datos llamado Resource Description Framework (RDF). RDF proporciona un conjunto estándar de declaraciones para describir entidades o recursos.

Formato de descripción de activos (RDF)

RDF es un lenguaje para la descripción de entidades y sus relaciones. Se compone de recursos.

Un recurso puede referirse a:

  • Unidad o artículo
  • Tipo de entidad o clase
  • relaciones de entidad

Estos recursos están organizados en expresiones RDF denominadas tripletas semánticas.

Los triples semánticos son un conjunto de tres entidades dispuestas en una oración en forma de sujeto-predicado-objeto. (Cuando se representa como un gráfico, una instrucción RDF se representa mediante un nodo para el sujeto, un borde que pasa del sujeto al objeto y un nodo para el objeto).

El sujeto y el predicado están representados por su propio identificador numérico llamado URI. El objeto de instrucción se puede representar mediante un URI o puede ser un valor literal.

Para aquellos de ustedes, aprendices visuales, aquí hay una ilustración:

El sujeto del triple es el ser. Un predicado puede ser un tipo de entidad o una relación. Por ejemplo, nacionalidad, fecha de nacimiento, nombre, etc.. Un objeto es otra unidad o valor, como una cadena que representa un nombre o un número que representa una fecha.

Por ejemplo, considere la primera oración de un artículo de Wikipedia sobre Mike Tyson:

Michael Gerard Tyson (nacido el 30 de junio de 1966) es un ex boxeador profesional estadounidense que compitió en competencias de 1985 a 2005.

Vamos a desglosarlo visualmente.

En la imagen de arriba, he presentado la primera frase como tres.

El sujeto es “Mike Tyson”, el predicado es “fecha de nacimiento” y “30/06/1966” es el objeto. Coloqué un rectángulo alrededor de Mike Tyson para mostrar que Mike Tyson es una entidad. 1966-06-30 por otro lado, no es una entidad, sino un valor, así que lo pongo entre comillas.

Aquí hay una representación visual de la oración completa:

Continuando, cada entidad que existe en el ejemplo anterior se puede ver como un sujeto en un conjunto diferente de triples, lo que da como resultado una gran red compleja de entidades y relaciones.


por GIPHY

La (lejos de) última palabra sobre gráficos de conocimiento

Ahora debería tener una comprensión básica de lo que es un gráfico de conocimiento. Además, debe tener un conocimiento básico de la información almacenada en los gráficos de conocimiento, y también debe comprender de dónde provienen.

Si bien no hay estrategias prácticas en esta publicación, creo que este conocimiento es una base fundamental de la comprensión del SEO semántico que lo ayudará a aumentar su fama de SEO.

Y la comprensión conduce a percepciones prácticas.

Sobre el Autor

Darrell Mordechai

Darrell es un revendedor de contenido de Rank Ranger. Trabajando como gerente de SEO para una pequeña agencia de marketing, Darrell descubrió su amor por el marketing y el SEO.

Happy
Happy
0
Sad
Sad
0
Excited
Excited
0
Sleepy
Sleepy
0
Angry
Angry
0
Surprise
Surprise
0
Previous post Cómo promover una plataforma de negocios de criptomonedas, analizar tendencias en este ámbito y usar Serpstat de manera efectiva
Next post Los mejores consejos para optimizar tu sitio web para el éxito

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Deja una respuesta