Google a récemment annoncé qu’ils utilisaient un algorithme de «correspondance neuronale» pour mieux comprendre les concepts. Danny Sullivan de Google a déclaré que 30% des requêtes de recherche.
Google a récemment publié un document de recherche qui correspond à des requêtes de recherche avec succès aux pages Web en utilisant uniquement la requête de recherche et les pages Web. Bien que cet algorithme ne soit pas utilisé, ou peut-être utilisé dans le cadre d’un groupe d’algorithmes, il sert d’exemple de la façon dont un algorithme de «correspondance neuronale» pourrait fonctionner.
Contents
- 1 Google utilise-t-il des algorithmes publiés?
- 2 Google discute de nouveaux algorithmes d’IA
- 3 IA, pages d’apprentissage en profondeur et de classement
- 4 Le classement de la pertinence des documents de Google n’utilise-t-il pas de liens?
- 5 Que fait réellement l’algorithme?
- 6 Le contenu est plus important
- 7 Est-ce que cette correspondance neuronale?
Google utilise-t-il des algorithmes publiés?
Google n’utilise pas toujours les algorithmes publiés dans les brevets et les documents de recherche. Cependant, un nombre indéterminé d’algorithmes publiés est en effet utilisé dans les algorithmes de recherche de Google.
Il faut également indiquer que Google ne confirme généralement pas si un algorithme spécifique est utilisé.
Google discute de nouveaux algorithmes d’IA
Google a par le passé discuté des algorithmes en termes généraux, tels que l’algorithme Panda et l’algorithme Penguin. Et cela semble être le cas aujourd’hui, car Danny Sullivan laisse tomber des indices sur ce nouvel algorithme de «correspondance neuronale».
Ce nouvel algorithme a été discuté par Danny Sullivan (dans un tweet) comme étant un:
«… Match neuronal, –ai méthode pour mieux connecter les mots aux concepts.»
Danny Sullivan de Google discute de l’appariement neuronal.Danny Sullivan a également tweeté:
«La façon dont la recherche des gens est souvent différente des informations sur lesquelles les gens écrivent des solutions.»
Danny Sullivan a tweeté une capture d’écran montrant comment les mots ont des significations différentes.IA, pages d’apprentissage en profondeur et de classement
Le blog AI de Google a récemment publié un lien vers un nouveau document de recherche intitulé Ranque de pertinence en utilisant des interactions de documents améliorées. Bien que cette recherche d’algorithme soit relativement nouvelle, elle améliore une méthode révolutionnaire de réseau neuronal profond pour accomplir une tâche connue sous le nom de classement de pertinence de documents. Cette méthode est également connue sous le nom de récupération ad hoc.
Bien qu’il ne puisse pas dire définitivement que cela fait partie de ce que Google appelle la correspondance neuronale, cela constitue une recherche intéressante sur quelque chose qui est similaire à cela.
C’est ainsi que le nouveau document de recherche décrit la récupération ad hoc:
«Le classement de pertinence des documents, également connu sous le nom de récupération ad hoc… est la tâche de classement des documents d’une grande collection en utilisant la requête et le texte de chaque document uniquement.»
Le document de recherche est clair, que cette forme de classement utilise uniquement la requête de recherche et la page Web uniquement. Il poursuit en disant:
«Cela contraste avec les systèmes de récupération des informations standard (IR) qui reposent sur des signaux textuels en conjonction avec la structure du réseau (Page et al., 1999; Kleinberg, 1999) et / ou les commentaires des utilisateurs (Joachims, 2002).»
Dans la déclaration ci-dessus, il indique que le classement de pertinence des documents diffère des autres technologies de recherche (systèmes de récupération d’informations) qui reposent sur la «structure du réseau», puis cite la page Larry, qui est une référence à PageRank et aux liens. Il cite également Kleinberg, qui fait référence à la recherche de Jon Kleinberg sur l’utilisation des liens pour classer les pages Web.
Il est clair que le classement de pertinence de documents est une méthode relativement nouvelle pour le classement des pages Web et qu’elle ne reposait pas sur les signaux de liaison.
Le classement de la pertinence des documents de Google n’utilise-t-il pas de liens?
Le nouvel alorithme publié dans le blog AI de Google n’utilise pas directement des facteurs de classement traditionnels. Cependant, les facteurs de classement traditionnels sont utilisés en premier. Ensuite, la partie de récupération ad hoc de l’algorithme est utilisée.
Cela signifie que quel que soit le signal de classement, une page Web doit sauter pour être classée existante. Cependant, les signaux de classement traditionnels ne déterminent pas quelles pages se classeront dans les dix premiers.
On pourrait donc dire que les signaux de classement traditionnels remplissent une sorte de fonction de vérification. Le signal de classement supprime le spam et recueille les documents les plus pertinents.
Ce que fait ce nouvel algorithme, c’est reconstituer ces pages Web en fonction d’un tout autre ensemble de critères pour faire correspondre ce que Danny Sullivan a appelé «Super Synonymes».
Et cette utilisation des signaux de classement est d’abord ce qui rend cet algorithme différent de celui publié en 2016, appelé modèle de correspondance de pertinence (DRMM).
Voici ce que la nouvelle redeach a dit en comparant DRMM avec ce nouvel algorithme:
«Dans le paradigme basé sur l’interaction, des encodages explicites entre des paires de requêtes et des documents sont induits. Cela permet une modélisation directe des termes exacts ou en quasi-correspondance (par exemple, synonymes), ce qui est crucial pour le classement de pertinence.
En effet, Guo et al. (2016) ont montré que le DRMM basé sur l’interaction surpasse les méthodes basées sur la représentation. D’un autre côté, les modèles basés sur l’interaction sont moins efficaces, car on ne peut pas indexer une représentation de document indépendamment de la requête. Ceci est moins important, cependant, lorsque les méthodes de classement de pertinence relonnent les principaux documents renvoyés par un moteur IR conventionnel, qui est le scénario que nous considérons ici. »
Que fait réellement l’algorithme?
Le but de l’algorithme est de faire correspondre une requête de recherche à une page Web, en utilisant uniquement la requête de recherche et le texte de la page Web lui-même. Les pages Web classées par ce type d’algorithme n’auront pas été promue dans les positions les plus importantes en vertu de liens ou de mots clés, car ce type d’algorithme concerne la «correspondance de pertinence».
«Nous explorons plusieurs nouveaux modèles de classement de pertinence de documents, en s’appuyant sur le modèle de correspondance de pertinence profonde (DRMM)… Contrairement à DRMM, qui utilise des encodages de termes et de termes de requête, nous injectons de riches encodages contextuels tout au long de nos modèles, inspiré par les pacrr (Hui et al., 2017) Convolution N-gramms.
Le contenu est plus important
Cela signifie-t-il que les éditeurs devraient utiliser plus de synonymes? L’ajout de synonymes m’a toujours semblé être une variation du spam de mots clés. Je l’ai toujours considéré comme une suggestion naïve.
Le but de Google Comprendre les synonymes est simplement de comprendre le contexte et la signification d’une page. La communication clairement et cohérente est, à mon avis, plus importante que de spammer une page avec des mots clés et des synonymes.
Ce que Google a officiellement déclaré, c’est qu’il est capable de comprendre les concepts. Donc d’une certaine manière, Cela va au-delà de simples mots clés et synonymes. C’est une compréhension plus naturelle de la façon dont une page Web résout le problème impliqué dans une requête de recherche. Selon l’annonce officielle de Google:
«… Nous avons maintenant atteint le point où les réseaux de neurones peuvent nous aider à faire un bond en avant de comprendre les mots à la compréhension des concepts. Les intérêts neuronaux, une approche développée dans le domaine des réseaux de neurones, nous permettent de transformer les mots en représentations plus floues des concepts sous-jacents, puis de faire correspondre les concepts de la requête avec les concepts du document. Nous appelons cette technique correspondant neuronale. »
Est-ce que cette correspondance neuronale?
Il est possible que la correspondance neuronale ait des éléments de cet algorithme mélangés à des éléments d’autres algorithmes. La question de savoir si Google utilise cet algorithme exact est moins important que de comprendre que les documents de classement en utilisant uniquement la requête de recherche et le contenu de la page Web sont possibles.
Comprendre cela aidera les éditeurs à éviter de faire tourner leurs roues avec des stratégies inutiles comme l’ajout de synonymes.
Ce nouveau type de classement IA montre comment il est possible de générer des résultats de recherche qui ne sont pas directement classés par des facteurs de classement traditionnels tels que des liens ou des mots clés. Et cela exige une attention particulière à des choses comme l’intention de l’utilisateur et à comprendre comment une page de contenu aide un utilisateur.
Lisez le document de recherche ici: Ranqueur de pertinence profonde en utilisant des interactions de documents améliorées
Images de Shutterstock, modifiées par l’auteur
Captures d’écran par auteur