Skip to content

Sefvravela un site mystérieux sur le réseau Tor

Il y a quelques jours, un site mystérieux a fait son apparition sur le réseau anonyme Tor. Le site porte le nom étrange de « Sefvravela ». Il est composé, pour l’instant, d’une unique page composée d’une image énigmatique et d’un lien en forme de tête de mort. Le lien permet de télécharger un fichier mp3, au contenu extrêmement glauque, qui parle de viols et de meurtres d’enfants.

 

Sefvravela

Sous l’image il y a un texte codé :

YN ERIRYNGVBA FHVIEN … VPV, OVRAGBG.

Il se décrypte facilement en utilisant la table de correspondance suivante :

NOPQRSTUVWXYZABCDEFGHIJKLM
ABCDEFGHIJKLMNOPQRSTUVWXYZ

Ce qui donne en clair, le message :

LA REVELATION SUIVRA … ICI, BIENTOT.

L’adresse du site est :

http://zzjqdsoq7edvkwiv.onion/

Il faut un client Tor pour y accéder ou alors il faut passer par le service onion.to

http://zzjqdsoq7edvkwiv.onion.to/

Qwant après le « bad buzz » ?

Le moins que l’ont puisse dire c’est que ma petite analyse du moteur de recherche Qwant a déclenché une vraie polémique durant la semaine précédente. Je trouve assez dommage que certaines personnes de la sphère Web française se soient, souvent, focalisées sur des petits détails ou sur la forme de mon modeste article, plutôt que sur le fond.

Plus triste encore, les réponses sous forme d’attaques personnelles, de menaces, d’insultes (qui ont parfois frisé le harcèlement), plutôt qu’un débat construit et positif. Un peu plus drôles étaient les accusations de fausses publicités déguisées pour des services dont je n’avais jamais entendu parler avant de faire des recherches sur le classement des résultats par Qwant. Surtout que je jugeais ces services de piètre qualité (je pense, en particulier, à Kurrently).

Avant d’entrer dans le vif du sujet je tiens à revenir sur un point que je juge important : le reproche que l’ont m’a fait, et à mon humble avis, le seul qui était valide, a été de ne pas avoir demandé de précisions à la société Qwant avant de publier mon étude. Je tiens à dire que cela est faux et que suite à l’article qui présentait le moteur de recherche sur le site de « Le figaro » j’ai rapidement contacté Qwant par le biais de leur formulaire de contact afin de leur poser plusieurs questions techniques. Je n’ai pas obtenu de réponses de leur part. Je n’ai fini de rédiger et publier mon article que plusieurs jours plus tard.

Olivier Andrieu, d’Abondance a annoncé, par la suite, que lui non plus n’avait pas obtenu de réponse à sa demande de contact avec Qwant. Du moins, avant de publier son article qui était, en partie, inspiré de ma démonstration.

Les réponses de Qwant à mon article

Qwant à répondu plusieurs fois à mes tests, une première fois sur leur blog, puis une seconde fois lors d’un podcast sur le blog de Laurent Bourrelly.

Sur la forme de ces réponses, il y a une bonne partie d’ironie et d’esquive lorsqu’ils abordent certains des points que j’ai soulevés. Il y a aussi une bonne partie de ce que j’appellerai du « blabla marketeux sans intérêt », mais personne ne pourra leur reprocher, car c’est une forme de communication d’entreprise qui est plus que courante à l’heure actuelle.

En revanche j’aimerais mettre en avant les points intéressants présentés par Qwant et leur stratégie pour lancer leur moteur.

Ce qu’il faut comprendre avant tout, c’est comment fonctionne un moteur de recherche (je vais essayer de simplifier ça pour les personnes peu techniques).

D’un côté nouveau une base de données que l’on nomme « index » et qui stocke les contenus des pages des sites Web. Plus l’index est conséquent et plus on peut travailler dessus et offrir des résultats variés à l’internaute.

L’autre module important est un robot (un programme) qui parcourt les pages Web, en extrait leur contenu et les envois dans l’index.

Enfin nous avons un dernier programme qui est composé de plusieurs algorithmes de tri qui se charge de trier l’index afin de renvoyer les résultats les plus pertinents par rapport aux recherches des internautes.

Ces trois modules demandent une puissance de calculs et une capacité de stockage conséquentes. En clair ça coûte très cher.

L’approche de Qwant

Si l’ont en croit Eric Léandri de Qwant, la partie algorithmes de tri serait déjà opérationnelle. Le robot d’indexation le serait lui aussi, mais il ne serait pas encore actif (il ne parcourt pas encore les Web pour en extraire le contenu). L’index quant à lui reste à construire.

Qwant a donc choisi, pendant cette phase de transition, d’appuyer une grosse partie de ses résultats sur d’autres moteurs de recherche et services Web (Bing en tête), afin de pouvoir servir, dés son lancement, des résultats aux internautes pendant qu’il construit son index.

Une simple erreur de communication ?

Le fait de ne pas avoir communiqué sur cette stratégie et de s’enfermer dans, une vieillissante, culture du secret et, à mon humble avis une vraie erreur de communication. Les sociétés internet modernes sont de plus en plus dans la communication à propos de leurs technologies et de leurs choix stratégiques, et à ce niveau, Qwant semble s’être basé sur de vieux modèles, quasi obsolètes.

Une touche d’espoir et des interrogations

Ma conclusion se résume assez simplement : pour l’instant ne nous savons pas ce que vaut Qwant car peu de ses résultats de recherche ne reflètent sa propre technologie. Que vaut-il vraiment face aux autres moteurs de recherche comme Google, Bing ou Voilà ? Il est impossible de répondre à cette question à l’heure actuelle.

Tout ce que j’espère est que Qwant en ait vraiment derrière le capot et qu’il arrive à nous le prouver dans un avenir plus ou moins proche. Mais pour l’instant, c’est « wait and see ».

Qwant, derrière le masque du Google killer français

Difficile d’être passé à côté de Qwant durant ces derniers jours tellement, celui que la presse présente comme le Google et Bing killer « made in France », fait le buzz.

Ce nouveau moteur de recherche créé par une équipe française s’annonce comme révolutionnaire grâce à un concept simple : chercher sur tout le Web et afficher tous les résultats sur une page.

Qwant propose ainsi plusieurs zones sur sa page de résultats. Elles sont au nombre de 6 et affichent selon les résultats :

  1. Des médias : images et vidéos.
  2. Les pages Web en rapport avec la recherche, comme sur Google et Bing.
  3. Les actualités comme sur Google News.
  4. Le « knowledge graph » (orthographié étrangement « Qnowledge graph »), soit un encart donnant des précisions sur la requête si il s’agit d’une personnalité, d’un lieu connu, etc.).
  5. La recherche sur les réseaux sociaux (comme Facebook ou Twitter).
  6. Et enfin le shopping qui affiche des produits Amazon.

Qwant aurait été développé en 2 ans, en secret, avant d’être présenté officiellement au public la semaine dernière. Cela semble vraiment très peu pour un tel produit, surtout quand on compare avec le temps de développement des géants comme Google et Bing et qu’on voit la quantité de fonctionnalités que présente le moteur, dés sa sortie. Je dois avouer que j’étais très sceptique avant de tester le moteur.

La recherche Web et Live

J’ai commencé mon test par la recherche Web afin de la comparer avec Google et Bing. Ces deux étant les références actuelles pour la recherche sur le Web.

J’ai donc lancé plusieurs recherches histoire de me faire une première idée. Rapidement j’ai été agréablement surpris par la pertinence des résultats. J’ai donc décidé de faire un test plus complet et de comparer les résultats avec Google et Bing. J’ai donc choisi une cinquantaine de requêtes de recherche plus ou moins populaires afin de voir comment le petit « french » s’en sortait.

Et là ce fut une grosse déception pour moi. En effet Qwant ne fait qu’utiliser et resservir les résultats de Bing. Toutes les requêtes renvoient exactement les mêmes résultats que Bing (même s’il peut y avoir des microvariations qui sont tout à fait normales).

Ceci fût confirmé plus tard sur Twitter par Stéphane Madelano, chef de projet chez Qwant : Qwant utilise Bing pour la recherche sur le Web et dans les Actualités (Live).

C’est déjà un très gros point noir pour le moteur français, car il ne propose pas une technologie alternative, mais simplement une interface afin de servir le contenu du moteur de recherche de Microsoft. En gros : Qwant paye Bing pour afficher ses résultats.

Vous pouvez voir les tarifs pour l’utilisation de l’API search de Bing ici :

https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE-BF57-A49D98D29A44

La recherche sociale

Cette fonctionnalité est largement mise en avant dans les articles parlant de Qwant. Elle permet de rechercher sur les réseaux sociaux et d’interagir sur les résultats tout en restant sur Qwant : répondre à un Tweet, poster un commentaire sur Facebook, etc.

Pour commencer par un bon point : l’interface est bien faite. En revanche au niveau des résultats ce n’est pas aussi rose, car ils sont vraiment de mauvaise qualité : ils ne sont pas localisés (vous recevez des résultats dans des langues qui ne sont pas la vôtre) et ne semblent pas du tout classés par pertinence.

Finalement après quelques recherches sur le Web je me sus rendu compte que Qwant affiche exactement les mêmes résultats que http://www.kurrently.com/.

Un prototype de site de recherche sur les réseaux sociaux. Si ce dernier n’offre pas de possibilités d’utiliser une API comme Bing, en revanche on peut acheter le moteur pour l’intégrer à son propre site pour $999. C’est, peut être, ce qu’a fait Qwant avant de lui rajouter une interface permettant l’interaction. Ou alors ils utilisent simplement les mêmes API que Kurrently et les classent de la même manière.

Le lien pour acheter le code source se trouve dans le pieds de page de http://www.kurrently.com/ et s’intitule « API/Source code ».

Cela devient un peu inquiétant, car, pour l’instant, sur les 3 premiers blocs de recherche, aucun n’a été développé par Qwant, et donc aucun n’est « made in France » comme annoncé par la presse.

Le shopping

La colonne shopping et plus facile à analyser : elle ne contient que des résultats provenant d’Amazon.com sous la forme de liens d’affiliations.

On peut facilement comparer les résultats donnés par Qwant avec ceux données sur Amazon.fr. On s’aperçoit ainsi qu’ils sont identiques, ou quasiment. Encore une preuve que Qwant utilise l’API search d’Amazon et pas une technologie développé en interne.

Amazon product advertising API : https://partenaires.amazon.fr/gp/advertising/api/detail/main.html

Cela veut simplement dire que cette colonne utilise le moteur de recherche d’Amazon pour vous afficher des produits provenant de ce site. Quand vous achetez un produit en passant par un de ces liens, Amazon reverse un pourcentage sur la transaction à Qwant.

Donc toujours pas de technologie de recherche « Made in France » dans Qwant. Il s’agit juste d’une liste de liens publicitaires sans aucune valeur ajoutée pour l’internaute.

La recherche de médias

Un point vite testé : il suffit de faire un click-droit sur une vignette puis de l’afficher dans le navigateur pour se rendre compte que toutes les vignettes sont hébergées chez Bing. Donc là encore c’est l’API de Bing qui est utilisée pour la recherche, et pas du tout une technologie maison développée par Qwant.

Le « knowledge graph »

Là encore la technologie employée est simplement vérifiable. Après quelques tests sur des requêtes simples de noms de lieux et personnalités on se rend compte que Qwant ne fait que récupérer le résumé (celui de la colonne de droite) de Wikipedia et l’intégrer dans sa page. Ce n’est donc pas une technologie ni une base de connaissance développée par Qwant mais une simple agrégation du site Wikipedia.org. D’ailleurs c’est autorisé par la licence Wikipedia à condition de citer la source et de faire un lien retour vers l’article. Ce que ne fait pas Qwant qui viole donc la licence Wikipedia. Le lien vers la page Wikipedia a été rajouté (bravo pour la réactivité).

Triste conclusion

En fin de compte, Qwant est une vraie déception, ce n’est pas un nouveau moteur de recherche et encore moins un moteur de recherche « made in France ». C’est juste une interface, pas forcément réussie, qui utilise les technologies d’autres moteurs de recherche et qui les présente à sa sauce.

Beaucoup de buzz pour peu de chose et un pauvre travail d’investigation de la part de la presse spécialisée.

Par contre, j’ai une question sérieuse : pourquoi cela a demandé 2 ans pour créer ce site, sachant qu’il n’y a aucune réelle technologie originale ni innovante dérrière ? Si vous avez des idées à ce sujet, n’hésitez pas à les laisser en commentaire !

Je vous invite tous à ne pas prendre pour argent comptant ce que je dit dans cet article et à tester et comparer les résultats par vous même afin de vérifier l’information ! Vous avez toutes les clés pour le faire.

PS : cet article est libre de droit et peut être distribué, copié, dupliqué, modifié comme bon vous semble.

PPS : Je n’ai pas fait de lien vers Qwant.com dans l’article car ce n’est pas autorisé par leurs conditions d’utilisations. Ces dernières, sont par ailleurs très instructives à parcourir.

Mise à jour : J’ai modifié légèrement l’article afin d’être un peu plus précis, par exemple en donnant des liens vers les API probablement utilisés (en tout cas, celles qui renvoient des résultats de recherche identiques à ceux qu’on trouve sur Qwant).

Suivre

Recevez les nouvelles publications par mail.