2007.09.19

Les moteurs de recherche

Les moteurs de recherche

Il faut tenir compte des accents, de la casse, de la langue, de l'expression et des mots clés, de l'algorithme de classement des résultats… qui varient suivant les différents moteurs existants. Certains moteurs ont des fonctionnalités originales et des spécificités particulières.

Les basiques:

 Moteurs de recherche fédérée:

Ils permettent sur une interface unique de rechercher dans plusieurs sources différentes. Les performances de ces différents moteurs de recherce fédérée interne varie énormément. Voici 2 références de moteurs de recherche fédérée qui permettent d'effectuer des recherches croisées (compatibles avec des connecteurs "malins" si besoin).

 

Qwam Content Intelligence Moteur Qwam System QES:

http://www.qwam.info/qesinfo/pub/FRA/qwam_info/moteurs.jsp 

 

XEROX EMC Documentum Moteur de recherche fédérée "askOnce(tm) V3" (site en anglais)

http://www.askonce.com/

Sur le site Bibliothèque ouverte: http://www.bomlr.info/features_fr.html  les fonctionnalités sont décrites en français. Ce moteur offre un classement par concepts et permet ainsi une interrogation aisée.

Nouveautés "tout moteur"...

Moteurs professionnels couplés aux outils de travail collaboratif: il s'agit de l'association des fonctions de base de la collecte, de l'indexation et du traitement des requêtes à des fonctionnalités collaboratives: partage de signets, de résultats ou pistes de recherche.

  • Wikio: http://www.wikio.fr/ (moteur collaboratif de recherche d'actualités, avec notes et signalement d'intérêt possibles. Informations en continu de 28 007 médias et blogs)
  • Webzzle: http://www.webzzle.fr/search/home.kol Webzzle est le premier explorateur Web collaboratif basé sur le sens (possibilité de sauvegarder et qualifier documents avec concepts qui s'y rapportent). {Dutheil}
  • Mashups: espaces web développés en Ajax fédérant des sources internes et externes {Dutheil}: BEA (application Builder) et Polyspot (publication de documents répertoriés, espace privé ou public, document visible suivant utilisateur)

Ajout de réseaux sociaux au moteur: Sharepoint Server 2007, Alogic, Graffiti de BEA (tag, classement), technologie Contextuel Insight (Fast Search & Transfer, Norvège) (recoupements entre noms cités dans un document avec d'autres sources liées).

Moteur du site «Observatoire des sites gouvernementaux»: http://moteur-auracom.com/cgi-bin/aurweb.exe/goov/new, Ce système détecte 6 fois par jour les nouveautés annoncées dans les pages d'accueil des grands sites institutionnels français et des « gouv.fr ». Il est possible d'obtenir la liste des nouveautés (cumulées du jour, mise à jour par mise à jour) ou bien d'effectuer des sélections par thème (rapports, documents, affaires étrangères, affaires sociales, agriculture, tourisme, ville… apparus dans la dernière mise à jour) dans le flux des nouveautés et dans les pages d'accueil.

Métamoteurs:

http://www.coelis.com/ Coelis développe et commercialise un méta moteur d'interrogation «temps réel» des sites de commerce électronique. Sous la forme d'un «macro langage», cette solution permet de paramétrer rapidement des automates de recherche qui :

  • Interrogent en temps réel tout site de vente en ligne sans participation technique du marchand,
  • Simulent à l'identique le comportement de l'internaute,
  • Collectent et traitent les informations tarifaires affichées sur les sites : prix, disponibilité, taxes, frais de dossier, frais d'annulation, fiche descriptive des produits...

Les produits sont PricePilote (solution de veille tarifaire pour les professionnels) et Sprice (comparateur de voyages, séjours, locations de voiture et chambres d'hôtels).

Moteur «Google Custom Search Engine»:

Lire l'article: http://www.precisement.org/blog/article.php3?id_article=183 … «Le principe est simple : vous listez les sites ou adresses web à mettre dans l’index de «votre» moteur et Google limitera sa recherche à ceux-ci. Cette restriction sélective et «matière» du champ de recherche rend les résultats plus pertinents. Le danger, toutefois, réside dans l’absence d’exhaustivité ou de mise à jour de votre sélection. Il vaut mieux être un spécialiste de son secteur sur Internet pour monter un CSE (Custom Search Engine) valable…»

Nouveautés!

Accoona: http://www.accoona.eu/ (en Europe, disponible en français) et (aux USA) existe depuis juin 2006 en Europe, a bénéficié d'un excellent article dans la revue «Netsources» n° 68 Mai/juin 2007 de la part de Jennifer Clerté. Ce moteur «fonctionne grâce à un algorithme sémantique qui associe différents types de terme (synonymes, acronymes, pseudonymes, hyperonymes…), il tient compte de la position des mots dans la page, ainsi d'après les concepteurs la requête est plus fine et pertinente

Search Crystal: http://www.searchcrystal.com/home.html n'est pas à proprement parler un moteur de recherche, c'est une interface de visualisation des résultats des différents moteurs de recherche que sont Exalead, Google, Yahoo et MSN, le tout sur les catégories: web, images, news et blogs.

L'interface est  agréable et ses deux atouts reposent dans la possibilité de mixer les contenus et de les visualiser dans une seule interface. Les modes de visualisation proposés sont : la spirale, le cluster et la liste. Par ailleurs la création d'un compte vous permet d'avoir accès à diverses fonctionnalités d'interrogation, de visualisation et de comparaison complémentaires. (Source : NetWizz Jungle Blog)

Skreemr, MP3 toujours  est un moteur de recherche simple d'utilisation qui permet de trouver des fichiers musicaux.

 

Omgili : http://www.omgili.com/

est un nouveau moteur qui a la particularité de rechercher sur les forums et listes de discussion sur le web. A suivre...
(Source: http://www.sphere-ie.fr/index.php?option=com_content&...)

Les annuaires généralistes ou spécialisés sont à utiliser quand les réponses ne sont pas pertinentes, incomplètes ou non spécifiques avec les moteurs de recherche classiques ou élaborés. (Voir l'article de Béatrice Foenix-Riou «Méthodologie de recherche: quand les moteurs ne répondent pas…» dans «Netsources» n° 68 Mai/juin 2007)