racine uZine

Dans la même rubrique
Trouver l’information
10 août 2000
10 août 2000
 
jeudi 10 août 2000

Les outils

par ARNO*

Le bon outil pour le bon artisan... Pour chaque étape de la recherche, on utilisera donc l’outil et le site Web qui convient.

Les moteurs de recherche

Passage obligé par les moteurs de recherche. Mais on regroupe souvent sous ce terme deux types de services très différenets : les répertoires et les robots. L’erreur classique du débutant consiste à utiliser l’un pour l’autre, AltaVista au lieu de Yahoo, Nomade au lieu de Google, ce qui le condamne à ne jamais récupérer qu’une information imprécise et incomplète.

- Les répertoires

Les répertoires sont des listes de sites, classés de manière thématique. Ce classement est effectué à la main par les équipes qui gèrent ces sites.
Les webmestres signalent leur site à ces équipes, qui le visitent (souvent très rapidement) et se chargent d’en faire une très courte description et de l’installer dans un des dossiers thématiques du répertoire.

Les répertoires les plus connus sont Yahoo, Nomade, Yahoo.france.

L’information contenue dans ces répertoires est donc à la fois très thématique et très grossière. Si la recherche correspond à un thème général prévu par le répertoire, on obtiendra une liste de sites traitant spécifiquement de ce thème. En revanche, on n’a qu’une description sommaire (quelques lignes) du contenu du site ; la plupart des sites Web traitant de nombreux sujets différents, leur référencement dans ces répertoires est forcément imprécis (l’exemple-type : un webzine personnel, traitant de tout ce qui tient à cœur à son auteur, est toujours mal référencé dans ces services ; il sera généralement dans une rubrique généraliste « webzines », mais on ne connaîtra pas tous les thèmes qu’il aborde ponctuellement).

Les répertoires généralistes sont donc un excellent moyen de commencer une recherche, lorsque l’on ne connaît pas encore le contexte. Pour une recherche très générale, c’est là qu’on aura le plus de chances d’obtenir une réponse.

Les répertoires thématiques. Certains répertoires se spécialisent dans certains thèmes spécifiques. Lorsqu’on a déjà une première idée générale du contexte de la recherche, ils permettent à la fois d’effectuer une recherche généraliste, mais permettent d’obtenir plus de réponses, souvent plus précises, que les répertoires généralistes. Par exemple, pour une recherche juridique, on pourra commencer par droit.org. On trouvera des répertoires sur presque chaque sujet général ; depuis peu, ces répertoires thématiques aiment se baptiser « le portail de... ».

- Les robots

Les robots fonctionnent d’une manière totalement différente : ce sont des programmes informatiques qui « visitent » l’internet, et récupèrent toutes les informations qu’ils y trouvent. Chaque page visitée (et cela signifie : toutes les pages de tous les sites visités) est mémorisée, et classée dans la base de donnée du service. On nomme souvent ces services des crawlers (qui rampe, qui grouille, sur tout le Web) ou des spiders (des araignées qui tissent leur toile).

Ce sont les plus nombreux : en ce moment, Google est très apprécié pour sa sobriété et sa précision. HotBot et AltaVista sont des références, mais pollués par des publicités envahissantes et des mise en pages surchargées. Les robots limités à une seule langue me semblent moins intéressants : d’abord parce que l’on peut limiter la recherche dans les grands moteurs précédents à une seule langue, surtout parce que la pertinence d’une information n’est pas limitée à la langue utilisée.

Il est important de comprendre ici que les robots visitent tout, c’est-à-dire ont vocation à enregistrer tous les mots de tous les sites du Web (dans la réalité, ils n’y parviennent que partiellement, mais c’est le but de ces services) : des millions de pages et tous leurs mots sont mémorisés.

Une recherche sur ces services va donc s’effectuer sur l’intégralité du contenu de toutes les pages de tous les sites visités par ces moteurs. C’est donc énorme. Là où, rappelons-le, un répertoire ne chercherait que dans la description générale de chaque site référencé à la main.

Pour un webzine, un répertoire connait des informations succintes : le nom, l’adresse, parfois le nom de l’auteur, et le thème général (« un webzine qui parle grosso modo de tel thème »). Le même site, dans un moteur-robot, serait référencé intégralement : ces services connaissent tous les mots de toutes les pages du site.

L’avantage est évident : on peut retrouver n’importe quel mot, ou n’importe quelle suite de mots, à l’intérieur de n’importe quel site. Inconvénient : si l’on effectue une recherche sur un mot très souvent utilisé, on obtient des dizaines ou des centaines de milliers de réponses inutilisables.

Les robots ne s’utilisent que lorsque l’on connaît précisément le contexte de ce que l’on recherche.

Les méta-moteurs. Les méta-moteurs sont des services qui ne disposent pas de leur propre base de donnée, mais permettent d’interroger d’un coup plusieurs robots. Très appréciés des débutants, on leur attribue souvent plus d’utilité qu’ils n’en ont véritablement. Ils ne se justifient qu’en fin du processus, lorsque l’on a déjà déterminé très précisément l’ensemble des critères nécessaires et que les robots précédents ne répondent plus que par une poignée de pages.

Les grands sites d’information

Dans la méthode que nous préconisons, il convient de définir progressivement le contexte de la recherche. Pour cela, il faut trouver, au fur et à mesure, des informations complémentaires.

Une méthode rapide pour déterminer les premiers éléments du contexte consiste à rechercher dans les grands sites d’information. Munis de moteurs de recherche limités à leur propre contenu, ils permettent de trouver des articles contenant des « mots » précis sur les sujets qui nous intéressent.

Pour mes besoins personnels, j’utilise souvent les sites des grands journaux.
Pour un thème de société lié à l’actualité, Le Monde, Libération, Les Dernières Nouvelles d’Alsace (là, l’interface pour les recherches est trop complexe à mon avis pour un débutant). Pour de l’information internationale ou sur les médias, Le Monde diplomatique dispose d’une base énorme.

De tels sites fournissent d’abord des articles et des opinions que l’on peut utiliser tels quels, mais il serait dommage de s’y limiter. L’idée, ici, est de trouver dans ces articles des informations qui permettront de préciser la recherche sur l’internet.

Les liens

Souvent quelqu’un a déjà effectué le travail de recherche sur tel thème avant vous. Cela donne ces dizaines de milliers de « pages de liens » (links) que l’on trouve sur la plupart des sites amateurs ; on peut tourner en ridicule cette attitude maniaque que certains ont à publier des listes de liens qui semblent sans intérêt ; on peut aussi les utiliser pour ce qu’elles sont, des raccourcis très pratiques pour trouver rapidement une information.

On peut les utiliser, assez systématiquement, de cette façon : lorsque l’on trouve un site, au cours d’une recherche, qui semble traiter notre thème d’une manière intéressante (bien construite, bien écrite, semble-t-il digne de confiance...), une réaction très saine consiste à visiter sa propre liste de liens. Cela correspondrait, pour un article journalistique, à accéder aux sources de l’information ; pour un livre, à la bibiographie.

Le courier électronique

Les petits nouveaux n’osent pas le faire systématiquement, pourtant c’est la base même du fonctionnement du réseau : si vous avez une question, posez-la directement !

Il y a bien sûr les mailing-lists spécialisées, les news-groups...

Mais il ne faut pas oublier les auteurs des sites Web. S’ils ont consacré du temps à traiter tel ou tel thème sur leur site Web, ils sont certainement les plus aptes à vous aider dans vos recherches, à vous orienter vers d’autres pages, ou vers d’autres utilisateurs qui pourront vous renseigner.

C’est même la méthode la plus certaine de découvrir les joies du Web indé, de comprendre, par la pratique, la richesse humaine qui l’anime.

Par exemple : de retour de vacances à Cuba, vous voulez vous renseigner sur un petit groupe que vous avez entendu là-bas. Vous recherchez son nom, et ne trouvez pas grand chose. En revanche, vous trouvez quelques sites Web, visiblement animés par des amateurs passionnés, consacrés à la musique cubaine. Écrivez-leur, présentez-vous, dites ce que vous avez vu là-bas, ce qui vous a plu (ben oui, ce ne sont pas des machines, ils aiment qu’on leur parle comme à des êtres humains), et posez votre question. En quelques heures, quelques jours, vous recevrez des informations très utiles, des liens vers des sites et d’autres utilisateurs ; souvent on vous demandera des précisions sur votre expérience, ce qui vous permettra alors d’enrichir les connaissances du réseau.

Le courrier électronique vous permettra d’obtenir souvent des informations plus précises, plus de commentaires, et plus de chaleur humaine...

Muni de ces outils, passons maintenant à un exemple pratique.

 
 
ARNO*
Imprimer
format impression

Vainqueur 1982 du concours « Chateau de sable » du Club Mickey des Pingouins à Sainte-Cécile.

28 septembre 2003
 
SPIP
Web indépendant


> Les outils
2 mai 2005, message de ak47-elendil
 

desolé si je me plante d’endroit pour signaler ça mais une petite faute d’orthographe (ou mieux une simple coquille)s’est vicieusement glissée dans le texte.
Au titre "courier electronique" il vaudrait mieux lire "courrier electronique"... ;)

Répondre


> 2. Les outils
9 mai 2003, message de Banzaï
 

Mais pourquoi ce genre de[’in] formation n’est-il pas fourni en standard quand on "saute le pas" vers Internet (bonjour les providers - pardon les fournisseurs d’accès ;-) !)

Au lieu de nous livrer brut de fonderie l’accès à la toile, ils feraient mieux de nous donner un mode d’emploi même succint non ?

En tout cas, ces articles sont particulièrement bien écrits et hyper pratiques.

Répondre