Rappelons le but de notre recherche : l’acteur Toto. Admettons que nous n’en savons pas plus.
Comme nous l’avons déjà signalé, « Toto » fait partie de ces mots qui ont tellement de sens différents qu’il est particulièrement important de déterminer le contexte. C’est le nom du loto allemand, un group de rock, un diminutif commun, la victime des blagues françaises...
Dans Google, « Toto » correspond à 371 000 pages. Ca n’est donc pas par là qu’il faut commencer.
Une base spécialisée
Sachant qu’il s’agit d’un acteur, que nous préparons une soirée télé, un petit tour par Internet Movie Database va permettre de se faire une première idée.
Dans l’interface de recherche, indiquons « toto », et sélectionnons le critère « people » (les personnes). On obtient un liste de 20 acteurs (fichtre !). Un seul correspond à notre recheche : « Totò », sans nom de famille. Nous obtenons donc la filmographie du bonhomme.
De nombreuses infos permettent de situer le contexte. C’est un acteur italien, de Naples, il est acteur et compositeur, de petites biographies donnent quelques renseignements supplémentaires ; et son vrai nom est « Antonio de Curtis ».
On pourra bien entendu continuer les recherches sur d’autres sites spécialisés dans le cinéma.
Utiliser les répertoires
Passons aux répertoires. On peut commencer par là, mais pour notre exemple, l’utilisation d’IMdB était évidente.
« Toto » dans Yahoo.fr et Nomade ne donne rien. Seulement des pages de blagues et sur le groupe de rock. Normal : l’acteur est presque inconnu en France, personne ne semble lui avoir consacré un site complet en français.
Puisqu’on cause anglais, un petit tour par Yahoo.com. Là, beaucoup plus de réponses, mais le même problème : pas grand chose qui ressemble à ce qu’on cherche. Cependant, dans la longue liste, on trouve un site lié au cinéma, « Toto cinema matters » ; malheureusement ce sont des critiques de films en général, rien à voir. Et dans « Actors and actresses », un Toto, « acteur napolitain et artiste également connu sous le nom d’Antonio de Curtis » ; les infos récupérées dans IMdB nous permettent de voir qu’il s’agit exactement de ce qu’on cherche. Bingo !
Problème, la page est entièrement en italien. Gardons la tout de même sous le coude, elle pourra servir par la suite.
Revenons à nos répertoires. Puisque Toto est italien, essayons Yahoo Italie. Là, on trouve carrément une rubrique complète « Attori e attrici : De Curtis, Antoni (Totò) ». Quatre liens : un est obsolète, les trois autres en italien.
Même sans comprendre l’italien, les quatre sites déjà trouvés contiennent des informations exploitables. Plus de précisions : Toto n’est pas qu’acteur, il est aussi auteur de théatre, poète, prince ; on peut sur certains sites trouver une foule de photographies et des extraits de films. C’est pas mal pour un début... (Et si on parle italien, on peut s’arrêter là.)
En revanche, ces sites ne contiennent pas de listes de liens exploitables où l’on aurait pu trouver des sites dans des langues que l’on comprend. Cul de sac...
Les robots
Désormais, nous avons des informations sur le contexte. Toto, Antonio de Curtis, acteur italien, napolitain, poète, homme de théatre... autant d’éléments que l’on peut exploiter dans un robot (crawler).
Dans Google, la recherche « toto de curtis » donne beaucoup de réponses, mais la plupart en italien. Limitons la recherche au français : le bide ! En anglais, 2 340 réponses, et la plupart semblent correspondre à notre homme.
Très bien... Voilà déjà de quoi s’informer.
...et trouver d’autres informations permettant d’affiner la recherche. Pour une soirée-télé, les informations que l’on trouve ainsi sont bien plus que suffisantes.
Plus loin...
Et maintenant, comment en savoir plus ? Comment trouver des films de Toto en version originale sous-titrée, est-il très connu en Italie ou seulement par quelques fans loufoques ? A-t-il tourné en France ; si oui avec qui ?
Autant de réponses auxquelles on trouvera facilement des réponses, maintenant que l’on connait bien le contexte.
Sans oublier, surtout : le courrier électronique. Pour des questions précises, on peut écrire sans hésiter aux webmestres des sites ; un petit courrier aux webmestres italiens, même en anglais, a quelques chances de donner d’excellents résultats.
La recherche sert, comme nous l’avons vu, non seulement à trouver l’information intéressante pour elle-même, mais aussi comme étape permettant d’effectuer de nouvelles recherches plus précises, chaque nouveau détail étant une étape vers une nouvelle recherche. On commence avec « Totò » dans une base de cinéma, « Totò » en Italie (Yahoo.it) puis, dans un robot, autant de requêtes que de sujets précis : « Toto de curtis », « Antonio de Curtis », « Toto Pasolini », « Toto Louis de Funes », « Toto maciste »...