Les Outils de Recherche sur Internet

I. Les outils de base

1. Les moteurs de recherche (search engines)

Avec ces outils, les recherches sont effectuées par des robots qui fouillent un maximum de pages, inventoriant les mots qui les composent.

Google : le moteur de recherche le plus populaire; 3 milliards de pages inventoriées début 2002.

AltaVista : Le site le plus visité au monde fin des années nonantes, et notamment en Europe, malgré son caractère anglo-saxon, mais aussi sans doute à cause de ses recherches par langue. L’un des moteurs de recherche les plus performant, traductions automatiques et choix de support (page web, image, vidéo, audio). Système de comparaison des prix pour sur sites visités. Régulièrement modifié et amélioré .

AltaVista Belgique , AltaVista International , AltaVista Canada : Versions belge, américaine et canadienne d’AltaVista.

AllTheWeb : un des moteurs de recherche les plus puissants, développé par des ingénieurs norvégiens de Trondheim ( Fast ), ayant travaillé 10 ans sur les algorithmes de recherche. Sobre, car trouvant son origine dans des recherches académiques. Ses recherches simples sont particulièrement aisées d’accès, ses critères de recherches personnalisées particulièrement fouillées.

UltraSeek , NorthernLight, Excite , Excite France, HotBot, Voilà, Voilà France , WebCrawler, InfoSeek, Lycos , Lycos France : Autres moteurs de recherche puissants.

AllTheWeb , AltaVista , Ecila ,Google , HotBot , Lokace , Lycos , Northernlight : Principales recherches avancées : la plupart des moteurs de recherche ont développé des versions plus détaillées de leurs outils, incluant des filtres divers, le choix de la langue, des recherches sur nom de domaine, des exclusions, etc.

LexiBot , InvisibleWeb : Moteurs de recherche de pages " invisibles " (peu référencées).

WiseNut , Teoma , Vivisimo : moteurs de recherche créant automatiquement des catégories.

 

2. Les index ou annuaires (directories)

Dans ces outils, les recherches sont effectuées par des documentalistes, qui classent hiérarchiquement les sites, et encodent des mot clés représentatifs. Ils donnent moins de résultats que les moteurs de recherches, mais ils sont généralement plus pertinents. Chez certains, une certaine tendance à insérer préférentiellement des sites commerciaux (rentabilité oblige). Par exemple, chez Yahoo !, pas de références aux traducteurs online gratuits. Et pourtant … (voir fin de ce document). Les index généralistes sont rares, ceux s’intéressant à des domaines particuliers innombrables.

Yahoo !, Yahoo ! France , AdValvas : Les meilleurs index en recherche internationales, France et Belgique. Nombreux autres services offerts.

ShareLook , ShareLook Belgique , ShareLook France , ShareLook Liège : ShareLook est un autre index généraliste, bien connu pour sa spécialisation géographique.

 

3. Les chercheurs de nom de domaine

Ces outils, pratiquement inconnus du grand public, permettent de faire une recherche sur une chaîne de caractères se trouvant dans les noms de domaines déposés. Par exemple, une recherche sur " LIEGE " sur NetCraft donne en Septembre 2000 plus de 800 références, telles que www.liege.be ou www.cyberliege.net. Mais elle donne également une série de références sur chene-liege, cafe-liegeois, Devlieger et autres Vliegende-Hollander. Pour une fois ici, une recherche exhaustive peut-être faite, puisqu’il s’agit d’une base de donnée complète et existante. Mais il peut arriver que les sites n’aient en fait pas encore été activés, le dépôt du nom étant bien entendu la première étape à effectuer avant de l’activer.

Pour les recherches sur NetCraft, taper simplement la chaîne de caractère à chercher. Le caractère " * " remplace tout caractère (rechercher par exemple " *liege*.be ", " *liege*holland* ou encore " liege.* ").

NetCraft : Très rapide, donnant les références pour sites à suffixes à 2 et 3 lettres, ainsi que les sous-domaines.

DomainAtlas : Uniquement les domaines géographiques (suffixe à deux lettres), mais ceux-ci sont indexés par pays. Permet notamment de voir qu’il existe un domaine Antarctique ! Moins rapide que le précédent.

 

4. Remarques à propos des outils de recherche

1.Il est rarement possible de différencier moteurs de recherche et index du premier coup d’œil. En effet, l’un comme l’autre ont en général l’ambition d’être des PORTAILS. A savoir donc une page de référence pour l’internaute, d’où il effectuera ses recherches, mais fournissant aussi un accès rapide vers un WebMail, des informations météo, boursières, Internet gratuit, des petites annonces, etc. Les moteurs de recherche se dotent donc généralement d’un index de petite taille (souvent à vocation commerciale), et les index affichent une case de recherche pour les mots clés encodés. De plus, ils indiquent rarement la nature de leurs systèmes de recherche. Seule une utilisation régulière permet de juger des capacités et de la nature de ces outils. Certains (tel LYCOS) visent ouvertement le sommet du classement sur ces deux outils.

2. Malgré une large diffusion (l'Index de la K.U.L., par exemple, adopte une classification proche),  la terminologie ici adoptée ne rencontre pas l'unanimité. Le guide "Internet pour les nuls" par exemple, désigne un outil manuellement construit tel que YAHOO ! sous le vocable de "Répertoire", et un outil tel qu'ALTAVISTA, automatiquement construit, sous le terme d' "Index" (les chercheurs de chaînes de caractères sur noms de sites, tels NETCRAFT,  ne sont pas évoqués). Tous sont rassemblés sous le terme générique de "Moteurs de Recherche". De telles dénominations apparaissent impropres et sources d'erreurs. Le terme "Moteur de Recherche" évoque pour tout un chacun un mécanisme travaillant sans intervention humaine directe, excluant donc les outils tels que YAHOO !. Le terme plus général d' "Outils de Recherche" semble donc plus approprié. ALTAVISTA est un outil automatisé, ce qui s'oppose à l'acceptation courante du terme "Index" désignant un ensemble de termes de référence, choisis, regroupés, ordonnés, parfois repris à la fin d'un ouvrage auquels ils se réfèrent. Les résultats des outils automatiques ne sont pas donnés sur base d'un quelconque critère de pertinence, contrairement à ceux fournis par des outils manuellement construits. Le terme "Index" est mieux adapté à ces derniers (outils manuellement construits), en lieu et place de "Répertoire", le terme de "Moteur de Recherche" devant être réservé aux premiers (outils automatisés).

 

II. Les outils dérivés

1. Les index d’index / de moteurs de recherche

Ils réunissent un ensemble de références vers d’autres outils de recherche.

SearchEngineColossus : Plus d’un millier de moteurs mondiaux sont recensés sur Collossus : du Belize au Népal en passant par l’Islande (non exhaustif malgré tout). Classés par pays (voir même région) ou par thèmes (business, sport, éducation, etc.).

C.I.U.F. : Index de la Conférence Inter Universitaire Francophone de Belgique.

Index de la K.U.L. : en français.

Index de la Toile du Quebec : Index d’outils francophones.

SearchgateWay, IntraPorta : Index des traducteurs online (voir fin de guide). Nombreuses autres références linguistiques.

 

2. Les méta-moteurs online

Il s’agit ici de sites Internet. Ils qui se chargent de réunir les recherches issues de plusieurs moteurs de recherche / index.

MetaCrawler , SavvySearch : Les plus connus des méta moteurs.

IxQuick : Serait le plus puissant.

Ariane : Méta moteur spécialisé dans les outils francophones.

 

3. Les méta-moteurs offline

Il s’agit ici de programmes chargés sur le disque dur de l’ordinateur, et qui rassemblent les recherches issues de plusieurs sites de moteurs de recherche / index.

Copernic : Copernic est le plus connu, téléchargeable gratuitement à cette adresse.

 

4. Les aspirateurs de sites (ou navigateurs off line)

Programmes permettant de consulter des sites off line, en chargeant directement la page de garde d’un site et les pages subordonnées (à partir des hyper liens présents). Une fois les sites chargés, ils peuvent donc être consultés sans que l’ordinateur ne soit branché sur la ligne téléphonique (et donc économies d’autant). Possibilité de préciser le niveau de recherche (ex : 2 niveaux permet le téléchargement des pages dont l'adresse figure sur le page demandée, via les liens hypertextes, et ensuite le téléchargement des pages dont l'adresse figure sur les pages trouvées à l'issue du premier téléchargement; accroissement exponentiel, attention à l'engorgement !). Téléchargeables gratuitement aux adresses données.

ECatch , MemoWeb 

 

III. Les aides complémentaires

1. Les traducteurs automatiques

Les outils en langues étrangères vous posent problème ? Utilisez les traducteurs automatiques ! Inscrivez l’adresse de la page à l’emplacement indiqué, et cette page vous apparaîtra traduite. Les liens hypertextes par après activés seront également traduits. Vous pouvez également traduire un texte que vous y écrivez.

SysTranSoft , Voila France Traductions , VoyCabulary , Translate , Traductions Lycos, LingoLex , Babelfish / AltaVista / Digital , Free Translations , Reverso , Mendez , Fortune city : systèmes de traduction entre les principales langues européennes : anglais, russe, allemand, français, italien, espagnol, portugais, norvégien, ....

Systranet : offre les mêmes services et la même qualité que les sites ci-dessus, mais pour un plus grand nombre de langues (avec notamment traductions du français de / vers le néerlandais ou le grec), avec en plus ciblage de la traduction en sélectionnant des dictionnaires thématiques. Le tout moyennant une insciption personnalisée gratuite.

Translation-Experts , TranExp , : Et même plus encore (25 X 25 combinaisons, passant sans doute par l’anglais : dont le néerlandais, le croate, le gallois, le hongrois, l'islandais, …). Très approximatif.

Your Dictionary, TravLang : dictionnaires multilingue classique (mot par mot).

LiensUtiles : nombreuses ressources linguistiques.

 

2. Explications à propos des outils de recherche

Abondance : explications, comparatifs, listes d’outils de recherche, statistiques, actualités, le tout en français.

K.U.L. : explications en français et liste d'outils. Nombreuses références et liens.

 

3. Divers sites de logiciels utilitaires à télécharger

DownLoad , Tucows , ShareWares de Yahoo ! France

 

4. Remarques et autres outils

Et ne pas hésiter à m’envoyer un petit mail :