Les Outils de Recherche sur Internet
I. Les outils de base
1. Les moteurs de recherche (search engines)
Avec ces outils, les recherches sont effectuées par des robots qui fouillent un maximum de pages, inventoriant les mots qui les composent.
Google : le moteur de recherche le plus populaire; 3 milliards de pages inventoriées début 2002.
AltaVista : Le site le plus visité au monde fin des années nonantes, et notamment en Europe, malgré son caractère anglo-saxon, mais aussi sans doute à cause de ses recherches par langue. Lun des moteurs de recherche les plus performant, traductions automatiques et choix de support (page web, image, vidéo, audio). Système de comparaison des prix pour sur sites visités. Régulièrement modifié et amélioré .
AltaVista Belgique , AltaVista International , AltaVista Canada : Versions belge, américaine et canadienne dAltaVista.
AllTheWeb : un des moteurs de recherche les plus puissants, développé par des ingénieurs norvégiens de Trondheim ( Fast ), ayant travaillé 10 ans sur les algorithmes de recherche. Sobre, car trouvant son origine dans des recherches académiques. Ses recherches simples sont particulièrement aisées daccès, ses critères de recherches personnalisées particulièrement fouillées.
UltraSeek , NorthernLight, Excite , Excite France, HotBot, Voilà, Voilà France , WebCrawler, InfoSeek, Lycos , Lycos France : Autres moteurs de recherche puissants.
AllTheWeb , AltaVista , Ecila ,Google , HotBot , Lokace , Lycos , Northernlight : Principales recherches avancées : la plupart des moteurs de recherche ont développé des versions plus détaillées de leurs outils, incluant des filtres divers, le choix de la langue, des recherches sur nom de domaine, des exclusions, etc.
LexiBot , InvisibleWeb : Moteurs de recherche de pages " invisibles " (peu référencées).
WiseNut , Teoma , Vivisimo : moteurs de recherche créant automatiquement des catégories.
2. Les index ou annuaires (directories)
Dans ces outils, les recherches sont effectuées par des documentalistes, qui classent hiérarchiquement les sites, et encodent des mot clés représentatifs. Ils donnent moins de résultats que les moteurs de recherches, mais ils sont généralement plus pertinents. Chez certains, une certaine tendance à insérer préférentiellement des sites commerciaux (rentabilité oblige). Par exemple, chez Yahoo !, pas de références aux traducteurs online gratuits. Et pourtant (voir fin de ce document). Les index généralistes sont rares, ceux sintéressant à des domaines particuliers innombrables.
Yahoo !, Yahoo ! France , AdValvas : Les meilleurs index en recherche internationales, France et Belgique. Nombreux autres services offerts.
ShareLook , ShareLook Belgique , ShareLook France , ShareLook Liège : ShareLook est un autre index généraliste, bien connu pour sa spécialisation géographique.
3. Les chercheurs de nom de domaine
Ces outils, pratiquement inconnus du grand public, permettent de faire une recherche sur une chaîne de caractères se trouvant dans les noms de domaines déposés. Par exemple, une recherche sur " LIEGE " sur NetCraft donne en Septembre 2000 plus de 800 références, telles que www.liege.be ou www.cyberliege.net. Mais elle donne également une série de références sur chene-liege, cafe-liegeois, Devlieger et autres Vliegende-Hollander. Pour une fois ici, une recherche exhaustive peut-être faite, puisquil sagit dune base de donnée complète et existante. Mais il peut arriver que les sites naient en fait pas encore été activés, le dépôt du nom étant bien entendu la première étape à effectuer avant de lactiver.
Pour les recherches sur NetCraft, taper simplement la chaîne de caractère à chercher. Le caractère " * " remplace tout caractère (rechercher par exemple " *liege*.be ", " *liege*holland* ou encore " liege.* ").
NetCraft : Très rapide, donnant les références pour sites à suffixes à 2 et 3 lettres, ainsi que les sous-domaines.
DomainAtlas : Uniquement les domaines géographiques (suffixe à deux lettres), mais ceux-ci sont indexés par pays. Permet notamment de voir quil existe un domaine Antarctique ! Moins rapide que le précédent.
4. Remarques à propos des outils de recherche
1.Il est rarement possible de différencier moteurs de recherche et index du premier coup dil. En effet, lun comme lautre ont en général lambition dêtre des PORTAILS. A savoir donc une page de référence pour linternaute, doù il effectuera ses recherches, mais fournissant aussi un accès rapide vers un WebMail, des informations météo, boursières, Internet gratuit, des petites annonces, etc. Les moteurs de recherche se dotent donc généralement dun index de petite taille (souvent à vocation commerciale), et les index affichent une case de recherche pour les mots clés encodés. De plus, ils indiquent rarement la nature de leurs systèmes de recherche. Seule une utilisation régulière permet de juger des capacités et de la nature de ces outils. Certains (tel LYCOS) visent ouvertement le sommet du classement sur ces deux outils.
2. Malgré une large diffusion (l'Index de la K.U.L., par exemple, adopte une classification proche), la terminologie ici adoptée ne rencontre pas l'unanimité. Le guide "Internet pour les nuls" par exemple, désigne un outil manuellement construit tel que YAHOO ! sous le vocable de "Répertoire", et un outil tel qu'ALTAVISTA, automatiquement construit, sous le terme d' "Index" (les chercheurs de chaînes de caractères sur noms de sites, tels NETCRAFT, ne sont pas évoqués). Tous sont rassemblés sous le terme générique de "Moteurs de Recherche". De telles dénominations apparaissent impropres et sources d'erreurs. Le terme "Moteur de Recherche" évoque pour tout un chacun un mécanisme travaillant sans intervention humaine directe, excluant donc les outils tels que YAHOO !. Le terme plus général d' "Outils de Recherche" semble donc plus approprié. ALTAVISTA est un outil automatisé, ce qui s'oppose à l'acceptation courante du terme "Index" désignant un ensemble de termes de référence, choisis, regroupés, ordonnés, parfois repris à la fin d'un ouvrage auquels ils se réfèrent. Les résultats des outils automatiques ne sont pas donnés sur base d'un quelconque critère de pertinence, contrairement à ceux fournis par des outils manuellement construits. Le terme "Index" est mieux adapté à ces derniers (outils manuellement construits), en lieu et place de "Répertoire", le terme de "Moteur de Recherche" devant être réservé aux premiers (outils automatisés).
II. Les outils dérivés
1. Les index dindex / de moteurs de recherche
Ils réunissent un ensemble de références vers dautres outils de recherche.
SearchEngineColossus : Plus dun millier de moteurs mondiaux sont recensés sur Collossus : du Belize au Népal en passant par lIslande (non exhaustif malgré tout). Classés par pays (voir même région) ou par thèmes (business, sport, éducation, etc.).
C.I.U.F. : Index de la Conférence Inter Universitaire Francophone de Belgique.
Index de la K.U.L. : en français.
Index de la Toile du Quebec : Index doutils francophones.
SearchgateWay, IntraPorta : Index des traducteurs online (voir fin de guide). Nombreuses autres références linguistiques.
2. Les méta-moteurs online
Il sagit ici de sites Internet. Ils qui se chargent de réunir les recherches issues de plusieurs moteurs de recherche / index.
MetaCrawler , SavvySearch : Les plus connus des méta moteurs.
IxQuick : Serait le plus puissant.
Ariane : Méta moteur spécialisé dans les outils francophones.
3. Les méta-moteurs offline
Il sagit ici de programmes chargés sur le disque dur de lordinateur, et qui rassemblent les recherches issues de plusieurs sites de moteurs de recherche / index.
Copernic : Copernic est le plus connu, téléchargeable gratuitement à cette adresse.
4. Les aspirateurs de sites (ou navigateurs off line)
Programmes permettant de consulter des sites off line, en chargeant directement la page de garde dun site et les pages subordonnées (à partir des hyper liens présents). Une fois les sites chargés, ils peuvent donc être consultés sans que lordinateur ne soit branché sur la ligne téléphonique (et donc économies dautant). Possibilité de préciser le niveau de recherche (ex : 2 niveaux permet le téléchargement des pages dont l'adresse figure sur le page demandée, via les liens hypertextes, et ensuite le téléchargement des pages dont l'adresse figure sur les pages trouvées à l'issue du premier téléchargement; accroissement exponentiel, attention à l'engorgement !). Téléchargeables gratuitement aux adresses données.
III. Les aides complémentaires
1. Les traducteurs automatiques
SysTranSoft , Voila France Traductions , VoyCabulary , Translate , Traductions Lycos, LingoLex , Babelfish / AltaVista / Digital , Free Translations , Reverso , Mendez , Fortune city : systèmes de traduction entre les principales langues européennes : anglais, russe, allemand, français, italien, espagnol, portugais, norvégien, ....
Systranet : offre les mêmes services et la même qualité que les sites ci-dessus, mais pour un plus grand nombre de langues (avec notamment traductions du français de / vers le néerlandais ou le grec), avec en plus ciblage de la traduction en sélectionnant des dictionnaires thématiques. Le tout moyennant une insciption personnalisée gratuite.
Translation-Experts , TranExp , : Et même plus encore (25 X 25 combinaisons, passant sans doute par langlais : dont le néerlandais, le croate, le gallois, le hongrois, l'islandais, ). Très approximatif.
Your Dictionary, TravLang : dictionnaires multilingue classique (mot par mot).
LiensUtiles : nombreuses ressources linguistiques.
2. Explications à propos des outils de recherche
Abondance : explications, comparatifs, listes doutils de recherche, statistiques, actualités, le tout en français.
K.U.L. : explications en français et liste d'outils. Nombreuses références et liens.
3. Divers sites de logiciels utilitaires à télécharger
DownLoad , Tucows , ShareWares de Yahoo ! France
4. Remarques et autres outils
Et ne pas hésiter à menvoyer un petit mail : ![]()