numéro soixante-sept ( #67 ) le mercredi 12 février 2003
Sommaire
Éditorial

Une actualité bien chargée...

Suite aux conseils judicieux de certains d'entre vous, Enfin.com est en train de subir un "lifting" majeur. Non, non, je vous rassure, Enfin va rester le « guide des outils de recherche francophones », mais il n'en reste pas moins qu'il va y avoir un bouleversement important aussi bien dans la forme, que dans le contenu et la manière d'appréhender l'information. Normalement, le nouvel Enfin.com devrait sortir avant le prochain numéro de MoteurZine... mais, attention, c'est juste normalement.

David, le responsable de la chronique sur les "métamoteurs", est l'heureux propriétaire d'un moteur de recherche développé maison, Apocalx Now, avec plus de 1 million de pages dans la base. Comme vous vous en doutez, l'entretien, le développement d'un tel moteur demande du temps, il n'a donc plus la possibilité de s'occuper de cette chronique sur les métamoteurs. Donc, si l'un d'entre vous est interessé par reprendre cette chronique paraissant un numéro sur deux, qu'il ou elle me contacte de suite... la prochaine parution est dans moins de 10 jours.

Bonne lecture à toutes et tous,

par CHRis HÉDÉ

Le monde selon Google

Faire des recherches sur Google : recherches spécialisées

Après les bases de la recherche sur Google, les premières recherches avancées et les opérateurs de recherche spécialisée, voici l'utilisation d'opérateurs pour modifier des recherches standard :

Recherche dans un site donné
Pour limiter la recherche à un site donné, tapez vos mots à chercher puis l'opérateur "site:" suivi du nom de domaine du site.
Exemple : recherche avancee site:www.google.fr
=> recherche les pages contenant les mots "recherche" et "avancee" situées sur le site www.google.fr
Remarques :

  • S'il y a un mot présent sur toutes les pages d'un site (son nom par exemple), ceci permet de connaître le nombre de pages indexées du site.
  • S'il n'y a pas de mot présent sur toutes les pages, on peut chercher par exclusion... Exemple : -itjgfuhruhfe site:www.google.fr (cherche toutes les pages du site www.google.fr ne contenant pas le terme "itjgfuhruhfe"

Recherche dans le titre exclusivement
Pour limiter la recherche aux mots du titre des documents, tapez l'opérateur allintitle: suivi (avec espace) de vos mots à chercher. Seul le titre des documents est utilisé pour cette recherche.
Exemple : allintitle: google recherche
=> recherche les pages contenant les mots "google" et "recherche" dans le titre.

Recherche dans le titre
Pour effectuer une recherche mixe entre le titre et le reste du document, tapez l'opérateur intitle: devant (sans espace) chaque mot à chercher dans le titre. Les autres mots seront cherchés partout dans le document.
Exemple : intitle:google recherche
=> recherche les pages contenant le mot "google" dans le titre et le mot "recherche" n'importe où dans le document (y compris dans le titre).

Recherche dans l'URL exclusivement
Pour limiter la recherche aux mots de l'URL des documents, tapez l'opérateur allinurl: suivi (avec espace) de vos mots à chercher. Seule l'URL des documents est utilisée pour cette recherche. L'ordre des mots ne peut pas être imposé ; on ne peut pas non plus faire une recherche comme "allinurl: google/recherche" pour chercher les documents ayant un répertoire "google" contenant un fichier ou un sous-répertoire commençant par "recherche".
Exemple : allinurl: google recherche
=> recherche les pages contenant les mots "google" et "recherche" dans l'URL.

Recherche dans l'URL
Pour effectuer une recherche mixe entre l'URL et le reste du document, tapez l'opérateur inurl: devant (sans espace) chaque mot à chercher dans l'URL. Les autres mots seront cherchés partout dans le document.
Exemple : inurl: google recherche
=> recherche les pages contenant le mot "google" dans l'URL et le mot "recherche" n'importe où dans le document (ou même dans l'URL).

par Olivier DUFFEZ de WebRankInfo

Espace publicitaire
Développez votre indice de popularité...
  • pour 0 euros en passant 3 jours à référencer votre site dans les 150 outils généralistes d'Enfin (ICI!).
  • pour 55 euros en passant 5 minutes en commandant un référencement dans les 150 outils généralistes d'Enfin (LA!).
- votre publicité lue par 15.000 personnes ! -
La page des moteurs et métamoteurs

Les moteurs - 5%

Derrière cette valeur bien ridicule se cache une réalité bien étonnante.

En effet, ce chiffre annoncé sur un forum anglophone concerne le pourcentage réel d'indexation des moteurs de recherche par rapport au nombre de pages disponibles sur le Web. Même Google et ses 3.000.000.000 de pages mondiales ne dispose pas de l'exhaustivité tant prétendue. Il faut maintenant s'interroger sur la manière dont les moteurs de recherche trouvent les nouvelles pages.

Reprenons l'exemple DeepIndex (tant qu'à faire)... ;-)

La plupart des webmasters soumettent leur site sur les moteurs. Pourtant, ce n'est pas en recevant des centaines de soumissions par jour voire des milliers que DeepIndex ou Google peuvent couvrir tous les thèmes et sujets de l'Internet francophone voire européen (pour DeepIndex) ou mondial (pour Google). En fait une veille est réalisée sur des sites un peu particuliers et souvent "oubliés" par le référencement. Ce sont les "petits" annuaires. Ces "petits" annuaires sont pourtant de vraies mines d'or, s'ils sont correctement tenus et s'ils sont un tant soit peu "professionnels".

Mais que vaut le "petit" annuaire du coin face à un Y..... ou à un V.... ? Les "petits" annuaires, quelque soit leur thématique, sont peut-être moins selectifs et moins importants en terme de trafic, mais ils sont certainement moins chers lorsqu'ils sont payants. Ces désavantages par rapport aux "gros" sont aussi des qualités car ces "petits" annuaires sont accessibles à tous. Les informations et les liens proposés traitent de sujets (ou de mots clés) que les gros ne couvrent pas ou alors d'une façon non exhaustive. Pourquoi ? Tout simplement à cause de critères de sélection trop stricts se basant sur autre chose que la qualité du contenu.

Vous l'aurez certainement compris, je parle ici des "petits" annuaires comme Poossin, Cyber-annuaire et / ou les autres qu'il est possible de trouver dans un annuaire d'annuaires comme Enfin. Dans le millieu on parle aussi, souvent à tord, des liens FFA ("free for all") qu'il ne faut surtout pas confondre avec les "petits" annuaires.

Ces "petits" annuaires ont une importance non négligeable. Il est, aujourd'hui, absolument impensable qu'un webmaster, quelqu'il soit, néglige ce vivier. De même, il est également impensable que ces annuaires disparaissent, car dites le vous bien, l'exhaustivité passe aussi par eux.

Et si certains vous demandent quelques euro pour traiter votre inscription, il ne faut pas réagir en pensant forcement trafic. Dites-vous plutôt que ce lien supplémentaire peut vous apporter une indexation car les moteurs viennent enrichir leur base dans ces "petits" annuaires.

par Gilbert WAYENBORGH de DeepIndex

La chronique du Web invisible

Le web invisible : comment rechercher des bases de données

Après avoir évoqué le concept, intéressons nous maintenant à quelques outils qui permettent de rechercher sur le web invisible.

1. Les bases de données

Certaines bases de données sont partiellement indexées par les moteurs (ainsi Google indexe près d'1/3 des 700 000 pages de l'Internet Movie Database ) mais d'autres, protégées, ne le sont pas du tout. Reste à les identifier.

a. Les bases gratuites

Récemment modernisé, le site de l' URFIST (Unité Régionale de Formation et de Promotion pour l'Information Scientifique et Technique) de l'Université Lyon I propose une sélection de plus de 800 bases de données gratuites classées en 10 catégories : Généralités, Philosophie et psychologie, Religion, Sciences sociales, Langage, Sciences de la nature et mathématiques, Techniques (sciences appliquées), Arts, Littérature et rhétorique, Géographie et Histoire…

b. Les banques de donnés payantes

Parmi les plus importantes :
Thomson-Dialog
L'une des banques les plus volumineuses donne accès à plus de 700 bases de données sur l'intelligence Economique, la chimie, les marché et produits, le biomédical, la santé, la pharmacie, l'ingénierie et Technologies, l'environnement, les données gouvernementales ainsi que des annuaires d'entreprises et des informations financières...

Lexis Nexis
Lexis Nexis permet d'obtenir des informations personnalisées à travers la définition d'un profil de recherche concernant des acteurs, des marchés, des technologies ou des concurrents à partir de 35.000 sources (journaux, bdd, rapports, brevets etc.) indexées dans tous les domaines et pour de nombreux pays (plus de 90)
Lexis.com : archives juridiques
Nexis.com : archives de journaux
Lexis-Nexis Alert personal : revue de presse personnalisée par mail
Lexis-Nexis Professional : service de recherche multi-critère sur base de donnée.

Factiva
Issu de la fusion de Reuters Business Briefing et Dow Jones Interactive, Factiva rassemblent les dépêches de Dow Jones, de Reuters, le Wall Street Journal et plus de 8 000 autres publications du monde entier. Ces ressources permettent d'accéder à l'actualité, à des articles archivés et à des publications en langue locale (Les Echos, Le Monde, Le Figaro…), à des études de marchés, à des rapports d'analystes ainsi qu'aux cotations de bourse. Accès à 22 langues provenant de plus de 110 pays.

One Source
Une des plus grandes bases de donnée disponibles en ligne sur les entreprises et les secteurs d'activité. One source fournit des informations sur plus d'un million d'entreprises et leurs branches d'activité :
Rapport d'analystes, biographie des dirigeants, études de marchés, prévisions, cotations, statistiques sectorielles. Choix possible par nom de société, par secteur, code produit.
Parmi les produits disponibles :
- US Business Browser : 250 000 entreprises aux USA et Canada
- UK BB : 350 000 entreprises au Royaume Uni
- Global BB : 350 000 entreprises US + Monde
- European BB : 300 000 entreprises en Europe et 50 000 au Royaume Uni

Parmi les services :
- Company profiler : rapport sur historique, produit, concurrence, structure
- WatchListUpdate : suivi automatique de news et documents financiers
- Industry Profiler : Rapport sur marché, segmentation, tendances et prévision

Retrouvez la suite (Les moteurs spécialistes du web invisible) dans le prochain numéro de MoteurZine.

par Christophe ASSELIN de Intelligence-center.com

Espace publicitaire

- votre publicité lue par 15.000 personnes ! -
Enfin, les informations

Vous êtes le responsable d'un moteur ou d'un annuaire ? Vous travaillez dans le référencement ? Communiquez et insérez gratuitement votre actualité ici.

07/02/2003 : "Synomia: un moteur de recherche français en ASP"
« Un nouvel acteur français positionné sur le créneau des moteurs de recherche se dévoile. Lancée en juillet 2000, la société en question (Synomia), qui s'adosse à une enveloppe initiale de 2 millions d'euros d'investissement, naît de la rencontre entre un chercheur du CNRS et trois entrepreneurs en quête d'une technologie de recherche Web susceptible d'être implémentée sous forme de produit fini. »
07/02/2003 : "Lycos UK nomme une nouvelle société pour gérer sa publicité"
Lycos Angleterre vient de nommer A Vision pour gérer son budget publicitaire qui s'élève tout de même à 4 millions de livre sterling (3 millions d'euro ?????). Ce budget concerne uniquement le marché anglais et l'objectif fixé à A Vision est d'augmenter le nombre de visiteurs de 18 à 34 ans sur le portail Lycos Angleterre.
07/02/2003 : "Yahoo renforce son équipe commerciale"
Yahoo! vient de recruter deux personnes pour renforcer son équipe commerciale. Beth-Ann Eason, qui a travaillé entre autre chez DoubleClick Media et Ziff Davis Publishing, rejoint Yahoo! comme Vice-Présidente de la gestion des catégories et de la formation des forces de vente. Beth Lawrence, qui a travaillé chez America Online, DoubleClick entre autres, rejoint Yahoo! comme Vice-Présidente des ventes de l'Est.
07/02/2003 : "Qui est placé premier sur le terme "search engine" sur Google ?"
Voici, de nouveau, un résumé des quatre années de la vie de Google en commencant par sa naissance et en finissant avec les differents jeux existant autour de Google.
07/02/2003 : "Yahoo va mettre encore plus en avant les liens payants"
Yahoo! est en train de tester une nouvelle présentation pour sa page des résultats où les liens payants seraient mis beaucoup plus en avant. Cette nouvelle page permettrait à Yahoo! de générer plus de revenus et surtout va faire plaisir à son partenaire, Overture.
07/02/2003 : "Sharelook, le retour en France"
En fin d'année 2002, Sharelook (annuaire généraliste à la Yahoo! de nationalité allemande) avait mis à jour son interface pour son pays d'origine, l'Allemagne. Aujourdhui, c'est au tour de Sharelook France de bénéficier de ce rajeunissement. Ce nouveau design laisse toujours en avant l'annuaire, fait disparaître le bandeau publicitaire et surtout nous subjugue avec une couleur prédominante qui est l'orange.
07/02/2003 : "Looksmart change sa charte graphique"
Looksmart devait être fatigué de son design d'un jaune douteux (que vous pouvez encore voir sur la version française du site Looksmart) et propose désormais une mise en page beaucoup plus épurée, beaucoup plus dynamique avec, pour la première fois, la mise en avant de Zeal.
06/02/2003 : "Des liens entre votre hébergement et votre référencement ?"
Le fait de changer de serveur peut-il nuire à votre positionnement auprès des moteurs de recherche ? C'est une question que beaucoup de référenceurs amateurs ou professionnels se posent régulièrement.
06/02/2003 : "Les résultats de Findwhat explose pour le 4ème trismestre de 2002"
Findwhat, le concurrent direct à Overture sur le marché américain, a réalisé un excellent 4ème trimestre 2002. Les résultats sont 15 fois plus importants que prévus.
06/02/2003 : "Terra Lycos se sépare encore d'une partie de son personnel américain"
Terra Lycos (société espagnole) a décidé de licencier une partie de son personnel américain, soit 147 personnes sur les 649 employés (à peu près 20%). Après cette annonce, l'action Terra Lycos a augmenté de 3,4%.
05/02/2003 : "Une option originale proposée par AllTheWeb"
Grâce au "Keyword Search", vous pouvez taper directement votre requête, précedée par atw, dans votre barre de tâche.
05/02/2003 : "Kvasir : moteur de recherche numéro 1 en Norvège"
La Norvège a une population sur Internet de 2,7 millions d'habitants, soit 60% de la population totale. Kvasir a comptabilisé 347 millions de requêtes pour l'année 2002, soit une moyenne de 128 requêtes par an et par habitant.
04/02/2003 : "Ask Jeeves, après tous les excès, les restrictions et la réussite"
A l'époque de la folie de l'Internet, Ask Jeeves y a contribué en faisant mettre, par exemple, des autocollants publicitaires sur des pommes et bananes. Aujourd'hui, après être passé de 850 à 347 employés, Ask Jeeves est une société financièrement stable. Le rachat de Téoma pour 4,5 millions de dollars a permis à Ask Jeeves de se positionner comme un challenger de Google et les 25% de part de marché le confirme.
04/02/2003 : "Hotbot, un outil de recherche qui ne vit que sur sa gloire passée"
En 1997, Hotbot était un élément incontournable du net international. Il a pendant plusieurs années fait parti du top 10 des principaux outils de recherche. Aujourd'hui, Hotbot n'est plus qu'un fantôme de ce qu'il était avant. La chute a débuté en 1999 quand Lycos et son "va chercher" a racheté Hotbot.
04/02/2003 : "Un nouvel outil de recherche anglais au paiement par clic"
Un nouvel outil de recherche anglais vient de voir le jour. Cet outil est produit par Thomson Directories et s'appelle WebFinder.com. Il est destiné aux personnes et sociétés désirant utiliser le PPC (paiement par clic) pour se faire connaître. AltaVista, Freeserve et Streetmap reprendraient déjà le contenu de cet outil.
04/02/2003 : "Sortie de Google search 1.2"
Google search est une extension qui permet de chercher dans la base de données de Google à partir de l'interface de Webmin. Pour ceux qui ne le savent pas, Webmin est l'outil majoritairement utilisé pour la gestion de serveurs Internet sous Linux. Un outil à destination des techniciens de l'Internet.
03/02/2003 : "Deuxième mois de baisse pour Google"
« Avec -0,63% ce mois, Google affiche pour le deuxième mois consécutif une baisse de trafic. Difficile de ne pas tenir pour responsable direct de ce décrochage l'annuaire qui (re)monte, Yahoo!, qui affiche +0,85% ce mois réduisant encore son écart sur Google qui reste toujours largement en tête du peloton.
Si le réveil de Yahoo! ne fait pas de doute, on peut se demander si Google aura les ressources nécessaires pour repartir à la hausse. Facteur déterminant, l'épée de damoclès représenté par Inktomi si Yahoo! le choisit en lieu et place de Google. Cela réprésentant encore une perte en notoriété pour le moteur leader. Rendez-vous est pris pour une réponse possible aux alentours du mois de mars. »
03/02/2003 : "Antidot distinguée par deux fois"
« L'innovation technologique et l'originalité de la solution AFS (Antidot Finder Suite) ont permis à Antidot d'être nominée pour l'European IST Prize 2003 et de recevoir la qualification "Entreprise Innovante" (Label FCPI) décernée par l'Agence Nationale de Valorisation de la Recherche (ANVAR). »
03/02/2003 : "Apocalx Now : 1 012 802 pages dans la base"
Apocalx Now, le moteur de recherche du site spécialisé dans la recherche et plus particulièrement célèbre par son métamoteur, vient de dépasser la barre du million de pages dans la base. Souhaitons donc la bienvenue au club des millions à Apocalx et rendez-vous au club des milliards (beaucoup plus petit, je vous rassure).
02/02/2003 : "Les mots-clés sponsorisés, champions de la mémorisation des publicités"
« Chaque année, DoubleClick publie un rapport tiré de ses activités d'Ad Serving avec son outil DART et fournit ainsi au marché de nombreux indicateurs concernant l'évolution de la publicité en ligne. Les données récoltées sont basées sur plus de 630 millions de publicités délivrées par DoubleClick pour le compte de plusieurs milliers de clients. Sur l'année 2002, on observe une forte hausse du taux de mémorisation des campagnes, qui passe de 0,36 % au premier trimestre à 0,53 % au quatrième trimestre. Cela représente une hausse de 47 %. Dans le même temps, DoubleClick constate l'emprise croissante des mots-clés et du contenu dans le système de ciblage des campagnes publicitaires. Dans plus de 80 % des cas, le ciblage est fait par mots-clés, loin devant un ciblage géographique (12 %). »
01/02/2003 : "Yahoo et Inktomi vont-ils freiner l'ascension de Google ?"
« NetBooster et Weborama tablent sur une éventuelle bataille entre Google et son partenaire cette année, suite au rachat d'Inktomi par Yahoo le mois dernier. »
30/01/2003 : "Yahoo! allume sa webradio musicale payante"
« Après avoir réglé mardi dernier le contentieux entre sa filiale LaunchCast (webradio gratuite) et Sony Music pour violation de copyright, Yahoo a dévoilé hier son tout nouveau service de webradio payante : LaunchCast Plus. Pour 3,99 dollars par mois ou 35,99 dollars par an, les abonnés auront accès à des douzaines de radios musicales non commerciales, dont une cinquantaine de stations thématiques (classique, country, jazz, etc.). »
30/01/2003 : "Arisem se renforce dans le KM avec MS et Business Interactif"
« Arisem, éditeur français spécialisé dans la gestion des connaissances, propose une solution globale de KM avec le soutien de Business Interactif et Microsoft. »
30/01/2003 : "Dell et FAST search & transfer, une longue histoire d'amour"
Dell communique autour de son partenariat avec FAST search & transfer et le fait que ses serveurs sont utilisés depuis le début par FAST. Alltheweb est passé de 80 millions de pages en 1999 pour atteindre 2,1 milliards, aujourd'hui. Tous les serveurs de FAST, plus de 1000, sont des serveurs PowerEdge et l'espace disque, plus de 200 TB, est fourni par des PowerVault.
Les outils de recherche francophones
08 Fevrier 2003 :
TOP | sexe | adulte
    E-sexe.ch : Annuaire adulte avec de nombreuses catégories, une topliste des meilleurs sites de qualité.

07 Fevrier 2003 :
TOP | internet | guide généraliste | f
    Fouille : Annuaire francophone.

TOP | art et culture | encyclopédie
    Wanadoo Encyclopédie : Encyclopédie Hachette avec Wanadoo.

TOP | commerce et économie | les entreprises
    Space business : Le portail des entreprises.

06 Fevrier 2003 :
TOP | régional | europe | france | rhône alpes | grenoble
    City38 : Enfin un portail pour les grenoblois, annuaire, cinéma, logement, bons plans...

05 Fevrier 2003 :
TOP | méta-moteurs
    Cyberneto : Meta-Moteur : Cyberneto

04 Fevrier 2003 :
TOP | technologie | referencement | prest. referencement
    Synodiance : Synodiance est une société de conseil spécialisée dans la conception, le déploiement et l'optimisation des stratégies de communication on-line.

TOP | commerce et économie | marketing
    01expo.net : Annuaire pour particuliers et professionnels sur les foires, expositions, salons, congrés...

01 Fevrier 2003 :
TOP | technologie | referencement | prest. referencement
    Brioude Internet Référencement : Prestataire spécialisé en référencement suivi de positionement et trafic généré par les outils de recherche.

TOP | sexe | rencontre | rencontrez-vous
    Africa vip : Rencontre réservée aux échanges entre l'Europe, l'Afrique, l'Ile de la Reunion, la Polynesie et les Antilles .

30 Janvier 2003 :
TOP | régional | europe | france | pays de loire
    Info La Baule .com : Le portail de la Baule, Guérande et leur région.

TOP | art et culture | audiovisuel | télévision
    Annuaire de Séries Max : Séries Max, un magazine et un annuaire de sites liés aux séries.

Espace publicitaire
refgratuit.com
- votre publicité lue par 15.000 personnes ! -
Entretien avec...
http://www.openfind.com/
Sun Wu, fondateur de Openfind

ATTENTION, cet interview est une traduction de l'américain sachant que ce n'est pas notre langue d'origine à lui comme à moi. Il est donc possible que je ne traduise pas littéralement les paroles de Sun Wu mais j'essaye de m'adapter au mieux à l'esprit de ses réponses !

«Moteurzine». -- Bonjour. Tout d'abord, est-ce que vous pouvez vous présenter à nos lecteurs ?

Sun Wu. -- Je m'appelle Sun Wu. Je suis Professeur Associé en Informatique à l'Université Nationale Chung-Cheng à Taiwan.

J'ai créé Openfind en 1998 et depuis, je travaille comme consultant pour Openfind.

«Moteurzine». -- Vous avez travaillé sur Glimpse, la technologie de moteur de recherche. Vous pouvez nous en dire plus sur votre contribution ?

Sun Wu. -- Ce que j'ai fait sur Glimpse, c'est une extension d'un précédent travail sur un outil d'approximation de champs ("an approximate pattern matching tool") s'appelant "agrep". C'était une partie de mon travail de ma thèse. J'ai implanté cet élément dans Glimpse en 1993.

«Moteurzine». -- Vous pouvez nous raconter comment tout a commencé avec Openfind ?

Sun Wu. -- Depuis 1994, je travaille sur un projet s'appellant "GAIS" (qui signifie Global Area Information Search|Service) qui est devenu en 1996 le premier moteur de recherche de langue chinoise (le moteur a été lancé fin 1995).

En 1997, des investisseurs m'ont encouragé à créer une société. Ayant pour objectif de mettre en place un moteur qui ait un bon accueil et un certain succès, je me suis lancé dans cette aventure (Il est important de noter que le projet GAIS a débuté sans aucun fond, le laboratoire n'avait même pas ses propres serveurs. :-( A cause de cette absence de ressources en serveur et bande passante, je n'ai pas été capable de construire, alors, un important moteur de recherche.).

Openfind a été créé officiellement en janvier 1998 avec la technologie développée au sein du laboratoire GAIS et avec un investissement d'environ 0,6 millions de dollars américains.

«Moteurzine». -- J'ai lu dans un communiqué de presse de Yahoo! qu'en 1998, Yahoo! Chine a intégré Openfind comme moteur de recherche. Aujourd'hui, c'est le rêve de beaucoup de moteurs de recherche de pouvoir être intégré dans Yahoo! et vous, vous l'avez réalisé en 1998. Comment ça s'est passé ?

Sun Wu. -- GAIS était déjà reconnu dans le milieu chinois à cette époque. Yahoo! a ouvert sa version chinoise en avril 1998. En mai 1998, Openfind était lancé officiellement. Le jour suivant le lancement du moteur de recherche Openfind, j'ai reçu un coup de téléphone de l'équipe de Yahoo!, qui connaissait bien GAIS, pour une prise de contact. Après plusieurs mois de négociation, nous avons commencé à coopérer.

Openfind était, en 1998, une petite structure sans aucune expérience. Il y avait 20 employés, la moitié était des ingénieurs et nous n'avions même pas une personne en charge du commercial et du marketing au commencement.

«Moteurzine». -- Aujourd'hui, Openfind est toujours en "béta test". Qu'est-ce qui manque pour qu'Openfind passe vers une version définitive ?

Sun Wu. -- Pour parler honnêtement, le projet est en quelque sorte en hibernation.

Nous sommes principalement 4 personnes à avoir travaillé sur ce projet depuis juillet 2001.

Après août 2003, nous allons être occupé avec nos contrats avec Yahoo! Taiwan et HongKong et un contrat avec YAM (le troisième plus grand portail à Taiwan). Ce sont deux gros marchés que nous avons gagné face à Google. Nous risquons donc de mettre de côté notre travail sur le moteur de recherche.

Le problème que nous avons, c'est le manque de personnel sur les projets liés au moteur de recherche, alors que l'activité principale d'Openfind est de proposer une solution professionnelle globale autour de la recherche et d'un système webmail.

Nous sommes en train de mettre en place une nouvelle société dédiée uniquement à la technologie des moteurs de recherche et sa commercialisation.

La version finale d'Openfind sera très différente de la version béta avec une nouvelle interface pour les utilisateurs et de nouveaux services comme la recherche d'images, de sons, d'actualités, de logiciels, etc.

J'espère que la version définitive sera en ligne pour juin 2003.

«Moteurzine». -- Quelle est l'architecture matériel d'Openfind ?

Sun Wu. -- Nous utilisons des PCs sous FreeBSD.

La plupart des machines que nous utilisons ont ces caractéristiques :
- CPU : PentiumIII 1G - 1,26G
- Memoire : 1G ou 2G
- Disque dur : WesternDigital 120G * 4

www.openfind.com
Copie écran de la page de garde du site Openfind

«Moteurzine». -- Et au niveau logiciel ?

Sun Wu. -- Tous les logiciels et toute la technologie que nous utilisons sont développés en interne sauf pour l'OS (FreeBSD).

«Moteurzine». -- Quels sont les moteurs de recherche que vous estimez être vos principaux concurrents ?

Sun Wu. -- Je dirais cela d'une autre manière :-)

Nous voulons être les concurrents de Google et FAST.

«Moteurzine». -- Pour tout le monde ou presque, le moteur de recherche numéro 1 est Google. Comment l'expliquez-vous ?

Sun Wu. -- Personnellement, je respecte beaucoup Google.

Leur interface utilisateur est clair et leur service de recherche est fabuleux.

«Moteurzine». -- Fast et Google font une sorte de course autour du nombre de pages qu'ils ont dans leur base. Openfind est, depuis pas mal de temps, en tête avec 3,5 milliards de pages. Mais, ce nombre n'ayant pas évolué depuis plusieurs mois, Google n'est plus très loin avec ses 3 milliards de pages. Combien en avez-vous réellement aujourd'hui ? Pensez-vous être capable d'atteindre les 5 milliards de pages et quand ?

Sun Wu. -- Nous n'allons pas mettre à jour notre base de données avant le prochain lancement d'Openfind. Il y a donc beaucoup de chance que notre base contienne des pages vides.

C'est possible d'atteindre les 5 milliards de pages si nous possédons les ressources nécessaires (bande passante et serveurs). Pour maintenir un moteur de recherche avec une base très importante cela coûte énormément cher au niveau de la bande passante car il faut "crawler" (visiter) tout le web.

Nous sommes en train de créer une nouvelle société pour être capable de gérer ce genre de ressources nécessaire pour ce type de moteur.

«Moteurzine». -- Connaissez-vous plus ou moins le pourcentage de pages pour chaque langue ?

Sun Wu. -- Je peux me rappeler uniquement le pourcentage approximatif pour les principales langues :

anglais : 55%
russe : 7%
allemand : 6%
chinois : 5%
japonais : 5%
français : 3%
espagnol : 3%

«Moteurzine». -- Pensez-vous proposer Openfind dans différentes langues avec une interface locale pour chaque pays ?

Sun Wu. -- Oui, nous comptons, graduellement, construire une interface locale pour chaque pays.

«Moteurzine». -- Quels sont les éléments pris en compte pour le positionnement dans Openfind ? Lisez-vous les méta tags ?

Sun Wu. -- Oui, nous lisons les meta-tags.

Les éléments pris en compte pour le positionnement sont :
1. les éléments externes basés sur les liens entre les pages web, sur le texte de l'URL, la taille, le temps, etc.

2. les éléments internes basés sur le degré de concordance entre une requête et la page web. L'élément de concordance prendra en compte l'occurence de la forme de la requête, sa position, etc.

«Moteurzine». -- Vous pouvez nous dire ce qu'un webmaster doit faire ou ne pas faire pour être bien positionné sur Openfind ?

Sun Wu. -- 1. Un site avec une bonne syntaxe et un contenu d'une bonne longueur sera mieux positionné.

2. Openfind va vérifier les spams et les sites qui utilisent des artifices comme beaucoup de liens artificiels seront probablement filtrés (certains sites utilisent beaucoup de domaines différents pour le même site et mettent des liens entre ces pseudo sites pour augmenter leur nombre de liens et donc augmenter leur positionnement).

«Moteurzine». -- Vous avez développé une technologie spécifique pour Openfind qui s'appelle PolyRank. Vous pouvez nous en dire plus dessus ?

Sun Wu. -- PolyRank a deux sens :

1. Cela désigne que le positionement est basé sur des critères de position,

2. PolyRank, quand ce sera complètement achevé, permettra aux utilisateurs d'ajuster leurs critères de positionnement par eux même.C'est à dire que les utilisateurs pourront contrôler et maîtriser les effets du positionnement d'une façon plus personnelle.

«Moteurzine». -- Comptez-vous garder la soumission à votre moteur de recherche gratuite, ou faire comme plusieurs outils et devenir payant ?

Sun Wu. -- Oui, nous comptons garder une soumission gratuite pour Openfind.

«Moteurzine». -- Plusieurs portails et moteurs de recherche proposent des résultats avec des "liens sponsorisés". Qu'en pensez-vous ? Est-ce que vous pensez intégrer ce genre de résultats sur Openfind ?

Sun Wu. -- Nous n'avons pas de projets à ce niveau là, actuellement.

«Moteurzine». -- Bien que vous soyez toujours en béta version, connaissez-vous votre trafic quotidien ?

Sun Wu. -- Ca fait très longtemps que je n'ai pas regardé les chiffres. Je ne connais donc pas le trafic que nous pouvons avoir maintenant.

«Moteurzine». -- Comment voyez-vous l'évolution des outils de recherche dans les mois à venir ?

Sun Wu. -- Beaucoup plus de services (plus de formats) seront couverts et offerts par les moteurs de recherche. Ils vont devenir de plus en plus intelligents puisque la technologie évolue. (telle qu'une classification automatique, la clusterisation des résultats, des techniques de réponses des requêtes, etc).

«Moteurzine». -- Comment voyez-vous le futur pour Openfind ? Allez-vous être capable de faire concurrence aux moteurs de recherche majeurs ?

Sun Wu. -- Ce n'est pas sûr.

Si j'ai la possibilité d'avoir assez de ressources à investir, il y a de bonnes chances.

«Moteurzine». -- Quel moteur de recherche utilisez-vous ? Si vous pouvez construire le moteur de recherche parfait, comment serait-il ?

Sun Wu. -- J'utilise Openfind et Google.

Le moteur parfait serait :
- plus intelligent et proposerait un mode plus interactif,
- plus organisé,
- plus facile à controler et personnaliser.

«Moteurzine». -- Pour finir, une question plus personnelle. Quel est votre site préféré et pourquoi ?

Sun Wu. -- Honnêtement, je n'ai pas de site préféré. La plupart du temps, sur Internet, je le passe à lire et gérer mes e-mails.

Le système de mail que j'utilise est mail2000.com.tw qui est un autre produit majeur d'Openfind.

«Moteurzine». -- Sun Wu, merci beaucoup pour avoir trouvé le temps de répondre à toutes ces questions.

Sun Wu. -- Merci.

Conclusion

ATTENTION
La liste des abonnés n'est pas disponible. Nous ne la donnons ni ne la revendons à personne. En revanche, vous pouvez sponsoriser notre lettre d'information : contactez-nous pour discuter des modalités.

 
 

Abonnement gratuit à « Moteurzine »


 
 
 
 
 

Désinscription de « Moteurzine »


 
 

 

les crédits
Chronique sur « Google »   Olivier DUFFEZ de WebRankInfo
Chronique sur les moteurs   Gilbert WAYENBORGH de DeepIndex
Chronique sur le Web invisible   Christophe ASSELIN de Intelligence-center.com
Infodesign   Max, le talentueux !
Le reste (mise en page, édito, actualités, les nouveautés et l'interview)   CHRis HÉDÉ de MoteurZine / Enfin
 
© 1999 à 2003 par IDF.net