numéro soixante-cinq ( #65 ) le jeudi 23 janvier 2003
Sommaire
Éditorial

Un superbe numéro...

Et oui, je suis d'une nature très modeste et je vais me contenter du terme "superbe" pour ce numéro. L'interview exclusif de Tim Mayer de FAST Search & Transfer et surtout cette nouvelle mise en page nous permettent de franchir une nouvelle étape, tout comme l'a été aussi le passage en html / pdf de MoteurZine. Max, merci pour la nouvelle charte graphique. Pour ceux qui veulent le contacter, n'hésitez pas.

J'en profite pour signaler que MoteurZine vient de dépasser les 15.000 abonnés.

Bonjour à tous les nouveaux !!


Au fait, avez-vous vu cet enfant ? Si elle ne vous évoque rien, n'hésitez pas à faire passer le mot.

Bonne lecture à toutes et tous,

par CHRis HÉDÉ

Le monde selon Google

Faire des recherches sur Google : recherche avancée

Après les bases de la recherche sur Google, voici les premières recherches avancées :

Exclusion de mots
Pour exclure un mot d'une recherche, faites-le précéder du signe "-".
Exemple : vente voiture -particulier
=> recherche les pages contenant les mots vente et voiture mais pas particulier

Recherche d'expression
Pour rechercher une expression, tapez plusieurs mots entre guillemets (doubles).
Exemple : "norme html 4.01"
=> recherche les pages contenant l'expression "norme html 4.01" (et non pas les pages contenant séparément les mots norme html et 4.01)

Recherche en fonction du type de document
Google n'indexe pas seulement les documents au format HTML mais aussi de nombreux autres formats (en général issus de logiciels de bureautique). Pour spécifier le type de document, utilisez l'opérateur filetype: suivi du code du type de document selon la nomenclature suivante :
Adobe Portable Document Format : pdf
Adobe PostScript : ps
Lotus 1-2-3 : wk1, wk2, wk3, wk4, wk5, wki, wks, wku
Lotus WordPro : lwp
MacWrite : mw
Microsoft Word : doc
Microsoft Excel : xls
Microsoft PowerPoint : ppt
Microsoft Works : wks, wps, wdb
Microsoft Write : wri
Rich Text Format : rtf
Texte : ans, txt

Vous pouvez aussi faire une recherche en excluant les document d'un certain type.
Ex: "norme html 4.01" -filetype:pdf
=> recherche les pages contenant l'expression "norme html 4.01" en excluant les documents PDF

Remarque : il semble que l'opérateur "ext" soit similaire à "filetype", mais il n'est pas documenté sur le site de Google.

Retrouvez la suite (utilisation d'opérateurs pour des recherches spécialisées) dans le prochain numéro de MoteurZine.

par Olivier DUFFEZ de WebRankInfo

Espace publicitaire
Développez votre indice de popularité...
  • pour 0 euros en passant 3 jours à référencer votre site dans les 150 outils généralistes d'Enfin (ICI!).
  • pour 55 euros en passant 5 minutes en commandant un référencement dans les 150 outils généralistes d'Enfin (LA!).
- votre publicité lue par 15.000 personnes ! -
La page des moteurs et métamoteurs

Les moteurs - Le blacklistage : mythe ou réalité ?

Sur les forums spécialisés, la question qui revient souvent est : « mon site est-il "blacklisté" ? »

Si certains ont reussi à trouver dans les moteurs de recherche des listes réelles ou irréelles de sites non indéxés, la presse a souvent tendance à crier tout de suite au "blacklistage". Mais quelle est la réalité ?

Tout le monde connait des méthodes plus ou moins secrètes pour pousser l'optimisation d'un site jusque dans ces derniers retranchements, y compris les moteurs et leurs hordes d'ingénieurs. Sans doute ces derniers n'auront jamais le dernier mot, tant les webmasters sont inventifs. Mais, comment font ces moteurs pour tenir des listes de sites à ne plus indexer ? Comment font-ils pour savoir analyser à la volée, de surcroit, un code html ? Enfin comment font-ils pour s'y retrouver dans leurs listes de sites qui empilées sur des feuilles de papier feraient une tour de 100 Km de haut ?

En fait, hormis le jonglage mathématique complexe et la multitude de cas, c'est l'algorithme qui se débrouille pour faire sortir un site avant un autre. Qu'est-ce que cela a avoir avec le "blacklistage" ? Rien !

Les 600 (chiffre non vérifié) ingénieurs de Google, ou le petit bonhomme que je suis, ne nous amusons pas à chercher si tel ou tel site fait du spamdexing. Nous laissons faire nos petites machines pour rechercher l'url qui fait du spamdexing, ou plutôt nous lui indiquons des filtres, et laissons la majorité du travail à l'algorithme de recherche. Mais alors, comment les moteurs tiennent-ils une "blackliste" ? A vrai dire, il n'y en a pas... enfin, pas vraiment.

Alors votre site a-t-il été "blacklisté" ? Ou ne serait-ce pas plutôt un autre problème que vous n'avez probablement pas remarqué ? Par exemple, le plantage de votre serveur pour cause de surcharge. Ou, vous avez oublié d'enlever votre robots.txt indiquant au moteur de ne pas visiter votre site ! Les raisons peuvent être diverses et variées et ce n'est pas forcement le résultat d'un "blacklistage" !

Le seul filtrage appliqué par les outils de recherche : la soumission de sites automatisée à grande échelle, à savoir une adresse email ou IP qui soumet toutes les minutes un site. Ceux qui recoivent ce genre de soumission savent de quoi je parle, c'est éprouvant. Les outils de recherche connaissent parfaitement bien ceux qui utilisent ce genre de procédé. A ma connaissance, c'est la seule véritable manière d'être "blacklistée". Le reste c'est un mythe, une légende...

Méfiez vous quand même... on ne sait jamais ce qui peut arriver demain !

par Gilbert WAYENBORGH de DeepIndex

(NB : être "blacklisté", c'est être mis sur une "liste noire")

Espace publicitaire

- votre publicité lue par 15.000 personnes ! -
Enfin, les informations

Vous êtes le responsable d'un moteur ou d'un annuaire ? Vous travaillez dans le référencement ? Communiquez et insérez gratuitement votre actualité ici.

19/01/2003 : "WebRankInfo -le royaume de Google- ouvre ses portes à DeepIndex"
« Ouverture d'un forum consacré à DeepIndex sur WebRankInfo. Ce forum est dédié aux discussions sur le moteur de recherche DeepIndex (inscription, indexation et optimisation, commentaires). Gilbert Wayenborgh, le responsable de DeepIndex, nous fait l'honneur de venir répondre à toutes les questions... profitez-en !
Une rubrique DeepIndex voit également le jour sur WebRankInfo, avec en particulier une FAQ déjà bien remplie... »
17/01/2003 : "Yahoo! : objectif Europe pour 2003"
Yahoo! a décidé que l'Europe allait être sa cible pour l'année 2003. En effet, Yahoo! compte proposer sur le marché européen une offre d'accès à Internet. Aux Etats-Unis, Yahoo! s'est allié avec SBC communications.
16/01/2003 : "FAST et Espotting signent ensemble pour contrer Google"
FAST (Alltheweb) vient de signer un accord avec Espotting pour contrer Google sur le marché européen. Les trois premiers résultats de FAST seront désormais des liens payants provenant d'Espotting. Sur le marché américain, FAST propose des liens payant provenant d'Overture. A la question « pourquoi avoir choisi Espotting » ? FAST répond qu'à ce jour Espotting est le meilleur en Europe. « Les autres n'ont pas une couverture suffisante !!! » déclare Stephen Baker.
16/01/2003 : "Yahoo bénéficiaire au quatrième trimestre"
« Yahoo a fait état d'un bénéfice au quatrième trimestre, alors qu'il était déficitaire un an auparavant, à la faveur d'une croissance du chiffre d'affaires tiré des abonnements. »
16/01/2003 : "Alexa et Dmoz : une nouvelle histoire commence"
Alexa vient de refaire sa page de garde avec un annuaire dessus : Dmoz. Alexa, c'est donc aujourd'hui Dmoz (pour l'annuaire) et Google (pour le moteur) plus sa propre technologie de ranking se basant sur sa "toolbar". Il est bon aussi de savoir qu'Alexa appartient à Amazon.
15/01/2003 : "Overture annonce pour le 4ème trimestre 2002 des résultats meilleurs que prévu"
Overture Services Inc. a annoncé lundi 13 janvier 2003 que les résultats du 4ème trimestre de l'année 2002 seront supérieur aux prévisions et ceci grace aux partenaires dont le volume et le trafic sont supérieurs à ce qui était prévu.
13/01/2003 : "Article sur le fichier .htaccess"
Cet article (écrit par Dan Hetzel) a pour but de vous faire découvrir le fichier .htaccess et son utilisation pour améliorer votre site web.
Ce simple fichier texte vous permet d'ajuster finement certains paramètres de votre serveur Apache tels que les redirections, les réécritures d'URL, les redirections et les restrictions d'accès. (...)
13/01/2003 : "Abondance lance son propre moteur de recherche"
Abondance (Olivier Andrieu) vient de lancer en partenariat avec Brioude Internet son propre moteur de recherche, Reacteur.com. Son objectif, faire un laboratoire pour aborder et développer de nouvelles idées et technologies. Le moteur de recherche utilise la base de données de Fast (Alltheweb, Lycos, Club-Internet, etc) avec, avant les résultats et d'une manière illimitée, les liens sponsorisés d'Espotting.
10/01/2003 : "Jill Whalen répond à des questions sur le référencement"
Une spécialiste américaine du référencement (SEO) répond à différentes questions de base concernant le référencement. Par exemple, "changer les méta-tags de mon site peut-il modifier ma position dans les moteurs ?", "j'ai une erreur quand je soumets mon site à Dmoz, pourquoi ?", etc, etc.
10/01/2003 : "Ask Jeeves se convertit au tout liens promotionnels"
« Annoncée en début de semaine, la suppression des bannières publicitaires sur le site américain Ask Jeeves a fait des remous jusqu'au Royaume-Uni. En effet, la version britannique de l'annuaire a décidé de ne pas aller dans le sens de sa maison-mère et de continuer à afficher des bandeaux sur son site. »
10/01/2003 : "Terra Lycos : petit bilan sur cette société présente sur de nombreux fronts"
Terra Lycos est la branche internet du géant espagnol des télécommunications : Telefonica. Terra Lycos est actuellement présent sur trois marchés bien définis qui sont la publicité en ligne, les services liés aux portails et l'accès à Internet et ceux-ci sont proposés en Europe, aux Etats-Unis et en Amérique latine. 60% des revenus de Terra Lycos viennent de la publicité et des services liés aux portails.
Les outils de recherche francophones
19 Janvier 2003 :
TOP | institutions | politique
    Anarchistes sur le web : Annuaire des sites web libertaires dans le monde. Portail international de l'anarchisme.

TOP | commerce et économie | annonces | véhicules
    1000annonces-auto.com : Site d'annonces gratuites dans les domaines de l'automobile, de la moto, des camping-cars, etc.

17 Janvier 2003 :
TOP | santé et spiritualité | bien-être
    Thalasso first : La thalassotherapie en France.

TOP | commerce et économie | les entreprises
    Welcome.li : Entreprises et institutions de la principauté du Liechtenstein.

TOP | loisirs et sports | animaux | chiens
    Pal3000 : Outil de recherche sur les chiens.

TOP | internet | guide généraliste | a
    Anegocier : Pour trouver les meilleurs sites gratuits du web.

TOP | loisirs et sports | véhicule | autos
    Webmycar (annuaire) : Le rendez vous des passionnés des automobiles.

16 Janvier 2003 :
TOP | régional | europe | france | midi pyrénées | toulouse
    Juraver : Des milliers de références et infos gratuites sur la vie toulousaine.

TOP | sexe | adulte
    AdultCertif : Les sites certifiés par Adultcertif sont de qualité ou gratuits.

TOP | internet | guide thématique
    AlloCertif : AlloCertif.com référence et certifie les sites a micro paiement audiotel.

TOP | internet | pages perso
    PersoCertif : Les meilleurs sites persos gratuits certifiés.

TOP | sexe | rencontre | rencontrez-vous
    Amours-rencontres : Vous cherchez l'âme soeur, ou simplement lier de nouvelles amitiés ? Visitez ce site sérieux et gratuit d'annonces de rencontres avec photo.

TOP | commerce et économie | commerce
    Acheter en France : Annuaire des sites marchands utilisables en France et index de leurs produits.

15 Janvier 2003 :
TOP | internet | guide généraliste | l
    Lesfavoris.com : Guide des meilleurs sites internet francophones.

13 Janvier 2003 :
TOP | commerce et économie | les entreprises
    Ile Maurice : Annuaire intéractif de l'Ile Maurice. Toute l'ile Maurice en un seul clic.

10 Janvier 2003 :
TOP | sexe | rencontre
    Ariest : Agence internationale de rencontre, agence matrimoniale sur pays de l'est.

TOP | commerce et économie | annonces
    Jhd.com : Bienvenue dans votre site de petites annonces de proximité.

Espace publicitaire
refgratuit.com
- votre publicité lue par 15.000 personnes ! -
Entretien avec...
http://www.alltheweb.com/
Tim Mayer, Vice President, Web Search - Fast Search & Transfer

ATTENTION, cet interview est une traduction de l'américain, il est donc possible que je ne traduise pas littéralement les paroles de Tim Mayer mais j'essaye de m'adapter au mieux à l'esprit de ses réponses !

«Moteurzine». -- Bonjour Tim. Tout d'abord, est-ce que vous pouvez vous présenter à nos lecteurs et nous expliquer comment vous êtes arrivé à travailler sur Internet et plus particulièrement chez Alltheweb ?

Tim Mayer. -- Je suis présent dans l'industrie de la recherche d'informations depuis quelques années, déjà. En 1993, je travaillais dans le milieu de la propriété intellectuelle (recherche des marques déposées et des noms de domaine). En 1998, j'ai vu Eric Brewer (le co-fondateur d'Inktomi) à Infonortics et j'ai trouvé qu'Inktomi serait une société intéressante où travailler. En 2000, après mon diplôme d'une école de commerce, j'ai rejoint Inktomi dans leur département de recherche sur le Web ("Web Search Group") où je suis resté 2 ans. Au tout début de cette année, j'ai été recruté par FAST pour m'occuper de leur recherche sur le Web. Je trouve que c'est une excellente opportunité de pouvoir travailler dans une société européenne qui a une aussi forte croissance et surtout avec un important noyau technologique.

«Moteurzine». -- Vous pouvez nous rappeler comment tout a commencé avec FAST / Alltheweb ? Je me rappelle du vieux FTPsearch en 1997 et aujourd'hui, c'est FAST.

Tim Mayer. -- FAST a commencé avec FTP Search en novembre 1998. Ensuite, il y a eu la recherche de MP3 et la recherche sur le Web en 1999. FAST Data Search a été créé en 2000 et fournit sa technologie de recherche à plusieurs des plus grands sites du réseau Internet.

«Moteurzine». -- Comment expliquez-vous votre succès ?

Tim Mayer. -- FAST propose de nombreuses solutions personnalisables qui peuvent répondre aux besoins les plus exigeants en ce qui concerne la recherche. FAST possède aussi une équipe très efficace au niveau développement qui est capable de s'aligner au plus haut niveau sur le marché du travail.

«Moteurzine». -- Vous pouvez nous dire ce qu'un webmaster doit faire pour améliorer son positionnement sur Alltheweb ?

Tim Mayer. -- Le meilleur moyen, c'est d'avoir un contenu utile pour les internautes. C'est aussi une bonne chose que les sites faisant autorité fassent un lien vers votre contenu.

«Moteurzine». -- Et quelles sont les choses qu'un webmaster ne doit absolument pas faire ?

Tim Mayer. -- Un webmaster doit créer ses pages et ses sites pour les internautes et non pas pour les outils de recherche. Posez-vous la question : "si les outils de recherche n'existaient pas, est-ce que je ferais mon site de cette manière ?"

«Moteurzine». -- Quels sont les éléments pris en compte dans le positionnement chez Alltheweb ? Lisez-vous les méta-tags ?

Tim Mayer. -- Alltheweb prend en compte des éléments dans la page (titre, texte dans le corps de la page, etc.) et hors de la page (liens, le texte inclu dans les ancres, etc.) pour calculer le positionnement du contenu. FAST ne prend pas en compte les métas mots-clés (keywords).

www.alltheweb.com
Copie écran de la page de garde du site Alltheweb

«Moteurzine». -- Qu'est-ce que vous considérez comme du spam sur FAST et comment vous traitez ce problème ?

Tim Mayer. -- Nous considérons comme du spam les pages qui essayent délibérément de tromper le moteur de recherche en donnant des résultats inappropriés, redondants ou de piètre qualité. Il n'y a pas de technique en particulier que nous considérons comme du spam. Le spam, c'est plutôt comment et de quelle manière une technique spécifique est utilisée. Il y a certaines techniques qui peuvent être appropriées mais qui sont malheureusement utilisées pour faire du spam, dans la majorité des cas. Les pages satellites (cloaking) sont une de ces techniques. Pour mieux connaître la politique de FAST concernant le spam, vous pouvez visiter cette page.

«Moteurzine». -- Est-ce que FAST envisage de sortir une barre à outil (toolbar) ?

Tim Mayer. -- Nous en avons déjà une que nous utilisons en interne et qui n'est pas encore disponible pour les internautes.

«Moteurzine». -- Quelle est l'architecture matériel (hardware) de Alltheweb ?

Tim Mayer. -- AlltheWeb tourne sur des serveurs Interl fabriqués par Dell.

«Moteurzine». -- Et quelle technologie utilisez-vous pour Alltheweb ? Combien de personnes travaillent dessus ?

Tim Mayer. -- Nous utilisons comme OS (Operating System) FreeBSD. La plupart de nos logiciels sont la propriété de FAST. Nous avons approximativement 185 personnes qui travaillent sur FAST.

«Moteurzine». -- Pour tout le monde ou quasiment tout le monde, le moteur de recherche numéro 1 est Google. Comment l'expliquez-vous ?

Tim Mayer. -- Google est devenu populaire parce qu'il cherchait avant tout à proposer des résultats pertinents quand les concurrents avaient d'autres priorités. Google a été capable de créer une marque qui a plu aux internautes et gagner ainsi leur fidélité.

«Moteurzine». -- Dernièrement, nous avons le sentiment qu'il existe une sorte de compétition entre vous deux pour le nombre de pages indéxées. Il y a quelques semaines, Google a dépassé les 3 milliards de pages... quelle va-t-être votre réaction ?

Tim Mayer. -- Nous restons compétitif en terme de couverture du Web. En nous basant sur des tests que nous avons effectués, nous sommes compétitif avec Google. Il est important de privilégier l'impact de la recherche sur les internautes. FAST s'efforce de donner aux internautes la meilleure expérience possible. C'est à dire, avoir en plus un des plus grands index, nous fournissons les résultats les plus pertinents et les plus récents.

«Moteurzine». -- Quel est votre argument pour convaincre un internaute d'utiliser votre moteur de recherche au lieu de Google ?

Tim Mayer. -- FAST utilise un algorithme différent et est capable de trouver des résultats plus pertinents sur certaines requêtes ou sujets comme par exemple voyage (travel). Il n'y pas sur le marché un moteur de recherche qui a toutes les réponses à tout moment. FAST possède d'autres éléments qui le différencie de Google comme la recherche des actualités (news) y compris les actualités dans d'autres langues que la langue anglaise et la capacité de les indexer en temps. Il y a aussi la recherche multimedia qui permet de chercher sur les vidéos, musiques et images.

«Moteurzine». -- Alltheweb et Google ont quasiment la même base de données au niveau taille. Pourquoi n'avez-vous pas le même trafic ?

Tim Mayer. -- Alltheweb est un site de démonstration de la technologie de FAST. Nous ne faisons pas la promotion de la marque Alltheweb pour concurrencer Google. Nos partenaires tel que Lycos, T-Online, Tiscali sont eux directement en compétition avec Google, avec leur outil de recherche utilisant la technologie FAST.

«Moteurzine». -- Tout le monde comptait voir Alltheweb comme nouveau moteur de recherche de Yahoo! et finalement, c'est de nouveau Google. Qu'est-ce qui vous manquait pour devenir le moteur de Yahoo! ?

Tim Mayer. -- Je pense que la question devrait être posée plutôt à une personne de chez Yahoo!

«Moteurzine». -- Plusieurs portails et outils de recherche donnent des "liens sponsorisés" avec des résultats au paiment par clic. Qu'en pensez-vous ?

Tim Mayer. -- Je pense que pour certaines requêtes, généralement des requêtes commerciales tel que "hébergement de sites web" ("web hosting"), les liens sponsorisés peuvent donner des résultats plus pertinents que ceux calculés algorithmiquement. Mais, il y a beaucoup plus de cas où l'inverse est vrai.

«Moteurzine». -- A côté de la soumission gratuite à Alltheweb, vous proposez un référencement payant. Comment fonctionne ce référencement et qui utilise principalement ce service ?

Tim Mayer. -- Le programme de référencement payant a reçu un bon accueil. Nous avons 6 millions d'Urls dans cet index. Les clients vont du grand magasin en ligne avec de nombreux produits aux webmasters indépendants.

«Moteurzine». -- Quel est le modèle économique derrière FAST ? Pouvez-vous vous considérer comme une société faisant des profits ?

Tim Mayer. -- AST génére des revenus dans 3 domaines, sur les services de recherche en entreprise (Enterprise Search), de recherche sur le web (Web Search) et de recherche marketing (Search Marketing). La recherche en entreprise apporte de l'argent en vendant la licence d'utilisation de FAST Data Search aux entreprises, la recherche sur le web en facturant chaque requête et le marketing, en vendant de la visibilité sur les produits et sur le moteur en fonction des mots clés. FAST est une société qui génère des profits, aujourd'hui. Nos revenus sont visibles sur notre site, ici !

«Moteurzine». -- Pensez-vous traduire Alltheweb dans d'autres langues comme l'allemand, le français, le russe, le japonais, etc ? De même, comptez-vous proposer une interface spécifique pour chaque pays ?

Tim Mayer. -- Nous avons discuté de ce projet. C'est quelquechose qui se justifie pour les pays où la population ne parle pas anglais.

«Moteurzine». -- Quels sont les projets à moyen terme de FAST / Alltheweb ?

Tim Mayer. -- FAST va continuer de privilégier les 4 éléments constituant la recherche : pertinence, taille, fraicheur et format des fichiers.

«Moteurzine». -- Dernièrement, de nouveaux moteurs de recherche sont apparus : Teoma, Gigablast, Openfind, ... Que pensez-vous d'eux ?

Tim Mayer. -- Je pense qu'il est de plus en plus difficile pour de nouveaux moteurs de recherche de faire concurrence à ceux qui ont déjà leur place sur le marché car, fondamentalement, ils n'apportent rien de différent. Les moteurs de recherche ont déjà parcouru beaucoup de chemin depuis ces dernières années, mais nous ne sommes encore qu'au début du cycle de vie de ce produit. Il y a vraiment de quoi améliorer les moteurs actuels. Les nouveaux moteurs qui savent innover ont donc leur place à prendre.

«Moteurzine». -- Pour finir, une question beaucoup plus personnelle, quel est votre site préféré et pourquoi ?

Tim Mayer. -- ESPN.com qui a beaucoup de possibilités interactives en temps réél et je suis un grand fan de sports.

«Moteurzine». -- Tim Mayer, merci d'avoir pris le temps de répondre à toutes ces questions.

Conclusion

ATTENTION
La liste des abonnés n'est pas disponible. Nous ne la donnons ni ne la revendons à personne. En revanche, vous pouvez sponsoriser notre lettre d'information : contactez-nous pour discuter des modalités.

 
 

Abonnement gratuit à « Moteurzine »


 
 
 
 
 

Désinscription de « Moteurzine »


 
 

 

les crédits
Chronique sur « Google »   Olivier DUFFEZ de WebRankInfo
Chronique sur les métamoteurs   David CHARBONNIER de ApocalX
Chronique sur les moteurs   Gilbert WAYENBORGH de DeepIndex
Infodesign   Max, le talentueux !
Le reste (mise en page, édito, actualités, les nouveautés et l'interview)   CHRis HÉDÉ de MoteurZine / Enfin
 
© 1999 à 2003 par IDF.net