Ecrans, un site de Libération.fr

Dixit

Le piratage est un danger pour l’avenir de notre civilisation.

Muriel Marland-Militello, députée UMP

  • Home
  • Internet
  • Télévision
  • Cinéma
  • Dvd
  • Jeux
  • Téléphone
  • Forums
  • Rss

mercredi 6 août 2008 16:49

  • internet

Inside Wikipédia #5 : Sous haute surveillance

Écrans.fr s’invite à l’intérieur de Wikipédia et vous propose d’aller voir comment un projet aussi pharaonique peut fonctionner au quotidien. Aujourd’hui, la patrouille « Recent Changes » et leur arme secrète.

par Camille Gévaudan

tags : Wikipédia , inside Wikipedia

Salebot, le bot qui reverte plus vite que son ombre

« b ;jhlkjkjlkjhb nb, ». C’était l’unique contenu de l’article “VR6”, créé sur Wikipédia par une adresse IP (raccourci utilisé pour un utilisateur non enregistré). C’est incompréhensible, c’est inutile, c’est moche et ça pollue l’encyclopédie, et pourtant ce n’est pas du vandalisme. Ce genre de contributions, qu’on dirait apportées par le passage d’un chat sur le clavier, sont généralement de simples tests effectués par des débutants incrédules. Juste pour voir si c’est bien vrai, si on peut vraiment écrire n’importe quoi sur une page visible au monde entier. Eh bien oui, c’est vraiment vrai. Du moins en théorie, car personne n’a vraiment eu le temps de lire l’article VR6 : créé à 17h14, il a été effacé… à 17h14. Diantre, mais les wikipédiens réagissent plus vite que leur ombre ! Comment arrivent-ils à repérer l’article, le lire, l’effacer ET prévenir le créateur de sa bourde en une poignée de secondes ?

En réalité, ils disposent d’une arme secrète, répondant au doux nom de Salebot. Un bot, sur Wikipédia, est un « utilisateur virtuel » programmé pour effectuer de façon automatique des tâches répétitives et/ou ingrates, comme changer la syntaxe d’un modèle dans des milliers d’articles ou mettre à jour les liens vers les Wikipédia dans d’autres langues. Salebot, lui, est spécialisé dans la lutte contre le vandalisme. Surveillant tout spécialement les actions effectuées par les adresses IP et les nouveaux utilisateurs, il scanne les modifications d’articles à la recherche de phrases écrites entièrement en majuscules, d’excès de signes de ponctuation, ou de certains mots-clés (je/tu/nous/vous, insultes et jurons dans plusieurs langues ainsi que leurs variantes mal orthographiées, « j’aime », « gay », « skyrock »...). Chacun de ces indices de vandalisme rapporte des points négatifs, selon une grille de notation très complète : -5 pour un kikoo ou un prout, -10 pour une série de points d’exclamation et -20 pour « yo man ». En revanche, le respect de la syntaxe wikipédienne, les liens vers d’autres wikipédias ou des sites en .edu ou .gouv rapportent des bons points. Au final, si le total est inférieur à un certain nombre, Salebot révoque la modification. Il lui arrive bien sûr de se tromper, mais, bien élevé, il ne récidivera pas si un utilisateur humain annule son action.

LiveRC

Diablement efficace, Salebot facilite grandement le travail de la « patrouille RC », cette équipe de wikipédiens bénévoles qui se charge de surveiller la liste des modifications récentes (d’où RC, pour Recent Changes). Certains prennent le travail très au sérieux et y passent une grosse partie de leur journée, dans l’espoir de figurer un jour dans le top 50 des révocateurs, ce qui jouera en leur faveur s’ils briguent le statut d’administrateur. Mais la plupart d’entre eux patrouillent occasionnellement, quand il en ont le temps et l’envie. Il n’est d’ailleurs pas obligatoire de s’inscrire où que ce soit, le patrouilleur n’étant défini ni par ses résultats ni par un quelconque engagement mais simplement par son passage sur la liste des modifications récentes. Les novices y découvriront qu’un nouvel article (repéré par un N devant le titre) est créé sur Wikipédia toutes les deux minutes environ, mais cette page est tout sauf pratique pour les patrouilleurs professionnels, devant être rafraîchie manuellement. Pour traquer les vandales, les wikipédiens disposent d’un outil bien plus performant : LiveRC.

Ce programme, écrit en javascript, affiche et actualise en temps réel la liste de toutes les modifications effectuées sur la Wikipédia francophone — une trentaine par minute. Son interface ultra-optimisée permet de repérer au premier coup d’œil le résumé de la modification (si le champ n’est pas rempli, c’est mauvais signe), l’utilisateur qui en est responsable (si c’est une IP, c’est forcément louche), le nombre de caractères ajoutés ou supprimés (-34 672, c’est carrément pas normal)... Les pages les plus sensibles (élues Articles de Qualité, protégées ou suivies par les wikipompiers) sont repérés par un petit logo, les créations d’articles sont en vert, les blanchiments d’articles en rouge. Un clic sur « diff » affiche en haut de la fenêtre les différences entre l’ancienne version et l’actuelle. Un clic sur « Défaire » révoque la modification.

Avec ça, on est presque aussi bien équipé que Salebot, et la patrouille prend des airs de Shoot them up multijoueurs. La souris prête à dégainer, on guette dans une tension presque palpable l’apparition d’une modification suspecte, on survole les “diffs” qui apparaissent chaque seconde (pas le temps de tout lire, sous peine d’en laisser passer une vingtaine entre temps), et on tire... Fanatisme (« britney t’es trop belle je t’adore ») ? Revert ! Vulgarité (« harry potter il a niké hermione ») ? Revert ! Spam (« venez voir mmorpg-powa.skyblog.fr ») ? Rev… Ah ben non, grillé par Salebot.

Un peu frustrant ce bot, il faut l’avouer. Mais les patrouilleurs ont encore du pain sur la planche : il existe bien d’autres formes de vandalisme invisibles aux yeux du robot, plus sournoises et donc plus dangereuses.

Lire la suite.

A lire également :
- Inside Wikipédia #1 : Wikilove !
- Inside Wikipédia #2 : Au feu !
- Inside Wikipédia #3 : Maux de PàS
- Inside Wikipédia #4 : Tuer des Pokémons ne fera pas grossir les écrivains


Il y a 4 réactions à cet article.

Lire les réactions.
Réagir à cet article.

Partager cet article

Partager Tweet


Twitter Ecrans Facebook Ecrans

Sur les mêmes thèmes:

Wikipédia - Un seul Wikipédia vous manque... et le Guardian prend le relais

inside Wikipedia - Inside Wikipédia #6 : Ces vandales, quelle plaie !

article précédent
« Trials 2 » : L’important, ce n’est pas la chute...
article suivant
Au fil des jeux : Burnout Paradise, Shaun White Snowboarding, et les autres...


 

Loading

Outils

  • imprimer
  • écrire à Camille Gévaudan
  • réactions (4)
  • Tweet
  • Partager

Actualit

  • Wikileaks : Bradley Manning sera mis en accusation le 23 février
  • Les revendeurs Apple au bord de l’asphyxie
  • Silence, on joue ! Soul Calibur V, Final Fantasy XIII-2
  • Le sac de nœuds du financement numérique
  • L’Elysée à l’abordage du Net

Lib.fr

  • Les principales déclarations de Sarkozy
  • Les revendeurs Apple au bord de l'asphyxie
  • Les Lejaby réclament de solutions pour les salariés des autres sites
  • UraMin : Lauvergeon dénonce une «cabale», un «acharnement»
  • Une campagne à la «con»
publicité

De saison

img75
L’Elysée à l’abordage du Net

Dans un merveilleux dessin interactif, OWNI liste les principales figures de la conquête de l’Internet par l’Elysée, et schématise leur relations en filant la métaphore de l’île déserte.


Chronophage

Q - Compressing the Heart

« Vous vous réveillez dans un monde différent, après qu’une créature étrange a volé votre cœur. »


Hum, bizarre...

img75
Les sosies sont six

Vous ne vous êtes jamais dit que votre voisin de train ou de fil d’attente ressemblait à un personnage de fiction ?


Dixit

« C’est un peu comme si vous rajoutiez des dizaines de bières sur le plateau d’un serveur : au bout d’un moment, il tombe. »


De saison

img75
L’hommage de Google à François Truffaut

François Truffaut aurait eu 80 ans ce 6 février 2012. Google en fait donc son Doodle du jour.


Vendredi, à poils !

img75
Avoir un bon copain...




accueil | internet | télévision | cinéma | DVD | jeux | téléphone
contacts | licence | mentions légales | données personnelles | charte d’édition
engine SPIP | powered by carburant
© Libération- un site de Libération Network - 2006 - 2008