Pourriel

Un article de Wikipédia, l'encyclopédie libre.

Le pourriel ou le spam (anglicisme) désigne une communication électronique, notamment du courrier électronique, non sollicitée par les destinataires, expédiée en masse à des fins publicitaires ou malhonnêtes. Le terme polluriel est, plus rarement, utilisé pour désigner le pourriel.

Boîte de réception infestée
Boîte de réception infestée

Le premier spam a été envoyé le 3 mai 1978 par Gary Thuerk[1], marketeur travaillant chez DEC. Il envoya son message à près de la totalité des utilisateurs d'ARPAnet (ancêtre d'Internet) vivant sur la côte ouest des États-Unis, soit environ 600[2] personnes. Il fit cela sans mauvaise intention, afin d'inviter ces utilisateurs technophiles à une démonstration de la gamme DEC ; voulant éviter d'écrire un message à chaque adresse, il mit les 600 adresses directement dans le champ Destinataire. Les réactions furent vives et contrastées, l'administration américaine gérant le réseau condamnant d'office la pratique, la jugeant non-conforme aux termes d'utilisation du réseau[3].


Sommaire

[modifier] Terminologie

Le mot pourriel, proposé par l'Office québécois de la langue française en mai 1997, est un mot-valise construit à partir de poubelle et courriel tandis que polluriel est construit à partir de pollution et courriel. Le mot pourriel est d'usage assez courant, polluriel est plus rarement utilisé (plutôt réservé au contexte des forums de discussion Usenet). La proposition d'officialisation de pourriel par la Commission générale de terminologie et de néologie française a été rejetée par l'Académie française[2] parce que phonétiquement trop proche de courriel. Le mot québécois pourriel a toutefois été consigné dans les éditions récentes du Petit Larousse illustré et du Petit Robert.

Le verbe spammer est souvent utilisé dans le langage familier pour qualifier l'action d'envoyer du pourriel. Le mot spammeur désigne celui qui envoie du pourriel. Les mots polluposter, pollupostage et polluposteur, proposés aussi par l'OQLF, en sont des équivalents.

En France, 95 % des messages échangés courant décembre 2006 étaient des pourriels, selon un article daté du 27 décembre 2006 publié par zdnet.fr [4]. Ce même article indique que ce pourcentage devrait atteindre 99 % courant 2007. Ces pourcentages varient selon les articles publiés, mais la barre des 90 % est toujours dépassée.

[modifier] Origine du mot anglais

Une boîte de SPAM.
Une boîte de SPAM.

L'association de spam et de indésirable provient d'un sketch comique des Monty Python dans lequel le même mot, désignant un jambon en boîte de basse qualité, envahit la conversation et le menu d'un petit restaurant. SPAM est la contraction de SPiced hAM (jambon épicé) et est une marque créée et déposée par Hormel Foods en 1937 (cf. (en)"SPAM In Time" sur le site officiel). Ce sketch parodiait d'ailleurs une des premières formes de message indésirable. En effet c'est une publicité radiophonique pour SPAM, pendant laquelle la marque était répétée de nombreuses fois[réf. souhaitée], qui est à l'origine du sketch des Monty Python.

Ce « pâté » a largement été utilisé par l'intendance des forces armées US pour la nourriture des soldats. Un dessin dû à la plume du sergent George Baker montre tout le cas que les soldats faisaient de cette nourriture considérée comme une cochonnerie lassante et décourageante. Incidemment George Baker est le créateur d'un personnage devenu célèbre : the Sad Sack paru pour la première fois en 1942 dans Yank dont les dessins ont été réunis par l'éditeur Simon & Schuster en 1944. Dans cet ouvrage vers la fin du volume (non paginé) figure un ensemble de sept dessins dont le titre générique est « SPAM ». Le copyright est de 1944. Il s'agirait de la première émergence publique du mot pour désigner un objet repoussant dont on aimerait bien ne pas être le destinataire.

[modifier] Contenu et objectifs du pollupostage

  • Le pourriel contient généralement de la publicité. Les produits les plus vantés sont les services pornographiques, les médicaments (le plus fréquemment les produits de « dopage sexuel » ou, des hormones utilisées dans la lutte contre le vieillissement), le crédit financier, les casinos en ligne, les montres de contrefaçon, les diplômes falsifiés et les logiciels craqués.
  • Des escrocs envoient également des propositions prétendant pouvoir vous enrichir rapidement : travail à domicile, conseil d'achat de petites actions (penny stock).
  • Les lettres en chaînes peuvent aussi être qualifiées de pourriel.
  • Parfois aussi, mais de plus en plus rarement, il s'agit de messages d'entreprises ignorantes de la Netiquette qui y voient un moyen peu coûteux d'assurer leur promotion.
  • Certains messages indiquant qu'un mail n'est pas arrivé à destination peuvent également être qualifiés de pourriel lorsque le message d'origine n'a pas été envoyé par vous même mais par exemple par un virus se faisant passer pour vous.
  • Enfin la dernière forme de pourriel, l'hameçonnage (phishing en anglais, terme dérivé de fishing, la pêche à la ligne), consiste à tromper le destinataire en faisant passer un courriel pour un message de sa banque ou d'un quelconque service protégé par mot de passe. Le but est de récupérer les données personnelles des destinataires (notamment des mots de passe, un numéro de carte bancaire) en les attirant sur un site factice enregistrant toutes leurs actions.

[modifier] Pourriel de demande de transfert de fonds

Il s'agit d'un exemple classique de pourriel qui reprend toujours le même principe : le message demande de l'aide afin de transférer des fonds depuis un compte en banque. Le destinataire (supposé compatissant) est censé faire l'intermédiaire pour la transaction.

Les anglophones parlent de nigerian scam (littéralement arnaque nigériane) car une bonne partie de ces messages émanaient du Nigéria. On rencontre aussi le terme de fraude 4-1-9, la numérotation étant relative à un texte de loi du Nigéria.

Icône de détail Article détaillé : Fraude 4-1-9.

[modifier] Pourriel publicitaire

Il s'agit d'une des formes les plus courantes de spam, qui consiste à l'envoi en masse d'un message publicitaire. Les auteurs de ce type de pourriels utilisent souvent des ressources informatiques de manière frauduleuse, telles que des machines zombies, car cela nécessite une grande bande passante et une certaine puissance de calcul pour la génération automatique des adresses destinataires.

Le spam continue d'exister et de prospérer grâce aux revenus qu'il peut engendrer, ce qui motive certains commanditaires car près de 11 % d'internautes admettent avoir acheté un produit suite à la réception d'un pourriel publicitaire, d'après une étude de Sophos[5].

[modifier] Cibles du pourriel

Le pourriel peut s'attaquer à divers médias électroniques : les courriels, les forums de discussion de Usenet, les moteurs de recherche, les wikis, les messageries instantanées, les blogs.

[modifier] Par courrier électronique

Le pourriel par courrier électronique est le type de pollupostage le plus répandu. Le coût d'envoi d'un courrier électronique étant négligeable, il est facile d'envoyer un message à des millions de destinataires. Les destinataires assument le coût de réception et de stockage en boîte aux lettres, ce qui peut causer des coûts non négligeables aux prestataires de services, à cause du volume pris par le pourriel qui lui est considérable : 93% des courriers reçus au printemps 2007 serait des spams.[6]

Contrairement aux promotions commerciales pour lesquelles les utilisateurs peuvent avoir donné leur accord, le pourriel n'est pas sollicité. Il est souvent rédigé spécialement pour contourner les filtres antipourriels. Un mot clé tel que Viagra (souvent vanté dans les pourriels) peut être ainsi écrit « vi@gr@ » ou « v|agra » ou « v i a g r a » de manière à tromper un filtrage automatique basé sur ce mot. Une autre méthode employée consiste à accompagner un texte anodin d'une image sur laquelle se trouve le véritable message publicitaire, l'absence de mot compromettant en dehors de l'image rendant le filtrage de ces messages très compliqué.

Les polluposteurs redoublent d'imagination pour masquer leurs activités et ne pas être démasqués, que ce soit en falsifiant les adresses d'expéditeur ou en utilisant des serveurs SMTP (serveur de courrier électronique) non sécurisés qui permettent des envois anonymes.

Les adresses à polluposter sont généralement collectées par robot d'indexation. Il existe un marché pour les listes d'adresses (vente de cd-roms contenant des milliers d'adresses...) qui aggrave le phénomène du pollupostage : une fois que votre adresse électronique est divulguée publiquement sur le net et collectée, la divulgation de votre adresse se fera par le biais du marché noir de ces adresses et non plus sur le seul support du Net. Il est donc trop tard pour enlever son adresse du Net à ce moment là, mais préférable tout de même.

Pour éviter d'être polluposté, les internautes font souvent figurer leurs adresses d'une manière masquée lorsqu'elle doit apparaitre dans un site web ou dans Usenet. Par exemple :

  • Jean@NOSPAM.exemple.fr pour Jean@exemple.fr.
  • Jean chez exemple point fr pour Jean@exemple.fr
  • Jean[at]exemple.fr pour Jean@exemple.fr (l'arobase se prononçant souvent « at »).

Mais cette méthode est aussi déconseillée car rien n'interdit à l'arroseur (spammer en anglais) de faire un traitement d'enlèvement des drapeaux les plus communs (NOSPAM, AT, chez etc.).

Une autre méthode consiste à encoder son adresse avec un algorithme quelconque (par exemple, remplacer chaque lettre par la suivante dans l'alphabet), et d'insérer dans la page une fonction javascript qui décode. Ainsi rien ne change pour l'internaute qui peut toujours cliquer sur le lien « envoyer un mail », mais l'adresse n'apparaît pas en clair dans la page. Jusqu'ici, les arroseurs n'exécutent pas le code javascript avant de chercher les adresses (trop long, plus complexe, etc.).

Enfin, on peut choisir de communiquer son adresse par une image, ainsi on ne pourra pas la récupérer « facilement » par un robot. Pourvu que cette image soit étirée et maquillée afin qu'un logiciel de reconnaissance de caractères (OCR) ne puisse reconstituer votre adresse (sur le même principe qu'un captcha). Cette dernière méthode est considérée comme la plus sûre, bien qu'elle ait pour inconvénient majeur de la rendre très difficile à lire pour des personnes ayant un handicap visuel.

La méthode la plus sûre est sans doute de ne pas divulguer son adresse personnelle sur le Net, lieu public par excellence, mais de la communiquer seulement à vos amis et à vos proches. Et encore, les serveurs mail peuvent parfois être piratés (autre méthode pour les arroseurs pour collecter des adresses).

[modifier] Par message de forum de discussion

Ce type de pollupostage est apparu sur Usenet avant celui par courrier électronique. Les forums de discussion de Usenet sont une cible facile de pollupostage. En effet, un message envoyé à un forum touche tous les lecteurs du forum. Certains groupes de discussion ne reçoivent pratiquement plus que du pollupostage (c'est l'une des raisons pour lesquelles de nombreux forums sont modérés, c'est-à-dire surveillés par un humain ou un robot qui effectue un tri parmi les articles proposés). D'autre part, les participants de Usenet faisant généralement figurer leur adresse électronique dans leurs articles, les polluposteurs peuvent facilement récolter des milliers d'adresses au moyen d'un robot, puis polluposter les auteurs de ces articles par courrier électronique.

Le phénomène est rendu encore plus pénible par la publication croisée ou la publication multiple, qui consistent respectivement à destiner un message à plusieurs groupes simultanément ou à envoyer le message dans plusieurs groupes de suite.

Pour cette raison, tout message de promotion, quel qu'il soit, est prohibé dans les forums Usenet, à l'exception du groupe alt.business et apparentés.

Dans Usenet, on parle également de pourriel lorsqu'un article, quel que soit son contenu, et même s'il n'appartient pas aux catégories usuelles de messages abusifs (publicités commerciales, escroqueries, insultes…) est publié en un nombre d'exemplaires excessif : tous les exemplaires d'un tel article peuvent être annulés par les utilisateurs (les critères numériques exacts permettant d'identifier de tels pollupostages dans la principale hiérarchie francophone sont donnés dans la documentation du forum [3]). Les diverses hiérarchies possédant des critères différents pour identifier et annuler les articles de pollupostage, il existe une certaine incertitude quant aux traitements qui peuvent être appliqués aux pollupostages diffusés simultanément dans plusieurs de ces hiérarchies. Une règle particulièrement simple décide du sort des escroqueries manifestes, c'est-à-dire des articles proposant de « gagner de l'argent rapidement et sans rien faire » (habituellement appelés « MMF », de l'anglais Make money fast : « gagnez de l'argent rapidement ») : ces articles peuvent être annulés immédiatement par n'importe quel utilisateur.

Les actions des usenautes spécialisés dans la lutte contre le pollupostage donnent souvent lieu à des accusations de censure et de cabale.

Depuis peu, le terme général de spamposting est parfois utilisé pour désigner le pollupostage apparaissant dans les blogs, forums, livre d'or...

[modifier] Par des fenêtres intruses

Icône de détail Article connexe : fenêtres intruses.

C'est ce que l'on appelle le pollupostage par messagerie instantanée.

[modifier] Par systèmes vocaux

Le développement de la voix sur réseau IP (téléphonie par Internet) fait craindre l'arrivée prochaine sur nos combinés d'un nouveau type de pourriel, le pourriel vocal, baptisé SpIT (Spam over Internet Telephony). En effet, des systèmes comme Skype voient déjà une part notable des appels être d'origine non sollicitée, même s'il s'agit encore de contacts personnels plutôt que de sollicitations commerciales.

[modifier] Référencement abusif

Icône de détail Article détaillé : Spamdexing.

Optimisation abusive des techniques de référencement destinée aux robots d'indexation de moteur de recherche qui consiste à modifier des pages web en utilisant des mots-clés d'une façon abusive pour améliorer le classement dans les moteurs de recherche.

Parmi les techniques utilisées :

  • La manipulation des mots clés consistant à ajouter une longue liste de mots souvent recherchés (comme « sexe » ou « piratage ») répétitivement dans une page (« sexe à UneVille », « sexe à UneAutreVille », « sexe à EncoreUneAutreVille », « sexe à UnVillageTropPetitPourÊtreUneVille », et toute autre variation possible) pour apparaître immédiatement si on fait une recherche avec ces mots. Parfois une page ne contient que les résultats d'une recherche, mis sur le web pour être trouvé et classé par les moteurs de recherche et affiché aux usagers cherchant avec les mêmes mots.
  • Le bourrage de mots clés populaires, dissimulés au visiteur mais pas au robot, soit en les imprimant blanc sur fond blanc, ou en utilisant la police de caractères la plus petite, ou encore en les utilisant en lignes « commentaire » et « méta » qui ne sont pas affichées à l'usager, ou encore en changeant le contenu de la page après que le logiciel « robot » ou « araignée » l'a lu ou en modifiant le serveur pour envoyer une page au moteur de recherche et une autre aux usagers ordinaires.
  • Le pollupostage de liens consiste à mettre les liens vers un site qu'on veut promouvoir dans autant d'autres sites externes que possible, incluant les forums publics et les pages de commentaires d'autres sites.
  • Une ferme de liens (link farm) est un site hébergeant des listes de liens vers tous les autres sites qu'on contrôle pour améliorer le classement de ces derniers en les faisant apparaître populaires. Google compte notamment la quantité et l'importance des liens vers un site pour déterminer l'importance du site (le PageRank). Parfois on construit aussi les sites multiples (simulant des sites indépendants et pas simplement des sous domaines du même site) avec presque le même contenu ; chacun contient un tas de liens vers tous les autres pour améliorer leurs classements.
  • La technique de Bombardement Google en sa forme originale consiste à placer des hyperliens vers George W. Bush avec des phrases comme « l'idiot du monde » dans autant de sites web que possible. La destination de cet hyperlien est normalement un site externe (dans cet exemple, la page de Bush). Si ce genre de lien figure dans un assez grand nombre de pages web, une recherche pour « l'idiot du monde » va diriger l'usager immédiatement sur Bush, peu importe s'il désire ça et peu importe si ces mots figurent sur son site ou pas.
  • Une autre variation est le pourriel d'affiliation ((en) affiliate spam) où une compagnie paye pour chaque visiteur ou chaque client envoyé par des liens affichés par des autres, du genre « affiliez-vous et devenez riche, mettez un lien vers www.arnaqueur.porno.example.com et pour chaque victime qui nous donne tous ses numéros de carte de crédit nous vous donnons un sou ». Les liens venant de ces programmes d'affiliation contiennent le code d'identification d'un affilié de façon www.arnaquer.porno.example.com/donnemoiargent?MonsieurLeSpammeur pour laisser savoir qui doit être payé pour avoir posté tous ces liens partout.

Les opérateurs de sites de recherche comme Google cherchent en permanence des moyens de détecter ce genre de choses et les rendre plus difficiles à utiliser effectivement. Par exemple, un nombre excessif de liens provenant de fermes comme «www.ferme-aux-liens-inutiles.spam.example.com, peut se solder par une diminution de la pertinence attribuée au site pointé, ce qui est l'effet inverse de celui recherché initialement.

[modifier] Dans les blogs

Icône de détail Article détaillé : Splog.

La présence de liens vers un site web est un critère important de classement dans les moteurs de recherche. Afin d'augmenter artificiellement le nombre de liens pointant vers leurs sites, certains créent des blogs, ou mettent des messages de commentaires dans des blogs préexistants, uniquement pour ajouter des liens vers un ou plusieurs sites web à promouvoir.

L'automatisation de ce genre de pollution a mené plusieurs logiciels de blog à introduire des contrôles (Captcha) qui rendent cette automatisation par une machine plus complexe à réaliser.

[modifier] Sur les wikis

De nombreux polluposteurs ou publicitaires ajoutent des liens vers leurs sites sur des wikis, en particulier ceux modifiables par des personnes non inscrites, comme Wikipédia. En réponse, certains wikis mettent en place des listes noires (liens interdits) ou l'obligation (sauf éventuellement pour les membres inscrits depuis suffisamment de temps) de passer un Captcha pour ajouter un lien vers un autre site lors de la modification d'une page.

[modifier] Aspects juridiques

[modifier] Dans l'Union européenne

La directive du 24 octobre 1995 relative à la protection des personnes physiques à l'égard du traitement des données à caractère personnel et à la libre circulation de ces données [7] prévoit que les données à caractères personnel doivent être traitées loyalement et licitement, avec le consentement clair de la personne concernée. Ces données ne peuvent être collectées que pour des finalités déterminées et explicites.

La directive du 12 juillet 2002 sur la protection de la vie privée dans le secteur des communications électroniques précise l'interdiction d'envoi de messages commerciaux non sollicités en instaurant le principe dit de l'opt-in : un opérateur doit obtenir le consentement du destinataire avant de lui envoyer des messages commerciaux.

[modifier] En France

Le principe introduit par la directive européenne a été transposé en France par la loi du 21 juin 2004 pour la confiance dans l’économie numérique et figure désormais à l'article L.34-5 du code des postes et des communications électroniques, repris à l'article L.121-20-5 du code de la consommation :

« Est interdite la prospection directe au moyen d'un automate d'appel, d'un télécopieur ou d'un courrier électronique utilisant, sous quelque forme que ce soit, les coordonnées d'une personne physique qui n'a pas exprimé son consentement préalable à recevoir des prospections directes par ce moyen.»

La Cnil indique qu'un formulaire doit demander le consentement d'une personne à l'envoi de messages commerciaux à son adresse ; la case correspondante ne doit pas être pré-cochée[8]. Même si le message est envoyé de manière légale, le courrier de prospection doit proposer au destinataire un moyen simple de refuser toute utilisation ultérieure de ses coordonnées.

La récupération des adresses électroniques (sur le web, sur des forums de discussion) de manière automatique est elle-même interdite. L'article 226-18-1 du code pénal, introduit par une loi du 6 août 2004, punit de cinq ans d'emprisonnement et de 300 000 euros d'amende un « traitement de données à caractère personnel concernant une personne physique malgré l'opposition de cette personne, lorsque ce traitement répond à des fins de prospection, notamment commerciale ». Même pour des faits antérieurs à la loi du 6 août 2004, la cour de cassation avait déjà confirmé[9] l'interdiction d'utiliser des robots collecteurs d'adresses électroniques en se basant sur l'article 226-18 du code pénal, qui réprime « le fait de collecter des données par un moyen frauduleux, déloyal ou illicite, ou de procéder à un traitement d'informations nominatives malgré l'opposition de la personne ».

[modifier] Aux États-Unis

Les États-Unis ont développé une législation anti-pourriel au niveau d'un grand nombre d'États ainsi qu'au niveau fédéral (CAN-SPAM Act du 16 décembre 2003). Le mécanisme est celui de l'opt-out, c’est-à-dire que le destinataire de messages commerciaux doit avoir la possibilité de demander à ne plus recevoir ces messages, alors que le système européen, plus restrictif pour les auteurs de messages commerciaux, exige un consentement a priori du destinataire (opt-in).

[modifier] Corollaire

Techniquement, l'envoi de courriel en masse demande des ressources importantes. Les polluposteurs n'en disposent pas forcément, et ils souhaitent en outre masquer ou effacer les traces de leur activité frauduleuse. Pour cela, ils piratent très couramment des machines tierces, notamment pour les transformer en machines zombies. Il est donc fréquent que, du point de vue juridique, les polluposteurs tombent également sous le coup des articles 323-1 et suivants du code pénal [10].

[modifier] Voir aussi

b:Accueil

Wikibooks propose un ouvrage abordant ce sujet : Se prémunir contre le courrier indésirable.

[modifier] Articles connexes

[modifier] Liens externes

[modifier] Notes et références

  1. (de)Spam feiert 30. Geburtstag, article relatif au trentième anniversaire du spam
  2. (en) Opening Pandora's In-Box
  3. (en) Reaction to the DEC Spam of 1978
  4. « 95 % des messages échangés courant décembre 2006 étaient des spams » (Article publié le 27 décembre 2006 [1] par zdnet)
  5. 11 % of people admit to having bought goods in response to spam messages , étude Sophos citée par theregister.co.uk
  6. 93% des e-mails sont du spam - Actualités RT Sécurité - Reseaux et Telecoms
  7. Directive 95/46/CE du 24 octobre 1995 (site de la Communauté européenne).
  8. Spam : les règles à respecter par les professionnels, site de la Cnil.
  9. Cour de cassation, chambre criminelle, 14 mars 2006, pour des faits datant de 2002 et 2003.
  10. Article 323-1 et suivants du Code Pénal