Le deep web

Le deep web, appelé aussi web invisible ou web caché désigne la partie de la Toile accessible en ligne, mais non indexée par les moteurs de recherche classiques généralistes (certains moteurs, tels que BASE, prennent en compte cette partie du réseau). Cette terminologie oppose « web profond » à web surfacique. Le deep web représenterait 96 % de l'intégralité du web1.
A l’origine, on appelait darknet tout réseau qui n’était pas en relation avec l’ARPANET – l’ancêtre d’Internet développé par le DARPA (Department of Defense’s Advanced Research Projects Agency). Par définition, un darknet est donc un réseau inaccessible publiquement, la connexion se fait entre pairs de confiance.

Mais de nos jours, au fur et à mesure d’amalgames, les définitions se rejoignent : ce qui est de l’autre côté du Web en surface, mis à part le Deep Web, touche à l’illégalité.
Le web surfacique
Il s’agit d’Internet tel que nous, pauvres mortels, le vivons quotidiennement : consultation des courriels, connexion aux réseaux sociaux, achats sur les sites de e-commerce, fréquentation de sites ou de blogs indexés par un moteur de recherche, etc. Bref, Internet quoi ! Et bien non : sous la surface, on peut accéder à d’autres Internets…

Le web profond
Estimé à 70 ou 75% du web total, le web profond est aussi appelé « web invisible« , « web caché » ou « deep web« . Le web profond est l’Internet de tous les contenus qui ne sont pas indexés par les moteurs de recherche (ex : Google). Il faut donc connaître l’adresse précise des sites concernés pour y accéder. Cette non-indexation de pages web peut être volontaire ou non. Sont notamment concernés :

- Les pages 100% dynamiques dont le contenu change en fonction de certains paramètres
- Sites ou pages isolées du reste du web, sans hyperliens faisant leur promotion
- Sites protégés par authentification
- Sites techniquement mal conçus
- Sites utilisant exclusivement des technologies incomprises des robots d’indexation
- Sites proposant des contenus incompréhensibles pour les robots d’indexation, comme l’a été par exemple le PDF à une certaine époque
- On peut estimer que le web privé (sites réservés à des utilisateurs limités et identifiés) et le web opaque (web techniquement indexable mais non indexé) font partie du web profond.

Le web sombre
Aussi appelé Dark Web, le web sombre est un recoin (important) d’Internet, auquel il n’est pas facile d’accéder : il faut non seulement connaître les adresses spécifiques, mais également utiliser des outils informatiques particuliers (ex : navigateur dédié). Les moteurs de recherche ne connaissent pas cette partie du web, et le chargement des contenus peut être très lent. L’anonymat est la règle, et chaque connexion se veut indirecte, en passant par de nombreux nœuds (nodes).

Vous l’aurez compris, le web sombre n’est pas facile d’accès pour l’internaute lambda. Ce n’est d’ailleurs peut-être pas plus mal : s’il abrite les échanges des défenseurs de la liberté d’expression ou de certains opposants politiques réprimés, le dark web est aussi le lieu de nombreuses malversations :

Cybermarchés noirs : contrefaçons, drogues, cartes bancaires, armes, etc.
Echanges de contenus choquants ou illégaux : pédopornographie, torture, cannibalisme, sexe violent, etc.
Services illégaux : embauche d’un tueur à gage, transport d’organes, location de botnets, achats de logiciels malveillants, etc.

Si ces différentes couches du web ont chacune leurs caractéristiques propres, il existe de nombreuses passerelles qui les relient : tous les jours, des numéros de cartes bancaires obtenues par phishing dans le web surfacique sont par exemple revendus sur des sites du web sombre. Alors, quel est votre Internet préféré ?

Sources:
https://fr.wikipedia.org/wiki/Web_profond
http://www.panoptinet.com/cybersecurite-decryptee/deep-web-dark-web-les-parties-immergees-dinternet/
http://www.bitdefender.fr/blog/Deep-Web-Darknet-et-autres-trucs-:-la-face-cachee-du-Web-1379.html
http://spintank.fr/2013/09/on-a-explore-le-deep-web/

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License