Hadoop est un framework, notion qui peut paraitre étrangère pour la plupart des gens. C'est à dire qu'Hadoop est une structure logicielle qui a donc pour objectif d'être un ensemble cohérent de composants d'un logiciel, on peut dire que c'est ce qui sert à faire la base d'un logiciel. Et par ça on entend aussi la création d'applications. Le rôle principal d'Hadoop est donc d'automatiser une réparation, les pannes dans ce domaine sont assez fréquentes, et le framework travaille pour réparer lui même les problèmes et ne pas avoir besoin d'une aide humaine.
Depuis sa création en 2004, Hadoop sert aussi à faire une gestion de fichiers distribués. Leur principal contributeur est Yahoo, qui utilise le framework afin de supporter l'interface de son moteur de recherche pour éviter les pannes.
Les réparations qui sont donc automatiques sont faites avec des algorithmes et des grilles de calcul qui ont pour but de proposer plusieurs solutions (plusieurs "noeuds") en cas d'échec de l'étape défaillante.
Au niveau de la composition d'Hadoop : le framework est composé d'HDFS (pour Hadoop Distributed File System). Ils sont la afin de répartir toutes les données qui sont stockés par des blocs d'informations qui sont dans les solutions ou les noeuds.
Hadoop est aussi utilisé pour stocker un nombre énorme de données, et donc par la plupart des réseaux sociaux comme Facebook, Twitter ou encore Linkedin ou même des sites présents dans le e-commerce comme ebay ou amazon. Ils ont tous besoin d'un framework capable de pouvoir stocker des données en toute sécurité à cause du grand nombre de visiteurs et des conséquences en cas de panne.
Hadoop stock donc des pétaoctets (1 000 000 000 000 000 octets) par exemple Facebook a migré 30 pétaoctets sur ce framework qui comprend des informations sur les inscrits mais aussi des sauvegardes des différents serveurs.
_
Auteur : Guillaume Pichon
http://www.journaldunet.com/solutions/dsi/informatique-de-facebook/hadoop-chez-facebook.shtml
http://www.journaldunet.com/solutions/systemes-reseaux/definition-d-hadoop.shtml
https://fr.wikipedia.org/wiki/Hadoop