Des bases souples pour la performance et le Big Data
Durant les deux dernières décennies, le volume des données brassées par les entreprises a considérablement augmenté. Émanant de sources diverses (transactions, comportements, Internet des objets, géolocalisation...), ces données sont souvent structurées autour d'un seul point d'entrée, la clé, et susceptibles de croître très rapidement. Autant de caractéristiques qui les rendent très difficiles à traiter avec des serveurs de bases de données relationnelles.
C'est pour répondre à ces problématiques que sont nées les bases de données NoSQL (Not Only SQL), sous l'impulsion de grands acteurs du Web comme Facebook ou Google, qui les avaient développées à l'origine pour leurs besoins propres. Grâce à leur flexibilité et leur souplesse, ces bases non relationnelles permettent de gérer de grands volumes de données hétérogènes sur un ensemble de serveurs de stockage distribués, avec une capacité de montée en charge très élevée. Elles peuvent aussi fournir des accès de paires clé-valeur en mémoire avec une très grande célérité. En une quinzaine d'années, elles se sont imposées comme un complément du modèle relationnel.
Du choix de la base NoSQL à sa mise en oeuvre
Cet ouvrage d'une grande clarté dresse un panorama complet des bases de données NoSQL, en analysant en toute objectivité leurs avantages et inconvénients. Il présente d'abord les grands principes de ces bases non relationnelles : interface avec le code client, architecture distribuée, paradigme MapReduce, etc. Il détaille ensuite les principales solutions existantes (Hadoop, MongoDB, Cassandra, Couchbase Server...), en précisant spécificités, forces et faiblesses de chacune. Enfin, il consacre sa dernière partie au déploiement concret de ces bases : dans quel cas passer au NoSQL ? Quelle base adopter selon ses besoins ? Quelles données basculer en NoSQL ? Comment mettre en place une telle base, la maintenir et la superviser ?
Cette troisième édition a été mise à jour et augmentée des nouvelles tendances du NoSQL : moteurs optimisés comme ScyllaDB, bases de données de séries de temps avec InfluxDB, enrichissement fonctionnel des moteurs phares du NoSQL.
À qui s'adresse cet ouvrage ?