Analyse statistique des séquences biologiques est le résultat de quinze années de recherche et présente de manière synthétique et didactique une approche nouvelle fondée sur les automates finis.
L'analyse statistique des séquences génomiques - un des points forts de la recherche en bioinformatique ou en biostatistique en France - développe des outils permettant la modélisation des séquences (chaînes de Markov, chaînes de Markov cachées) ainsi que l'étude des occurrences de motifs (par une approche novatrice fondée sur les automates finis déterministes). Elle permet également la recherche automatique de gènes et d'autres signaux biologiques (annotation) et compare des séquences provenant d'espèces différentes (alignement), en particulier pour reconstruire l'histoire de leur évolution (phylogénie).
Une présentation du domaine biologique et des divers modèles markoviens utilisés permet une lecture autonome. Les méthodes sont illustrées par de nombreux exemples et figures, les algorithmes qui leur correspondent sont systématiquement détaillés et l'on donne en référence les sites web et programmes qui permettent leur mise en oeuvre pratique.