Séminaire Mensuel / Monthly seminar

Mardi 12 Mai / May 10th (AgroParisTech, salle 31)

10h00: Sandrine Pavoine (MNHN / Oxford University)

Mesurer la diversité dans et entre des assemblages d'espèces: exemple des diversités phylogénétiques et fonctionnelles alpha et beta.

La biodiversité désigne toute la variabilité du vivant, allant du gène à l'écosystème. Les indices de diversité permettent de quantifier cette biodiversité à différentes échelles. Par exemple il peuvent mesurer la diversité dans des assemblages d'espèces (diversité alpha) et la diversité entre assemblages d'espèces (diversité beta). Dans les années 1980, C.R. Rao proposait une axiomatisation des mesures de biodiversité dans laquelle il décomposait plusieurs indices de diversité selon des facteurs hiérarchiques et/ou croisés. Au cœur de cette axiomatisation, un indice, qu'il a nommé l'entropie quadratique, est le seul à pouvoir être décomposé selon n'importe quel nombre de facteurs croisés. Rao a également montré que cet indice unifie les concepts de diversité et de dissimilarité dans un même schéma mathématique. L'utilisation de l'entropie quadratique pour mesurer la diversité s'est répandue d'abord en génétique (par exemple sous le nom de diversité nucléotidique) puis plus récemment en écologie. L'engouement récent pour cet indice vient probablement de la simplicité de son interprétation: en écologie, on l'utilise par exemple pour mesurer la dissimilarité (phylogénétique ou fonctionnelle) moyenne entre deux espèces d'un assemblage. Malgré les propriétés de cet indice identifiées par Rao, l'entropie quadratique a récemment été critiquée notamment dans sa façon de mesurer la diversité beta: la diversité beta associée à cet indice est la différence entre la dissimilarité moyenne entre deux espèces tirées d'une région (définie par le mélange des assemblages d'espèces) et la dissimilarité moyenne entre deux espèces tirées d'un seul assemblage. Nous explorerons des solutions pour répondre à ces critiques tout en gardant des indices de diversité simples et facilement interprétables. Ces approches appliquées à la diversité biologique en écologie sont en réalité générales et peuvent être appliquées dans toutes les disciplines intéressées par un concept de diversité.

15h00: Martin Lindner (Robert Koch Institute / 4 Antibody)

Who's there? Two approaches to taxonomic profiling of environmental genomic samples.

In the context of genome sequence analysis, metagenomics describes the analysis of genomic samples taken directly from the environment. Since metagenomic samples typically consist of genomic material from multiple (in particular microbial) organisms, one of the key challenges in metagenomics is to disentangle the genomic ravel and identify the organisms present in the sample. In this talk, I will review the main ideas used in taxonomic profiling and present two reference genome based strategies in more detail. The first strategy aims at identifying and discriminating between highly similar microbial organisms in a metagenomic sample. Given a set of reference genomes, our approach correctly identifies and quantifies organisms in the sample using a non-negative Lasso formulation of the mixture problem. The second strategy has a broader focus and seeks to provide an overview over the whole complexity of the sample. Here, we first estimate the similarity between the organism in the sample and the reference genomes. This is accomplished by fitting discrete probability distributions to genome coverage profiles with a modified EM algorithm. The similarity is then used in the second step to cluster the available reference genomes into groups, where each group represents one organism in the dataset. The mathematical foundations as well as practical examples will be given for both strategies.