Programme de la réunion du mardi 21 juin 2016

Lieu : Jouy-en-Josas (salle de réunion du bâtiment 210).

Déjeuner
 14h00 - 15h00  Externe

Morgane Thomas-Chollier (IBENS, ENS)

Using RSAT for cis-regulatory element analyses

15h00 - 16h00 Externe

Khawla Seddiki (EGCE, UPSay)

Approche comparative des méthodes de détection  des gènesssb différentiellement exprimés en RNA-seq en condition réelle

Titres et résumés

Using RSAT for cis-regulatory element analyses

RSAT (Regulatory Sequence Analysis Tools) is a modular software suite for the analysis of cis-regulatory elements in genome sequences. Its main applications are (i) motif discovery, appropriate to genome-wide data sets like ChIP-seq, (ii) transcription factor binding motif analysis (quality assessment, comparisons and clustering), (iii) comparative genomics and (iv) analysis of regulatory variations. In addition to a global overview, the presentation will focus on the latest tools dedicated to ChIP-seq analysis and motif clustering.

Approche comparative des méthodes de détection  des gènesssb différentiellement exprimés en RNA-seq en condition réelle

Le recours aux technologies HTS devient une pratique courante dans de nombreuses applications biologiques. À l'IDEEV (Institut Diversité Écologie et Évolution du Vivant), cette technologie est appliquée notamment pour générer des données RNA-seq chez deux espèces modèles : la drosophile et le maïs. L'objectif de telles études est de détecter les changements d'expression des gènes entre différentes conditions expérimentales ou différentes populations pour identifier des ensembles de gènes d'intérêt et étudier leur co-expression. La spécificité des données produites à l'IDEEV est un faible nombre de réplicats et une possible hétérogénéité intra-échantillons. Les méthodes de modélisation des données de comptage issues du RNA-seq sont nombreuses. Certaines d'entre elles s'inspirent des méthodes déjà mises en place pour les puces à ADN (méthodes basées sur un modèle gaussien : voom limma). D'autres ont été développées spécialement pour répondre à la spécificité de ces données discrètes (méthodes basées sur un modèle binomial négatif : EdgeR et DESeq). Notre travail consiste à améliorer les connaissances sur les propriétés de ces données, dont le traitement reste jusqu'à présent difficile, et de comparer ces trois méthodes d'analyse, en terme de performance et de robustesse. Nous concentrerons nos efforts sur l'étude de l'influence du modèle statistique et du type de normalisation sur l'identification des gènes différentiellement exprimés. L'objectif est de proposer une démarche générale pour adapter le cadre d'analyse à chaque type de données selon leur spécificité et leur plan d'expérience.