Séminaire Mensuel / Monthly seminar

Mardi 13 Mai / May 13 (Evry)

10h00: Gregory Nuel (CNRS INSMI, LPMA UPMC)

Estimating Causal Effects in Gene Expression from a Mixture of Observational and Intervention Experiments

An important step in systems biology is to improve our knowledge of how genes causally interact with one another. A few approaches have been proposed for the estimation of causal effects among genes, either based on observational data alone or requiring a very precise intervention design with one knock-out experiment for each gene. We recently suggested a more flexible algorithm, using a Markov chain Monte Carlo algorithm and the Mallows ranking model, that can analyze any intervention design, including partial or multiple knock-outs, using the framework of Gaussian Bayesian networks.   We previously demonstrated the superior performance of this algorithm in comparison to alternative methods, although it can be computationally expensive to implement. The aim of this paper is to propose an alternative approach taking advantage of node pair ordering preferences to sample the posterior distribution according to the Babington-Smith ranking distribution. This novel algorithm proved, both in a simulation study and on the DREAM4 challenge data, to attain estimation of the causal effects as accurate as the MCMC-Mallows approach with a highly improved computational efficiency, being at least 100 times faster. We also tested our algorithm on the Rosetta Compendium dataset with more contrasted results. We nevertheless anticipate that our new approach might be very useful for practical biological applications.
 

14h00: Madalina Olteanu (SAMM, Université Paris I)

Cartes auto-organisées pour données complexes (travail en collaboration avec Nathalie Villa-Vialaneix)

Cet exposé sera dédié à la présentation de quelques extensions des cartes auto-organisées pour des données non-vectorielles. Dans un premier temps, on supposera que les données sont connues uniquement à travers une matrice de dissimilarités. Dans un deuxième temps, les données seront décrites par plusieurs sources numériques et/ou non-numériques (par exemple, un graphe étiqueté avec de l'information quantitative et/ou qualitative sur les noeuds). Les différentes sources d'information seront prises en compte à l'aide d'un mélange adaptatif de noyaux ou de dissimilarités. Quelques exemples sur données réelles et simulées permettront d'illustrer les différents algorithmes et d'introduire le package
R SOMbrero (http://sombrero.r-forge.r-project.org).


Précédents séminaires/Previous seminars