Plateforme transcriptome de NICE - Sophia-Antipolis


Le projet bio-informatique de la plateforme

En bio-informatique, le projet spécifique de la plate-forme transcriptome de Sophia-Antipolis intègre la conception et production des sondes, la mesure et l'analyse des résultats et leur interprétation biologique. L'automatisation des protocoles et des procédures, le pilotage et l'intégration de différents programmes, l'extraction automatique des résultats expérimentaux après analyse d'images, et leur annotation à l'aide d'informations récupérées sur des bases de données distantes a nécessité la mise en place d'un système d'informations cohérent permettant de stocker et d'accéder les informations d'intérêt.

Une large place laissée au contrôle humain lors des étapes clés a rendu le système d'information voisin d'un entrepôt de données, la partie analyse étant déléguée à des outils complémentaires tels que Bioconductor. Le système d'information ainsi constitué, nommé Mediante, permet de gérer toutes les informations relatives à la fabrication des biopuces, ainsi que certains résultats post-quantifications.

Mediante utilise le moteur de base de données relationnelle PostgreSQL interfacé par une application Java J2EE développée depuis 6 ans sur la plate-forme. La gestion des mises à jour des données de séquences et d'annotation se fait régulièrement au sein de la base de données Mediante par l'intermédiaire de script Perl de récupération des annotations depuis un large ensemble de bases de données publiques (Refseq, Ensembl, Source, Ressourcerer, etc). Le système d'information Mediante est actuellement utilisé dans le cadre de la distribution par le RNG de la ressource Resogen, et permet la distribution au niveau national de puces pan-génomiques humaines et murines.

Les 3 principaux objectifs sont:
  • de gérer de manière autonome la production des biopuces en fonction des commandes des collaborateurs distants, en liaison avec le serveur du RNG,
  • de stocker l'ensemble des résultats des hybridations des biopuces,
  • d'aider l'expérimentateur biologiste dans l'interprétation des expériences de biopuces en lui fournissant une vision synthétique des données propres à chaque sonde.
  • Ce projet intègre la comparaison de résultats obtenus entre différentes plates-formes. Il permet également la gestion de la production des puces pan-génomiques humaines et souris de 2 autres plates-formes transcriptome : Evry et Strasbourg, dans le cadre du programme Resogen du RNG. Parallèlement à ce travail, la mise en place d'outils issus des recherches en web sémantique se poursuit, en collaboration avec l'équipe de Rose Dieng (projet ACACIA, INRIA).
    Les axes de recherche poursuivis concernent :
  • l'acquisition des connaissances et l'enrichissement d'ontologies à partir de textes,
  • la recherche d'information sémantique,
  • la construction de mémoires d'expériences,
  • l'aide à la validation et à l'interprétation des expériences basés sur les puces ADN.
  • La base de donnée Mediante, et les applications interfaçant cette base de données (Medlab et Mediante) sont hébergés sur un serveur Dell, biprocesseur Xeon 3,2Gb, disposant de 8Go de Ram et 2 To d'espace de stockage, ce qui permet de conserver l'ensemble des données de biopuces issues des productions comme des hybridations. L'objectif est de stocker à terme autour de 20.000 résultats de biopuces.

    Accéder au site Mediante.