Le projet bio-informatique de la plateforme
En bio-informatique, le projet spécifique de la plate-forme transcriptome de Sophia-Antipolis intègre
la conception et production des sondes, la mesure et l'analyse des résultats et leur interprétation biologique.
L'automatisation des protocoles et des procédures, le pilotage et l'intégration de différents programmes,
l'extraction automatique des résultats expérimentaux après analyse d'images, et leur annotation à l'aide
d'informations récupérées sur des bases de données distantes a nécessité la mise en place d'un système
d'informations cohérent permettant de stocker et d'accéder les informations d'intérêt.
Une large place laissée au contrôle humain lors des étapes clés a rendu le système d'information
voisin d'un entrepôt de données, la partie analyse étant déléguée à des outils complémentaires tels
que
Bioconductor.
Le système d'information ainsi constitué, nommé
Mediante, permet de gérer toutes
les informations relatives à la fabrication des biopuces, ainsi que certains résultats post-quantifications.
Mediante utilise le moteur de base de données relationnelle PostgreSQL interfacé par une application Java J2EE
développée depuis 6 ans sur la plate-forme. La gestion des mises à jour des données de séquences et d'annotation
se fait régulièrement au sein de la base de données
Mediante par l'intermédiaire de script Perl de récupération
des annotations depuis un large ensemble de bases de données publiques (
Refseq,
Ensembl,
Source,
Ressourcerer, etc).
Le système d'information
Mediante est actuellement utilisé dans le cadre de la distribution par le RNG
de la ressource
Resogen, et permet la distribution au niveau national de puces pan-génomiques humaines et murines.
Les 3 principaux objectifs sont:
de gérer de manière autonome la production des biopuces en fonction des
commandes des collaborateurs distants, en liaison avec le serveur du RNG,
de stocker l'ensemble des résultats des hybridations des biopuces,
d'aider l'expérimentateur biologiste dans l'interprétation des expériences
de biopuces en lui fournissant une vision synthétique des données propres à chaque sonde.
Ce projet intègre la comparaison de résultats obtenus entre différentes plates-formes.
Il permet également la gestion de la production des puces pan-génomiques humaines et souris
de 2 autres plates-formes transcriptome : Evry et Strasbourg, dans le cadre du programme Resogen du RNG.
Parallèlement à ce travail, la mise en place d'outils issus des recherches en web sémantique se poursuit,
en collaboration avec l'équipe de Rose Dieng (projet ACACIA, INRIA).
Les axes de recherche poursuivis concernent :
l'acquisition des connaissances et l'enrichissement d'ontologies à partir de textes,
la recherche d'information sémantique,
la construction de mémoires d'expériences,
l'aide à la validation et à l'interprétation des expériences basés sur les puces ADN.
La base de donnée Mediante, et les applications interfaçant cette base de données (Medlab et Mediante)
sont hébergés sur un serveur Dell, biprocesseur Xeon 3,2Gb, disposant de 8Go de Ram et 2 To d'espace de
stockage, ce qui permet de conserver l'ensemble des données de biopuces issues des productions comme
des hybridations. L'objectif est de stocker à terme autour de 20.000 résultats de biopuces.
Accéder au site Mediante.