Service à la communauté MUSE

La KIM s’appuie sur un pôle composé d’une spécialiste de la gestion et du stockage de données,Christelle Pierkotet d’une bio-informaticienne,Sonia Tieo. Un état des lieux de la gestion et du traitement des données du vivant et de l’environnement dans la communauté MUSE a pu ainsi être réalisé par le pôle.

Afin de créer ou renforcer les liens entre les plateformes d’analyse de données et la communauté scientifique, la KIM a organisé, en janvier 2020, une journée de présentation des différentes plateformes et mis en ligne des fiches descriptives de ces plateformes ; ces fiches comportent une description de la plateforme, les services et outils proposés, les équipements associés s’ils existent, les formations mises en place, les droits d’utilisation et les contacts :

ATGC Plateforme de bio-informatique orientée vers la génomique comparative, évolutive et fonctionnelle
Bio2M Plateforme de bio-informatique et biomarqueurs orientée dans la vers le traitement rapide des données NGS
IMGT Plateforme de bio-informatique spécialisée dans les domaines de l’immunogénétique et l’immunoinformatique
MBB Plateforme de bio-informatique pour les domaines de l’évolution et de l’écologie
MGX Plateforme de bio-informatique spécialisée dans l’offre des technologies de pointe de la génomique
PPM Plateforme technologique spécialisée dans l’analyse protéomique
SouthGreen Plateforme bio-informatique pour l’analyse des ressources génomiques appliquée aux plantes méditerranéennes et tropicales
StatABio Plateforme de bio-statistiques offrant des services en traitement statistique des données biologiques

La KIM a créé leRéseau des bio-statisticiens de Montpellier(Montpellier Bio-Stats, MBS) qui regroupe actuellement166 membresaffiliés à divers laboratoires et unités de Montpellier, représentant de nombreuses institutions : CHU, CIRAD, CNRS, IRD, Inserm, Inrae, Université de Montpellier.

Le profil des membres est varié : bio-statisticiens, bio-informaticiens, biologistes, informaticiens, statisticiens. Les domaines d’activités et de compétences des membres du réseaux sont très larges : données de séquençage, données de santé / essais cliniques, observations terrain / comptages, images, données spatio-temporelles, spectrales, audios, climatiques, météorologiques, biométriques.

L’objectifdu réseau est defédérer et mettre en relationles acteurs scientifiques ayant des expertises ou besoins complémentaires pour partager leurs compétences et possiblement nouer des collaborations.

Le réseau propose une animation scientifique autour des méthodes de machine learning appliquées à la biologie : 2 workshops sur les Random Forests et le Deep Learning ont été organisés en 2019.

En 2019, plusieurs sessions de formation d’une journée R pour les débutants tenues par des formateurs du réseau ont été organisées. Elles ont permis à 130 participants au total d’apprendre les bases d’un logiciel incontournable de traitement de données.

 Pourquoi faire une formation R ?

Dans le cadre du réseau MBS, après avoir sondé la communauté des sciences du vivant et de l’environnement, un grand besoin est ressorti: découvrir R ou améliorer ses compétences pour ce langage.

Celangage de programmation clé pour la Data Scienceoffre de multiples fonctionnalités comme la collecte, la manipulation, la transformation, l’analyse statistique, la modélisation, la visualisation et la communiquer autour de la donnée.

Grâce aux présentations faites dans le cadre du réseau MBS, les novices pourront apprendre R et les autres pourront bénéficier de la présentation des quelques outils qui font la puissance de R.

Formation R débutant 2020

24 septembre 2020

R-Débutant anglais : Benjamin Viart , IGH-CNRS

Formations R avancé 2020

29 septembre – matin

R-Markdown : Jean-Michel Marin, IMAG-Université de Montpellier

29 septembre –  après-midi

R Shiny : Ghislain Durif, IMAG-CNRS

8 octobre – matin

R-Mardown : David Kaplan, MARBEC-IRD

8 octobre – après-midi

R-SIG : David Kaplan, MARBEC-IRD

9 octobre – matin

R ggplot : Thibault Nidelet, SPO-INRAE

13 octobre – après-midi

R Shiny : Ghislain Durif, IMAG-CNRS

15 octobre – après-midi

R ggplot : Sandra Cortijo, BPMP-CNRS

Les formations auront lieu en présentiel sur le campus Triolet de l’université de Montpellier à l’IMAG (salle 109).

En décembre 2020, plusieurs sessions de formation Python d’une journée pour les débutants proposées par des formateurs du réseau ont été organisées à distance (pour raison de crise sanitaire). L’objectif est de permettre à une centaine de participants d’apprendre les bases d’un langage de programmation qui est devenu incontournable pour le traitement des données.

Pourquoi faire une formation Python ?

Dans le cadre du réseau MBS, après avoir sondé la communauté des sciences du vivant et de l’environnement, un grand besoin est ressorti: découvrir Python ou améliorer ses compétences pour ce langage.

Celangage de programmation clé pour la Data Scienceoffre de multiples fonctionnalités comme la collecte, la manipulation, la transformation, l’analyse statistique, la modélisation, la visualisation et la communiquer autour de la donnée.

Les séances se sont déroulées les :

8 décembre avec Nicolas Barrier de l’UMR Marbec et Aymeric Antoine-Lorquin de l’UMR DGIMI
09 décembre avec Aubin Thomas de l’IGH
10 décembre avec Benjamin Pillot de l’UMR Espace-Dev
11 décembre avec Aymeric Antoine-Lorquin de l’UMR DGIMI
14 décembre avec Benjamin Pillot de l’UMR Espace-Dev
15 décembre avec Enrique Ortega du CEFE en anglais
16 décembre avec Aubin Thomas de l’IGH
17 décembre avec Nicolas Barrier de l’UMR Marbec et Enrique Ortega du CEFE

La KIM Biomarkers & Therapy considère que les biomarqueurs sont essentiels non seulement pour confirmer les diagnostics, mais aussi pour définir les sous-types de pathologie et établir des liens avec la réponse au traitement. Une bonne exploitation de ces données est impérative. Le développement de nouveaux outils bioinformatiques et mathématiques est donc indispensable, la KIM Data & Life Sciences peut ainsi venir en appui de la création d’un outil d’extraction automatisée de données patients à partir de bases de données distribuées entre les différents systèmes informatiques des établissements de santé (CHU de Montpellier, CHU de Nîmes et Institut du Cancer de Montpellier).
Des réunions mensuelles pour les Ingénieurs de Recherche et d’Etude dans les domaines du traitement et du stockage des données, seront consacrées aux méthodologies et algorithmes.

Contact

Responsable de la KIM :
Jean-Michel MARIN

Chargé de projet :
Nathalie Collain