Laboratoire SIGMA - SIGnaux, Modèles, Apprentissage statistique

 

Apprentissage artificiel, théorie et applications  Modélisation des systèmes nerveux

Retour à la page Présentation Générale

APPRENTISSAGE STATISTIQUE, THÉORIE ET APPLICATIONS


L'apprentissage artificiel ("machine learning") est la branche des statistiques et de l'informatique qui cherche à reproduire les capacités d'apprentissage des êtres vivants à l'aide d'algorithmes, implantés dans des programmes exécutés sur des ordinateurs. Les méthodes développées dans ce cadre s
e sont révélées très puissantes pour le développement de modèles prédictifs de processus complexes : lorsque les connaissances (physiques, chimiques, biologiques, etc.) sur le processus sont insuffisantes, voire inexistantes, l'apprentissage permet d'inférer des modèles prédictifs du comportement du processus à partir d'exemples de ce comportement.

PROJETS EN COURS

GRAPH MACHINES : apprentissage de données structurées ; application à l'aide à la découverte de nouveaux médicaments

Le concept de "graph machine", proposé et développé au laboratoire, permet l'apprentissage de données qui sont représentées par des graphes, alors que les méthodes conventionnelles d'apprentissage artificiel telles que les machines à vecteurs supports ou les réseaux de neurones, apprennent à partir de données représentées par des vecteurs. La méthode est particulièrement bien adaptée à la découverte de nouveaux médicaments, car la structure des molécules est naturellement celle d'un graphe. La supériorité des "graph machines" sur les méthodes conventionnelles de prédiction (QSAR/QSPR : Quantitative Structure-Activity Relations, Quantitative Structure-Property Relations) a été démontrée sur de nombreux exemples. Le partenaire de ce projet est la Laboratoire de Chimie Organique de l'ESPCI-ParisTech.

FLASH : prédiction de crues subites par apprentissage statistique et modélisation semi-physique

La prévision des crues en temps réel constitue un enjeu économique et sociétal majeur. Elle est traditionnellement réalisée par le couplage de modèles météorologiques et atmosphériques complexes. Le projet FLASH, soutenu par l'ANR, cherche à mettre à profit les nombreuses données existantes pour concevoir, par apprentissage statistique, des modèles prédictifs des crues, notamment dans le sud-est de la France ("épisodes cévenols"). Se fondant sur son expérience du domaine, le laboratoire mettra en œuvre les méthodes de modélisation par machines à vecteurs supports (SVM) dynamiques qu'il a développés, ainsi que la méthode de modélisation semi-physique qui permet de réaliser, par apprentissage, des modèles qui tiennent compte des connaissances physiques, chimiques, biologiques avérées. Nos partenaires sont l'École des Mines d'Alès, le Laboratoire EDYTEM (Environnements Dynamiques et Territoires de Montagne), et le SCHAPI (Service Central d'Hydrométéorologie et d'Appui à la Prévision des Inondations).

OUISPER et REVOIX : conception d'une interface de communication parlée silencieuse ; application à la conception d'un "téléphone silencieux"

Le projet OUISPER (Oral Ultrasound Synthetic Speech Source) et le projet REVOIX, soutenus par l'ANR et la DGA, visent à la conception et à la réalisation d'un système de synthèse d'un signal de parole intelligible, à partir de séquences d'images échographiques de la langue, et d'images optiques des lèvres, sans vocalisation. Deux types d'applications sont envisagées :

Nos partenaires actuels sont le Laboratoire de Traitement et Communication de l'Information (Télécom-ParistTech) et le Laboratoire de Phonétique et de Phonologie (Université de Paris 3).

ARPEGEO : géolocalisation de porteurs de téléphones mobiles à l'intérieur de bâtiments, application au suivi des patients atteints de la maladie d'Alzheimer

L’incidence de la détérioration intellectuelle due à la maladie d'Alzheimer, ou à d’autres causes, rend nécessaire le suivi minutieux des déplacements, dans son lieu d’habitation et ses environs immédiats, d'une population de plus en plus nombreuse. En effet, la désorientation et l’errance qui en est la conséquence entraînent souvent le confinement de ces patients dans un espace restreint au domicile ou en institution. Le projet ARPEGEO propose une solution élégante à la localisation de ces personnes, grâce à un procédé original, qui nécessite simplement que la personne à localiser porte sur elle un téléphone cellulaire, équipé ou non d’un GPS, muni d'une modification logicielle mineure. Comme le port quotidien d'un téléphone portable ne crée aucun gêne pour l'utilisateur, et que le réseau radiotéléphonique - qui permet à la fois d'effectuer la localisation et d'en communiquer le résultat à un serveur - est déjà en place, le projet ouvre la voie à un système de suivi quotidien, d'une grande simplicité d'utilisation et de très faible coût.

CARDIO : Modélisation par apprentissage de signaux électro-physiologiques à une ou deux dimensions ; application à l'aide au diagnostic à partir d'enregistrements de l'activité cardiaque ou de l'activité cérébrale

Les signaux électro-physiologiques ont fréquemment une structure "en bosses". L'apprentissage artificiel permet de modéliser ces signaux ("modélisation en bosses") de manière immédiatement compréhensible et utilisable par le praticien.

Les signaux électro-cardiographiques ont une structure caractéristique de pics négatifs ou positifs (les "ondes" P, Q, R, S, T), correspondant à des phénomènes de dépolarisation et de repolarisation bien identifiés. Des pathologies sont détectables par des modifications de forme, d'amplitude et de position de ces pics. Dans des enregistrements de longue durée (enregistrements Holter), il est important d'aider le praticien à trouver automatiquement la ou les anomalies dans les quelque cent mille à cent cinquante mille battements enregistrés en une journée chez un patient. Le laboratoire a mis au point des méthodes de modélisation et de classification originales qui permettent d'atteindre cet objectif.

Des applications de l'apprentissage artificiel à l'aide à la chirurgie intra-cardiaque ont été menées en collaboration avec des hôpitaux (Bordeaux, Paris).

Enfin, en collaboration avec la société Sorin, nous avons mis au point des méthodes originales de modélisation des signaux endo-cavitaires pour l'aide à la prise de décision des défibrillateurs implantés, qui permettent d'améliorer le fonctionnement de ces défibrillateurs.

STRESS : conception de capteurs virtuels par apprentissage ; applications dans les domaines de l'environnement et de la santé.

Les capteurs virtuels sont de plus en plus fréquemment mis en oeuvre : ils permettent d'éviter l'installation de capteurs coûteux, en les remplaçant par des modèles prédictifs, conçus par apprentissage à partir de mesures plus simples et économiques. En collaboration avec l'unité 551 de l'INSERM (Pitié-Salpêtrière), un capteur virtuel de marqueurs forts du stress oxydatif a été conçu. Il devrait permettre de s'affranchir d'analyses coûteuses, dont on prédit le résultat par un modèle dont les variables sont les résultats de dosages simples (vitamine C, vitamine E, etc.).

PROJETS PASSÉS

Ces progrès méthodologiques ont été reconnus par de nombreux industriels français et étrangers, avec lesquels nous avons mené à bien des projets appliqués qui ont fréquemment abouti à des réalisations opérationnelles :

 

Pour plus de détails sur tous ces sujets et bien d'autres, consultez la page des publications du Laboratoire. Voyez aussi nos activités de modélisation de systèmes vivants.

Certaines contributions méthodologiques du laboratoire ont été industrialisés sous la forme d'une suite logicielle destinée au développement d'applications industrielles ou financières de l'apprentissage artificiel.

Cliquez ici pour savoir ce que sont devenus nos anciens doctorants

soudage
Modélisation du procédé de soudage par points

Retour en haut de page


[ SIGMA-ESPCI | ESPCI ]

Dernière modification :