Theses: abstracts and texts
THESES DISPONIBLES / AVAILABLE THESES
D. Urbani (1995)
Méthodes statistiques de sélection d'architectures neuronales : application à la conception de modèles de processus dynamiques
Isabelle Rivals (1995)
Modélisation et commande de processus par réseaux de neurones; application au pilotage d'un véhicule autonome.
Hervé Stoppiglia (1997)
Méthodes statistiques de sélection de modèles neuronaux ; applications financières et bancaires
Yacine Oussar (1998)
Réseaux d'ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus.
Gaetan Monari (1998)
Sélection de modèles non linéaires par leave-one-out. Etude théorique et application des réseaux de neurones au procédé de soudage par points.
Mathieu Stricker (2000)
Réseaux de neurones pour le traitement automatique du langage : conception et réalisatiion de filtres d'informations.
Rémi Dubois (2004)
Application des nouvelles méthodes d'apprentissage à la détection précoce d'anomalies en électrocardiographie.
François-Benoît Vialatte (2005)
Modélisation en bosses pour l’analyse des motifs oscillatoires reproductibles dans l’activité de populations neuronales : applications à l’apprentissage olfactif chez l’animal et à la détection précoce de la maladie d’Alzheimer.
Marc Lucea (2006)
Modélisation dynamique par réseaux de neurones et machines à vecteurs supports : contribution à la maîtrise des émissions polluantes de véhicules automobiles.
Aurélie Goulon-Sigwalt-Abram (2008)
Une nouvelle méthode d'apprentissage de données structurées : applications à l'aide à la découverte de médicaments.
Thomas Hueber (2009)
Reconstitution de la parole par imagerie ultrasonore et vidéo de l’appareil vocal : vers une communication parlée silencieuse
Cette thèse, soutenue le 16 Novembre 1995, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), sous la direction de Gérard Dreyfus (Professeur à l'ESPCI) avec l'encadrement de Pierre Roussel-Ragot (Maître de Conférences à l'ESPCI) et Léon Personnaz (Maître de Conférences à l'ESPCI).
Résumé
Les réseaux de neurones formels connaissent depuis quelques années un développement important, notamment dans le domaine de l'automatique et de la commande de processus. Cependant, peu de travaux abordent le problème de la sélection de modèles : la sélection consiste à déterminer les entrées et l'architecture du modèle afin que celui-ci soit tout à la fois performant (possédant de bonnes capacités de généralisation) et parcimonieux (la complexité de sa structure est minimale, afin de réduire le nombre de calcul). D'autre part, l'intérêt croissant pour les réseaux de neurones a conduit à la conception de circuits dédiés aux applications neuronales. Or, la réalisation de tels circuits est d'autant plus facile que leur structure est simple. Dans cette double optique, nous nous sommes intéressés au problème de la sélection de modèles neuronaux. Des méthodes heuristiques de sélection ont été proposées dans la littérature, mais nous avons choisi d'utiliser des méthodes statistiques, qui reposent sur des bases théoriques solides. Le problème a été abordé dans le cadre particulier de la modélisation de processus dynamiques non linéaires. Après avoir posé le problème de la modélisation de processus, nous proposons une procédure de sélection de modèles NARX qui se décompose en trois phases : dans la première phase, le processus est étudié dans plusieurs zones locales de fonctionnement, dans lesquelles son comportement peut être approché à l'aide de modèles simples, linéaires par rapport aux paramètres. Un modèle neuronal du processus, valide sur tout le domaine de fonctionnement du processus, et dont les entrées sont celles sélectionnées lors de la première phase, est alors construit. De nouvelles sélections sont effectuées pour réduire si nécessaire ses entrées (deuxième phase), puis le nombre de ses neurones (troisième phase). Cette procédure est appliquée à plusieurs processus NARX simulés.
Vous pouvez télécharger soit toute la thèse, soit des chapitres :
Cette thèse, soutenue le 20 Janvier 1995, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), sous la direction de Gérard Dreyfus (Professeur à l'ESPCI) avec l'encadrement de Léon Personnaz (Maître de Conférences à l'ESPCI).
Résumé
Les réseaux de neurones formels permettent de construire, par apprentissage, une vaste famille de modèles et de correcteurs non lineaires. L'objet de cette thèse est la définition des modalités de mise en oeuvre de réseaux de neurones et l'évaluation de leur apport pour la modélisation et la commande non adaptatives de processus dynamiques non linéaires.
Sur le plan théorique, nous présentons la modélisation et la commande de processus par réseaux de neurones dans un cadre aussi général que possible, en les plaçant dans la perspective de l'Automatique classique, linéaire en particulier. Du point de vue de la modélisation, les résultats concernant les systèmes linéaires nous aident à formuler les prédicteurs non linéaires optimaux théoriques correspondant à diverses hypothèses sur le bruit intervenant dans le processus à modéliser ; une méthodologie d'apprentissage associée fournit des prédicteurs neuronaux qui sont
des réalisations des prédicteurs théoriques. Nous proposons ensuite une famille de systèmes de commande neuronaux, dont nous étudions les propriétés et les liens avec les systèmes de commande classique, linéaire ou non, en insistant notamment sur la robustesse ; ceci nous conduit à la commande avec modèle interne.
Sur le plan pratique, nous illustrons notre démarche et nos résultats par une application industrielle, le pilotage d'un véhicule autonome tout-terrain, dont le volant, l'accélérateur et les freins sont commandés par des réseaux neuronaux.
Vous pouvez télécharger toute la thèse (à l'exception des chapitres confidentiels), ou des chapitres séparés
Cette thèse, soutenue le 16 Décembre 1997, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), sous la direction du Professeur Gérard Dreyfus.
Résumé
Le travail présenté dans ce mémoire traite de l'évaluation, à l'aide de réseaux de neurones, de l'état de santé financière de collectivités locales ou d'entreprises. Dans un premier temps, nous rapprochons cette évaluation d'un problème de classification ; nous expliquons pourquoi ce type de problème peut être avantageusement résolu avec des méthodes statistiques de classification comme les réseaux de neurones. Les chapitres suivants présentent et définissent plus précisément les concepts de la classification, les méthodes usuelles de classification, les réseaux de neurones ainsi que l'apprentissage de ceux-ci. Dans les applications envisagées, l'individu à classer (collectivité locale ou entreprise) peut être décrit par une très grande quantité de variables (données comptables, fiscales, socio-économiques, etc) ; ce constat nous a conduit à étudier les méthodes de sélection de modèles. Nous proposons une méthode statistique originale de sélection des meilleures variables descriptives, puis de définition du modèle neuronal. La dernière partie de ce mémoire concerne les applications industrielles de ces travaux ; la première concerne l'analyse financière des collectivités locales,la seconde l'analyse financière des entreprises.
L'apport orignal de cette étude concerne trois domaines :
- Sélection de variables : nous ajoutons une variables aléatoire aux autres variables descriptives afin de distinguer celles qui sont réellement pertinentes.
- Sélection de modèles : nous utilisons la méthode précédente pour sélectionner les seuls neurones utiles dans un réseau de neurones à une couche cachée.
- Classification : nous inversons la formule de Bayes pour estimer les fonctions densité de probabilité avec des approximateurs.
En ce qui concerne l'analyse financière des entreprises, ce travail a débouché sur une application opérationnelle à la Caisse des Dépôts et Consignations depuis 1995.
Publications portant sur cette thèse / Related publications
H. Stoppiglia, G. Dreyfus, R. Dubois, Y. Oussar
Ranking a Random Feature for Variable and Feature Selection
Journal of Machine Learning Research, pp. 1399-1414 (2003).
L. Oukhellou, P. Aknin, H. Stoppiglia, G. Dreyfus
A New Decision Criterion for Feature Selection: Application to the Classification of Non Destructive testing Signatures
European SIgnal Processing COnference (EUSIPCO'98), Rhodes (1998)
H. Stoppiglia, Y. Idan, G. Dreyfus
Neural-Network-Aided Portfolio Management
Industrial Applications of Neural Networks., F. Fogelman-Soulié, P. Gallinari, eds. (World Scientific, 1997).
M. Stricker, F. Vichot, G. Dreyfus, F. Wolinski
Two-Step Feature Selection and Neural Network Classification for the TREC-8 Routing
Eighth International Text REtrieval Conference (TREC-8), Gaithersburg (1999).
Vous pouvez télécharger toute la thèse , ou des chapitres séparés
Cette thèse, soutenue le 06 Juillet 1998, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), sous la direction du Professeur Gérard Dreyfus.
Résumé
Durant les dix dernières années, les réseaux de neurones à fonctions sigmoïdales ont connu de grands succès dans de nombreux domaines. Associés à des algorithmes d'apprentissage efficaces, ils constituent un puissant outil de modélisation non linéaire de processus, grâce à leur propriété d'approximation universelle parcimonieuse. Ce travail de thèse propose une mise en uvre de réseaux d'ondelettes, alternative possible aux réseaux de neurones, pour la modélisation statique et dynamique.
Les ondelettes sont une famille de fonctions issues du traitement du signal et de l'image, dont il a été récemment montré qu'elles possèdent la propriété d'approximateur universel. La mise en uvre des réseaux d'ondelettes est effectuée suivant deux
approches :
- Approche fondée sur la transformée continue : les paramètres des fonctions sont à valeurs continues dans l'ensemble des nombres réels et peuvent donc être ajustés, comme ceux d'un réseau de neurones classique, à l'aide de méthodes de gradient. Nous proposons des réseaux et des algorithmes d'apprentissage pour la modélisation entrée-sortie et d'état. Les résultats obtenus sur des processus simulés et réel montrent que ces réseaux permettent d'obtenir des modèles de performance et de parcimonie équivalentes à celles des réseaux de neurones si des précautions de mise en uvre sont prises.
- Approche fondée sur la transformée discrète : les paramètres des fonctions étant à valeurs discrètes, les apprentissages fondés sur des méthodes de gradient ne sont pas applicables. Nous proposons de construire des réseaux par sélection d'ondelettes dans une bibliothèque pré-établie. Cette procédure est également utilisée pour l'initialisation des paramètres des ondelettes avant leur apprentissage. Les résultats obtenus montrent que la procédure proposée confère à l'apprentissage une meilleure indépendance vis-à-vis de l'initialisation aléatoire des autres paramètres ajustables du réseau.
Publications portant sur cette thèse / Related publications
Y. Oussar, G. Dreyfus
Initialization by Selection for Wavelet Network Training
Neurocomputing, 20, 131-143 (2000)
Y. Oussar, I. Rivals, L. Personnaz, G. Dreyfus
Training Wavelet Networks for Nonlinear Dynamic Input-Output Modeling
Neurocomputing, 20, 173-188 (1998).
Vous pouvez télécharger toute la thèse , ou des chapitres séparés
Cette thèse, soutenue le 03 Novembre 1999, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), sous la direction du Professeur Gérard Dreyfus.
Résumé
Le soudage par points est la principale technique d'assemblage des tôles de carrosserie automobile. Cependant, la variabilité de ce procédé, et en particulier de l'état des électrodes de soudage, pose deux problèmes non résolus à ce jour : le contrôle non destructif de la qualité des soudures et la commande des paramètres de soudage.
Utilisé fréquemment dans le domaine des réseaux de neurones, et réputé pour donner de bons résultats avec peu d'exemples, le leave-one-out conduit en réalité souvent à la sélection de modèles surajustés. Or, par un développement de Taylor, nous pouvons calculer l'effet du retrait d'un exemple de la base d'apprentissage sur la sortie du modèle. Nous prouvons que l'estimation de l'erreur de généralisation obtenue à partir de ce calcul est plus fiable que celle obtenue classiquement par apprentissage. Par ailleurs, nous montrons le lien existant entre le leave-one-out calculé et les intervalles de confiance sur la sortie du modèle. Enfin, nous proposons une technique originale de sélection de modèles non linéaires qui évite le surajustement en limitant l'influence de chaque exemple sur l'estimation des paramètres du modèle.
Nous présentons une méthode permettant d'obtenir un modèle de prévision du diamètre d'une soudure, valable dans des conditions préétablies. Plus particulièrement, nous montrons comment constituer une base de données initiale, sélectionner le modèle adéquat, puis compléter progressivement la base d'apprentissage. Appliquée à deux types de tôles, cette méthode permet d'atteindre une précision proche de l'erreur de mesure. En outre, utilisés au sein d'une loi de commande, ces modèles permettent d'optimiser l'usure des électrodes.
Publications portant sur cette thèse / Related publications
G. Monari, G. Dreyfus
Local Overfitting Control via Leverages
Neural COmputation, vol. 14, pp. 1481-1506 (2002).
Y. Oussar, G. Monari, G. Dreyfus
Reply to the Comments on "Local Overfitting Control via Leverages" in "Jacobian Conditioning Analysis for Model Validation" by I. Rivals and L. Personnaz.
Neural Computation, vol. 16, pp. 419 - 443 (2004).
G. Monari, G. Dreyfus
Withdrawing an Example from the Training Set : an Analytic Estimation of its Effect on a Non-linear Parameterised Model
Neurocomputing, vol. 35, pp. 195-201 (2000).
G. Monari, G. Dreyfus
Local Linear Least Squares: Performing Leave-One-Out Without Leaving Anything Out
"Learning" Conference, Snowbird (1999), présentation invitée.
Vous pouvez télécharger toute la thèse (à l'exception des chapitres confidentiels) ou des chapitres séparés
Cette thèse, soutenue le 19 Décembre 2000, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), en collaboration avec La Caisse des Dépôts et Consignations, sous la direction du Professeur Gérard Dreyfus.
Résumé
En raison de l'augmentation constante du volume d'information accessible électroniquement, la conception et la mise en uvre d'outils efficaces, permettant notamment à l'utilisateur de n'avoir accès qu'à l'information qu'il juge pertinente, devient une nécessité absolue. Comme la plupart de ces outils sont destinés à être utilisés dans un cadre professionnel, les exigences de fiabilité et de convivialité sont très importantes ; les problèmes à résoudre pour satisfaire ces exigences sont nombreux et difficiles. L'accès à cette information pertinente peut se faire en fournissant à un utilisateur des documents pertinents ou en lui proposant des passages de documents pertinents (ou des réponses à des questions). Le premier cas relève du domaine de la recherche de textes et le second du domaine de l'extraction d'informations.
C'est dans le domaine très actif de la recherche de textes que s'est situé notre travail, réalisé dans le cadre d'une collaboration entre Informatique CDC, filiale de la Caisse des Dépôts et Consignations, et le Laboratoire d'Électronique de l'ESPCI.
Le but de nos travaux a été de développer un modèle fondé sur l'apprentissage numérique pour la catégorisation de textes ou, plus précisément, pour ce qui correspond à la tâche de routing dans le découpage de la conférence TREC (Text REtrieval Conference). L'approche que nous avons conçue nous a permis d'obtenir un résultat très satisfaisant : nous avons remporté la tâche de "routing" de la compétition TREC 9, devançant notamment Microsoft.
Le point essentiel de notre approche est l'utilisation d'un classifieur qui est un réseau de neurones dont l'architecture prend en considération le contexte local des mots. La mise en uvre d'une méthode de sélection des entrées nous a permis de réduire à une vingtaine le nombre de descripteurs de chaque texte ; néanmoins, le nombre de paramètres reste élevé eu égard au nombre d'exemples disponibles (notamment lors de la compétition TREC 9). Il a donc été nécessaire de mettre en uvre une méthode de régularisation pour obtenir des résultats significatifs à l'issue des apprentissages.
Nos résultats ont été validés d'une part grâce au corpus Reuters-21578 qui est souvent utilisé par la communauté de la catégorisation de textes, et d'autre part, par la participation aux sous-tâches de routing de TREC-8 et TREC-9, qui ont permis d'effectuer des comparaisons chiffrées avec d'autres approches.
Nos travaux ont été intégrés dans l'application ExoWeb développée à la Caisse des Dépôts, pour y ajouter des fonctionnalités opérationnelles originales. Cette application offrait, sur l'intranet du groupe, un service de catégorisation de dépêches AFP en temps réel ; cette catégorisation s'effectuait grâce à des modèles à bases de règles.
La première fonctionnalité nouvelle résultant de nos travaux est un outil qui permet à l'administrateur du système de surveiller automatiquement le vieillissement de filtres construits sur des modèles à base de règles. L'idée de cette application est de fabriquer une "copie" d'un filtre à base de règles avec un filtre utilisant un réseau de neurones. Comme le réseau de neurones produit une probabilité de pertinence et non une réponse binaire, il est possible d'attirer l'attention de l'administrateur sur les documents pour lesquels les filtres et les réseaux de neurones fournissent des réponses divergentes : documents considérés comme pertinents par la méthode à base de règles, mais obtenant une probabilité proche de zéro avec le réseau de neurones, et documents considérés comme non pertinents avec le premier et obtenant une probabilité de pertinence proche de un avec le second.
Nous avons également proposé les bases d'une deuxième application, qui permet à un utilisateur de fabriquer lui-même un filtre à sa convenance avec un travail minimum. Pour réaliser cette application, il est nécessaire que l'utilisateur fournisse une base de documents pertinents. Cela peut se faire grâce à l'utilisation d'un moteur de recherche conjointement avec un réseau de neurones ou uniquement grâce au moteur de recherche.
Publications portant sur cette thèse / Related publications
Vous pouvez télécharger toute la thèse ou des chapitres séparés :
Cette thèse, soutenue le 27 janvier 2004, a été effectuée au Laboratoire d'Électronique de l'ESPCI (Paris), en collaboration avec la société Ela Médical.
Résumé
L'enregistrement Holter (enregistrement électrocardiographique de 24 heures) est un examen très fréquemment utilisé en cardiologie. Parmi les 100 000 battements enregistrés, seul un petit nombre d'entre eux peut traduire la présence d'une pathologie sous-jacente ; l'analyse automatique est donc indispensable.
Les outils actuels fonctionnent sur le principe d'un système expert, robuste, mais peu adaptatif et essentiellement limité à la détection et la classification des signaux de dépolarisation ventriculaire. Une analyse plus détaillée des signaux cardiaques permet une bien meilleure détection de nombreuses pathologies, en particulier grâce à l'extraction des signaux d'origine auriculaire et des ondes de repolarisation.
Nous proposons dans cette thèse une méthode de décomposition mathématique originale des battements cardiaques sur une base de fonctions appelées "bosses". Contrairement aux régresseurs classiques utilisés en modélisation (ondelettes, RBF,), les bosses sont des fonctions prévues pour modéliser chaque onde caractéristique du battement cardiaque (les ondes P, Q, R, S et T).
Chaque battement de l'enregistrement est ainsi décomposé en bosses ; puis les labels médicaux P, Q, R, S et T leur sont attribués par des classifieurs (réseaux de neurones).Disposant alors de l'emplacement et de la forme des toutes les ondes caractéristiques pour l'ensemble de l'ECG, nous pouvons désormais repérer automatiquement des anomalies comme l'inversion de l'onde P, jusqu'alors non détectées par les algorithmes sur les enregistrements de longues durées.
Cette approche a été testée sur de nombreuses bases de données et a montré toute son efficacité par rapport aux méthodes actuelles de détection d'anomalies.
Télécharger les chapitres du mémoire (.pdf):
Cette thèse, soutenue le 16 décembre 2005, a été effectuée au laboratoire d'Électronique de l'ESPCI, dirigée en co-tutelle par Gérard Dreyfus (ESPCI) et Rémi Gervais (Institut des Sciences Cognitives, équipe Neurobiologie de la Mémoire Olfactive, Lyon)
Résumé
L'étude des dynamiques neuronales associées aux processus cognitifs peut être abordée par l?analyse de l?activité électrique de populations neuronales enregistrée par des électrodes placées sur le scalp (électroencéphalogramme ou EEG), ou en profondeur (local field potential ou LFP) ; ce dernier type d'enregistrements localise l'origine du signal avec une meilleure résolution spatiale. On détecte ainsi des motifs d?activité rythmiques divisés en bandes de fréquences (rythmes alpha, bêta, gamma...), qui traduisent différents « états cérébraux » comme le niveau de vigilance et d'attention, ou certains états pathologiques comme l'épilepsie.
On ignore toutefois si ce type d'activité révèle également des aspects plus fins du traitement de l'information, comme la réponse neuronale sélective (« code neuronal ») à une stimulation sensorielle donnée. Si tel était le cas, on devrait pouvoir mettre en évidence le fait que la présentation d'un stimulus sensoriel donné engendre un motif reproductible d'activité oscillatoire. C'est pourquoi nous nous intéressons tout d'abord, dans ce travail, à l'analyse des représentations temps-fréquence de signaux LFP, enregistrés chez le rat libre de se mouvoir, en réponse à différents odorants. Dans une seconde partie, nous analysons des enregistrements électro-encéphalographiques (EEG) de courte durée obtenus chez des patients dont on soupçonne qu'ils développeront la maladie d'Alzheimer. Nous cherchons à détecter des motifs d'activité oscillatoires qui pourraient contribuer au diagnostic. Ces deux approches sont rendues possibles par une nouvelle méthode d'analyse des cartes temps-fréquence qui constitue le coeur de cette thèse.
La méthode que nous présentons ici, la « modélisation en bosses », fournit une représentation simple, parcimonieuse en nombre de paramètres, des cartes temps-fréquence obtenues par décomposition du signal en ondelettes. Cette modélisation permet l’extraction de caractéristiques temps-fréquence, à l’aide desquelles l’analyse statistique d’enregistrements nombreux, et la détection de motifs temps-fréquence reproductibles, peuvent être effectuées.
La méthode est d'abord validée sur des signaux artificiels (simulation de signaux réels). Elle est ensuite appliquée en premier lieu à l'analyse de plusieurs centaines de réponses aux odeurs obtenues dans le bulbe olfactif du rat (signaux LFP). Nous montrons, d'une part, que chacun des quatre odorants étudiés engendre des motifs d'activité oscillatoire reproductibles, et que certains de ces motifs diffèrent entre eux de façon significative. Ces motifs spécifiques d'activité, principalement observés dans la bande beta (15-35 Hz), pourraient refléter le recrutement successif d'assemblées neuronales associées à la représentation du stimulus. Pour les signaux EEG, nous présentons les premiers résultats d'une étude effectuée en collaboration avec le laboratoire LABSP du Riken Brain Science Institute (Wako, Japon). Nous montrons que notre méthode permet une détection précoce de la maladie d'Alzheimer (18 à 24 mois avant le diagnostic de la pathologie) avec une précision largement améliorée par rapport aux prédictions effectuées par d'autres méthodes sur la même base de données.
En conclusion, notre approche montre qu'il est possible d'extraire, à partir de l'analyse des motifs complexes d'activités oscillatoires engendrés par de larges populations neuronales, des corrélats du traitement de l'information sensorielle et la signature encore discrète d'états pathologiques.
Télécharger le mémoire (.pdf)
Cette thèse, soutenue le 22 septembre 2006, a été effectuée au laboratoire d'Électronique de l'ESPCI, dans le cadre d'une convention CIFRE avec Renault, sous la direction de Gérard Dreyfus (ESPCI) et avec l'encadrement de Yacine Oussar (ESPCI).
Résumé
La complexité croissante des systèmes employés dans l’industrie automobile, en termes de fonctions réalisées et de méthodes de mise en œuvre, mais aussi en terme de norme d’homologation, amène à envisager des outils toujours plus innovants lors de la conception d’un véhicule. On observe d’ailleurs depuis quelques années une forte augmentation du nombre de brevets déposés, en particulier dans le domaine des systèmes électroniques, dont l’importance ne cesse de croître au sein d’un véhicule automobile moderne. Cette complexité croissante des fonctions réalisées requiert une précision de description accrue pour les dispositifs impliqués, notamment pour les systèmes complexes où une approche analytique est difficilement envisageable. Aux impératifs de précision de la description, qui imposent souvent de prendre en considération les non-linéarités des processus, s’ajoute donc la complexité d’analyse des phénomènes physiques à l’origine des observations que l’on souhaite modéliser.
Les développements qu’ont connus ces dernières années les techniques de modélisation non linéaires par apprentissage (notamment les réseaux de neurones formels et les machines à vecteurs supports), alliés à la croissance de la capacité des ordinateurs et des calculateurs embarqués dans les véhicules automobiles, justifient donc l’intérêt porté par Renault à ces outils.
C’est dans cette optique qu’a été envisagée une étude portant sur les méthodes de modélisation non linéaire par apprentissage, dont l’objectif était d’en tester les secteurs d’applications possibles dans le contexte automobile, et d’en évaluer les difficultés de mise en œuvre ainsi que les gains attendus. Cette étude a fait l’objet d’une collaboration, sous forme d’un contrat de thèse CIFRE, avec le Laboratoire d’Electronique de l’Ecole Supérieure de Physique et de Chimie Industrielles de la Ville de Paris (ESPCI), dirigé par le Professeur Gérard Dreyfus.
De manière générale, les techniques de modélisation par apprentissage permettent d’aborder la modélisation de phénomènes physiques dont la description est ardue, élargissant ainsi le champ des possibles en matière de modélisation, mais également de s’affranchir d’une description physique détaillée pour des processus connus, réduisant ainsi le temps de développement d’un modèle particulier. En contrepartie, l’élaboration de tels modèles par apprentissage requiert la réalisation de mesures sur ledit processus, ce qui implique des coûts qui sont parfois loin d’être négligeables. Notre objectif a donc été d’identifier certains problèmes correspondant à la première approche, c’est-à-dire pour lesquels la réalisation de modèles de connaissance est soit inenvisageable soit particulièrement ardue.
Le premier chapitre de ce mémoire s’attache à rappeler les concepts de base relatifs à la modélisation de processus par apprentissage. Nous y introduirons les notions essentielles que nous serons amenés à employer par la suite. Dans le deuxième chapitre, nous décrivons les principaux outils d’optimisation nécessaires à l’élaboration de modèles par apprentissage. Le troisième chapitre regroupe l’ensemble des travaux menés, au cours de cette thèse, sur le thème des réseaux de neurones. Après avoir rappelé la méthodologie d’élaboration de modèles neuronaux, en particulier dans le cas récurrent, nous présentons les résultats obtenus sur deux applications industrielles : l’estimation de la température en un point particulier de la ligne d’échappement, et l’estimation des émissions de différents polluants en sortie d’échappement. Ces deux applications participent à la maîtrise des émissions polluantes, soit durant l’utilisation habituelle d’un véhicule, car la connaissance de cette température est indispensable à la mise en œuvre des stratégies de dépollution actives, soit au stade de la mise au point du moteur, qui sera facilitée par l’utilisation d’un modèle de prédiction des débits de polluants en fonction des réglages du moteur. Nous décrivons également un système de commande optimale en boucle ouverte, associé à un modèle neuronal, et destiné à réduire les variations rapides de la sortie d’un processus : ce système est susceptible d’être utilisé pour contrôler les à-coups de couple d’un véhicule, consécutifs à une variation rapide de l’enfoncement de la pédale d'accélérateur. Une méthode de calcul exact de la matrice Hessienne, dans le cas de modèles décrits par des équations récurrentes, est alors introduite pour permettre l’utilisation de ce système de commande dans le cas de processus dynamiques. Dans le quatrième chapitre, nous nous intéressons aux méthodes de modélisation par noyaux, dont font partie les machines à vecteurs supports, et tentons de les adapter à la modélisation de processus dynamiques, d’abord par un traitement analytique (pour l’une particulière de ces méthodes), avant de proposer un approche itérative du problème d’apprentissage, inspirée de l’algorithme d’apprentissage semi dirigé utilisé pour les réseaux de neurones récurrents.
Télécharger le mémoire (.pdf)
Cette thèse, soutenue le 21 mai 2008, a été effectuée au laboratoire d'Électronique de l'ESPCI-ParisTech, dans le cadre d'une collaboration avec le Laboratoire de Chimie Organique de l'ESPCI-ParisTech, sous la direction de Gérard Dreyfus et Arthur Duprat.
La modélisation de propriétés et d’activités de molécules constitue un champ de recherche important, qui permet par exemple de guider la synthèse de médicaments. Les méthodes traditionnelles de modélisation établissent des relations non linéaires entre les propriétés étudiées et les caractéristiques structurelles des molécules, appelées descripteurs. Leurs principaux inconvénients résident dans la difficulté du choix des descripteurs et leur calcul préalable.
Nous avons mis au point une nouvelle technique de modélisation qui s'affranchit de ces problèmes, en établissant une relation directe entre la structure des données et la propriété modélisée. L'apprentissage s'effectue non plus à partir de vecteurs de données, mais à partir de graphes. Les molécules peuvent en effet être représentées par des graphes, qui tiennent compte des liaisons chimiques, de la nature des atomes ou encore de la stéréochimie du composé initial. Chaque graphe de la base étudiée est alors associé à une fonction de même structure mathématique, appelée graph machine, obtenue par combinaison de fonctions paramétrées identiques. Ces paramètres sont alors déterminés par apprentissage.
Nous montrons que les techniques traditionnelles de sélection de modèle peuvent être utilisées dans le cadre des graph machines ; elles permettent d’évaluer les capacités en généralisation des modèles proposés, mais aussi de détecter les catégories de molécules sous-représentées dans la base d’apprentissage, et d’estimer les intervalles de confiance des prédictions. De très bons résultats ont été obtenus par l’utilisation de cette technique sur un grand nombre de bases de données de propriétés ou d’activités moléculaires.
Télécharger le mémoire (.pdf)
Cette thèse, soutenue le 9 décembre 2009, a été effectuée au laboratoire d'Électronique de l'ESPCI-ParisTech et au LTCI (ENST-ParisTech), sous la direction de Bruce Denby et Gérad Chollet.
L’objectif poursuivi dans ce travail de thèse est la réalisation d’un dispositif capable d’interpréter une parole normalement articulée mais non vocalisée, permettant ainsi la « communication parlée silencieuse ». Destiné, à terme, à être léger et portatif, ce dispositif pourrait être utilisé d’une part, par une personne ayant subi une laryngectomie (ablation du larynx suite à un cancer), et d’autre part, pour toute communication, soit dans un milieu où le silence est requis (transport en commun, opération militaire, etc.), soit dans un environnement extrêmement bruité. Le dispositif proposé combine deux systèmes d’imagerie pour capturer l’activité de l’appareil vocal pendant « l’articulation silencieuse » : l’imagerie ultrasonore, qui donne accès aux articulateurs internes de la cavité buccale (comme la langue), et la vidéo, utilisée pour capturer le mouvement des lèvres. Le problème traité dans cette étude est celui de la synthèse d’un signal de parole « acoustique », uniquement à partir d’un flux de données « visuelles » (images ultrasonores et vidéo). Cette conversion qualifiée ici de « visuo-acoustique », s’effectue par apprentissage artificiel et fait intervenir quatre étapes principales : l’acquisition des données audiovisuelles, leur caractérisation, l’inférence d’une cible acoustique à partir de l’observation du geste articulatoire et la synthèse du signal.
Dans le cadre de la réalisation du dispositif expérimental d’acquisition des données, un système de positionnement de la sonde ultrasonore par rapport à la tête du locuteur, basé sur l’utilisation combinée de deux capteurs inertiaux a tout d’abord été conçu. Un système permettant l’enregistrement simultané des flux visuels et du flux acoustique, basé sur la synchronisation des capteurs ultrasonore, vidéo et audio par voie logicielle, a ensuite été développé. Deux bases de données associant observations articulatoires et réalisations acoustiques, contenant chacune environ une heure de parole (continue), en langue anglaise, ont été construites. Pour la caractérisation des images ultrasonores et vidéo, deux approches ont été mises en œuvre. La première est basée sur l’utilisation de la transformée en cosinus discrète, la seconde, sur l’analyse en composantes principales (approche EigenTongues/EigenLips). La première approche proposée pour l’inférence des paramètres acoustiques, qualifiée de « directe », est basée sur la construction d’une « fonction de conversion » à l’aide d’un réseau de neurones et d’un modèle par mélange de gaussiennes. Dans une seconde approche, qualifiée cette fois « d’indirecte », une étape de décodage des flux visuels au niveau phonétique est introduite en amont du processus de synthèse. Cette étape intermédiaire permet notamment l’introduction de connaissances linguistiques a priori sur la séquence observée. Elle s’appuie sur la modélisation des gestes articulatoires par des modèles de Markov cachés (MMC). Deux méthodes sont enfin proposées pour la synthèse du signal à partir de la suite phonétique décodée. La première est basée sur une approche par concaténation d’unités ; la seconde utilise la technique dite de « synthèse par MMC ». Pour permettre notamment la réalisation d’adaptations prosodiques, ces deux méthodes de synthèse s’appuient sur une description paramétrique du signal de parole du type «Harmonique plus Bruit» (HNM).
Mots-clés : parole silencieuse, communication parlée augmentée, imagerie ultrasonore, vidéo, capteurs, traitement du signal appliqué, modélisation par apprentissage, fusion de données, multimodalité, reconnaissance, synthèse, modèle de Markov caché, mélange de gaussiennes, réseau de neurones, image, systèmes homme-machine, laryngectomie, cancer, handicap, langue, lèvres, articulateurs.
Télécharger le mémoire (.pdf)
[ SIGMA-ESPCI , SIGMA-ESPCI (English Version) | ESPCI ]