RECHERCHE

Domaines de recherche :

  • TAL (Traitement Automatique des Langues)
  • Résolution automatique des anaphores et de la coréférence (chaînes de référence)
  • Etude des genres textuels
  • Détection de thèmes dans les documents
  • Identification fine des Entités Nommées
  • Cohésion et cohérence dans le discours
  • Sémantique lexicale
  • Disfluences de l'oral

 

Participation à des projets :

Depuis mars 2016 : 

Membre du projet ANR Democrat (DEscription et MOdélisation des Chaînes de Référence : outils pour l’Annotation de corpus (en diachronie et en langues comparées) et le Traitement automatique), en collaboration avec les laboratoires Lattice (ENS – Paris 3), LiLPa (Strasbourg) et ICAR (ENS/Lyon 2) [http://www.agence-nationale-recherche.fr/?Projet=ANR-15-CE38-0008]

Depuis décembre 2014
(en cours) :

Membre du Projet Logoscope (Initiative d’Excellence, IdEx, Université de Strasbourg), « Veille et ressource néologique », piloté par Christophe Gérard et Delphine Bernhard.

Depuis mars 2012 (en cours) :

Membre du Consortium Corpus écrit (IR-Corpus), groupe 8 (Annotation de plus haut niveau : syntaxe, sémantique, référence, annotations collaboratives), piloté par Amalia Todiraşcu et Agnès Tutin.

Juillet 2011 - décembre 2012 :

Membre du PEPS (Projets Exploratoires Pluridisciplinaires) MC4 « Modélisation Contrastive et Computationnelle des Chaînes de Coréférence », dirigé par F. Landragin, Laboratoire Lattice, ENS (UMR 8094), Montrouge.

Depuis juin 2011 (en cours) :

Membre du projet Procope N-Huma « Les noms d’entités humaines entre lexique et grammaire », collaboration entre le laboratoire LiLPa (Strasbourg) et le laboratoire de linguistique romane (Bochum, Allemagne).

Juin 2010 - mars 2013 :

Membre de l’atelier « énonciation et poétique » dirigé par M. Boisseau, Laboratoire LiLPa (UR 1339).
Réflexion autour de la notion de rythme. Création d’un corpus électronique de textes de poésie et en prose, et leurs traductions. Extraction statistique à l’aide de l’outil de lexicométrie Hyperbase. 

Septembre 2009 - juin 2011 :

Membre du groupe de travail « chaînes de coréférence » dirigé par F. Landragin, Laboratoire Lattice, ENS (UMR 8094), Montrouge. Réflexion autour des relations de coréférence dans des corpus variés. Annotation des relations de coréférence dans un corpus de résumés de films avec la plate-forme d’annotation GLOZZ (Widlöcher et Matey, 2009) puis ANALEC (Victorri, 2011). 

Février 2008 - décembre 2010  :

Membre du projet multilingue « CAP », une fonction lexicale hiérarchique liée aux noms propres, Laboratoire LiLPa (UR 1339), dans le cadre du projet européen CLARIN.
Etude des contextes des noms de fonction dans les corpus constitués. Analyse des données recueillies, mise en place de patrons pour identifier les noms propres de personne et d’organisation liés par des relations hiérarchiques.

2007 :

Participation à la campagne RIMES (Reconnaissance et Indexation de données Manuscrites et de fac similés) du programme Techno-Vision.
Réalisation d’écrits manuscrits suivant des scénarii prédéfinis.

2003 :

Participation au projet PFC (Phonologie du français contemporain) mené par A. Coquillon, laboratoire Parole et Langage, Université d'Aix en Provence.
Analyse d'un usage du français aprlé à Cussac Fort-Médoc (Gironde) : transcription de l'enregistrement audio puis étude de la nasalisation vocalique par assimilation dans cet usage régional.

×