L'objectif de ce cours est de faire découvrir aux étudiants les bases de l'ingénierie des langues (ou ingénierie linguistique). Il consistera en une immersion progressive dans les différents niveaux et types d'analyse des langues par ordinateur. Les notions théoriques présentées seront illustrées par l'utilisation de différents outils de traitement de données textuelles.

 Tout d'abord de linguistique de corpus et de textométrie (statistique textuelle et concordance), puis de traitement automatique des langues (TAL). Les étudiants seront ainsi amenés au cours du semestre à réaliser un projet d'analyse linguistique automatique, depuis sa formalisation jusqu'à sa mise en œuvre.

 L'objectif de ce cours est de permettre aux étudiants d'appréhender la plus-value que les outils d'analyse automatique de textes offrent à la linguistique et inversement la plus-value que la connaissance linguistique offre à l'utilisation des outils d'analyse automatique.


Il s'agit ici de mettre en oeuvre nos connaissances des probabilités et des méthodes statistiques à l'aide du logiciel LibreOffice Calc, qui est l'analogue dans l'univers du logiciel libre du célèbre Excel de Microsoft.

On apprendra à effectuer les traitements fondamentaux : tris, filtres, graphiques, analyse univariée, analyse bivariée, régression linéaire simple, tests de moyenne, tests de proportion, test du khi-deux, analyse de la variance


Ce cours vise à aborder les bases de l'algorithmique et d'apprendre à manipuler les structures de données classiques pour concevoir des programmes structurés en langage Python.