Le cours est la continuité du cours L5SOPRG intitulé "Programmation de modèles linguistiques 1 (phonétique et morpho-syntaxe)". Nous poursuivrons la découverte des pratiques en Traitement Automatique des Langues.

Dans le domaine du TAL (Traitement Automatique du Langage), l'utilisation des ressources linguistiques et lexicales s'est accru pour améliorer les performances des systèmes.  Ce cours aborde principalement  le réseau sémantique lexical Wordnet et les usages associés dont principalement la désambiguïsation sémantique. L'objectif visé est de connaitre les notions essentielles et les principales relations sémantiques de Wordnet. Dans la continuité du principe du réseau sémantique, la conception d'une ontologie incluant les formalismes de base de logiques de description est abordé à travers l'outil Protégé.  

Logique du 1er ordre pour la représentation des connaissances.

Statistiques descriptives, paramètres de position, de dispersion et de forme, présentation et analyse de données avec le logiciel R.

Alternance de cours et TD.

Notion de probabilité et variable aléatoire : espérance, variance, écart-type

Lois discrètes : lois binomiale, de Poisson,  et lois continues : uniforme, normale, du \(\chi^2\)

Test du \(\chi^2\), estimation et intervalle de confiance et de pari, tests de conformité, d'homogénéité d'échantillons, tableau de contingence.

Les séances de travaux dirigés sont réalisés avec le logiciel R.