Lexicométrie / textométrie

La lexicométrie peut être définie comme « La lexicométrie peut être définie comme un ensemble de mesures, de traitements statistiques qui sont effectués sur du texte. »

(Ludovic Lebart et André Salem, « Analyse statistique des données textuelles »1988, p.183 ; André Salem, 1989)

Pourquoi utiliser l’analyse lexicométrique ?

Elle permet de :

  • travailler sur la base de corpus de textes de taille importante ;
  • dégager de l’information grâce à des algorithmes statistiques sur la base d’une démarche méthodologique préalablement définie (protocole, questions de recherches, hypothèses) ;
  • présenter les résultats sous formes d’ensembles de mots organisés de différentes manières ;
  • aider à l’interprétation (sans la détacher du contexte, du corpus) ;
  • sous réserve de bien comprendre les méthodes et algorithmes de traitement, faciliter le traitement du corpus.

Lexicométrie avec Iramuteq

Iramuteq est un logiciel libre qui permet de faire ce type d’analyse à partir d’un corpus de textes prédéfini. Il est beaucoup utilisé en recherche.

L’usage pertinente du logiciel suppose un certain nombre de prérequis :

  • connaissance de base des méthodes statistiques implémentées dans ce logiciel ;
  • connaissance du contexte d’analyse (corpus) nécessaire à l’interprétation (retour au texte) ;
  • formatage correct des données en entrée.

Une fois ces aspects maîtrisés, il permet de procéder à des analyses via de la statistique graphique.

Iramuteq : site du logiciel

http://www.iramuteq.org/

Fonctionnalités

Analyses sur des corpus texte

  • Iramuteq reproduit la méthode de classification décrite par Reinert (1983, 1991) (Classification Hiérarchique Descendante sur un tableau croisant les formes pleines et des segments de texte);
  • Recherche de spécificité à partir de segmentation définie;
  • Statistiques textuelles classiques;
  • Analyse de similitude sur les formes pleines d’un corpus découpé en segments de texte;
  • Consultez la documentation pour connaître toutes les analyses disponibles dans Iramuteq.

Analyses sur des tableaux individus / caractères

  • Classification Hiérarchique Descendante avec l’algorithme décrit par Reinert (1983) ;
  • Classification Hiérarchique Descendante par matrice des distances;
  • Analyse de similitude;
  • Description et chi2;

Iramuteq : tutos vidéo