Lexique 4.00 fournit des mesures de fréquence issues d’un corpus de sous-titres de 316 millions de mots, la diversité contextuelle, des représentations phonologiques, les lemmes associés, la structure morphologique, la prévalence ainsi que des données de décision lexicale pour 190 000 formes de mots françaises.

Lexique est distribuée sous une licence Creative Commons Attribution – Partage dans les mêmes conditions 4.0


Open Lexicon

Openlexicon rassemble plusieurs bases de données lexicales dont la base de données Lexique mais aussi d’autres bases donnant des informations telles que l’âge d’acquisition, les temps de lecture ou la concrétude par exemple.

OpenLexicon GitHub permet avec les bases d’Open Lexicon :
– d’interroger ces bases en lignes
– de les télécharger
– d’obtenir les scripts (R et Python) et les apps (shiny) pour les manipuler hors-ligne ou en-ligne.


Contribuer

Lexique et OpenLexicon sont des projets collaboratifs auxquels tout le monde est encouragé à participer. N’hésitez pas à poser des questions sur le forum, et à proposer des améliorations du code (shiny apps, scripts, …) sur le site github d’Openlexicon.