# Gougenheim 1.00 # Le fichier `gougenheim.tsv` présente, pour 1064 mots, leur fréquence et leur répartition (nombre de textes dans lesquels ils apparaissent). Le corpus sur lequel, il est basé est un corpus de langue oral basé sur un ensembles d'entretiens avec 275 personnes. C'est donc non seulement un corpus de langue orale mais aussi de langue produite. Le corpus original comprend 163 textes, 312.135 mots et 7.995 lemmes différents. Cette base, publiée dans le livre _L'élaboration du français fondamental_, ne fournit pas les fréquences pour les mots de fréquences inférieures à 20. Table: [gougenheim.tsv](http://www.lexique.org/databases/Gougenheim100/gougenheim.tsv) Les champs sont les suivants: `mots`, `répartition`, `fréquence brute`. ## Auteurs ## Cette base est tirée du livre __L'élaboration du français fondamental_ écrit par G. Gougenheim, P. Rivenc, R. Michéa et A. Sauvageot. Je remercie les auteurs ci-dessus pour leur fabuleux travail. Boris New [Online access](http://www.lexique.org/shiny/openlexicon) | [Openlexicon](http://chrplr.github.io/openlexicon)