Université de Savoie LPNC Lexique - Une Base de Données Lexicales Libre RISC CNRS
Un site réalisé par Boris New & Christophe Pallier et hébergé par le RISC


Menu principal


Voisins 1.02


Le fichier Voisins.txt est une base donnant divers descripteurs concernant les voisins orthographiques (calculés d'après les 130000 entrées de la base Graphemes). Les voisins orthographiques d’un mot sont les mots qui peuvent être créés en changeant une lettre sans modifier pour autant la position des autres lettres (Coltheart, Davelaar, Jonasson et Besner, 1977). En d'autres termes, les voisins sont tous les mots différents d'un autre uniquement par la substition d'une seule lettre. Ainsi "vol" a commme voisins "vil" ou "bol"

Cette base est constituée des champs suivants:
  • Graph: Toutes les entrées orthographiques de Lexique
  • NbVoisOrth: Le nombre de voisins orthographiques.
  • VoisOrth: Les différents voisins orthographiques.
  • FreqVoisOrth: Les différentes fréquences (de Frantext et par millions) de chacun des voisins
  • FreqCum: La fréquence cumulée de tous les voisins
L'archive zip contient aussi les scripts perl permettant d'obtenir ces voisins. Cela vous permet de calculer facilement (si vous connaissez un peu la programmation) n'importe quel indice basé sur le nombre de voisins.

Historique

  • Voisins 1.02: Contient les scripts sources; Corrige un bug qui faisait que "ôtés" était considéré comme un voisin de "ôté"

Auteurs

Licence

Cette base de données est distribuée sous la même licence que Lexique. En résumé, cette base de données est redistribuable ou utilisable dans un autre produit uniquement si celui-ci est aussi sous licence Gnu (http://www.gnu.org).

Téléchargement

Voisins 1.02
Lexique - Une Base de Données Lexicales Libre
Copyleft © 2001 Lexique
Powered by phpWebLog