VoColex: A lexical database on phonological similarity between French words

 

Short description

Abstract: Several studies on auditory word recognition indicate that word processing is influenced by the phonological similarity with other words. We describe a lexical database, VoColex, which provides several statistical indexes of phonological similarity between French words. Phonological similarity is computed according to two distinct principles. According to the first principle, phonologically similar words share initial phonemes with the target word. According to the second principle, phonological neighbours correspond to any words which can be derived from the target by a single phoneme change (substitution, addition, or deletion) whatever the position of the modified phoneme. The statistical data provided by VoCoLex should allow the control and the empirical manipulation of various measures of phonological similarity, as well as quantitative descriptions of the auditory lexicon.

Key words: Auditory word recognition, phonological neighborhood, cohort, lexical database

Résumé : L'étude psycholinguistique de la reconnaissance des mots parlés indique que les similarités phonologiques du mot avec d'autres mots de la langue influence son traitement. Nous décrivons une nouvelle base de données lexicales informatisée, VoCoLex, qui fournit un ensemble d'indicateurs statistiques sur les similarités entre mots de la langue française. Les similarités phonologiques sont estimées selon deux principes différent. Le premier tient compte de l'ordre séquentiel des phonèmes. Selon le second principe, les voisins phonologiques correspondent à tous les mots pouvant être dérivés par modification d'un phonème, quelle que soit sa position. Par exemple, VoCoLex fournit le nombre de voisins phonologiques par substitution d'un phonème, ou bien encore le nombre d'items partageant les mêmes 'n' premiers phonemes, en tenant compte ou non de la structure syllabique. Ces données permettent le contrôle ou la manipulation de diverses mesures de similarités, ainsi que des descriptions quantitatives du lexique parlé.

Authors

S. Dufour, R. Peereman. Université de Bourgogne & C.N.R.S., Dijon, France
C. Pallier. Ecole des Hautes Etudes en Sciences Sociales, Paris, France
M. Radeau. F.N.R.S. & Université libre de Bruxelles, Belgique

Availability

The VoColex database is free of charge and available in text format. In addition, the Microsoft FoxPro scripts that were used to compute the neighborhood characteristics can also be downloaded to be used on other word corpora.