Les champs informatifs de VoCoLex

 

Champs généraux

-phon : code phonétique

-hom : champ mentionnant s’il existe ou non des autres entrées homophoniques (hétérographiques ou non). Valeurs : 1= mot homophone ; 0= mot non-homophone.

-graph : représentation orthographique du mot

-graphies : représentations orthographiques des entrées homophoniques

-cgram : classe grammaticale (NO: nom; AJ: adjectif; VB: verbe; AV: adverbe; CO: conjonction; LO: locution; PN: pronom; IN: interjection; AR: article; PR: preposition).

-cgramH : classes grammaticales des homophones

-nphons : nombre de phonèmes

-Franfreqpm: fréquence formelle (selon LEXIQUE) de l’entrée orthographique (arrondie à l’unité par million)

-Frecum : fréquences cumulées des entrées orthographiques homophones (fréquence de la forme phonologique)

-nsyll : nombre de syllabe

-psylpal : segmentation syllabique. Les transitions syllabiques sont représentées par le signe “ - ”

Calculs de Cohorte 

(rmq. Le mot cible n’est jamais comptabilisé dans les différentes cohortes. Il s’agit donc des nombres de mots “ compétiteurs ”)

PU: point d'unicité du mot

PUS : point d’unicité du mot calculé par rapport aux mots possédant la même première syllabe

CoPty2 à CoPty9 : nombre de candidats dans la cohorte au Xe phonème. La 9e position correspond au silence suivant la fin du mot pour les mots de 8 phonèmes. La cohorte sur le 1er phonème n’est pas fournie (elle correspond au nombre de mots ayant un premier phonème identique). Sigles : Co= cohorte ; P= phonologique ; ty= calculs par type
CoPto2 à CoPto9: idem que CoPty2 à CoPty9 mais par token. Il s’agit donc de la fréquence cumulée des mots présents dans la cohorte.
Sigle: to = calcul par token

HfCoPty2 à HfCoPty9 : idem que CoPty2 à CoPty9 en ne considérant que les mots plus fréquents que le mot cible. Il s’agit donc d’une fraction de la cohorte considérée dans CoPty2 à CoPty9. Sigle : Hf= haute fréquence
HfCoPto2 à HfCopto9 : idem que HfCoPty2 à HfCopto9 mais par token. Il s’agit donc de la fréquence cumulée des mots plus fréquents dans la cohorte.

SCoPty2 à ScoPty9 : nombre de candidats dans la cohorte ayant la même première syllabe que le mot cible. Il s’agit d’un sous ensemble de la cohorte telle que calculée en CoPty2 à CoPty9. Sigle : S=syllabe
SCoPto2 à ScoPto9 : idem que SCoPty2 à ScoPty9 mais par token. Il s’agit donc de la fréquence cumulée des mots de la cohorte ayant une même première syllabe

HfSCoPty2 à HfSCoPty9 : idem que SCoPty2 à ScoPty9 mais en ne considérant que les mots plus fréquents
HfSCoPto2 à HfSCoPto9 : idem que HfSCoPty2 à HfSCoPty9 par token. Il s’agit donc de la fréquence cumulée des mots de la cohorte qui sont plus fréquents que la cible, et ayant la même première syllabe

Calculs de Voisinage 

Le voisinage est déterminé en prenant en compte:
-les voisins par substitution d’un caractère phonétique
-les voisins  par addition d’un caractère
-les voisins par délétion d’un caractère

Les calculs déterminent:
-le nombre total de voisins
-le nombre total de voisins plus fréquents
-le nombre de voisins par substitution
-le nombre de voisins par addition
-le nombre de voisins par délétion

(tous les calculs ci-dessus sont réalisés par type et par token)

en outre, les valeurs par type sont fournies pour:
-le nombre de voisins par substitution pour chaque position
-le nombre de voisins par addition pour chaque position
-le nombre de voisins par délétion pour chaque position

Les différents champs informatifs sont les suivants:

-voty: nbr de voisins total par type (somme des trois sortes de voisins). Sigle: vo = voisin
-voto: idem par token

-vohfty: nbre de voisins total plus fréquents par type
-vohfto: idem par token

-voSty : nombre de voisins par substitution, par type. Sigle : S = substitution
-voSto : idem par token

-voAty : idem pour les voisins par addition. Sigle : A = addition
-voAto : idem par token

-voDty : idem pour les voisins par délétion. Sigle : D = délétion
-voDto : idem par token

-voSty1 à voSty8: nombre de voisin par substitution pour chaque position, par type.
 -voAty1 à voAty8: idem pour les voisins par addition.
-voDty1 à voDty8: idem pour les voisins par délétion.

-voHSty1 à voHSty8: nombre de voisin par substitution plus fréquents pour chaque position, par type. Sigle : H = voisin de plus Haute fréquence
-voHAty1 à voHAty8: idem pour les voisins par addition.
-voHDty1 à voHDty8: idem pour les voisins par délétion.