Lecture et lisibilité, partie 1
De la reconnaissance des lettres et du processus de lecture
Lire est un acte automatique pour la plupart d’entre nous. Une part non négligeable de nos activités visuelles quotidiennes a trait à l’interprétation du langage écrit, ce que nous faisons sans effort apparent dès lors que le processus de lecture est maîtrisé. Nous entrons alors dans l’univers magique de signes qui assemblés forment des mots, des phrases porteurs de sens.
Les lettres, mots, phrases, textes sont des éléments très particuliers, du moins dans leurs formes contemporaines. Ce sont tout d’abord des signes qui n’ont aucune relation d’analogie avec ce qu’ils représentent pour nos langues occidentales : ainsi à la différence d’une image, il n’y a aucune ressemblance perceptive entre un mot et l’objet qu’il désigne. Ensuite, à la différence de la plupart des autres objets qui nous entourent, le stimulus est strictement bidimensionnel : la troisième dimension est absente ou n’apporte aucune information supplémentaire. Ils sont par ailleurs dotés d’un niveau de contraste généralement bien supérieur à ce que l’on perçoit habituellement : il s’agit souvent de formes noires sur un fond blanc, ce qui signifie qu’il n’y a pas de dégradés, d’ombres, de textures, etc. Enfin les lettres sont assemblées de manière unilinéaire et dans une direction conventionnelle. Cette direction est fonction des différentes langues : de gauche à droite dans les langues européennes, mais de droite à gauche ou dans le sens vertical pour d’autres langues.
L’évolution des systèmes d’écriture
Dans les plus anciens systèmes d’écriture, à chaque mot correspondait un seul signe, un logographe, qui présentait souvent une certaine analogie physique avec l’objet qu’il désignait. Ces systèmes d’écriture avaient toutefois des inconvénients : il fallait un catalogue énorme de mots pour symboliser tous les objets de l’environnement et il n’était pas commode de représenter ce qu’on désigne aujourd’hui par des mots abstraits.
Ces systèmes ont donc évolué, chaque son de la langue étant à présent représenté par un symbole spécifique. Dans ces systèmes dits alphabétiques, un mot devient donc un assemblage linéaire particulier de symboles – les lettres ou groupes de lettres nommées graphèmes [1] – issus d’un catalogue limité : l’alphabet. Ces symboles à leur tour sont construits par assemblage dans l’espace de quelques traits issus d’un catalogue très réduit : des horizontales, verticales, obliques et courbes. Une analyse visuelle précise devient donc nécessaire pour distinguer tant les lettres que les mots : les différences entre C, G, O et Q, entre b, d, p, q, entre E et F, etc. tiennent à peu de chose.
Des langues régulières et irrégulières
Il existe deux sortes de langues. Pour les langues régulières, très rares, à chaque phonème [2] correspond un seul graphème et réciproquement. Cependant, dans la plupart des langues, un même graphème peut se prononcer de différentes façons (p dans typographie), et à un phonème donné peuvent correspondre plusieurs graphèmes (ph et f).
Pour ces langues « irrégulières » il a fallu constater que la lecture d’un mot peut avoir lieu de différentes façons. Ainsi la lecture correcte d’un mot non régulier peut nécessiter un passage par la signification ; tel mot ne sera lu adéquatement que si le lecteur connaît son sens. Il s’agit d’un système de reconnaissance par adressage : le mot est reconnu et compris parce qu’il évoque, dans notre mémoire, une représentation de ce mot, dans un lexique mental, et de sa signification dans un lexique sémantique. Cela suppose donc que des informations, situées à des adresses précises de notre mémoire, soient regroupées et activées. La lecture d’un mot régulier se fait par assemblage, reposant sur l’utilisation des règles habituelles de conversion des graphèmes en phonèmes. Dans ce cas nous reconnaissons chaque lettre successivement, y associons les phonèmes correspondants et assemblons ces phonèmes pour prononcer le mot. Ce dispositif nous permet de lire des mots rares ou des mots que l’on rencontre pour la première fois, mais cette lecture est plus lente et plus laborieuse que la lecture par adressage : elle ressemble à de la lecture lettre par lettre.
Le processus de lecture
De manière générale, le processus de lecture de mots est décomposé en une séquence d’opérations. Le stimulus – la lumière réfléchie par le texte – doit d’abord faire l’objet d’une analyse visuelle de nature perceptive. Le résultat de cette opération va ensuite activer une des représentations constituant le lexique visuel d’entrée : il s’agit d’un registre, ou stock, des mots qui nous sont familiers, sous leur forme écrite mais abstraite, c’est-à-dire indépendante du format, du caractère, de l’orientation.
Cette activation a lieu par appariement, c’est-à-dire par comparaison et détection d’une ressemblance suffisante entre une de ces unités du lexique et la représentation dérivée de l’analyse visuelle. C’est ce que l’on appelle « décision lexicale » : je reconnais être en présence d’un mot qui m’est familier. Ces unités lexicales sont connectées à des représentations sémantiques qu’elles activent : ces représentations concernent la signification du mot et constituent le système sémantique. L’activation de ces représentations sémantiques génère ensuite celle de la représentation du mot correspondant dans le lexique de sortie, stock de représentations des mots sous leur forme auditive ou phonologique, c’est-à-dire selon la manière de les prononcer. Enfin cette représentation active celle des phonèmes correspondants, dans le système phonémique ; éventuellement, ceci donnera lieu à l’articulation et la production, à haute voix ou de manière subvocale, de la suite sonore ainsi activée, c’est la prononciation du mot lu.
Si l’opération de lecture d’un mot nous paraît simple, rapide et automatique, elle est en réalité complexe, composée de nombreux constituants dont les ratés pourront être la source de différents types d’erreur de lecture. Cette complexité est d’ailleurs bien illustrée par le temps qu’il faut à l’enfant pour apprendre à lire.
Le cheminement qui vient d’être décrit correspond à la lecture habituelle de mots familiers, chez l’adulte normal et bon lecteur : c’est la voie par adressage. Toutefois, certaines observations laissent penser que la lecture peut s’effectuer selon d’autres manières, mais dans certaines conditions seulement. Ainsi nous sommes parfois parfaitement capables de lire à haute voix un mot que nous rencontrons pour la première fois, ou un non-mot prononçable (un non-mot est une suite de lettres qui ne forment pas un mot de la langue) : manifestement, de tels stimuli ne peuvent activer les lexiques d’entrée et de sortie, pas plus que les représentations sémantiques, puisqu’on ne les a jamais rencontrés. Toutefois, nous ne faisons preuve d’une telle aptitude que si les mots ou non-mots sont réguliers, c’est-à-dire si on peut leur appliquer les règles habituelles de conversion de graphèmes en phonèmes.
L’identification des lettres et des mots
Avec la reconnaissance des lettres et des mots, c’est un processus d’identification d’exemplaires qui est en jeu. Toutefois, les traitements perceptifs des lettres et des mots sont simples et particuliers étant donné l’unidirectionnalité des systèmes d’écriture. Néanmoins, comme pour tout stimulus visuel à reconnaître, on doit admettre un processus d’abstraction de représentations indépendantes du point de vue : une lettre ou un mot sont reconnus, indépendamment de leur orientation ou de leur typographie.
Selon l’opinion publique et les plus anciennes conceptions en psychologie, la reconnaissance d’un mot résulte de celles des lettres qui le composent et de l’ordre de celles-ci. Ceci se produit sans doute dans le cas de non-mots ou de mots nouveaux (lecture lettre par lettre), mais pas lors de la lecture habituelle. En effet, nous ne regardons pas toutes les lettres d’un mot pour le reconnaître, et nous ne regardons pas toutes les lettres d’une phrase pour la comprendre. Deux séries d’observations illustrent cette affirmation.
L’effet dit de « supériorité du mot » (sur la lettre) montre que le mot influence le traitement des lettres qui le composent : il y aurait donc en mémoire une représentation des mots connus explicitant leur forme – longueur, forme générale dépendant de la localisation des lettres « hautes » et « basses », etc. – et leur identité activée avant celle des lettres individuelles. Ainsi l’identification d’une lettre est plus rapide et/ou plus facile si elle est au sein d’un mot familier, par rapport à un mot plus rare ou un non-mot prononçable, et encore plus par rapport à une séquence non prononçable de lettres. Manifestement, il y a une reconnaissance au moins partielle du mot, qui précède – et influence – celle des lettres qui le composent. Une illustration de ce phénomène est le fait que, souvent, nous ne remarquons même pas qu’il manque une lettre au sein d’un mot.
Des études distinguant le niveau des traits, celui des lettres et celui des mots ont montré que si un trait est détecté (par exemple une verticale du côté gauche), il y a activation de toutes les unités correspondant aux lettres qui la possèdent (B, D, E, F, H, K, L, M, N, P, R, U) et inhibition de toutes les autres ; de même, si une lettre est détectée (en une position donnée), il y a activation de toutes les unités correspondant aux mots connus qui ont cette lettre en cette position et inhibition des autres mots ; si un mot est reconnu, il y a activation de toutes les unités correspondant aux lettres qui le composent et inhibition des autres lettres ; enfin, au sein de chaque niveau, l’activation d’une unité s’accompagne de l’inhibition des autres. Un système ainsi bouclé sur lui-même finit par converger vers un état stationnaire, correspondant à l’identification du mot et dont le point de départ n’est aucun niveau particulier. Le système s’arrête dès qu’une solution unique est trouvée : nous pouvons reconnaître un mot sans l’analyser complètement car, à un moment donné, il n’y a plus qu’un seul candidat parmi les mots que nous connaissons ; ceci est notamment à l’origine du recours aux abréviations.
L’analyse des mouvements oculaires
L’analyse des mouvements oculaires durant la lecture confirme cette vue des choses. La reconnaissance des lettres et des mots nécessite une vision précise. Or la vision n’est précise que si elle est fovéale – quelques degrés d’angle au centre du champ visuel. Par conséquent, la lecture d’un texte s’accompagne de mouvements oculaires destinés à amener l’image de fragments successifs du texte sur la partie la plus sensible de la rétine. Il s’agit en fait de mouvements rapides durant lesquels la vision est pratiquement inexistante – les saccades –, entre lesquelles se produisent de brefs arrêts au cours desquels une vision précise est possible – les fixations. Une saccade parcourt environ huit caractères (mais moins si le texte est complexe), une fixation dure environ 200 millisecondes et le regard se pose généralement sur le premier tiers d’un mot. C’est dire que nous sommes loin de « regarder » la totalité des lettres d’un texte.
Les endroits du texte sur lesquels se porte le regard indiquent la nature des informations recueillies durant la lecture. Il existe une zone de texte d’un peu moins de vingt caractères sur laquelle nous collectons de l’information durant les fixations : c’est l’empan. La taille de cette zone dépend toutefois de la taille des caractères, de la complexité du texte et du type de langue (cette zone est plus étroite pour des textes en caractères idéographiques comme le chinois ou le japonais). Cette zone est asymétrique : elle s’étend de trois ou quatre lettres à gauche du point de fixation à environ quinze lettres à droite. Cette asymétrie résulte de nos habitudes de lecture de gauche à droite : il y a en effet plus d’informations nouvelles à capter à droite qu’à gauche et on observe une asymétrie inversée dans la lecture de textes qui se lisent de droite à gauche, comme l’hébreu.
L’empan est fonction de la nature de l’information captée : l’empan total comprend l’empan d’identification des lettres qui est le plus large et désigne la portion de texte dans laquelle nous sommes capables de détecter des informations précises sur l’identité des lettres, et l’empan d’identification des mots, plus étroit, où les mots peuvent être reconnus.
L’empan est plus large que la région fovéale du champ visuel : nous détectons aussi des informations dans la région parafovéale (qui s’étend jusqu’à cinq degrés de part et d’autre du lieu de fixation). Ainsi, une fixation sur un mot sera de moindre durée si ce mot se trouvait dans la zone parafovéale de la fixation précédente, parce que le lecteur a déjà pu capter, avant la saccade certaines informations relativement grossières à propos de ce mot – telles sa forme ou sa longueur. Le niveau traité en vision parafovéale semble en particulier porter sur l’identité des lettres.
La durée de la fixation sur un mot dépend de la signification de ce mot dans la phrase : elle est courte sur un mot très prédictible par le contexte, mais longue sur le dernier mot critique de la phrase ou sur un mot qui change la signification d’un mot lu précédemment.
L’écrêtage visuel
Durant la lecture, le regard n’examine donc pas chaque lettre dans toutes ses parties puisque plusieurs lettres sont groupées par saccade. Le point de fixation se déplace suivant une ligne horizontale qui coupe toutes les lettres courtes en des points situés un peu plus bas que leur sommet, les autres parties des lettres sont vues indirectement. Cette idée rendrait possible la suppression de la partie inférieure des lettres ; de l’idée à la réalité, il n’y a qu’un pas, franchi par Maître Leclair, notaire, qui la développe dans une brochure publiée en 1843 : Réduction possible de la moitié de tous les frais d’impression. Il y affirme que tout lecteur devine plutôt qu’il ne lit, que la presque totalité des lecteurs ne lit que la partie supérieure des signes et que par conséquent, « la partie inférieure est inutile ». Javal reprend cette idée en ajoutant que c’est dans la partie supérieure de la ligne que se développent les capitales, les lettres ascendantes (plus nombreuses que les descendantes) et les lettres accentuées ; le lecteur doit donc porter plus d’attention au niveau supérieur de la lettre.
Lisez la suite de l’article Lecture et lisibilité, partie 2
[1] Graphème : unité minimale entrant dans la composition d’un système d’écriture.
[2] Phonème : son d’une langue défini par les propriétés distinctives qui l’opposent aux autres sons de cette langue