Pour la première fois, une étude scientifique propose une vision du « langage SMS ». Refusant de se fier aux intuitions ou aux impressions, les auteurs de cette étude linguistique, basée sur un corpus de données authentiques, bousculent les idées reçues. La brièveté des messages est-elle une règle ? Tout le monde utilise-t-il les mêmes abréviations ? Ces jeux de langue sont-ils nouveaux ? Est-ce un langage de jeunes ? Est-ce la ruine de l'orthographe française ? Le projet « Faites don de vos SMS à la science » a permis de rassembler 75 000 SMS dans une base de données qui constitue aujourd’hui la plus vaste source d’information accessible pour la recherche. Ce livre entraîne le lecteur dans les coulisses de ce projet scientifique avant de lui faire découvrir les trésors d’inventivité linguistique dont font preuve les usagers du SMS.
I Introduction 1
1 Problématique 3
2 Objectifs généraux de la thèse 7
2.1 Objectifs méthodologiques 7
2.2 Objectifs théoriques . 8
2.3 Objectifs empiriques . 9
2.4 Questions de recherche 10
3 Plan de la thèse 11
4 Conventions 13
4.1 Traductions 13
4.2 Transcriptions . 13
4.3 Etiquettes . 13
II De la théorie au recueil de données 15
5 sms et communication écrite médiée par ordinateur 17
5.1 Communication, médiation et informatisation . 18
5.1.1 Un état de l'art 20
5.1.1.1 Communication écrite médiée par ordinateur 20
5.1.1.2 Écrit sms 24
5.1.2 Traits de la communication médiée . 27
5.1.3 Principaux types de la Cémo 28
5.1.3.1 Messagerie instantanée et chat 29
5.1.3.2 Courrier électronique . 30
5.1.3.3 Forums de discussion . 32
5.1.3.4 Sites de réseautage social . 33
5.1.3.5 Muds ou communication dans les univers virtuels 36
5.2 L'écrit sms et ses phénomènes graphiques . 41
5.2.1 Un nouveau code graphique . 42
5.2.2 Phénomènes graphiques et lexicaux . 46
5.2.2.1 Abréviations graphiques 48
5.2.2.2 Emoticônes . 52
5.2.2.3 Ponctuation et casse expressives, caractères échos . 55
5.2.3 Un écrit oralisé, spontané ou simplement un langage ordinaire ? 56
5.2.4 Conclusions 60
5.3 Conclusions 61
ii Table des matières
6 Recueil et traitement de données 63
6.1 Constitution de corpus de sms 64
6.1.1 Linguistique de corpus et sms 66
6.1.2 Des sms comme corpus de données textuelles . 70
6.1.3 Collecte des données . 73
6.1.3.1 Méthodologie de collecte . 73
6.1.3.2 Collectes régionales 77
6.1.3.3 L'échantillon de données sms . 80
6.1.4 Comparabilité des données 83
6.1.4.1 Format, annotation et nettoyage . 83
6.1.4.2 Alignement : transcription en graphie standard . 92
6.2 Recueil de données sociodémographiques 101
6.2.1 Constitution et traitement de formulaires . 102
6.2.1.1 Tronc commun . 103
6.2.1.2 Limites des questionnaires élaborés 104
6.2.2 Distribution des variables 110
6.2.3 L’échantillon de locuteurs 118
6.3 Conclusions . . 124
III De la variation des données 125
7 Préliminaires 127
7.1 La notion de variation pour un corpus de sms . 127
7.2 Approches guidées par corpus et fondées sur corpus 129
7.3 Outils d’analyse 131
8 Variation lexicale 135
8.1 Questions générales de lexicologie 135
8.1.1 Lexicométrie . 136
8.1.2 Cooccurrences 141
8.1.3 Néologismes 143
8.1.3.1 Introduction et méthodologie . 143
8.1.3.2 Approche qualitative 146
8.1.3.3 Variation diatopique 148
8.1.3.4 Variation diastratique . 149
8.1.4 Conclusions 151
8.2 Éléments allogènes 154
8.2.1 Approche qualitative . 154
8.2.1.1 Typologie 154
8.2.1.2 Composition des éléments allogènes . 157
8.2.1.3 Fonctions des mélanges de langues 159
8.2.1.4 Conclusions sur les éléments allogènes d’après l’analyse
qualitative . 164
Table des matières iii
8.2.2 Variation diastratique 166
8.2.2.1 Belgique 166
8.2.2.2 La Réunion . 169
8.2.2.3 Québec . 172
8.2.2.4 Suisse 175
8.2.2.5 Corpus global : langue de l’élément allogène . 178
8.2.3 Conclusions 182
8.3 Régionalismes lexicaux 183
8.3.1 Régionalismes de Belgique 185
8.3.1.1 Approche qualitative 186
8.3.1.2 Variation diastratique . 190
8.3.2 Régionalismes de la Réunion 193
8.3.2.1 Approche qualitative 194
8.3.2.2 Variation diastratique . 196
8.3.3 Régionalismes du Québec 197
8.3.3.1 Approche qualitative 198
8.3.3.2 Variation diastratique . 200
8.3.4 Régionalismes de Suisse . 202
8.3.4.1 Approche qualitative 203
8.3.4.2 Variation diastratique . 206
8.3.5 Conclusions 209
8.4 Conclusions 212
9 Variation orthographique 215
9.1 Introduction 215
9.2 Variantes à dominantes morphogrammiques 219
9.3 Variation diastratique 224
9.4 Conclusions 227
10 Variation syntaxique 229
10.1 Interrogatives . 232
10.1.1 Introduction 232
10.1.2 Variation interne . 234
10.1.3 Variation externe . 240
10.1.4 Conclusions 247
10.2 Négation 249
10.2.1 Introduction 249
10.2.2 Variation interne . 249
10.2.3 Variation externe . 259
10.2.4 Conclusions 265
10.3 Conclusions 267
iv Table des matières
IV Conclusions 269
11 Conclusions générales de la recherche 271
12 Limites et perspectives 279
Bibliographie 281
A Annexes 307
A.1 Annexes au Chapitre 1 307
A.2 Annexes au Chapitre 2 320
A.2.1 Questionnaire belge . 320
A.2.2 Questionnaire réunionnais 321
A.2.3 Questionnaire québécois . 323
A.2.4 Questionnaire suisse . 326
A.3 Annexes au Chapitre 3 328
A.3.1 Lexicométrie . 328
A.3.2 Néologismes 332
A.3.3 Emprunts . 342
A.3.4 Régionalismes . 358
A.4 Annexes au Chapitre 4 371
A.4.1 Morphosyntaxe 371
A.4.2 Interrogatives . 379
A.4.3 Négatives . 384