Quantcast
Channel: CIRAD - Les dernières publications
Viewing all articles
Browse latest Browse all 11489

La néographie dans un grand corpus de SMS français : 88milSMS

$
0
0
Roche M., Verine B., Lopez C., Panckhurst R.
2016

Depuis 2014, le corpus 88milSMS est disponible en téléchargement public (Panckhurst et al., 2014, http://88milsms.huma-num.fr/). Contenant plus de 88 000 SMS authentiques en français recueillis dans le cadre du projet sud4scienceLR (http://www.sud4science.org/), ce corpus anonymisé permet aux chercheurs d'analyser, en employant ou non des techniques de traitement automatique des langues (TAL), ...

Documentation et information; Méthodes de relevé; Autres thèmes

Viewing all articles
Browse latest Browse all 11489

Trending Articles