Vous êtes ici

Recensement des corpus et des outils

Renseigner un corpus | Consulter les corpus disponibles

Les corpus

Dans le cadre du Réseau thématique, nous souhaitons mener un recensement de tous les corpus et donnés en L2/L3 - y compris les données du bilinguisme (donnés de production, de compréhension, perception, donnés verbales et non verbales donc occulometrie également) - dans tous domaines confondus, qui ont été réalisés ou sont en cours de réalisation afin de savoir ce qui existe, de valoriser l'existant, mais aussi de pouvoir aider à les finaliser et les valoriser. Pour ce faire, nous avons créé un formulaire qui permet de renseigner et décrire ces corpus, qu'ils soient accessibles ou non.

Quelques liens vers des listes de corpus en acquisition disponibles en ligne :

Sur CLARIN : https://www.clarin.eu/resource-families/L2-corpora
A l'UCL (Université catholique de Louvain) : https://uclouvain.be/en/research-institutes/ilc/cecl/learner-corpora-aro...
A Carnegie Mellon University, SLABank (TALKBANK) : https://slabank.talkbank.org

Les outils

CLAN : https://dali.talkbank.org/clan
ELAN : https://archive.mpi.nl/tla/elan
Praat : https://www.fon.hum.uva.nl/praat
EXMaRALDA : https://exmaralda.org
Sarramanka : https://sarramanka.hum-num.fr
Cotasigne : https://cotasigne.huma-num.fr

Pour toute question ou commentaire, n'hésitez pas à contacter Sarra El Ayari - sarra(point)elayari(at)cnrs(point)fr