Recensement des corpus et des outils
Renseigner un corpus | Consulter les corpus disponibles
Les corpus
Dans le cadre du Réseau thématique, nous souhaitons mener un recensement de tous les corpus et donnés en L2/L3 - y compris les données du bilinguisme (donnés de production, de compréhension, perception, donnés verbales et non verbales donc occulometrie également) - dans tous domaines confondus, qui ont été réalisés ou sont en cours de réalisation afin de savoir ce qui existe, de valoriser l'existant, mais aussi de pouvoir aider à les finaliser et les valoriser. Pour ce faire, nous avons créé un formulaire qui permet de renseigner et décrire ces corpus, qu'ils soient accessibles ou non.
Quelques liens vers des listes de corpus en acquisition disponibles en ligne :
- Sur CLARIN : https://www.clarin.eu/resource-families/L2-corpora
- A l'UCL (Université catholique de Louvain) : https://uclouvain.be/en/research-institutes/ilc/cecl/learner-corpora-aro...
- A Carnegie Mellon University, SLABank (TALKBANK) : https://slabank.talkbank.org
Les outils
- CLAN : https://dali.talkbank.org/clan
- ELAN : https://archive.mpi.nl/tla/elan
- Praat : https://www.fon.hum.uva.nl/praat
- EXMaRALDA : https://exmaralda.org
- Sarramanka : https://sarramanka.hum-num.fr
- Cotasigne : https://cotasigne.huma-num.fr
Pour toute question ou commentaire, n'hésitez pas à contacter Sarra El Ayari - sarra(point)elayari(at)cnrs(point)fr