ParCoLab est un corpus de textes alignés en français, serbe, anglais, espagnol, italien, occitan, corse, alsacien et poitevin-saintongeais, portugais et allemand destiné à la recherche en linguistique, à l’enseignement et à l’apprentissage de langues. C’est un corpus parallèle de plus de 79.000.000 de mots, avec des alignements au niveau des phrases manuellement vérifiés. Il est interrogeable gratuitement en ligne.









Laisser un commentaire