ParCoLab est un corpus de textes alignés en français, serbe, anglais, espagnol, italien, occitan, corse, alsacien et poitevin-saintongeais, portugais et allemand destiné à la recherche en linguistique, à l’enseignement et à l’apprentissage de langues. C’est un corpus parallèle de plus de 75.000.000 de mots, avec des alignements au niveau des phrases manuellement vérifiés. Il est interrogeable gratuitement en ligne.
Laisser un commentaire