Cette page présente la taille du corpus et la liste des documents intégrés à ParCoLab.

Taille du corpus

Le corpus parallèle comporte au total 29.000.000 de mots, les quatre langues comprises. Les données récoltées se répartissent comme suit:

Liste des documents intégrés

Le corpus comporte essentiellement des textes littéraires écrits en français, en serbe, en anglais, en espagnol ou en occitan et leurs traductions. Vous y trouverez également des textes juridiques et philosophiques, la presse, les transcriptions de films et conférences, etc.

A ce jour, les documents suivants ont été intégrés dans le corpus parallèle.

[A propos]     [Equipe]    [Technologies]    [Publications]   [Ressources]    [Remerciements]