{"id":281,"date":"2015-05-18T07:13:26","date_gmt":"2015-05-18T06:13:26","guid":{"rendered":"https:\/\/parcolab.univ-tlse2.fr\/?page_id=281"},"modified":"2020-05-13T16:29:05","modified_gmt":"2020-05-13T15:29:05","slug":"ressources","status":"publish","type":"page","link":"https:\/\/parcolab.univ-tlse2.fr\/en\/about-2\/ressources\/","title":{"rendered":"Ressources"},"content":{"rendered":"<p class=\"lead\">Cette page regroupe des ressources produites dans le cadre du projet ParCoLab. Vous y trouverez les ressources suivantes:<\/p>\n<hr \/>\n<ul>\n<li><a href=\"#parcojour\"><strong>ParCoJour<\/strong><\/a><\/li>\n<li><a href=\"#parcolabfree\"><strong>ParCoLabFree<\/strong><\/a><\/li>\n<li><a href=\"#parcotrain\"><strong>ParCoTrain<\/strong><\/a><\/li>\n<li><a href=\"#wikimorph-sr\"><strong>Wikimorph-sr<\/strong><\/a><\/li>\n<li><a href=\"#parcoglij\"><strong>ParCoGLiJ<\/strong><\/a><\/li>\n<\/ul>\n<hr \/>\n<p><a name=\"parcojour\"><\/a><\/p>\n<h3><span style=\"color: #666699;\">ParCoJour \u2013 treebank journalistique de la langue serbe<\/span><\/h3>\n<p><strong>Description<\/strong><\/p>\n<p><strong>ParCoJour <\/strong>est un corpus journalistique contenant 34 000 tokens. Il est compos\u00e9 de 37 articles journalistiques tir\u00e9s de deux journaux nationaux, <em>Danas<\/em> (quotidien) et <em>NIN<\/em> (hebdomadaire). Les articles couvrent la p\u00e9riode de 2003 \u00e0 2017. Le corpus indique le lemme, l&#8217;\u00e9tiquette \u00e0 gros grain, l&#8217;\u00e9tiquette d\u00e9taill\u00e9e, le gouverneur syntaxique et la fonction syntaxique de chaque token. L&#8217;annotation linguistique suit les lignes directrices de l&#8217;annotation du corpus ParCoTrain-Synt.<\/p>\n<p><strong>T\u00e9l\u00e9chargement :<br \/>\n<a href=\"https:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2020\/05\/ParCoJour_v0.1.zip\">ParCoJour_v0.1<\/a><br \/>\n<\/strong><\/p>\n<p><strong>Droits :<br \/>\n<\/strong><a href=\"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/3.0\/\" rel=\"license\"><img decoding=\"async\" src=\"https:\/\/i.creativecommons.org\/l\/by-nc-sa\/3.0\/80x15.png\" alt=\"Creative Commons License\" \/><\/a> Ce corpus est diffus\u00e9 sous la licence <a href=\"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/3.0\/\" rel=\"license\">Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License<\/a>.<\/p>\n<p><strong>Personne \u00e0 contacter :<br \/>\n<\/strong>Dusica Terzic, dusica.terzic@fil.bg.ac.rs<\/p>\n<p><strong>R\u00e9f\u00e9rence :<br \/>\n<\/strong><strong>Terzic, Dusica. (2019). <\/strong>Parsing des textes journalistiques en serbe par le logiciel Talismane. <em>Proceedings of TALN-RECITAL 2019, pp. 591-604. <\/em>Toulouse, France. [<a href=\"https:\/\/www.irit.fr\/pfia2019\/wp-content\/uploads\/2019\/07\/actes_TALN-RECITAL-recital_CH_PFIA2019-2.pdf\">PDF<\/a>]<\/p>\n<p><a name=\"parcolabfree\"><\/a><\/p>\n<h3><span style=\"color: #666699;\">ParCoLabFree &#8211; fichiers t\u00e9l\u00e9chargeables<\/span><\/h3>\n<p><strong>Description<\/strong><\/p>\n<p>Une partie du contenu de ParCoLab est libre de droit et disponible pour le t\u00e9l\u00e9chargement. La portion du corpus actuellement \u00e0 votre disposition contient 588 000 tokens au total (63 000 en serbe, 260 000 en fran\u00e7ais et 265 000 en anglais). Un bref descriptif des textes compris dans ce sous-corpus, ainsi que leur taille, sont donn\u00e9s dans la suite.<\/p>\n\n<table id=\"tablepress-1\" class=\"tablepress tablepress-id-1 tbody-has-connected-cells\">\n<thead>\n<tr class=\"row-1\">\n\t<th class=\"column-1\">Source<\/th><th class=\"column-2\">Type<\/th><th class=\"column-3\">Serbe<\/th><th class=\"column-4\">Fran\u00e7ais<\/th><th class=\"column-5\">Anglais<\/th><th class=\"column-6\">Total<\/th>\n<\/tr>\n<\/thead>\n<tbody class=\"row-striping row-hover\">\n<tr class=\"row-2\">\n\t<td class=\"column-1\">Ambassade de France au Canada<\/td><td class=\"column-2\">Contenu web<br \/>\n(textes courts)<\/td><td class=\"column-3\">-<\/td><td class=\"column-4\">28.297<\/td><td class=\"column-5\">28.288<\/td><td class=\"column-6\">56.585<\/td>\n<\/tr>\n<tr class=\"row-3\">\n\t<td class=\"column-1\">S\u00e9rie TV Bref<\/td><td class=\"column-2\">Sous-titres<br \/>\n(oral)<\/td><td class=\"column-3\">13.305<\/td><td class=\"column-4\">15.168<\/td><td class=\"column-5\">-<\/td><td class=\"column-6\">28.473<\/td>\n<\/tr>\n<tr class=\"row-4\">\n\t<td class=\"column-1\">Magazine web Pescanik<\/td><td class=\"column-2\">Contenu web<br \/>\n(articles socio-politiques)<\/td><td class=\"column-3\">31.151<\/td><td class=\"column-4\">-<\/td><td class=\"column-5\">34.275<\/td><td class=\"column-6\">65.426<\/td>\n<\/tr>\n<tr class=\"row-5\">\n\t<td class=\"column-1\">JRC-Acquis<\/td><td class=\"column-2\">L\u00e9gislation<br \/>\n(textes legislatifs de l\u2019EU)<\/td><td class=\"column-3\">-<\/td><td class=\"column-4\">195.095<\/td><td class=\"column-5\">181.290<\/td><td class=\"column-6\">376.385<\/td>\n<\/tr>\n<tr class=\"row-6\">\n\t<td class=\"column-1\">Conf\u00e9rences TED<\/td><td class=\"column-2\">Sous-titres<br \/>\n(conf\u00e9rences courtes sur des sujets vari\u00e9s)<\/td><td class=\"column-3\">18.933<\/td><td class=\"column-4\">21.105<\/td><td class=\"column-5\">21.410<\/td><td class=\"column-6\">61.448<\/td>\n<\/tr>\n<tr class=\"row-7\">\n\t<td colspan=\"2\" class=\"column-1\"><strong>Total<\/strong> (nombre de tokens)<\/td><td class=\"column-3\">63.389<\/td><td class=\"column-4\">259.665<\/td><td class=\"column-5\">265.263<\/td><td class=\"column-6\"><strong>588.317<\/strong><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-1 from cache -->\n<div>\n<p><strong>Personne \u00e0 contacter :\u00a0<\/strong><a href=\"http:\/\/clle.univ-tlse2.fr\/accueil\/miletic-aleksandra-414135.kjsp?RH=1458287996569\">Aleksandra Miletic (CLLE-ERSS)<\/a>, aleksandra.miletic@univ-tlse2.fr<\/p>\n<\/div>\n<div>\n<p><strong>Licence : <\/strong>Certains droits sont retenus. ParCoLab est distribu\u00e9 sous la licence\u00a0<a href=\"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/3.0\/deed.fr\">Creative Commons BY-NC-SA 3.0<\/a>.<\/p>\n<\/div>\n<div>\n<p><strong>T\u00e9l\u00e9chargement<\/strong><\/p>\n<p><a href=\"https:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2017\/04\/parcolab-copyrightfree.zip\">archive zip avec les fichiers XML<\/a><\/p>\n<\/div>\n<p><a name=\"parcotrain\"><\/a><\/p>\n<h3><span style=\"color: #666699;\">ParCoTrain &#8211; \u00e9tiquetage et lemmatisation du serbe<\/span><\/h3>\n<p><strong>Description<\/strong><\/p>\n<p>ParCoTrain est un corpus d&#8217;entra\u00eenement et d&#8217;\u00e9valuation pour l&#8217;\u00e9tiquetage en parties du discours et la lemmatisation du serbe. La partie du corpus lemmatis\u00e9e contient 95 585 tokens annot\u00e9s manuellement, alors que l&#8217;\u00e9chantillon annot\u00e9 en parties du discours compte au total 153 625 tokens (dont 95 585 ont \u00e9t\u00e9 annot\u00e9s manuellement, et 57 977 ont \u00e9t\u00e9 annot\u00e9s automatiquement et valid\u00e9s manuellement). Les textes source du corpus sont des romans contemporains serbes datant de la deuxi\u00e8me moiti\u00e9 du 20e si\u00e8cle.<\/p>\n<div>\n<p>L&#8217;annotation en parties du discours indique la cat\u00e9gorie principale aussi bien que la sous-cat\u00e9gorie. Pour les adjectifs et les adverbes, on indique \u00e9galement le degr\u00e9 de comparaison. Une pr\u00e9sentation d\u00e9taill\u00e9e du jeu d&#8217;\u00e9tiquettes utilis\u00e9 peut \u00eatre trouv\u00e9e dans la documentation PDF t\u00e9l\u00e9chargeable ci-dessous.<\/p>\n<p>Cette ressource a \u00e9t\u00e9 d\u00e9velopp\u00e9e dans le cadre du projet <a href=\"https:\/\/parcolab.univ-tlse2.fr\/\">ParCoLab<\/a> par <a href=\"http:\/\/clle.univ-tlse2.fr\/accueil\/miletic-aleksandra-414135.kjsp?RH=1458287996569\">Aleksandra Miletic<\/a> (CLLE-ERSS, Universit\u00e9 Toulouse &#8211; Jean Jaur\u00e8s), <a href=\"http:\/\/stl.recherche.univ-lille3.fr\/sitespersonnels\/balvet\/page_balvet\/page_Balvet.html\">Antonio Balvet<\/a> (STL, Universit\u00e9 Lille 3) et <a href=\"http:\/\/clle.univ-tlse2.fr\/accueil\/actualites\/annuaire\/stosic-dejan-327542.kjsp?RH=1458287996569\">Dejan Stosic<\/a> (CLLE-ERSS, Universit\u00e9 Toulouse &#8211; Jean Jaur\u00e8s).<\/p>\n<\/div>\n<div>\n<p><strong>Responsable ressource :\u00a0<\/strong>Aleksandra Miletic (CLLE-ERSS), aleksandra.miletic@univ-tlse2.fr<\/p>\n<\/div>\n<div>\n<p><strong>Droits :\u00a0<\/strong>Certains droits sont r\u00e9serv\u00e9s. ParCoTrain est diffus\u00e9 sous la licence <a href=\"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/3.0\/deed.fr\">Creative Commons BY-NC-SA 3.0<\/a>.<\/p>\n<\/div>\n<div>\n<p><strong>T\u00e9l\u00e9chargements :<\/strong><\/p>\n<p><a href=\"https:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2015\/05\/ParCoTrain.zip\">Corpus d&#8217;entra\u00eenement<\/a><\/p>\n<p><a href=\"https:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2016\/09\/ParCoTrain-Documentation-fr.pdf\">Documentation PDF en fran\u00e7ais<\/a><\/p>\n<\/div>\n<div>\n<p><strong>R\u00e9f\u00e9rences :<\/strong><\/p>\n<p>Balvet, A., Stosic, D., &amp; Miletic, A. (2014). TALC-sef, Un corpus \u00e9tiquet\u00e9 de traductions litt\u00e9raires en serbe, anglais et fran\u00e7ais. In SHS Web of Conferences (Vol. 8, pp. 2551-2563). EDP Sciences. [<a href=\"cmlf2014.pdf\">PDF<\/a>] [<a href=\"https:\/\/scholar.google.fr\/scholar.bib?q=info:r0AbJiIbPQcJ:scholar.google.com\/&amp;output=citation&amp;scisig=AAGBfm0AAAAAVmbuU90ZoQ7_Ce1OX20cIhZFeRj6ggth&amp;scisf=4&amp;hl=fr\">BibTex<\/a>]<\/p>\n<p>Miletic, A. (2013). Annotation semi-automatique en parties du discours d&#8217;un corpus litt\u00e9raire serbe. M\u00e9moire de Master. Universit\u00e9 Charles de Gaulle Lille 3, France.<\/p>\n<\/div>\n<p><a name=\"wikimorph-sr\"><\/a><\/p>\n<h3><span style=\"color: #666699;\">Wikimorph-sr &#8211; lexique pour le POS-tagging et le parsing du serbe<\/span><\/h3>\n<p><strong>Description<\/strong><\/p>\n<p><strong>Wikimorph-sr<\/strong> est un\u00a0est un lexique morphosyntaxique pour le serbe destin\u00e9 \u00e0 l&#8217;\u00e9tiquetage morphosyntaxique, \u00e0 la lemmatisation et au parsing. Le lexique a \u00e9t\u00e9 d\u00e9velopp\u00e9 dans le cadre du projet <a href=\"https:\/\/parcolab.univ-tlse2.fr\/\" target=\"_blank\" rel=\"noopener noreferrer\">ParCoLab<\/a>. Il a \u00e9t\u00e9 principalement extrait de l&#8217;<a href=\"https:\/\/sh.wiktionary.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">\u00e9dition serbo-croate du Wiktionary<\/a> et compte 1\u00a0226\u00a0638 formes fl\u00e9chies provenant de 117\u00a0445 lemmes diff\u00e9rents, qui donnent lieu \u00e0 3\u00a0066\u00a0214 combinaisons uniques &lt;<em>forme fl\u00e9chie, lemme, description morphosyntaxique<\/em>&gt;.<\/p>\n<p>Le corpus est distribu\u00e9 dans un format texte tabul\u00e9 en trois colonnes : la premi\u00e8re colonne contient la forme fl\u00e9chie, la deuxi\u00e8me le lemme, et la troisi\u00e8me une \u00e9tiquette complexe encodant plusieurs traits morphosyntaxiques. Un descriptif d\u00e9taill\u00e9 de la structure des \u00e9tiquettes et des traits morphosyntaxiques repr\u00e9sent\u00e9s dans le lexique est donn\u00e9 dans la documentation PDF de la ressource.<\/p>\n<p>Cette ressource a \u00e9t\u00e9 d\u00e9velopp\u00e9e dans le cadre du projet <a href=\"https:\/\/parcolab.univ-tlse2.fr\/\">ParCoLab<\/a> par <a href=\"http:\/\/clle.univ-tlse2.fr\/accueil\/miletic-aleksandra-414135.kjsp?RH=1458287996569\">Aleksandra Miletic<\/a> (CLLE-ERSS, Universit\u00e9 Toulouse &#8211; Jean Jaur\u00e8s).<\/p>\n<p><strong>Responsable ressource<\/strong><br \/>\n<a href=\"http:\/\/clle.univ-tlse2.fr\/accueil\/miletic-aleksandra-414135.kjsp?RH=1458287996569\">Aleksandra Miletic<\/a><br \/>\nContact : aleksandra.miletic@univ-tlse2.fr<\/p>\n<p><strong>Droits<\/strong><br \/>\nCertains droits sont r\u00e9serv\u00e9s. <strong>wikimorph-sr<\/strong> est diffus\u00e9 sous la licence\u00a0<a href=\"http:\/\/creativecommons.org\/licenses\/by-sa\/3.0\/deed.fr\" target=\"_blank\" rel=\"noopener noreferrer\">Creative Commons BY-SA 3.0<\/a>.<\/p>\n<p><strong>T\u00e9l\u00e9chargements<\/strong><br \/>\n<a href=\"http:\/\/redac.univ-tlse2.fr\/lexiques\/wikimorph-sr\/wikimorph-sr_1.0.zip\">Lexique<\/a><br \/>\n<a href=\"https:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2017\/04\/wikimorph-sr-documentation-fr-v1.1.pdf\">Documentation en fran\u00e7ais<\/a><\/p>\n<p><strong>R\u00e9f\u00e9rences<\/strong><\/p>\n<p><b>Miletic, Aleksandra. (2017)<\/b>. Building a morphosyntactic lexicon for Serbian from Wiktionary. <i>Actes de la 6e \u00e9dition des Journ\u00e9es d&#8217;\u00e9tude toulousaines (J\u00e9Tou2017)<\/i>. Toulouse, France.<\/p>\n<p><strong>Remerciements<\/strong><\/p>\n<p>L&#8217;auteure remercie chaleureusement Franck Sajous (UMR 5263 CLLE, CNRS &amp; Universit\u00e9 Toulouse &#8211; Jean Jaur\u00e8s) d&#8217;avoir partag\u00e9 avec elle ses exp\u00e9riences dans le travail sur le Wiktionary.<\/p>\n<div><\/div>\n<p><a name=\"parcoglij\"><\/a><\/p>\n<h3><span style=\"color: #666699;\">ParCoGLiJ &#8211; Corpus parall\u00e8le de litt\u00e9rature de jeunesse<\/span><\/h3>\n<p>Ce corpus est destin\u00e9 \u00e0 l&#8217;\u00e9tude des grands classiques de la litt\u00e9rature de jeunesse. Il contient 8 ouvrages en fran\u00e7ais et en anglais align\u00e9s avec leur traduction dans l&#8217;autre langue du corpus. Le corpus contient au total 1,6 millions de mots et il est libre de droits. La cr\u00e9ation de ce corpus a \u00e9t\u00e9 financ\u00e9e par le consortium CORLI.<\/p>\n<p><strong>Contenu<\/strong><\/p>\n<p>Oeuvres d\u2019auteurs fran\u00e7ais<\/p>\n\n<table id=\"tablepress-2\" class=\"tablepress tablepress-id-2 tbody-has-connected-cells\">\n<thead>\n<tr class=\"row-1\">\n\t<th class=\"column-1\">Auteur<\/th><th class=\"column-2\">Titre<\/th><th class=\"column-3\">Fran\u00e7ais<\/th><th class=\"column-4\">Anglais<\/th><th class=\"column-5\">Total<\/th><th class=\"column-6\">Formats<\/th>\n<\/tr>\n<\/thead>\n<tbody class=\"row-striping row-hover\">\n<tr class=\"row-2\">\n\t<td class=\"column-1\">Daudet, A. <\/td><td class=\"column-2\"><em>Lettres de mon moulin<\/em><br \/>\n<\/td><td class=\"column-3\">46\u00a0592<\/td><td class=\"column-4\">47 706<\/td><td class=\"column-5\">94 298<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2018\/05\/Lettres-de-mon-moulin_tmx.zip\">tmx<\/a>, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a>, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/lettres\/\" rel=\"noopener\" target=\"_blank\">bi-text<\/a><\/td>\n<\/tr>\n<tr class=\"row-3\">\n\t<td class=\"column-1\">Dumas, A.<\/td><td class=\"column-2\"><em>Les trois mousquetaires<\/em><\/td><td class=\"column-3\">213\u00a0791<\/td><td class=\"column-4\">228\u00a0900<\/td><td class=\"column-5\">442 691<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-4\">\n\t<td class=\"column-1\">De S\u00e9gur<\/td><td class=\"column-2\"><em>M\u00e9moires d\u2019un \u00e2ne<\/em><\/td><td class=\"column-3\">54\u00a0662<\/td><td class=\"column-4\">42\u00a0040<\/td><td class=\"column-5\">96 702<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-5\">\n\t<td class=\"column-1\">Verne, J.<\/td><td class=\"column-2\"><em>Vingt mille lieues sous les mers<br \/>\n<\/em><\/td><td class=\"column-3\">142\u00a0959<\/td><td class=\"column-4\">141\u00a0936<\/td><td class=\"column-5\">284 895<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-6\">\n\t<td colspan=\"2\" class=\"column-1\"><strong>Total<\/strong> (nombre de tokens)<\/td><td class=\"column-3\"><strong>458004<\/strong><\/td><td class=\"column-4\"><strong>460582<\/strong><\/td><td class=\"column-5\"><strong>918586<\/strong><\/td><td class=\"column-6\"><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-2 from cache -->\n<div>\n<p>Oeuvres d\u2019auteurs anglais<\/p>\n<p>\n<table id=\"tablepress-3\" class=\"tablepress tablepress-id-3 tbody-has-connected-cells\">\n<thead>\n<tr class=\"row-1\">\n\t<th class=\"column-1\">Auteur<\/th><th class=\"column-2\">Titre<\/th><th class=\"column-3\">Fran\u00e7ais<\/th><th class=\"column-4\">Anglais<\/th><th class=\"column-5\">Total<\/th><th class=\"column-6\">Formats<\/th>\n<\/tr>\n<\/thead>\n<tbody class=\"row-striping row-hover\">\n<tr class=\"row-2\">\n\t<td class=\"column-1\">Hodgson Burnett, F.<\/td><td class=\"column-2\"><em>The Secret Garden<br \/>\n<\/em><br \/>\n<\/td><td class=\"column-3\">76\u00a0940<\/td><td class=\"column-4\">80\u00a0558<\/td><td class=\"column-5\">157498<br \/>\n<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-3\">\n\t<td class=\"column-1\">Stevenson, R.L.<\/td><td class=\"column-2\"><em>Treasure Island<br \/>\n<\/em><\/td><td class=\"column-3\">69\u00a0827<\/td><td class=\"column-4\">68\u00a0996<\/td><td class=\"column-5\">138 823<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-4\">\n\t<td class=\"column-1\">Kipling, R.<\/td><td class=\"column-2\"><em>Jungle Book<br \/>\n<\/em><\/td><td class=\"column-3\">55\u00a0913<\/td><td class=\"column-4\">51\u00a0334<\/td><td class=\"column-5\">107 247<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-5\">\n\t<td class=\"column-1\">Dickens, Ch.<\/td><td class=\"column-2\"><em>Oliver Twist<br \/>\n<\/em><\/td><td class=\"column-3\">164\u00a0786<\/td><td class=\"column-4\">157\u00a0584<\/td><td class=\"column-5\">322 370<\/td><td class=\"column-6\">xml, <a href=\"http:\/\/parcolab.univ-tlse2.fr\/corpus\/#search\" rel=\"noopener\" target=\"_blank\">parcolab<\/a><\/td>\n<\/tr>\n<tr class=\"row-6\">\n\t<td colspan=\"2\" class=\"column-1\"><strong>Total<\/strong> (nombre de tokens)<\/td><td class=\"column-3\"><strong>367466<\/strong><\/td><td class=\"column-4\"><strong>358472<\/strong><\/td><td class=\"column-5\"><strong>725938<\/strong><\/td><td class=\"column-6\"><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<!-- #tablepress-3 from cache --><br \/>\n<strong>T\u00e9l\u00e9chargements<\/strong><\/p>\n<p><a href=\"https:\/\/partage.univ-tlse2.fr\/obubcjf\">Corpus XML<\/a><br \/>\n<a href=\"https:\/\/parcolab.univ-tlse2.fr\/wp-content\/uploads\/2018\/05\/ParCoGliJe-Readme.pdf\">Documentation en fran\u00e7ais<\/a><\/p>\n<p><strong>Responsables ressource<\/strong><br \/>\n<a href=\"http:\/\/blogs.univ-tlse2.fr\/dejanstosic\/\">Dejan Stosic<\/a> &amp; <a href=\"http:\/\/clle.univ-tlse2.fr\/accueil\/miletic-aleksandra-414135.kjsp?RH=1458287996569\">Aleksandra Miletic<\/a><br \/>\nContact : dejan.stosic@univ-tlse2.fr \/ aleksandra.miletic@univ-tlse2.fr<\/p>\n<p><strong>R\u00e9f\u00e9rences<\/strong><\/p>\n<p>Stosic, D., Marjanovi\u0107, S. &amp; Miletic, A. (2018). ParCoGLiJe:\u00a0Corpus parall\u00e8le pour l\u2019\u00e9tude des grands classiques de la litt\u00e9rature de jeunesse. Poster pr\u00e9sent\u00e9 \u00e0 la Journ\u00e9e d&#8217;\u00e9tude CORLI\u00a0<em>Traitements et standardisation des corpus multimodaux et web 2.0.\u00a0<\/em>Universit\u00e9 Paris Diderot &#8211; Paris 7 (25 mai 2018).<\/p>\n<h5 style=\"text-align: center;\">[<a href=\"https:\/\/parcolab.univ-tlse2.fr\/about\/\">A propos<\/a>] \u00a0 \u00a0[<a href=\"https:\/\/parcolab.univ-tlse2.fr\/about\/equipe\/\">Equipe<\/a>]\u00a0 [<a href=\"https:\/\/parcolab.univ-tlse2.fr\/about\/doc\/\">Technologies<\/a>] \u00a0\u00a0[<a href=\"https:\/\/parcolab.univ-tlse2.fr\/about\/contenu\/\">Contenu<\/a>] \u00a0 [<a href=\"https:\/\/parcolab.univ-tlse2.fr\/about\/publications\/\">Publications<\/a>] \u00a0[<a href=\"https:\/\/parcolab.univ-tlse2.fr\/about\/remerciements\/\">Remerciements<\/a>]<\/h5>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Cette page regroupe des ressources produites dans le cadre du projet ParCoLab. Vous y trouverez les ressources suivantes: ParCoJour ParCoLabFree ParCoTrain Wikimorph-sr ParCoGLiJ ParCoJour \u2013 treebank journalistique de la langue serbe Description ParCoJour est un corpus journalistique contenant 34 000 tokens. Il est compos\u00e9 de 37 articles journalistiques tir\u00e9s de deux journaux nationaux, Danas (quotidien)&#8230;  <a href=\"https:\/\/parcolab.univ-tlse2.fr\/en\/about-2\/ressources\/\" class=\"more-link\" title=\"Read Ressources\">Read more &raquo;<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":2,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-281","page","type-page","status-publish","hentry"],"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/pages\/281","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/comments?post=281"}],"version-history":[{"count":60,"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/pages\/281\/revisions"}],"predecessor-version":[{"id":2395,"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/pages\/281\/revisions\/2395"}],"up":[{"embeddable":true,"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/pages\/2"}],"wp:attachment":[{"href":"https:\/\/parcolab.univ-tlse2.fr\/en\/wp-json\/wp\/v2\/media?parent=281"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}