Cette page recense tous les travaux, publications et présentations réalisés dans le cadre du projet, autour du corpus parallèle ParCoLab:
2024
Dejan Stosic, Saša Marjanović, Delphine Bernhard, Xavier Bach, Myriam Bras, Laurent Kevers, Stella Retali-Medori, Marianne Vergez-Couret, and Carole Werner. 2024. The ParCoLab Parallel Corpus and Its Extension to Four Regional Languages of France. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 16014–16023, Torino, Italia. ELRA and ICCL.
2023
Stosic, D. (2023), « Le corpus parallèle multilingue ParCoLab: de la constitution à l’utilisation », Séminaire du Laboratoire FoReLLIS, Université de Poitiers, Poitiers (19 janvier 2023).
2021
Bras, M., Stosic, D., Vergez-Couret, M., Bernard, D., Miletic, A. & Sibille, J. (2021), « Outiller les langues régionales : expériences coopératives sur l’occitan et l’alsacien avec l’aide du français, de l’allemand, du serbe, du catalan… », La lettre de I’InSHS du CNRS, n° 69, p. 20-22.
Miletic, A., Thuilier, J. (2021) Minimisation de la longueur des dépendances et la position de l’adjectif épithète en serbe et en français. Langages, 223, 81-102.
Miletic, A. & Stosic, D. (2021), « Mutualisation de ressources pour la création de treebanks : le cas du serbe et de l’occitan ». International Online Workshop LINGUATEC: Resources and tools for the automatic processing of the languages of the Pyrenees. (May 12, 2021).
2020
Terzić, Dušica, Saša Marjanović, Dejan Stosic, Aleksandra Miletic. „Diversification of Serbian-French-English-Spanish Parallel Corpus ParCoLab with Spoken Language Data.” Lecture Notes in Computer Science, Text, Speech, and Dialogue. TSD 2020. 12284. Eds. Petr Sojka, Ivan Kopeček, Karel Pala i Aleš Horák. Cham: Springer, 2020. 61–70. (ISBN 978-3-030-58323-1, 978-3-030-58322-4, DOI 10.1007/978-3-030-58323-1_6).
Bernhard, D., Bras, M., Ligozat, A.-L., Miletic, A., Sibille, J., Todirascu, A., Vergez-Couret, M. (2020). L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard. Cahiers du plurilinguisme européen, 12.
Терзић, Душица. „Анализа успешности парсера Talismane на нивоу синтаксичких етикета у корпусу ParCoJour.” Језици и културе у времену и простору, 9.2. Нови Сад: Филозофски факултет, 2020. 265–279 (ISBN 978-86-6065-615-7).
2019
Terzic, Dusica. „Parsing des textes journalistiques en serbe par le logiciel Talismane.” Actes de la conférence TALN-RECITAL (Conférence sur le Traitement Automatique des Langues Naturelles) PFIA 2019. Ур. Anne-Laure Ligozat и Sahar Ghannay. Тулуз: AfIA, 2019. 591–604. Access at: https://aclanthology.org/2019.jeptalnrecital-recital.10/
Miletic, A., Fabre, C., Stosic, D. (2019) De la constitution d’un corpus arboré à l’analyse syntaxique du
serbe. Traitement Automatique des Langues, 59(3), 15-39.
Stosic, Dejan, Saša Marjanović, Aleksandra Miletic. „Corpus parallèle ParCoLab et lexicographie bilingue français-serbe : recherches et applications.” Rapports culturels franco-serbes II. Les relations littéraires et culturelles franco-serbes dans le contexte européen. Éds. Milivoj Srebro, Jelena Novaković. Dossier spécial, réalisé en collaboration entre l’Université Bordeaux Montaigne et Matica srpska – Novi Sad (Serbie), de Serbica – revue électronique 26 (2019) (ISSN 2268-3445). Access at: https://serbica.u-bordeaux-montaigne.fr.
Marjanović, Saša, Dejan Stošić, Аleksandra Miletić. „Paralelni korpus ParCoLab u službi srpsko-francuske leksikografije.” Srpsko-francuske književne i kulturne veze u evropskom kontekstu 1. Eds. Jelena Novaković, Milivoj S Novi Sad: Matica srpska – Bordeaux: Université Bordeaux Montaigne, 2019. 279–307 (ISBN 978-86-7946-293-0).
2018
Marjanović, S., Stosic, D. & Miletic, A. (2018), « Corpus parallèles comme alternative aux dictionnaires bilingues : le cas de ParCoLab ». Colloque international – Dictionnaires et apprentissage des langues, INALCO, Paris (7 décembre 2018).
Stosic, D. (2018), « Pour une linguistique contrastive outillée: corpus parallèles et comparaison des langues ». Colloque international – Etudes françaises aujourd’hui 2018. Université de Belgrade, Serbie (9-11 novembre 2018).
Marjanović, S. (2018), « Dušan Matić kao prevodilac: novi život dvaju Matićevih prevoda u paralelnom korpusu ParCoLab ». Manifestation 37. Matićevi dani, Ćuprija, Serbie (7 septembre 2018).
Marjanović, S., Stosic, D. & Miletic, A. (2018), « A Sample French-Serbian Dictionary Entry based on the ParCoLab Parallel Corpus ». In: Čibej, J., Gorjanc, V., Kosem, I. & Krek, S. (eds), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts. Znanstvena založba Filozofske fakultete Univerze v Ljubljani / Ljubljana University Press, Faculty of Arts, p. 423-435. (17-21 juillet 2018).
Stosic, D. (2018), « ParCoLaF. Une plateforme de constitution et de diffusion de corpus parallèles pour les langues de France ». Conférence « Langues et numérique 2018 », DGLFLF, Paris, La Villette (03 juillet 2018).
Miletic, A. (2018), Un treebank pour le serbe : constitution et exploitations. Thèse de doctorat, Université Toulouse Jean Jaurès (20 juin 2018) (voir les ressources développées).
Stosic, D., Marjanović, S. & Miletic, A. (2018), « ParCoGLiJe. Corpus parallèle pour l’étude des grands classiques de la littérature de jeunesse ». Journée d’étude CORLI: Traitements et standardisation des corpus multimodaux et web 2.0. Université Paris Diderot – Paris 7, Paris (25 mai 2018) (poster).
2017
Miletic A., Stosic D., Marjanović S. (2017). « ParCoLab: A Parallel Corpus for Serbian, French and English ». International Conference on Text, Speech, and Dialogue – TSD 2017, Prague, Czechia (27th-31st august 2017). (poster)
Miletic, A., Urieli, A. (2017) Non-Projectivity in Serbian: Analysis of Formal and Linguistic Properties. In Proceedings of the Fourth International Conference on Dependency Linguistics (Depling 2017), 135-144, Pisa, Italy.
Miletic, A. (2017). « Parsing du serbe : premières expériences avec Talismane ». Séminaire de l’axe CARTEL du Laboratoire CLLE (équipe ERSS), Toulouse (France) (23 juin 2017).
Miletic, A. (2017). « Constitution d’un corpus annoté du serbe : démarche, résultats et premiers apports pour l’analyse linguistique ». Séminaire de l’équipe ERSS du Laboratoire CLLE, Toulouse (France) (1er juin 2017).
Miletic, A. (2017). « Building a morphosyntactic lexicon for Serbian using Wiktionary ». In Actes de la 6ème édition des Journées d’étude toulousaines : Les interfaces en sciences du langage. Université Toulouse Jean Jaurès, Toulouse, p. 30-34.
2016
Miletic, A., Fabre, C., Stosic, D. (2016), « Mise au point d’une méthode d’annotation morphosyntaxique fine du serbe ». Actes de la conférence conjointe JEP-TALN-RECITAL 2016, volume 2 : TALN, p. 506-513.
Stosic, D. & Marjanović, S. (2016), « Un corpus parallèle, mais pour quoi faire ? ». Conférence-débat à l’Institut français de Serbie, Belgrade (21 avril 2016).
2015
Miletic, A. (2015). « Constitution des ressources du TAL pour une langue peu dotée : le cas du serbe ». Séminaire de l’axe CARTEL du Laboratoire CLLE (équipe ERSS), Toulouse (France) (17 novembre 2015).
Stosic, D. (2015), « Ressource ParCoLab: un corpus parallèle français-serbe-anglais ». Journées scientifiques de CLLE-ERSS – Grammaire aérée, Villefranche de Rouergue, France (10-11 septembre 2015).
Miletic, A., Fabre, C. & Stosic, D. (2015), « Construction du jeu d’étiquettes pour le parsing du serbe ». Actes du 22ème colloque TALN, Atelier TASLA 2015 (Traitement automatique des langues slaves), p. 1-12. ( pdf )
2014
Miletic, A. (2014). « POS-tagging a Literary Corpus of Serbian. Young Linguists’ International Conference ». Stockholm, Suède (22 juin 2014).
Balvet, A., Stosic, D. & Miletic, A. (2014), « TALC-Sef. Un corpus étiqueté de traductions littéraires en serbe, anglais et français ». In Neveu, F., Blumenthal, P., Hriba, L., Gerstenberg, A., Meinschaefer, J. & Prévost, S. (éds), Actes du 4e Congrès Mondial de Linguistique Française – CMLF 2014. SHS Web of Conferences, vol. 8, p. 2551-2563. ( pdf )
Balvet, A., Stosic, D. & Miletic, A. (2014), « TALC-Sef: a Manually-revised POS-Tagged Literary Corpus in Serbian, English and French ». In Calzolari, N., Choukri, K., Declerck, T., Loftssonn H., Maegaard, B., Mariani, J., Moreno, A., Odijk, J. & Piperidis, S. (eds), Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14). ELRA. ( pdf )
2013
Miletic, A. (2013). Annotation semi-automatique en parties du discours d’un corpus littéraire serbe. Mémoire de Master, Université Charles de Gaulle Lille 3.