Na ovoj stranici naći ćete podatke o veličini korpusa i spisak tekstova koji su dosad uneti u ParCoLab.

Veličina korpusa

Paralelni korpus trenutno sadrži ukupno 51.000.000 reči na svim jezicima. Prikupljeni materijal razdeljen je na sledeći način:

Spisak unetih dokumenata

Korpus sadrži uglavnom književne tekstove na srpskom, francuskom, engleskom, španskom, italijanskom, oksitanskom, korzikanskom, alzaškom i poatvenskom jeziku i njihove prevode, ali ne isključivo. U ParCoLab-u ćete takođe naći i pravne i filozofske tekstove, štampu, transkripte filmova i konferencija, itd.

Pored tekstova koji su u javnom domenu ili za koje su obezbeđena prava za korišćenje u ParCoLabu, korpus uključuje izvestan materijal zaštićen pravima intelektualne svojine. U skladu s Direktivom 2019/790 Evropskog parlamenta i Saveta od 17. aprila 2019. godine o autorskim i srodnim pravima na jedinstvenom digitalnom tržištu, koja menja Direktive 96/9/EC i 2001/29/EC, i u skladu s članom L122-5 Zakona o intelektualnoj svojini Republike Francuske, ovi tekstovi isključivo se koriste u svrhu pretraživanja i istraživanja tekstova i podataka za naučne potrebe. Takođe su preduzete sve neophodne mere kako bi se obezbedila bezbednost baze podataka u kojoj se tekstovi nalaze. Svi tekstovi su u XML formatu, ne distribuiraju se, ne mogu se preuzimati i nije im moguće pristupiti u celosti. U rezultatima pretraživanja nasumično se prikazuju samo kratki izvodi.

Do sada su u paralelni korpus uneti dolenavedeni tekstovi.

[Ekipa]    [Tehnologije]   [Sadržaj]    [Objavljeni radovi]    [Resursi]    [Zahvaljujemo]