Cette page fournit un premier guide d’utilisation pour l’interrogation de ParCoLab. Pour extraire les données de la base, vous devez d’abord définir vos critères de recherche et ensuite spécifier une ou plusieurs expression(s) à rechercher.
Pour accéder au formulaire de recherche, cliquez sur le bouton « Recherche » dans le menu situé en haut. Par défaut, l’interface de consultation vous permet d’effectuer une recherche dans l’ensemble des textes en français, originaux et traductions confondus. Vous pouvez cependant affiner votre recherche en fonction de vos besoins.
1. Définition des critères de recherche
La version actuelle de l’interface de consultation offre la possibilité d’exploiter un ou plusieurs critères parmi les cinq disponibles : Expression en français, Expression en anglais, Expression en serbe, Auteur et Langue de l’original. L’ajout d’un critère se fait à l’aide du bouton « Add Criteria ».
Si vous souhaitez chercher une expression en français, textes originaux et traductions confondus, il vous suffit de saisir l’expression recherchée dans le champ qui s’affiche par défaut et d’appuyer sur le bouton « Corpus Search »:
Lorsque vous souhaitez obtenir des exemples où tel terme français est traduit par tel terme anglais, textes originaux et traductions confondus, vous devez ajouter un critère supplémentaire à l’aide du bouton « Add Criteria ». Choisissez ensuite une deuxième langue et saisissez le terme recherché et son correspondant dans l’autre langue. Appuyez sur le bouton « Corpus Search » pour lancer la recherche:
Ce type de requête peut être étendu aux trois langues du corpus:
A la différence des exemples précédents où la base entière était interrogée, il est possible de limiter les requêtes aux seuls textes originaux écrits dans une des langues du corpus. Pour cela, vous devez ajouter un critère à l’aide du bouton « Add Criteria », choisir le filtre « Language of original » et sélectionner une des trois langues comme langue source:
En outre, vous pouvez viser dans l’ensemble des textes français ceux écrits par un des auteurs présents dans le corpus. Dans ce cas, il vous faut ajouter un critère à l’aide du bouton « Add Criteria », choisir le filtre « Author » et indiquer le nom de l’auteur qui vous intéresse:
2. Exécution de requêtes
Il vous est possible d’effectuer plusieurs types de requêtes dans ParCoLab, grâce au moteur de recherche ElasticSearch implémenté dans l’application. Celui-ci permet des requêtes visant un mot, une expression constituée de plusieurs mots, des expressions avec un ou plusieurs jokers, des mots qui commencent ou se terminent par telle ou telle chaîne de caractères, etc. L’utilisation des expressions régulières et celle des opérateurs booléens sont également possibles.
2.1. Recherche simple
Une recherche simple vise une graphie donnée ou un ensemble de forme à partir d’une seule « base ».
2.1.1. Recherche d’une graphie donnée
Si vous recherchez des contextes pour une forme précise:
- saisissez l’expression recherchée dans le champ de requête puis cliquez sur le bouton « Corpus Search »
Exemple:
Si vous recherchez le mot « volontairement », il vous suffit de le taper dans le champ de requête:
Vous obtiendrez tous les énoncés qui comportent le mot en question, avec leurs traductions dans les deux autres langues (ou dans une des deux, selon la disponibilité des traductions):
2.1.2. Recherche d’une forme variable
Si vous recherchez des contextes d’apparition d’une forme variable, vous devez utiliser le caractère « ? » pour remplacer un seul caractère ou l’étoile « * » pour remplacer 0, un ou plusieurs caractères. Il est possible de cumuler deux ou plusieurs « ? ». Le point d’interrogation et l’étoile peuvent figurer au début, au milieu ou à la fin de la forme recherchée:
Exemple 1:
Si vous souhaitez extraire les contextes d’apparition des formes du singulier du verbe « rougir » au présent de l’indicatif, vous pouvez formuler votre requête comme suit:
– rougi? => rougis, rougit
Une requête avec l’étoile permet plus de souplesse:
– courageu* => courageux, courageuse, courageuses, courageusement
Exemple 2:
Il est possible d’extraire tous les termes commençant par « anti »:
– anti* => antique/s, antichambre, antireligieux/se, antirépublicain/e/s, etc.
Exemple 3:
L’étoile permet également l’identification de familles de mots. Vous pouvez par exemple extraire tous les énoncés avec les formes comportant la base « monte »:
– « *monte* » => monte, démonte, remontes, montent, surmontez, remonter, remonteras, etc.
2.2. Recherche complexe
Dans ParCoLab, il est possible d’effectuer différents types de recherche complexe visant l’extraction de co-occurrences.
2.1. Recherche d’une expression complexe exacte
Si vous recherchez une expression exacte composée de plusieurs mots, saisissez-la dans le champ de requête en la mettant entre les guillemets puis cliquez sur le bouton « Corpus Search ».
Exemple:
Si vous recherchez l’expression exacte « un peu plus bas », formulez votre requête comme suit:
Notez que sans les guillemets, vous obtiendrez les énoncés où apparaissent tous les éléments de l’expression ensemble, ensuite ceux où ils figurent tous mais séparément et dans un ordre arbitraire, puis des exemples avec certains des éléments de l’expression recherchée et enfin avec un seul des constituants de votre expression.
– un peu plus bas => un peu plus bas, plus bas, un peu, peu à peu, peu – un – bas, Je regrettais déjà [ un ] [ peu ] que [ plus ] aucun soldat ne traversât notre village, etc.
2.2. Recherche de co-occurrences avec la définition de la distance
Vous avez également la possibilité d’effectuer des recherches avec joker en spécifiant la distance maximale entre les termes qui constituent votre expression complexe. L’expression complexe, mise entre les guillemets, doit être accompagnée d’un tilde suivi du chiffre indiquant la distance (≥1).
Exemple 1:
Si vous souhaitez extraire la co-occurrence « une belle » en admettant un modifieur devant l’élément « belle », votre requête doit être formulée comme suit:
– « une belle »~2 => une très belle, une si belle, une plus belle, une grande et belle, une autre belle, une fort belle, etc.
Exemple 2:
Si vous souhaitez extraire les contextes où figurent « un peu » et « sombre » en admettant la possibilité de gradation de l’adjectif, votre requête doit être formulée ainsi:
– « (un peu) sombre »~2 => un peu sombre, un peu plus sombre, un peu moins sobre, etc.