Analyse automatique du grec ancien par réseau de neurones. Évaluation sur le corpus De Thessalonica Capta

Auteurs

  • Bastien Kindt
  • Chahan Vidal-Gorène
  • Saulo Delle Donne

DOI :

https://doi.org/10.14428/babelao.vol1011.2022.65073

Mots-clés :

Traitement automatique des langues (TAL), Lemmatisation, Étiquetage morphosyntaxique, Grec ancien, Jean Anagnostès, Eustathe de Thessalonique, Jean Kaminiatès

Résumé

Le corpus DTC réunit des textes historiographiques grecs d’époque byzantine. Ces textes ont été analysés semi-automatiquement (lemmatisation et catégorisation morphosyntaxique) avec les outils informatiques et les ressources linguistiques du projet GREgORI (UCLouvain, Louvain-la-Neuve, Belgique) spécialisé dans le traitement automatique du grec et des langues de l’Orient chrétien. Une seconde analyse a été menée en collaboration avec l’entreprise Calfa (Paris, France) spécialisée dans le traitement de l’arménien et la mise en oeuvre d’approches basées sur l’intelligence artificielle. Cette seconde analyse est réalisée par un réseau de neurones. Cette étude compare et évalue les résultats produits par les deux méthodes et propose une approche hybride pour le traitement automatique des langues concernées.

Téléchargements

Publiée

24-02-2022

Comment citer

[1]
B. Kindt, C. Vidal-Gorène, et S. Delle Donne, « Analyse automatique du grec ancien par réseau de neurones. Évaluation sur le corpus De Thessalonica Capta », BABELAO, vol. 1011, p. 537–562, févr. 2022.

Numéro

Rubrique

Miscellanea