Analyse automatique du grec ancien par réseau de neurones. Évaluation sur le corpus De Thessalonica Capta
DOI :
https://doi.org/10.14428/babelao.vol1011.2022.65073Mots-clés :
Traitement automatique des langues (TAL), Lemmatisation, Étiquetage morphosyntaxique, Grec ancien, Jean Anagnostès, Eustathe de Thessalonique, Jean KaminiatèsRésumé
Le corpus DTC réunit des textes historiographiques grecs d’époque byzantine. Ces textes ont été analysés semi-automatiquement (lemmatisation et catégorisation morphosyntaxique) avec les outils informatiques et les ressources linguistiques du projet GREgORI (UCLouvain, Louvain-la-Neuve, Belgique) spécialisé dans le traitement automatique du grec et des langues de l’Orient chrétien. Une seconde analyse a été menée en collaboration avec l’entreprise Calfa (Paris, France) spécialisée dans le traitement de l’arménien et la mise en oeuvre d’approches basées sur l’intelligence artificielle. Cette seconde analyse est réalisée par un réseau de neurones. Cette étude compare et évalue les résultats produits par les deux méthodes et propose une approche hybride pour le traitement automatique des langues concernées.
Téléchargements
Publiée
Comment citer
Numéro
Rubrique
Licence
Ces articles sont disponibles sous licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Pas de Modification 4.0 International.
En conséquence, les lecteurs sont autorisés à Partager (copier, distribuer et communiquer le matériel par tous moyens et sous tous formats) selon les conditions suivantes :
- Attribution — Vous devez créditer l'œuvre, intégrer un lien vers la licence et indiquer si des modifications ont été effectuées à l'œuvre. Vous devez indiquer ces informations par tous les moyens raisonnables, sans toutefois suggérer que l'offrant vous soutient ou soutient la façon dont vous avez utilisé son œuvre ;
- Pas d’Utilisation Commerciale — Vous n'êtes pas autorisé à faire un usage commercial de cette œuvre, tout ou partie du matériel la composant ;
- Pas de modifications — Dans le cas où vous effectuez un remix, que vous transformez, ou créez à partir du matériel composant l'œuvre originale, vous n'êtes pas autorisé à distribuer ou mettre à disposition l'œuvre modifiée.