The Congress ‘Humanizing Digitalization. Digitalizing Humanities’ organised by El Consejo Superior de Investigaciones Científicas (CSIC) in Madrid took place online on the 20 and 21th October 2021. In the first session devoted to text analysis, I explained how to create a multilingual corpus (in Latin, Italian, Hebrew, Arabic) by using the textual analysis software Sketch Engine and how to use this corpus to construct a glossary with Lexonomy an open-source, web-based dictionary writing and publishing system.
Sketch Engine, logiciel de linguistique de corpus
Si vous travaillez sur la linguistique de corpus et la création de corpus multilingues, je vous recommande d’utiliser la plateforme en ligne Sketch Engine.
L’outil permet notamment de générer des concordances et d’effectuer des recherches à plusieurs niveaux (ensemble du corpus, contexte, texte) et selon différents critères (mot, lemme, phrase, suite de caractères, CQL).
L’utilisation de Sketch Engine est payante, ce qui permet de bénéficier d’une assistance rapide et efficace. Dans le cas du SGP Project, nous avons ainsi pu créer le premier corpus bilingue gréco-syriaque en disposant d’une aide en ligne de qualité de la part des membres de l’équipe technique.
Pour ceux qui seraient intéressés, il est possible de bénéficier gratuitement d’un mois d’essai avant de souscrire à une licence annuelle.