Expérimentation du langage artificiel IEML pour le balisage d'articles dans Stylo
Le projet consiste à mener une réflexion et une expérimentation des possibilités sémantiques offertes par IEML, le langage artificiel créé par Pierre Lévy, dans le cadre de l’écriture et le balisage des articles scientifiques.
Problématique
La sémantique des textes fait de plus en plus l'objet d'approches inductives qui essayent d'extraire, sur la base de modèles probabilistes, des informations à partir de textes pauvrement balisés.
Cela nous expose de manière croissante à un risque de perte de controle sur l'information que nous produisons et de son sens. À l'époque des LLM, il devient encore plus urgent de réintroduire dans les textes que nous produisons des couches sémantiques que nous maîtrisons. IEML permet de construire des concepts dont la syntaxe explicite la sémantique, ce qui rend cette dernière calculable. C'est une avenue très prometteuse pour reprendre en main le sens de nos productions intellectuelles. Nous allons commencer des expérimentations simples avec les mots-clés des articles, avec l'idée de réitérer les expérimentations sur des cas plus complexes dans la suite du partenariat Revue3.0.
Enjeux techniques
La production de concepts en IEML est très complexe et difficile à maîtriser. Nous allons identifier et spécifier des listes de mots et de concepts en IEML qui pourront être utiles pour les revues et mettre en place une ergonomie de sélection qui permette une prise en main relativement simple.
Actions de recherche
- Étude des champs sémantiques des revues partenaires
- Identification de mots-clés
- Traduction des mots-clés en IEML
Livrables
Prototype d’alignement de mots-clés avec IEML dans Stylo.