Une intervention sur le serveur d’authentification est programmée jeudi 13 mars entre 11h30 et 13h.
Elle peut occasionner des problèmes de connexion sur Sciencesconf. |
|
Challenge extraction d'informationsPrésentationDans le cadre de l’atelier EvalLLM2025, nous proposons un challenge d’évaluation de LLM par la tâche. Il s’agit d’extraction d’information dans le domaine de santé en français dans un contexte few-shot où seuls seront donnés le guide d’annotation et quelques documents annotés. Les participants sont invités à évaluer les mises-en-oeuvre par des LLM mais la participation avec d’autres approches est pertinente et permettra de mettre en perspective les résultats des systèmes fondés sur les LLM. À l’issue de la phase d’entraînement, les données de test seront mises à disposition des participants pendant 3 jours (à choisir dans un intervalle de 3 semaines) et les résultats leur seront ensuite communiqués. Les participants seront invités à présenter leurs travaux dans un bref article et sous forme de communication orale ou poster le jour de l’atelier.
Description des donnéesLes données représentent des documents journalistiques pour la veille sanitaire annotés, par le Service de Santé des Armées, avec des entités d’intérêt (maladie, agent pathogène, agent toxine, substance explosive…) pouvant être discontinues, et des évènements (présentant des situations sanitaires) représentés par des tuples d'entités, où chaque entité correspond à un attribut de l'évènement ; voir illustration ci-dessous. Les noms des attributs sont indiqués par des relations sémantiques entre un évènement et ses entités composantes. Le guide d'annotation est celui fourni à des annotateurs humains du métier et donne les règles générales d'annotation. Il définit les types d'entites et explicite les attributs d'évènements en fournissant quelques exemples.
Calendrier du challenge- inscription et récupération des données : jusqu'à phase de test
Comment participerPour participer et accéder aux données, transmettez par mail à vincent.claveau@def.gouv.fr et nihel.kooli@def.gouv.fr :
Pour leur rapport de participation, il est demandé aux équipes participantes de :
Soumission des runs et métriquesTrois runs par équipe peuvent être soumis, par mail à nihel.kooli@def.gouv.fr Format de sortie attendu en JSON : identique aux fichiers de train fournis. Métriques d'évaluation : à venir |
Personnes connectées : 1 | Vie privée | Accessibilité |
![]() ![]() |