Des jeux de données de questions-réponses en français, à quoi ça sert ?

Annoter des articles Wikipédia, oui, mais pourquoi ? Le projet PIAF ne s’arrête pas à la collecte de données d’évaluation et d’entraînement. L’objectif est de faire du jeu de données d’entraînement une brique utilisable pour des applications d’IA mobilisant les questions-réponses : agent conversationnel pour aider un usager dans sa démarche, plateforme d’exploration et vulgarisation de documents juridiques, outil pour capitaliser des connaissances dans un service administratif, les possibilités sont nombreuses !

Nous vos proposons d’ailleurs dans ce blog post d’explorer en détail trois cas d’usages de PIAF dans l’administration.

Le projet étant porté par une institution publique, nous nous tournerons d’abord vers des administrations qui souhaitent développer des services auprès des usagers se basant sur l’IA. Bien entendu, d’autres utilisateurs peuvent bénéficier de PIAF. Nous imaginons par exemple que des laboratoires de recherche en IA pourraient utiliser ce corpus dans des projets académiques.

Proposer des cas d’usage pour PIAF !

Vous avez des idées de projets pour utiliser le premier jeu de données de PIAF ? Vous disposer de corpus de textes annotés qui pourraient enrichir le projet PIAF ? Contactez-nous : piaf@data.gouv.fr

Un logiciel d’annotation réutilisable

Le projet PIAF est aussi un projet open source : l’interface d’annotation développée pourra aussi être réutilisée par des administrations qui souhaitent créer des jeux de données d’entraînement dans leur domaine !