PIAF c'est...

questions-réponses à générer

annotathons hebdomadaires

contributeurs attendus

organisations partenaires

PIAF, construire un jeu de données francophones ouvert pour l’IA

Le recours à l’intelligence artificielle au sein de l’action publique est souvent identifié comme une opportunité pour interroger des textes documentaires et réaliser des outils de questions/réponses automatiques à destination des usagers. Interroger le code du travail en langage naturel, mettre à disposition un agent conversationnel pour un service donné, développer des moteurs de recherche performants, améliorer la gestion des connaissances, autant d’activités qui nécessitent de disposer de corpus de données d’entraînement de qualité afin de développer des algorithmes de questions/réponses.

Aujourd’hui, il n’existe pas de jeu de données d’entraînement francophone public et ouvert qui permettrait d’entraîner ces algorithmes.

L’ambition du projet PIAF est de construire ce(s) jeu(x) de données francophones pour l’IA de manière ouverte et contributive

Étape 1 | Développer une plateforme d’annotation
fondée sur un protocole scientifique inspiré du projet anglophone SQuAD développé à Stanford, afin d’annoter des extraits d'articles de Wikipédia en français et tester la performance d’une telle démarche
Étape 2 | Construire ce jeu de données francophone avec une communauté de contributeurs
L’annotation d’articles étant une tâche importante dans l’IA, nous avons choisi d’en faire un projet participatif et pédagogique. Citoyens, associations, chercheurs et agents publics sont invités à y contribuer selon deux formats : des sessions d'annotation pour constituer la base de données d'évaluation, et une campagne grand public pour les données d'entraînement ! En savoir plus
Étape 3 | Tester et utiliser ce jeu de données
Une fois ce jeu de données constitué, nous pourrons ensuite le tester et l’utiliser pour des cas d’usage concrets rencontrés par des administrations.

PIAF - Pour des IA francophones - un outil mutualisé du Lab IA

En mars 2018, la France a lancé sa stratégie nationale pour l’intelligence artificielle. Pilotée au sein de la Direction interministérielle du numérique, cette stratégie comprend trois volets : la recherche, l’économie et la transformation publique.

La politique de la donnée étant un axe majeur du développement de l’intelligence artificielle, la mission Etalab pilote la mise en place d’un “Lab IA” interministériel, dont la mission est d’accélérer le déploiement de l’IA dans les administrations via 3 activités principales :

  • Constituer une équipe coeur afin d’internaliser des compétences et de l’expertise autour de l’IA
  • Accompagner des projets d’IA dans les administrations, par l’intermédiaire d’appels à manifestations d’intérêt
  • Co-construire des outils mutualisés pouvant être utilisés de la manière la plus ouverte possible

Le projet PIAF est l'un des outils mutualisés du Lab IA.

Le projet PIAF est porté par Etalab et bénéficie du financement du Programme d'investissements d'avenir, piloté par le Secrétariat général pour l'investissement et la Caisse des dépôts et consignations.