Jeudi 26 mars 2026

    • Mode

      Distanciel

    • Format

      Webconférence

    • Date limite des inscriptions

      Dimanche 1 mars 2026

    Objectifs

    Cette session s'inscrit dans le cadre de la Semaine Numérique des Urfist #SNDU2026 organisée intégralement en ligne du 23 au 27 mars 2026 par le Réseau URFIST. A travers ce programme, nous vous invitons à découvrir ou compléter vos connaissances pour gérer votre bibliographie (Bibliosphère), construire vos guides d'entretiens (REQUEST), dépolluer la science (RASP) publier en science ouverte (OPERAS, Datacite), interroger des bases de données ouvertes (Scholia, Wikidata et API), pour traiter vos données de sciences sociales avec l'IA (Active Tigger), etc. Nous vous proposons aussi deux rencontres : la première sur les relations "sciences sociales et société" et la seconde sur les recherches en cours autour de l'information scientifique et technique. 

    Programme

    Cette session est une introduction à la démarche d'annotation de corpus textuel pour les sciences sociales, avec l’outil Active Tigger. Pour réaliser cette annotation, cet outil open source développé par le groupe CSS@IPP/CREST (https://www.css.cnrs.fr/active-tigger/) s’appuie sur un usage parcimonieux des approches d'intelligence artificielle. Il permet le recours à l’apprentissage actif et à une ergonomie adaptée aux sciences sociales computationnelles.

    Une première partie sera consacrée à la présentation des notions liées à la tâche de classification reposant sur une démarche d’apprentissage supervisé, notamment la construction des corpus d’entraînement et de validation et les bonnes pratiques associées, autour d’exemples issus de la recherche actuelle.

    Une deuxième partie sera consacrée à la présentation de l’outil Active Tigger qui permet de guider l’utilisateur à travers les différentes étapes de l’annotation du corpus d’entrainement, de l’affinage (fine-tuning) d’un classifieur basé sur des modèles BERT et son évaluation en vue de la généralisation de la classification sur le corpus complet.

    Cette présentation sera assurée par Emilien Schultz, de l'équipe Active Tigger.

    Pré-requis

    Aucun

    Partager cette page

    Stages sur le même thème

    Voir la liste complète