Extraire des informations sur la biodiversité au niveau des espèces à partir de la littérature publiée

par Gabriel Muñoz

Project Details

  • Langue :
    Anglais
  • Matériel requis :
    R and RStudio
  • Instruit :
    Colloque R 2019
  • Contribué par :
    Gabriel Muñoz

Extraire des informations sur la biodiversité au niveau des espèces à partir de la littérature publiée

Produit de siècles de recherche, une grande quantité d’informations sur la vie sur notre planète est stockée dans la littérature publiée sur le web. La plupart de cette littérature est désormais accessible et se présente sous forme d’articles, de thèses ou de rapports, qui sont stockés et partagés sous forme de fichiers PDF. Cependant, le balayage manuel de tout ce corpus pour séparer et extraire les données de biodiversité au niveau des espèces à partir des travaux individuels peut être une tâche décourageante. Grâce à cet atelier, vous apprendrez à utiliser des outils informatiques et des méthodes plus automatisées pour rechercher les informations sur la biodiversité qui vous intéressent dans le vaste corpus de la littérature. Tout d’abord, nous passerons brièvement en revue les sources courantes et moins courantes de littérature sur la biodiversité. Ensuite, nous explorerons les techniques de recherche documentaire programmée et de sélection de mots-clés. Troisièmement, nous apprendrons à utiliser des outils spécifiques pour extraire des observations particulières sur la biodiversité à partir d’une collection d’articles pdf. Enfin, nous passerons brièvement en revue les agrégateurs communs de données sur la biodiversité mondiale.

Matériel de l’atelier

badge badge badge badge