Suivi à grande échelle des cétacés grâce à l’IA : cas d'étude pour la détection aérienne des bélugas
Mon statut pour la session
Justine Boulent, Bertrand Charry, Malcom Kennedy, Emily Tissier, Raina Fan, Marianne Marcoux, Cortney A. Watt, Antoine Gagné-Turcotte
La télédétection est une technique précieuse pour suivre les populations de cétacés sur de larges espaces. Son utilisation conduit néanmoins à la création de jeux de données de plusieurs milliers d’images, ce qui demande énormément d’effort humain pour leur analyse. Des solutions automatiques basées sur de l’apprentissage profond ont été proposées ces dernières années, mais elles se heurtent souvent à un problème de généralisation : comment faire en sorte qu’un modèle d’apprentissage profond entraîné sur un jeu de données source soit capable d’analyser un jeu de données cible, dont certaines caractéristiques comme les conditions d’acquisition, la zone géographique ou les espèces visées varient ? Pour surmonter ce défi, nous avons développé une approche « humain dans la boucle » afin d’associer la puissance de l’apprentissage profond avec l’expertise des biologistes pour fournir une analyse rapide et de qualité de nouveaux jeux de données. Nous avons testé cette approche sur 5334 images aériennes acquises par Pêches et Océans Canada en 2017 pour le suivi des bélugas de la population de la Baie de Cumberland (Clearwater Fjord, Canada). Nous avons comparé les résultats obtenus automatiquement avec les détections obtenues manuellement par des experts annotateurs indépendants. Avec seulement 100 images annotées, le modèle a obtenu jusqu’à 91.37% d’accord avec l’un des experts, surpassant l’accord inter-observateurs minimum de 88.55% obtenu entre les experts eux-mêmes. Cette expérimentation montre que la méthode « humain dans la boucle » proposée est adaptée au traitement de jeux de données aériens inédits pour le comptage de bélugas, et pourrait être utilisée pour améliorer et étendre le suivi des cétacés. Elle souligne également que des observateurs, même experts, possèdent divers biais de détection, invitant à une réflexion sur la standardisation des protocoles d’annotation.