Les résultats de ce projet sont disponibles sur HuggingFace, à l’adresse Faraphel/MarathonBibDetector.
Il peut être testé sur son propre espace HuggingFace.

L’un des projets qui nous a été confié à l’université consistait à détecter les participants à un marathon aux points de contrôle à partir uniquement de leur numéro de dossard.

Nous avons commencé par rechercher des projets ou des ensembles de données existants, mais nous n’avons trouvé qu’un petit projet utilisant un ensemble de données d’une centaine d’images qui n’était pas très précis.

Nous avons donc décidé de créer notre propre ensemble de données et d’entraîner un tout nouveau modèle pour détecter les numéros de dossard des coureurs. Ce projet était basé sur le framework YOLO, connu pour sa rapidité et sa précision dans le domaine de la détection d’objets. En fine-tunant l’un de leurs modèles avec un ensemble de données personnalisé d’images de dossards, nous nous attendions à ce qu’il fonctionne plutôt bien.

La première étape consistait à créer notre ensemble de données personnalisé. Il s’agissait d’une tâche fastidieuse en raison du nombre considérable d’images nécessaires pour créer un ensemble de données de qualité. Nous avons donc largement automatisé le processus à l’aide de l’estimation de profondeur et de l’OCR.

Vous trouverez plus de détails sur ce processus sur la page HuggingFace du projet.

Une fois notre modèle fine-tuné, nous avons obtenu des résultats assez précis, en particulier sur les vidéos avec lesquelles plusieurs images pouvaient être analysées rapidement à la fois.

L’un de nos membres a créé un site web pour afficher les résultats des détections, tandis que j’ai configuré le modèle et installé plusieurs caméras enregistrant des flux vidéo vers un serveur OSSRS qui les regroupait tous.

Les vidéos étaient ensuite envoyées au modèle pour analyse, et les résultats étaient enregistrés dans une base de données partagée avec le site web.

Au début, nous pensions que le projet allait probablement échouer en raison de la quantité généralement énorme de données requises pour ce type de formation en IA. Cependant, la création de notre ensemble de données a plutôt bien fonctionné et a permis d’obtenir un bon modèle pour la tâche. Au final, nos détections ont bien fonctionné et nous avons appris beaucoup de choses sur l’IA et la détection d’objets.