Récemment, des approches par IA ont permis de détecter l’usure dentaire à partir de simples photographies intra-orales [2]. La méthode utilisée repose généralement sur deux étapes successives : la première consiste à segmenter automatiquement les dents présentes sur une photographie intra-orale ; la seconde vise à classer chaque dent segmentée selon son degré d’usure. Pour la première étape, un réseau de neurones convolutif, comme le Mask RCNN, permet d’extraire les contours des surfaces dentaires. Ce modèle repose sur une architecture en deux volets : il commence par une détection des dents sous forme de boîtes englobantes, encadrant grossièrement chaque dent ; puis procède à une segmentation plus fine, précisant pixel par pixel, les limites exactes de chaque dent. Cette approche permet d’isoler précisément les structures dentaires, même en présence de tissus adjacents tels que les lèvres, la langue ou la muqueuse. Une fois les dents segmentées sur la photographie, un modèle appelé Vision Transformer est employé pour classer chaque dent selon la classification du Tooth Wear Index (TWI). L’un des atouts de ce dernier modèle réside dans son mécanisme d’attention : contrairement aux réseaux convolutifs, qui analysent l’image localement, le Vision Transformer permet d’avoir une vision plus globale, notamment de prendre en compte les relations spatiales entre différentes zones de l’image (fig. 1). Cette approche est essentielle pour mieux appréhender la structure d’ensemble de la dent usée.
Comme tout modèle d’apprentissage supervisé, ces modèles ont nécessité une phase d’entraînement sur des données préalablement annotées. Pour entrainer les modèles à classer l’usure, des experts ont ainsi annoté manuellement plus de 380 photographies, en attribuant un score d’usure à chaque dent selon le TWI. Les performances de l’outil ont ensuite été évaluées sur de nouvelles…