Prostate cancer Computer-aided diagnosicbased on multiparametric MRI : a supervised classification approach
Defended on 10 december 2012
Prostate cancer is one of the leading cause of death in France. Multi-parametric MRI is considered the most promising technique for cancer visualisation, opening the way to focal treatments as an alternative to prostatectomy. Nevertheless, its interpretation remains difficult and subject to inter- and intra-observer variability, which motivates the development of expert systems to assist radiologists in making their diagnosis. We propose an original computer-aided diagnosis system returning a malignancy score to any suspicious region outlined on MR images, which can be used as a second view by radiologists. The CAD performances are evaluated based on a clinical database of 30 patients, exhaustively and reliably annotated thanks to the histological ground truth obtained via prostatectomy. Finally, we demonstrate the influence of this system in clinical condition based on a ROC analysis involving 12 radiologists, and show a significant increase of diagnostic accuracy, rating confidence and a decrease in inter-expert variability. Building an anatomo-radiological correlation database is a complex and fastidious task, so that numerous studies base their evaluation analysis on the expertise of one experienced radiologist, which is thus doomed to contain uncertainties. We propose a new classification scheme, based on the support vector machine (SVM) algorithm, which is able to account for uncertain data during the learning step. The results obtained, both on toy examples and on our clinical database, demonstrate the potential of this new approach that can be extended to any machine learning problem relying on a probabilitic labelled dataset.
Aide au diagnostic du cancer de la prostate par IRM multi-paramétrique : une approche par classification supervisée
Soutenue le
10 December 2012
Le cancer de la prostate est le cancer le plus fréquent et la deuxième cause de mortalité par cancer chez l’homme, en France. Actuellement, la méthode de référence pour le diagnostic du cancer de la prostate reste les biopsies écho-guidées. Le cancer de la prostate étant mal visible en échographie, les biopsies écho-guidées sont en réalité réalisées ‘au hasard’ et distribuées de façon systématique dans la glande (biopsies dites randomisées). Ces biopsies randomisées n’étant qu’un échantillonnage, elles peuvent passer à côté de certains foyers tumoraux et apprécient mal le volume et l’agressivité des cancers détectés. L’imagerie par résonance magnétique multi-paramétrique (IRM-mp) se positionne actuellement comme la technique la plus prometteuse pour la prise en charge de ce cancer. En permettant une visualisation précise et complète de la glande, elle pourrait, à terme, permettre un diagnostic plus précoce (biopsies ciblées plutôt que randomisées) et rendre enfin possible le traitement focal des cibles malignes, alternative à la prostatectomie radicale. Cependant, l’IRM-mp reste difficile à interpréter, notamment lorsque les résultats des différentes séquences sont contradictoires et on observe une forte variabilité inter-lecteur. D’où l’intérêt porté au développement de systèmes experts pour "accompagner" les radiologues dans leur tâche de diagnostic. Dans une première partie, nous présentons un système d’aide au diagnostic (Computer-Aided Diagnosis, CAD en anglais) reposant sur un ensemble de caractéristiques descriptives extraites de trois séquences IRM (imagerie T2, dynamique et de diffusion) et intégrant de l’information statistique, structurelle et fonctionnelle. Appuyant notre étude sur une base de données cliniques de 30 patients pour lesquels nous disposons d’une référence histologique, nous comparons plusieurs stratégies de classification combinant quatre méthodes de sélection de caractéristiques à quatre algorithmes de classification. Le schéma optimal, basé sur un SVM (Séparateur à Vaste Marge) couplé à un test t, est ensuite évalué en pratique clinique auprès de douze radiologues, de 0 à 7 ans d’expérience, dont on teste les performances diagnostiques sans et avec l’outil CAD utilisé en "second avis". Les résultats obtenus montrent, de manière systématique, une amélioration des performances de discrimination et de la confiance dans l’interprétation, même pour les radiologues les plus expérimentés. L’analyse des limites du système proposé et des schémas classiques de systèmes supervisés en général souligne l’influence majeure de la base d’apprentissage sur les performances. Celle-ci doit en effet être à la fois riche et fiable. L’établissement d’une telle base de données, où les lésions malignes sont annotées, sur les images IRM-mp, de manière précise et exhaustive, est une tâche difficile et fastidieuse. De nombreuses études ne peuvent pas s’appuyer sur une corrélation anatomo-radiologique et la vérité terrain utilisée est souvent le résultat d’une analyse en aveugle réalisée par un radiologue expert, entachée d’incertitude. Or, si les SVM sont des algorithmes de discrimination efficaces, ils ne peuvent cependant pas être appliqués directement dans le cas où les données contiennent des étiquettes de classe certaines (sain/pathologique) et des étiquettes incertaines correspondant à un score de suspicion de malignité. Dans la seconde partie de ce travail, nous proposons une nouvelle formulation des SVM permettant d’intégrer l’incertitude de l’expert sur la classe de certains exemples, communiquée sous la forme d’une probabilité d’appartenance. L’idée est d’apprendre une fonction discriminante qui, à la fois, maximise les performances de classification sur les étiquettes certaines et prédit au mieux les probabilités sur les étiquettes incertaines. L’évaluation de ce nouvel algorithme, noté P-SVM (pour Probabilistic SVM), est d’abord réalisée sur des exemples jouets puis sur la série de données cliniques. Nous montrons que le P-SVM permet de pondérer l’influence des cas d’interprétation difficile et d’obtenir de meilleures performances que celles réalisées en utilisant une vérité expert binaire.