Choix de Voxels

Nouvelles

MaisonMaison / Nouvelles / Choix de Voxels

Dec 21, 2023

Choix de Voxels

Volume Biologie des communications

Communications Biology volume 5, Article number: 913 (2022) Citer cet article

2521 accès

4 Citations

9 Altmétrique

Détails des métriques

Les neurosciences fondamentales et cliniques ont énormément bénéficié du développement des analyses informatiques automatisées. Plus de 600 articles de neuroimagerie humaine utilisant la morphométrie basée sur Voxel (VBM) sont désormais publiés chaque année et un certain nombre de pipelines de traitement automatisé différents sont utilisés, bien qu'il reste à évaluer systématiquement s'ils fournissent les mêmes réponses. Ici, nous avons examiné la variabilité entre quatre pipelines VBM couramment utilisés dans deux grands ensembles de données structurelles cérébrales. La similarité spatiale et la reproductibilité entre les pipelines des cartes cérébrales de la matière grise traitées étaient généralement faibles entre les pipelines. L'examen des différences entre les sexes et des changements liés à l'âge a révélé des différences considérables entre les pipelines en termes de régions spécifiques identifiées. Des analyses multivariées basées sur l'apprentissage automatique ont permis des prédictions précises du sexe et de l'âge, mais la précision différait d'un pipeline à l'autre. Nos résultats suggèrent que le choix du pipeline seul conduit à une variabilité considérable des marqueurs structurels du cerveau, ce qui pose un sérieux défi pour la reproductibilité et l'interprétation.

Les neurosciences fondamentales et cliniques humaines visent à déterminer la contribution de systèmes cérébraux spécifiques aux processus et troubles mentaux, et les approches de neuroimagerie ont été largement utilisées à cette fin. En raison de sa haute résolution spatiale et de sa nature non invasive, les évaluations de la structure et de la fonction cérébrales basées sur l'imagerie par résonance magnétique (IRM) sont devenues l'une des techniques de neuroimagerie les plus largement utilisées. Cependant, la complexité et la flexibilité des flux de travail dans les analyses IRM, ainsi que les différences entre les quelques progiciels d'analyse couramment utilisés, peuvent entraîner une grande variabilité des résultats de neuroimagerie1. Cette variabilité remet en question l'interprétation des résultats en ce qui concerne la cartographie précise des processus mentaux et des biomarqueurs cérébraux des troubles mentaux. Par rapport au traitement des données d'IRM fonctionnelle (IRMf), les analyses de morphométrie cérébrale des images structurelles pondérées en T1 permettent moins de variations de traitement et peuvent avoir une fiabilité test-retest plus élevée1,2,3,4,5,6. Cependant, le choix du logiciel d'analyse peut encore avoir un impact considérable sur les résultats obtenus. La variabilité quant à savoir si et quelles régions spécifiques du cerveau dépassent le seuil statistique, à son tour, a un impact considérable sur l'interprétation des résultats en ce qui concerne la cartographie structure-fonction ou les biomarqueurs cérébraux et peut considérablement entraver la sensibilité des méta-analyses de neuroimagerie ultérieures. .

La recherche neuroanatomique a énormément bénéficié du développement d'approches informatiques automatisées telles que la morphométrie basée sur Voxel (VBM), examinant les variations du volume régional de matière grise, et les approches basées sur la surface plus récemment développées (par exemple, l'examen de l'épaisseur corticale). Le VBM représente l'une des approches d'analyse structurelle du cerveau les plus couramment utilisées à ce jour (par exemple, une simple recherche documentaire utilisant le terme "morphométrie à base de voxel" ou "VBM" sur PubMed a révélé 6210 études, https://pubmed.ncbi.nlm. nih.gov, de 1993 au 19 novembre 2020, voir également les publications pour VBM et d'autres approches telles que "l'épaisseur corticale" et la "surface" dans PubMed illustrées à la Fig. S1). Le flux de travail VBM standardisé et hautement automatisé comprend la segmentation de la matière grise à partir d'autres tissus cérébraux, la normalisation dans l'espace stéréotaxique standard et le lissage avec un noyau gaussien avant l'application des statistiques inférentielles. Les modèles statistiques inférentiels correspondants par voxel déterminent généralement (1) les différences entre les groupes dans le volume de matière grise régional (GMV), par exemple, entre les patients et les témoins ou les hommes et les femmes7,8,9,10, ou (2) les associations entre les individus variations du GMV régional et des phénotypes comportementaux, y compris l'apprentissage, l'âge ou les traits pertinents pour le trouble11,12,13,14,15,16. Des différences ou associations significatives sont généralement interprétées de manière régionale, par exemple en cartographiant des fonctions comportementales spécifiques à des systèmes cérébraux spécifiques et en déterminant quelles régions du cerveau subissent des changements liés à l'âge ou quelles régions contribuent aux troubles mentaux. Plus récemment, des approches analytiques multivariées basées sur l'apprentissage automatique telles que les analyses de modèles multivariés (MVPA) ont été de plus en plus appliquées aux données VBM pour détecter des modèles subtils et spatialement distribués de variations structurelles du cerveau afin d'améliorer le diagnostic des troubles mentaux basé sur des biomarqueurs17,18,19 . MVPA vise à déterminer les variations du modèle spatial à travers plusieurs voxels simultanément et est donc souvent plus sensible pour détecter les différences entre les groupes ou les associations structurelles cérébrales. L'approche est basée sur des algorithmes de reconnaissance de modèles d'entraînement, par exemple, des données structurelles du cerveau, et peut être appliquée à de nouvelles données pour prédire l'appartenance à un groupe (par exemple, patients contre témoins, ou femmes contre hommes) ou les variations individuelles d'une variable continue telle que comme âge.

Un certain nombre de progiciels ont été développés et sont largement utilisés pour les analyses VBM. Parmi eux, les plus utilisés actuellement sont la Computational Anatomy Toolbox (CAT, www.neuro.uni-jena.de/cat), qui est implémentée dans le logiciel Statistical Parametric Mapping (SPM, https://www.fil. ion.ucl.ac.uk/spm/software/spm12/), et FSLVBM et FSLANAT, qui sont basés sur la bibliothèque de logiciels FMRIB (FSL, https://fsl.fmrib.ox.ac.uk). Pour améliorer la robustesse et la reproductibilité des analyses de neuroimagerie, de nouveaux pipelines de prétraitement modulaires pour l'IRM structurelle (par exemple, sMRIPrep, https://www.nipreps.org/smriprep/) ont été récemment développés. Bien que les progiciels utilisent généralement des étapes de traitement similaires aux données IRM volumétriques pondérées en T1 (anatomiques), il existe des différences dans les étapes de traitement spécifiques et leur mise en œuvre. Cela soulève la question de savoir si le choix d'un logiciel spécifique et l'application de configurations de traitement par défaut spécifiques au logiciel peuvent entraîner une variabilité des résultats.

Une étude récente a examiné la fiabilité et la réplicabilité des mesures d'épaisseur corticale, en utilisant différents progiciels dans de grands ensembles de données de sujets sains, et a signalé une distribution d'épaisseur corticale similaire entre les progiciels, bien que les valeurs estimées absolues variaient considérablement d'un pipeline à l'autre20. En revanche, des études explorant la réplicabilité du VBM dans des échantillons de patients neurologiques ont révélé des variations considérables entre les pipelines de traitement, et les résultats suggèrent que le pipeline de traitement VBM choisi affecte fortement l'interprétation clinique21,22. Plus précisément, les inexactitudes de normalisation spatiale et différents modèles et méthodes de normalisation spatiale remettent en question l'une des principales hypothèses de VBM, à savoir que les différences cérébrales individuelles et la correspondance anatomique des zones cérébrales sont maintenues pendant le processus de normalisation spatiale23,24,25,26,27. De plus, VBM manque d'une validation histologique et neurobiologique claire in vivo ou ex vivo chez l'homme23. Ensemble, cela remet en question l'interprétation des résultats du VBM en tant que marqueurs biologiquement plausibles des troubles cérébraux ou des variations phénotypiques.

Dans ce contexte, la présente étude a systématiquement examiné si le choix du logiciel de traitement influence les résultats d'une étude VBM. Nous avons inclus les progiciels de traitement les plus couramment utilisés (FSLVBM et FSLANAT tels qu'implémentés dans FSL v6.0 et CAT12.7, toutes les versions récentes) ainsi qu'un pipeline interne utilisant certaines fonctionnalités sMRIPrep (version 0.6.2). Le pipeline sMRIPrep a servi d'exemple de pipeline personnalisé basé sur différents progiciels de neuroimagerie. Pour modéliser le flux de travail scientifique typique, les configurations par défaut recommandées ont été utilisées pour déterminer les différences entre les groupes et les associations biologiques au sein de deux échantillons indépendants d'individus en bonne santé (n = 200 ; n = 494). Compte tenu de la faible robustesse rapportée précédemment des associations entre les variables psychologiques et la structure cérébrale, voir réf. 28, nous nous sommes concentrés sur les variables biologiques, c'est-à-dire le sexe et l'âge9,10,29,30,31,32.

Pour déterminer les effets du choix du pipeline de traitement sur les résultats d'une étude VBM typique, nous avons examiné les différences entre les sexes et les changements liés à l'âge avec des analyses univariées (différences de groupe et régression, respectivement) ainsi que des analyses multivariées (basées sur l'apprentissage automatique). MVPA) dans deux grands ensembles de données (ensemble de données 1, n = 200, 18-26 ans, 100 femmes ; ensemble de données 2, n = 494, 19-80 ans, 307 femmes) après traitement des données avec les pipelines VBM couramment utilisés (Fig. 1). Plus précisément, les étapes systématiques suivantes ont été réalisées. Tout d'abord, la similarité spatiale et la corrélation intraclasse (ICC, à la fois par voxel et par images) ont été examinées pour déterminer la similarité spatiale, l'homogénéité et la réplicabilité des résultats entre les pipelines avant d'autres analyses statistiques. Deuxièmement, les résultats concernant les différences entre les sexes dans le GMV à partir de comparaisons univariées entre les groupes entre les hommes et les femmes ont été comparés entre les pipelines. Troisièmement, les résultats concernant les changements de GMV liés à l'âge de l'analyse de régression linéaire univariée ont été comparés entre les pipelines. Enfin, les effets des pipelines sur la précision des prédictions multivariées ont été examinés au moyen de prédictions basées sur MVPA du sexe et de l'âge basées sur des cartes GMV du cerveau entier à travers les pipelines.

*Étant donné que les pipelines FSLANAT et sMRIPrep sont principalement utilisés pour segmenter les données GM, WM et CSF, les résultats GM segmentés (dans l'espace natif) ont été soumis à des étapes de prétraitement de fslvbm_2_template (sauf pour la segmentation) et fslvbm_3_proc pour produire des données GM normalisées et modulées .

Nous avons d'abord examiné les cartes de similarité spatiale des images prétraitées à l'intérieur et entre les pipelines (Fig. S2). Les analyses statistiques au moyen de modèles ANOVA avec le pipeline de facteurs répétés et la similarité spatiale de la variable dépendante en termes de coefficients de corrélation spatiale transformés en z ont révélé une forte variation en termes de pipeline et de participants, à la fois au sein et entre les pipelines (tous les tests corrigés de Bonferroni p < 0,01). Pour les résultats détaillés de l'ANOVA et post hoc, veuillez consulter les résultats des matériaux supplémentaires, Fig. S3 et les tableaux S1 à S9. Ensemble, ces résultats indiquent des dissemblances spatiales significatives entre les cartes GMV des mêmes participants entre les pipelines ainsi que du même pipeline entre les participants. Plus précisément, dans tous les ensembles de données, la similarité spatiale la plus faible a été observée entre CAT et FSLVBM, et CAT et sMRIPrep, respectivement. Notamment, CAT a atteint une similarité spatiale intra-pipeline considérablement plus élevée par rapport aux autres pipelines (Fig. S3), reflétant une plus grande homogénéité des cartes GMV traitées entre les participants lorsque les données ont été traitées avec CAT.

L'examen des cartes ICC pour chaque comparaison entre pipelines a révélé une cohérence régionale généralement faible entre les cartes GMV calculées par différents pipelines (voir Fig. 2 pour les ensembles de données 1 et 2). Une exception était la réplicabilité relativement élevée entre FSLANAT et FSLVBM dans l'ensemble de données 1, et FSLANAT et sMRIPrep dans l'ensemble de données 2 (Fig. 2). Il convient de noter que dans les deux ensembles de données, les différents pipelines présentaient une réplicabilité inter-pipeline relativement faible. Cela peut s'expliquer par le fait que les données ont été acquises dans différents centres d'imagerie, systèmes d'IRM et populations de tranches d'âge et suggère que des interactions complexes entre les facteurs technologiques, d'échantillon et analytiques peuvent contribuer à la variabilité, voir réf. 33. L'examen de la distribution régionale des variations au niveau du voxel a révélé que les régions pariétales et frontales en particulier présentaient une faible cohérence entre les pipelines. L'examen d'un indice de réplicabilité basé sur l'image (I2C2) a révélé une cohérence généralement médiocre entre les pipelines (tous les coefficients de corrélation intraclasse d'image < 0,4), confirmant une faible réplicabilité inter-pipeline. Seule la réplicabilité entre CAT et FSLANAT ou CAT et FSLVBM s'est approchée du critère « équitable » (tableau S10).

Cartes du coefficient de corrélation intraclasse (ICC) au niveau du voxel entre les pipelines d'un ensemble de données 1 et b ensemble de données 2. L gauche, R droite. L'étalonnage des couleurs reflète la valeur ICC.

Pour déterminer l'impact du choix du pipeline de traitement sur les résultats d'une étude VBM typique entre sujets, nous avons comparé les participants masculins et féminins dans l'ensemble de données 1. Pour déterminer l'étendue des résultats communs et différents entre les pipelines, le pourcentage de résultats communs et différents. les voxels dans tous les voxels significatifs des quatre pipelines ont été calculés (méthodes supplémentaires). Pour les statistiques paramétriques avec une correction conventionnelle au niveau du cluster pFWE <0,05, seulement 10,98 % de chevauchement spatial des résultats pour les différences de sexe entre FSLANAT, FSLVBM et CAT (tableau 1) ont été observés, tandis que les différents pipelines ont cartographié un sexe GMV considérable unique au pipeline. -différences (jusqu'à 54,73 % de différences de sexe GMV uniques identifiées par l'un, mais pas les autres pipelines, tableau 1). Notamment, les données prétraitées par le pipeline sMRIPrep n'ont pas révélé de différences significatives entre les sexes dans le GMV. Entre les autres pipelines, un chevauchement pour homme> femme a été observé dans le gyrus lingual, le précuneus, l'hippocampe gauche, le cortex parahippocampique bilatéral, le cortex olfactif, le putamen gauche et l'insula gauche (Fig. 3a). Aucune région commune pour femme > homme n'a été observée parmi les quatre pipelines. Les deux pipelines FSL ne partageaient que 13, 16% de chevauchement (tableau 1), le GMV supérieur se chevauchant pour les femmes étant situé dans le cortex post-central bilatéral, l'angulaire droit, le lobule pariétal inférieur droit et le cervelet (Fig. 3a). Contrairement au chevauchement relativement faible entre les pipelines, de grandes variations dans l'emplacement et l'étendue des différences de sexe GMV identifiées ont été observées spécifiquement dans les régions médiales préfrontales et occipitales. Par exemple, alors que CAT a révélé un GMV plus élevé dans les régions cérébelleuses et limbiques étendues chez les hommes, FSLANAT et FSLVBM ont révélé un GMV plus élevé dans les régions pariétales postérieures / supérieures étendues chez les femmes (Fig. 3a).

a Résultats des statistiques paramétriques montrant le chevauchement entre les pipelines à un pFWE au niveau du cluster < 0,05 avec un cluster initial formant le niveau de voxel p < 0,001. Les panneaux de gauche d'un affichage des résultats pour le contraste masculin>féminin. Les panneaux de droite de a correspondent au contraste féminin > masculin. Pour a et d, les pipelines sont codés comme : rouge = CAT, vert = FSLVBM, bleu = FSLANAT, bleu clair = sMRIPrep, des couleurs supplémentaires visualisent le chevauchement entre les résultats, par exemple, CAT ∩ FSLVBM = jaune, CAT ∩ FSLANAT = violet, FSLVBM ∩ FSLANAT = bleu clair, CAT ∩ FSLVBM ∩ FSLANAT = blanc et etc. b La variabilité des cartes statistiques sans seuil. Les valeurs de corrélation entre les cartes statistiques sans seuil du cerveau entier de quatre pipelines ont été calculées respectivement pour les différences de sexe. Seules les valeurs positives sont visualisées à des fins d'affichage. c Décodant les propriétés fonctionnelles des régions cérébrales identifiées de l'homme> femme (a, rouge = CAT, vert = FSLVBM, bleu = FSLANAT, aucune différence dans sMRIPrep) à l'aide de NeuroSynth. Seuls les 20 premiers termes fonctionnels sont visualisés. La taille de la police reflète la taille de la corrélation. d Modèles cérébraux fiables pour distinguer les différences entre les sexes via un test d'amorçage (5000 permutations, pFDR < 0,05) et e précision de la prédiction croisée de quatre pipelines dans des échantillons indépendants. La couleur du froid au chaud indique une précision croissante de la classification (de 0,5 à 1).

Les résultats des statistiques non paramétriques (TFCE pFWE < 0,05) étaient très similaires aux résultats des statistiques paramétriques, ce qui suggère que les différences de pipeline sont robustes entre les modèles statistiques (pour plus de détails, veuillez consulter les résultats supplémentaires). Notamment, dans certains cas, le chevauchement entre les progiciels a légèrement augmenté en utilisant l'approche non paramétrique (tableau 1 et figure S4a).

Pour mieux tenir compte des effets d'interaction potentiels entre les pipelines de prétraitement et le seuil des comparaisons multiples, nous avons calculé les corrélations entre les cartes de différence statistique entre les groupes sans seuil à partir des quatre pipelines avec une approche similaire, voir réf. 34. Le schéma spatial des similitudes des différences de GMV dépendant du sexe variait de -0, 0033 à 0, 6328 (Fig. 3b), avec un chevauchement spatial particulièrement faible des différences de sexe révélées par sMRIPrep par rapport à celles obtenues par d'autres pipelines. De plus, les résultats du CAT étaient très différents des différences entre les sexes obtenues par les pipelines FSL.

Pour explorer la mesure dans laquelle les différentes régions identifiées par les pipelines peuvent affecter l'interprétation fonctionnelle des différences sexuelles volumétriques cérébrales, une approche de décodage fonctionnel méta-analytique a été utilisée (pour une approche similaire, voir réf. 35). L'approche est basée sur une synthèse automatisée à grande échelle d'études IRM fonctionnelles soutenues par des plateformes telles que Neurosynth et est de plus en plus utilisée pour améliorer la caractérisation fonctionnelle d'une région cérébrale donnée (voir par exemple, réf. 36, pour le contexte conceptuel), et pour faciliter l'interprétation des résultats du GMV, y compris les différences entre les sexes dans le GMV35. Selon le décodage méta-analytique avec Neurosynth, les régions identifiées entre les pipelines différaient fortement en termes de caractérisation fonctionnelle (Fig. 3c, notez que seuls trois pipelines ont révélé des différences sexuelles significatives). Ceci, à son tour, peut avoir favorisé des interprétations assez différentes des différences comportementales et cognitives potentielles entre les sexes.

Les approches de prédiction basées sur la MVPA ont été de plus en plus appliquées aux données GMV par voxel pour déterminer l'appartenance à un groupe, y compris les groupes de diagnostic ainsi que les groupes de sexe biologique. Pour tester si les différents pipelines influenceraient la précision de la prédiction multivariée, nous avons développé des classificateurs MVPA spécifiques au pipeline pour le sexe. À cette fin, l'ensemble de données 1 a été divisé en un ensemble de données d'apprentissage (n = 100) et de test (n = 100), chacun prétraité par des pipelines identiques. En général, les classificateurs développés sur chaque pipeline ont prédit avec précision le sexe dans les données indépendantes (précision allant de 68 % (sMRIPrep) à 94 % (CAT), d de Cohen = 0,2967 à 2,2815, Fig. 3).

Les régions les plus fiables pour la classification du sexe à travers les pipelines englobaient les régions médianes préfrontales, sous-corticales, insulaires, occipitales et pariétales. Des grappes se chevauchant de voxels prédictifs à travers les pipelines n'ont été observées que dans le cortex parahippocampique bilatéral (voxels de chaque grappe> 5, Fig. 3d), et il y avait de grandes différences dans l'emplacement des voxels prédictifs. Par exemple, les prédictions basées sur CAT ont fortement pondéré les voxels dans le putamen, l'hippocampe, le cortex cingulaire moyen et le gyrus angulaire, tandis que FSLANAT a identifié des voxels fortement prédictifs dans un réseau étendu comprenant le cortex frontal supérieur, le cortex orbitofrontal, le cortex pré- et post-central, l'insula. , pôle temporal, gyrus angulaire et cervelet. FSLVBM et sMRIPrep ont révélé des résultats généralement similaires à FSLANAT.

Pour valider davantage l'impact des pipelines de traitement sur la précision des prédictions dans l'ensemble de données indépendant, les classificateurs des données d'apprentissage de chaque pipeline ont été appliqués aux données indépendantes traitées par les autres pipelines. Malgré le faible chevauchement spatial entre les cartes prédictives seuillées (tableau S11), toutes les classifications à travers les pipelines pourraient prédire avec précision le sexe (58–94 %, d de Cohen = 0,1392–2,2815), à l'exception de l'utilisation du modèle développé sur sMRIPrep pour prédire le sexe à partir des données traitées par FSLVBM (50 %, d de Cohen = 0,2930) ou CAT (14 %, d de Cohen = −1,4909) (Fig. 3e, d de Cohen correspondant et détails des performances dans les tableaux S12 et S13). Plus précisément, les prédictions inter-pipelines entre les pipelines FSL ont atteint la plus grande précision (> 86 %), ainsi qu'une précision relativement élevée pour prédire les données traitées par sMRIPrep (FSLANAT : 80 %, Cohen's d = 0,6437 et FSLVBM : 76 %, Cohen's d = 0,7231) et CAT (FSLANAT : 72 %, d de Cohen = 0,7810 et FSLVBM : 76 %, d de Cohen = 0,7402). Pour une validation indépendante plus approfondie du modèle prédictif du sexe dans l'ensemble de données 2, voir les résultats supplémentaires.

En plus de déterminer les différences entre les groupes dans la morphométrie cérébrale, le VBM est souvent appliqué pour examiner les associations entre les variations des variables biologiques et le GMV. Les associations entre l'âge et les variations du GMV sont, par exemple, couramment interprétées en termes de changements cérébraux liés à l'âge. Pour examiner comment les différents pipelines affectent les résultats des études d'association, en particulier l'identification des régions qui subissent des changements liés à l'âge, nous avons examiné les différences entre les pipelines en ce qui concerne la détermination des changements volumétriques liés à l'âge dans une approche de régression. En utilisant des statistiques paramétriques (pFWE au niveau du cluster < seuil de 0,05), tous les pipelines ont révélé que le GMV diminue avec l'âge. Cependant, le chevauchement entre tous les pipelines n'a été observé que dans le gyrus occipital moyen (Fig. 4a et Tableau 2). Une inspection plus approfondie a révélé que FSLANAT avait un chevauchement plutôt faible avec les autres pipelines, tandis que les trois autres pipelines identifiaient en outre des diminutions communes liées à l'âge dans les régions préfrontale médiale, cingulaire et certaines régions pariétales et temporales (Fig. 4a). En revanche, des augmentations liées à l'âge n'ont été observées que dans deux pipelines (FSLVBM et sMRIPrep) avec un chevauchement minimal dans le cervelet (3,41 % de chevauchement, Fig. 4a et Tableau 2). En général, les résultats ont montré une grande variabilité en ce qui concerne à la fois la direction (FSLVBM et sMRIPrep) et l'étendue de l'effet lié à l'âge (sMRIPrep). Pour les statistiques non paramétriques avec TFCE pFWE <0, 05, les résultats étaient très similaires aux statistiques paramétriques, en particulier pour les régions du cerveau qui diminuaient avec l'âge (Fig. S4b et Tableau 2, détails s'il vous plaît voir Résultats supplémentaires).

a Résultats affichant le chevauchement entre les pipelines à un pFWE au niveau du cluster < 0,05 avec un cluster initial formant le niveau de voxel p < 0,001. Les panneaux de gauche d'un dépeignent les régions du cerveau avec un GMV croissant avec l'âge. Les panneaux de droite d'un dessin diminuent avec l'âge. Pour a et d, les pipelines sont codés comme : rouge = CAT, vert = FSLVBM, bleu = FSLANAT, bleu clair = sMRIPrep, des couleurs supplémentaires visualisent le chevauchement entre les résultats, par exemple, CAT ∩ FSLVBM = jaune, CAT ∩ FSLANAT = violet, FSLVBM ∩ FSLANAT = bleu clair, CAT ∩ FSLVBM ∩ FSLANAT = blanc et etc. b La variabilité des cartes statistiques sans seuil. Les valeurs de corrélation entre les cartes statistiques sans seuil du cerveau entier de quatre pipelines ont été calculées, respectivement, pour les effets liés à l'âge. Seules les valeurs positives sont visualisées à des fins d'affichage. c Modèles cérébraux fiables pour prédire l'âge déterminés par des tests d'amorçage (5000 permutations, pFDR < 0,05) et d valeur r prédite de quatre pipelines pour chacun des échantillons traités en pipeline. La couleur du froid au chaud indique des valeurs croissantes de r (de 0,8 à 1).

Un examen plus approfondi de la similarité spatiale des cartes d'association GMV liées à l'âge au moyen du calcul de corrélations entre des cartes statistiques sans seuil sur quatre pipelines a révélé des variations des effets liés à l'âge allant de -0,0051 à 0,6757 (Fig. 4b). Les valeurs de similarité les plus faibles indiquaient que FSLANAT produisait des cartes très différentes pour les changements liés à l'âge par rapport aux autres pipelines et que CAT était plutôt différent des pipelines de traitement FSLVBM. CAT et sMRIPrep présentaient la plus grande similitude en ce qui concerne les cartes sans seuil. Conformément aux résultats de chevauchement (tableau 2), une proportion considérable de la variance entre les pipelines a été introduite par les résultats de FSLANAT.

Les modèles de prédiction multivariés sont de plus en plus appliqués aux cartes GMV pour déterminer l'âge réel ou «l'âge du cerveau» en fonction de la structure du cerveau. Nous avons donc exploré plus en détail dans quelle mesure le choix du pipeline de traitement affecterait la précision de la prédiction ainsi que les régions qui contribuent le plus à la prédiction. À cette fin, nous avons formé un modèle de régression de vecteur de support (SVR) pour prédire l'âge sur la base des cartes GMV. Étant donné l'absence d'un ensemble de données de test indépendant approprié, nous avons utilisé une approche de validation croisée pour évaluer les effets des pipelines en quantifiant les forces de corrélation entre l'âge prédit et l'âge réel pour les pipelines intra- et inter-canalisations. En ce qui concerne le chevauchement spatial des expressions de motifs des quatre pipelines, les régions qui se chevauchent étaient principalement situées dans le pallidum bilatéral, le thalamus bilatéral et le gyrus parahippocampique (voxels de chaque groupe> 5, figure 4c). Des variations spatiales considérables sont devenues apparentes (tableau S11), par exemple, FSLANAT a révélé un poids prédictif élevé pour les régions du putamen, de l'hippocampe, de l'hypothalamus, du tronc cérébral, du cortex frontal médial, du gyrus temporal moyen, du gyrus frontal moyen et de l'insula, tandis que les données traitées avec FSLVBM ont suggéré que le gyrus post-central, le gyrus frontal supérieur, le gyrus temporal supérieur et le cervelet contribuaient fortement à la prédiction. Malgré des différences marquées dans la distribution spatiale, une prédiction précise de l'âge était possible sur la base des données de tous les pipelines, comme en témoignent les corrélations élevées entre l'âge prédit et l'âge réel (toutes les valeurs r> 0, 8, Fig. 4d).

Pour traiter les effets du modèle et de l'évaluation de la qualité après la normalisation spatiale, nous avons inclus l'approche en deux étapes suivante. Tout d'abord, nous avons retraité les données en utilisant le même modèle cérébral dans tous les pipelines. Étant donné que les pipelines basés sur FSL et sMRIPrep utilisaient des modèles spécifiques à l'étude, nous avons utilisé le modèle de CAT dans tous les pipelines (modèle CAT IXI555_MNI152). Deuxièmement, nous avons utilisé une évaluation de l'homogénéité de l'échantillon (similitude spatiale inter-participants) dans chaque pipeline comme stratégie d'évaluation de la qualité et exclu les images de faible qualité (pour plus de détails, voir les résultats supplémentaires, tableau S14). Une stratégie identique d'évaluation de la qualité est employée par le CAT, par exemple. Ensuite, nous avons mis en œuvre des analyses supplémentaires pour explorer les effets du modèle et de l'évaluation de la qualité sur la variabilité entre les pipelines en termes de différences de sexe et d'associations d'âge, ainsi qu'une comparaison statistique directe entre les pipelines au niveau du voxel.

Après avoir utilisé le même modèle pour tous les pipelines, les différences entre les effets du sexe et de l'âge (Fig. S5) ainsi que la comparaison statistique directe (Figs. S6 et S7) sont restées stables. La variabilité entre les pipelines est restée robuste après avoir contrôlé les effets potentiels de différentes approches d'estimation de VTI en alignant à la fois le modèle et le calcul de VTI sur les pipelines (Fig. S8). De plus, après avoir contrôlé le modèle et exclu les images qui n'ont pas passé le contrôle de qualité (images à faible similarité spatiale), les résultats des deux analyses ont considérablement changé (Fig. S9), suggérant un effet important de l'homogénéité de l'échantillon. Cependant, bien que la variabilité entre les pipelines ait pu être réduite au moyen d'un modèle et d'un contrôle de la qualité, une variabilité considérable est restée entre les pipelines (pour plus de détails, voir les résultats supplémentaires, les tableaux S15 et S16).

Le VBM est l'une des approches les plus couramment utilisées pour examiner les différences régionales ou les variations de la structure cérébrale dans les neurosciences fondamentales et la neuroimagerie psychiatrique. Nous avons examiné ici la variabilité des résultats VBM dans les progiciels et les pipelines couramment utilisés. De plus, nous avons examiné comment le choix du pipeline de traitement influence les résultats en termes de régions cérébrales identifiées dans deux scénarios d'étude prototypiques de VBM examinant les différences de GMV entre les groupes (différences de sexe) ou les associations linéaires (changements liés à l'âge). À cette fin, les données de deux ensembles de données indépendants ont été traitées avec les options par défaut recommandées dans les packages d'analyse VBM largement utilisés (CAT12, FSL et sMRIPrep) ou les pipelines (FSLANAT, FSLVBM), respectivement. L'examen de la similarité spatiale entre les données prétraitées a révélé des différences marquées dans la distribution spatiale au niveau du voxel du GMV dans les pipelines ainsi qu'en ce qui concerne l'homogénéité spatiale des données des participants dans les pipelines. Les analyses de réplicabilité au niveau du voxel et basées sur l'image ont révélé une réplicabilité constamment médiocre entre les pipelines, confirmant des variations considérables dans l'estimation du GMV régional. Nous avons ensuite examiné comment différents pipelines de traitement auraient un impact sur la détermination des variations de GMV dans deux scénarios analytiques univariés de masse typiques examinant les différences entre les groupes (différences de sexe) et les associations avec les variations phénotypiques (associations d'âge). Alors qu'un certain chevauchement dans les régions identifiées a été trouvé dans les procédures de correction paramétriques et non paramétriques, il y avait des variations considérables dans les différences de sexe GMV et les associations d'âge, ce qui montre que le choix du logiciel a un fort impact sur les régions identifiées. En plus des méthodes univariées de masse, des approches basées sur l'apprentissage automatique ont été appliquées pour explorer les associations générales entre les variations spatiales subtiles du GMV et les deux variables biologiques que sont le sexe et l'âge. Bien que le chevauchement régional des voxels les plus prédictifs entre les pipelines soit faible, les cartes GMV traitées avec chaque pipeline ont généralement permis une prédiction précise des variables biologiques. La précision de la prédiction variait à l'intérieur et entre les pipelines, ce qui suggère que le choix du logiciel de traitement influence la précision de la prédiction multivariée. Ensemble, les résultats indiquent une variabilité considérable dans les résultats obtenus et que le choix du pipeline de traitement influencera considérablement les régions identifiées dans les analyses VBM. Ceci, à son tour, influencera fortement l'interprétation des résultats en termes, par exemple, "quelles régions du cerveau diffèrent entre les hommes et les femmes" ou "quelles régions du cerveau montrent des baisses de volume liées à l'âge". D'autre part, la précision prédictive élevée pour le sexe et l'âge indique que toutes les cartes GMV ont codé des variations biologiquement significatives, bien que les interprétations spécifiques à la région doivent être considérées avec prudence.

Dans la première étape, nous avons examiné la variabilité spatiale et la réplicabilité des images GMV prétraitées entre les pipelines. Pour un indice biologique valide et robuste qui reflète les variations régionales de la matière grise, on s'attendrait à une homogénéité spatiale élevée ainsi qu'à une réplicabilité entre les pipelines. Cependant, les analyses de similarité spatiale ont révélé des variations considérables entre les pipelines ainsi qu'à l'intérieur de ceux-ci. Une grande variabilité existait à la fois au sein et entre les pipelines, mais notamment, les échantillons prétraités avec CAT présentaient une homogénéité intra-participant plus élevée par rapport aux autres pipelines (Figs. S2 et S3). Ces résultats suggèrent que le choix du pipeline a une influence considérable sur la distribution spatiale des variations de GMV et influence en outre la quantité de variation individuelle retenue après le prétraitement des données. L'examen de la réplicabilité entre les pipelines a révélé une cohérence généralement médiocre, reflétant une faible réplicabilité inter-pipelines, l'examen supplémentaire de la réplicabilité au niveau du voxel suggérant certaines variations régionales avec une cohérence particulièrement faible entre les pipelines dans les cortex pariétal et frontal (Fig. 2, Tableau S10). En outre, une grande variabilité entre les exemples d'ensembles de données dans la présente étude a été observée (par exemple, reflétée par des cartes ICC et des performances de pipeline incohérentes entre l'ensemble de données 1 et l'ensemble de données 2). Cela peut refléter l'influence potentielle de différents protocoles d'acquisition, systèmes d'IRM et caractéristiques de la population, et suggère des interactions complexes entre ces facteurs et le pipeline de prétraitement spécifique. De futures études multicentriques et des méga-analyses regroupant les données de différents centres sont nécessaires pour évaluer avec soin ces interactions complexes33.

Notre deuxième objectif principal était d'examiner comment le choix du pipeline et la mise en œuvre de la configuration par défaut spécifique au pipeline affecteraient les résultats d'une étude VBM typique. En ce qui concerne les variations du GMV et les facteurs biologiques, le sexe et l'âge ont été largement examinés dans des études antérieures. Bien que les régions spécifiques qui présentent des différences de GMV entre les hommes et les femmes diffèrent d'une étude à l'autre, les différences spécifiques à la région sont généralement interprétées comme sous-tendant les différences sexuelles dans les fonctions cognitives et émotionnelles qui leur sont associées8,9,10. De même, les résultats antérieurs sur les changements de GMV spécifiques à la région avec l'âge ont révélé des résultats incohérents28,29, même avec des tailles d'échantillon fortement croissantes9,10,37,38. Les changements de GMV associés à l'âge sont généralement interprétés en termes de changements atrophiques qui entraînent des changements émotionnels et cognitifs spécifiques avec l'âge. En revanche, les présents résultats indiquent que les régions spécifiques présentant des différences de sexe ou des changements liés à l'âge dépendent fortement du choix du pipeline de traitement. Par exemple, après avoir contrôlé l'influence de l'inférence statistique (même logiciel statistique, voir également la similitude des cartes sans seuil, Figs. 3 et 4) et les différences d'échantillon ou de scanner (le même ensemble de données a été utilisé dans tous les pipelines), seuls quelques-uns ou dans le cas des différences de sexe, même aucune (Fig. 3a, Tableau 1) - des régions qui se chevauchent ont été identifiées. De plus, pour les différences de sexe GMV identifiées, aucun trois pipelines ne se chevauchaient de plus de 20 %, ce qui reflétait également les fortes variations régionales. Par exemple, après traitement avec CAT, les résultats indiqueraient un volume GM plus élevé chez les hommes dans les régions limbiques généralement associées aux processus émotionnels ou à la navigation spatiale, tandis que les résultats pour le pipeline basé sur le FLS indiqueraient des différences de sexe GMV dans les régions pariétales postérieures généralement associées à l'attention ou à la navigation spatiale. intégration motrice. En ce qui concerne les changements liés à l'âge, les pipelines ont révélé certaines diminutions régionales du GMV qui se chevauchent dans le gyrus occipital moyen, bien que cela soit généralement faible (0,002 % et 0,02 % correspondant respectivement aux statistiques paramétriques et non paramétriques, Figs. 4a, S4, Tableau 2 ). En général, l'emplacement, l'étendue et la direction des changements de GMV liés à l'âge différaient considérablement d'un pipeline à l'autre. Par exemple, alors que l'analyse avec CAT a révélé une baisse généralisée du GMV liée à l'âge dans presque tout le cortex, FSLANAT a révélé à la place des diminutions spécifiques à la région dans les régions frontales inférieures, tandis que FSLVBM a révélé des augmentations du GMV liées à l'âge spécifiques à la région dans les régions cérébelleuses et limbiques. Conformément à une étude récente examinant l'influence des pipelines sur les résultats d'activation cérébrale fonctionnelle34, nous avons également examiné les corrélations spatiales entre les cartes statistiques sans seuil. Cependant, bien que cette étude précédente ait signalé un chevauchement considérable des cartes fonctionnelles sans seuil34, le chevauchement entre pipelines pour les cartes GMV dans la présente étude était plutôt faible (Fig. 3 et 4), ce qui implique que l'impact du pipeline varie en outre en fonction de la modalité cérébrale à l'étude.

En plus des analyses univariées de masse, des approches basées sur l'apprentissage automatique ont été utilisées pour étudier les différences entre les sexes et les effets liés à l'âge du point de vue de la validité biologique fonctionnelle et générale39,40. En bref, l'idée de base est que certaines caractéristiques qui peuvent être dérivées des cartes GMV contribuent de manière significative à la prédiction précise des variables biologiques âge et sexe. Notamment, sur la base de toutes les cartes GMV, des caractéristiques fiables pour une prédiction précise des variables biologiques pourraient être extraites (par exemple, pour l'âge, toutes les corrélations> 0, 8, Fig. 4d, pour les classificateurs de sexe, supérieur au niveau de chance, Figs. 3e et S10) . Ces résultats suggèrent que tous les pipelines ont conservé des informations biologiquement et fonctionnellement pertinentes. Cependant, un examen plus approfondi de la distribution spatiale des voxels les plus prédictifs a révélé des variations considérables entre les quatre pipelines, similaires aux analyses univariées de masse (Figs. 3d et 4c, Tableau S11). Par exemple, l'application de données traitées par CAT pour développer des classificateurs de sexe aurait mis l'accent sur la contribution spécifique à la région du putamen, de l'hippocampe, du cortex cingulaire moyen et du gyrus angulaire, tandis que FSLANAT aurait indiqué qu'un modèle largement distribué permettait une classification sexuelle réussie. Enfin, le pipeline de prétraitement a eu un effet significatif sur la précision des prédictions et les tailles d'effet de prédiction, de sorte que, selon le pipeline, nos classificateurs de sexe ont atteint une précision de classification de 70 à 94 % dans un ensemble de données indépendant. Cela indique que le pipeline de traitement peut avoir un effet considérable sur la sensibilité et la spécificité des signatures prédictives multivariées.

L'impact d'un certain nombre de sources potentielles de variabilité a été exploré plus en détail, c'est-à-dire les effets du modèle, de la VTI et de la qualité des données. Nos résultats suggèrent que tous ces facteurs contribuent à la variabilité, mais même après avoir aligné ces facteurs, des différences considérables entre les pipelines ont été observées. Les études futures devraient donc envisager d'employer des procédures standardisées pour ces facteurs (par exemple, la réplication avec des modèles standardisés, VTI et des contrôles approfondis de la qualité des données, en particulier des estimations d'homogénéité).

Les variations les plus importantes ont été observées entre le CAT et les autres pipelines et sont restées stables après contrôle de certaines sources de variabilité telles que les effets de gabarit et de VTI. Les différences marquées peuvent refléter le fait que les trois autres pipelines étaient basés sur FSL ou intégraient des modules basés sur FSL (le pipeline interne modulaire mis en œuvre dans sMRIPrep incorporait des fonctions FSL pour la normalisation et la modulation spatiales), tandis que CAT utilise des routines distinctes. Par exemple, CAT utilise la segmentation unifiée de SPM pour l'enregistrement initial, puis optimise la segmentation avec d'autres options étendues. Cela peut favoriser des images traitées par GMV plus homogènes et a contribué à la fois à la plus grande homogénéité dans les ensembles de données traités par CAT ainsi qu'aux différences marquées entre les pipelines entre CAT et les autres pipelines. De plus, les pipelines basés sur FSL créent et utilisent des modèles spécifiques à l'étude pour la normalisation, tandis que CAT utilise un modèle prédéfini. La variabilité introduite par le calcul d'un modèle spécifique à l'étude pourrait encore amplifier les différences entre les pipelines. Bien que la variabilité entre les pipelines soit restée stable après avoir utilisé le même modèle dans les analyses univariées et multivariées (voir les suppléments), nous ne pouvons pas exclure que des différences dans les modèles de normalisation puissent entraîner une variabilité dans les échantillons pathologiques présentant des altérations structurelles du cerveau. En ce qui concerne les analyses multivariées, nous avons également observé des variations entre les pipelines ; par exemple, même avec un modèle constant, les données du pipeline sMRIPrep n'ont produit qu'une précision prédictive relativement faible, ce qui peut refléter une faible cohérence interne dans l'ensemble de données 1 lorsqu'elles sont traitées par le pipeline sMRIPrep (voir Fig. S3). Enfin, CAT et FSL recommandent différentes stratégies pour moduler les données, c'est-à-dire une modulation affine + non linéaire et non linéaire uniquement, ce qui peut avoir entraîné une variabilité entre les pipelines. L'influence exacte de la modulation a été examinée dans des études antérieures pour des scénarios intra-canalisation, voir par exemple les réf. 41,42.

Nos résultats remettent en question la reproductibilité ainsi que l'interprétabilité biologique et fonctionnelle des variations régionales de GMV telles que déterminées par VBM. Le choix du logiciel a eu un impact considérable sur la variation régionale du GMV au niveau du voxel, difficile à concilier avec un indice biologiquement valide. De plus, les régions qui présentaient des différences de sexe ou des changements de GMV liés à l'âge différaient fortement selon le pipeline utilisé. La grande variabilité dans les régions identifiées aurait conduit à une interprétation fonctionnelle plutôt différente des différences de sexe (par exemple, Fig. 3c) ainsi qu'à des changements atrophiques avec l'âge et des conséquences fonctionnelles potentielles. En revanche, les analyses multivariées ont prédit avec précision l'âge et le sexe avec des classificateurs formés sur les cartes GMV de tous les pipelines ; cependant, les régions prédictives spécifiques différaient. Ensemble, ces résultats indiquent que les indices GMV codent des informations biologiquement pertinentes, mais l'interprétation de régions spécifiques dans les analyses univariées et multivariées dépendra dans une large mesure du pipeline. Dans le contexte de la crise de réplicabilité, les méta-analyses des données de neuroimagerie sont considérées comme l'étalon-or, mais nos résultats actuels indiquent que les méta-analyses basées sur les coordonnées peuvent également devoir tenir compte de la variabilité régionale entre les études introduites par l'utilisation de différents pipelines.

Les présentes conclusions soulignent la nécessité de rapports détaillés sur les spécifications et les configurations logicielles, ce qui est également préconisé par le rapport du Comité sur les meilleures pratiques en matière d'analyse et de partage des données (COBIDAS)43. Cependant, le fait que les pipelines avec des configurations par défaut recommandées aient révélé des résultats GMV considérablement différents indique que des efforts supplémentaires sont nécessaires pour promouvoir le développement de biomarqueurs robustes et reproductibles basés sur GMV34,44,45. Les premières étapes potentielles sont une coopération ouverte et des analyses de réplicabilité sur les plates-formes logicielles et les pipelines, des plates-formes logicielles ouvertes qui permettent des comparaisons et la normalisation des méthodes entre les plates-formes, et un rapport de traitement transparent et détaillé qui devrait accompagner les soumissions de manuscrits (par exemple, comme fourni par sMRIPrep et fMRIPrep) . Des analyses plus approfondies explorant les effets du modèle de normalisation, du calcul du TIV et de la qualité des données en termes d'homogénéité de l'échantillon ont révélé que la variabilité entre les pipelines restait robuste lors de l'alignement du modèle et du TIV entre les pipelines. En revanche, le contrôle de la qualité des images prétraitées au moyen de l'exclusion des images à faible similarité spatiale a réduit dans une certaine mesure la variabilité entre les pipelines. Ces résultats impliquent que l'amélioration de l'homogénéité des données peut améliorer la réplicabilité entre les pipelines. Cependant, selon le pipeline, différentes images ont été exclues en fonction de l'homogénéité de l'échantillon. De plus, l'absence d'étalon-or pour la flexibilité analytique dans la méta-analyse de neuroimagerie et le manque de vérité de terrain pour les indices VBM limitent la comparaison entre les pipelines. Par exemple, les pipelines peuvent présenter une réplicabilité élevée à l'intérieur du pipeline ; cependant, les travaux actuels ne nous permettent pas de préciser lesquelles des régions identifiées représentent de vrais résultats positifs. Malgré cette limitation, le présent travail démontre que le choix d'un pipeline VBM spécifique influencera fortement les résultats obtenus pour la même question de recherche. Pour déterminer davantage les vrais positifs et la plausibilité biologique de la technique VBM, il faudra une analyse comparative avec des indices biologiques clairs provenant de modèles animaux, des indices cérébraux post-mortem ou des approches invasives. Enfin, bien que la présente étude se concentre principalement sur l'examen initial de la variabilité introduite par les différents pipelines VBM, un certain nombre d'études récentes ont examiné la fiabilité intra-pipeline pour les mesures structurelles du cerveau, y compris VBM, à différents moments46,47,48,49. Ces études ont généralement fait état d'une fiabilité VBM intra-pipeline allant de bonne à excellente, bien qu'elle ait été influencée par les caractéristiques des participants telles que le sexe ou la présence d'un trouble. Une étude récente a examiné la variabilité entre les pipelines pour l'IRM fonctionnelle et a utilisé un ensemble de données test-retest densément échantillonné pour l'évaluation50, une approche qui permettrait d'identifier les interactions entre la variabilité entre les pipelines et les évaluations répétées dans les études futures sur le VBM. De plus, bien que les différents progiciels se réfèrent à des étapes de prétraitement générales telles que la "segmentation" ou la "normalisation spatiale", les détails de la mise en œuvre peuvent conduire à des résultats très variables. Il sera nécessaire d'explorer les outils de contrôle automatique de la qualité et d'établir un flux de travail global et modulaire pour améliorer la robustesse des analyses VBM.

La présente étude a démontré des variations considérables dans les indices GMV et les résultats correspondants dans les pipelines de traitement les plus couramment utilisés pour VBM. La combinaison d'analyses univariées de masse et d'approches multivariées basées sur l'apprentissage automatique a révélé que les régions spécifiques identifiées comme présentant des différences de sexe GMV ou des changements liés à l'âge variaient fortement en fonction du logiciel choisi. Alors que la prédiction multivariée du sexe et de l'âge était possible dans tous les pipelines, la précision de la prédiction variait fortement entre eux. Ensemble, ces résultats remettent en question l'interprétabilité et la robustesse des résultats du VBM.

L'ensemble de données 1 comprenait des données anatomiques pondérées en T1 de 200 participants chinois en bonne santé âgés de 18 à 26 ans (moyenne = 21,45 ans, SD = 2,18 ; 100 femmes et 100 hommes appariés pour l'âge ; détails de l'échantillon, voir également Liu et al.51) . Cet ensemble de données a servi à déterminer les variations entre les quatre pipelines analytiques en ce qui concerne la détermination des différences de matière grise dans les conceptions inter-sujets en utilisant l'exemple des différences de sexe.

L'ensemble de données 2 comprenait 494 participants chinois en bonne santé âgés de 19 à 80 ans (moyenne = 45,18 ans, SD = 17,44, 187 hommes) à partir d'un ensemble de données librement disponible (SALD) englobant des données d'IRM fonctionnelles à l'état de repos et anatomiques pondérées en T1 (pour plus de détails, voir la réf. 52). Cet ensemble de données a servi à déterminer les variations entre les progiciels en ce qui concerne les associations linéaires entre les indices biologiques et le GMV avec l'exemple des changements liés à l'âge. Pour les paramètres d'acquisition IRM structurels détaillés, veuillez consulter les méthodes supplémentaires.

Tout d'abord, nous avons inspecté les artefacts apparents et la qualité de l'image par inspection visuelle, ce qui a confirmé la haute qualité de l'image. Deuxièmement, l'évaluation automatisée de la qualité par la boîte à outils MRIQC (https://mriqc.readthedocs.io/)53 a été utilisée pour évaluer plus en détail la qualité des données brutes, y compris le rapport signal sur bruit (SNR), le rapport de l'énergie de premier plan à l'arrière-plan (FBER) , pourcentage de voxels d'artefacts (Qi1) (détails et résultats voir Matériel supplémentaire Figs. S11 et S12 et Wei et al.52). Troisièmement, le cadre d'assurance qualité (AQ) CAT12.7 (r1720) (http://www.neuro.uni-jena.de/cat/) pour la quantification empirique des différences de qualité entre les analyses et les études a été appliqué. Cette QA rétrospective permet l'évaluation des paramètres d'image essentiels tels que le bruit, les inhomogénéités et la résolution d'image qui peuvent être intégrés dans un seul indice de qualité (ensemble de données 1 : moyenne = 81,68, SD = 1,61, plage = 73,48-84,48 ; ensemble de données 2 : moyenne = 84,51, SD = 1,27, plage = 76,9–86,24 ; les scores > 70 indiquent une qualité d'image satisfaisante à excellente). Ainsi, toutes les données ont passé la procédure de contrôle de qualité.

Les analyses VBM écrivent couramment deux types d'indices structuraux, appelés volume et concentration, selon qu'une étape de modulation est employée ou non37,54,55. Conformément aux avantages et à l'utilisation plus large des images modulées (volume), toutes les analyses ultérieures se sont concentrées sur les données modulées.

En ce qui concerne les pipelines de prétraitement, nous avons établi quatre pipelines de prétraitement distincts. Ces pipelines ont mis en œuvre une estimation par voxel du GMV local. Étant donné que l'objectif principal de notre étude était d'examiner la variabilité introduite par l'utilisation de pipelines VBM couramment utilisés, les quatre pipelines ont été configurés selon les configurations par défaut ou recommandées dans les manuels respectifs des progiciels (Fig. 1). Un pipeline était basé sur CAT12.7 (r1720) (http://www.neuro.uni-jena.de/cat/) (CAT) ; deux pipelines étaient basés sur FSL v6.0 (https://fsl.fmrib.ox.ac.uk/fsl/fslwiki/FSL, Smith et al.56, Jenkinson et al.57) (FSLVBM et FSLANAT, respectivement) ; et un pipeline comprenait des modules de différents progiciels et était basé sur sMRIPrep 0.6.2 (Esteban et al.58, RRID:SCR_016216, https://www.nipreps.org/smriprep/) (sMRIPrep).

Le pipeline CAT a été implémenté dans CAT12.7 fonctionnant sur SPM12 v7219 (Welcome Department of Cognitive Neurology, Londres, Royaume-Uni, https://www.fil.ion.ucl.ac.uk/spm/software/spm12/). Les protocoles de prétraitement VBM standard de CAT12, tels que décrits dans le manuel CAT12.7, ont été utilisés dans le pipeline. En bref, les images pondérées en T1 ont été corrigées en biais, segmentées en matière grise (GM), matière blanche (WM) et liquide céphalo-rachidien (CSF) à l'aide de la fonction de segmentation unifiée de SPM pour la segmentation et l'enregistrement initial, avec une optimisation supplémentaire de la segmentation ( ex. en utilisant la segmentation adaptative locale et la segmentation a posteriori maximale adaptative) et spatialement normalisés à l'espace standard de l'Institut neurologique de Montréal (INM) à l'aide du modèle ICBM-152 (est-asiatique, les résultats supplémentaires obtenus avec le modèle caucasien n'ont pas affecté les résultats, voir les suppléments Fig. S13) avec une taille de voxel de 2 × 2 × 2 mm. Les images GM ont été lissées avec trois noyaux gaussiens avec des noyaux de lissage couramment utilisés (8, 10 et 12 mm) à pleine largeur à mi-hauteur (FWHM) pour une analyse statistique ultérieure et le volume intracrânien total (TIV) a été estimé pour corriger les différences individuelles dans taille du cerveau. Les paramètres par défaut ont été appliqués sauf indication contraire.

Deux pipelines de prétraitement par défaut différents ont été établis dans FSL56,57 : (1) FSLVBM (https://fsl.fmrib.ox.ac.uk/fsl/fslwiki/FSLVBM) et (2) FSLANAT (https://fsl. fmrib.ox.ac.uk/fsl/fslwiki/fsl_anat). Le pipeline par défaut de FSLVBM comprenait les quatre étapes suivantes : Tout d'abord, les tissus non cérébraux ont été supprimés à l'aide de BET (fslvbm_1_bet). Deuxièmement (fslvbm_2_template), la segmentation par type de tissu a été réalisée via l'outil de segmentation automatisé (FAST), pour segmenter les images en GM, WM et CSF. Troisièmement, les résultats ont été enregistrés de manière non linéaire dans le modèle GM ICBM-152 à l'aide de l'outil d'enregistrement FNIRT, puis en créant un modèle spécifique à l'étude. Enfin, les images GM ont été enregistrées de manière non linéaire dans le modèle spécifique à l'étude à l'aide de FNIRT (fslvbm_3_proc). En revanche, FSLANAT est un pipeline général de traitement d'images anatomiques comprenant les étapes suivantes (fsl_anat). Il convient de noter que l'ordre de traitement est différent de FSLVBM et que les résultats finaux sont des données segmentées dans l'espace natif. Tout d'abord, toutes les images pondérées en T1 ont été réorientées vers l'orientation MNI standard (fslreorient2std) et automatiquement recadrées (robustfov). Deuxièmement, la correction du champ de biais pour la correction de l'inhomogénéité RF/B1 (FAST) a été effectuée. Troisièmement, le pipeline a effectué une extraction cérébrale (BET) et une segmentation de type tissulaire (FAST). Le calcul du TIV pour FSLANAT et FSLVBM a adhéré aux protocoles fournis par le projet ENIGMA (http://enigma.ini.usc.edu/protocols/imaging-protocols/protocol-for-brain-and-intracranial-volumes/# fsl).

sMRIPrep 0.6.2 (Esteban, et al.58, RRID:SCR_016216, https://www.nipreps.org/smriprep/) est un pipeline de prétraitement structurel des données IRM conçu pour fournir un outil de pointe facilement accessible interface robuste aux variations des protocoles d'acquisition de numérisation et qui nécessite une intervention minimale de l'utilisateur, tout en fournissant des rapports d'erreur et de sortie facilement interprétables et complets. Le flux de travail est basé sur Nipype 1.5.0 (Gorgolewski, et al.59, RRID:SCR_002502). Un flux de travail similaire est également utilisé dans le flux de travail de prétraitement anatomique fMRIPrep (Esteban, et al.58, https://fmriprep.org/). Dans la présente étude, l'image pondérée en T1 (T1w) a été corrigée pour la non-uniformité d'intensité (INU) avec N4BiasFieldCorrection60, distribuée avec les ANT 2.2.0 (Avants et al.61, RRID : SCR_004757) et utilisée comme référence T1w tout au long du flux de travail. La référence T1w a ensuite été supprimée du crâne avec une implémentation Nipype du flux de travail antsBrainExtraction.sh (à partir d'ANTs), en utilisant OASIS30ANTs comme modèle cible. La segmentation des tissus cérébraux du LCR, de la MW et de la GM a été réalisée sur le T1w extrait du cerveau en utilisant fast (FSL 5.0.9, RRID :SCR_002823, Zhang et al.62). Étant donné qu'aucune estimation du TIV n'est fournie par sMRIPrep, la taille du cerveau correspondante pour l'analyse a été calculée en résumant les types de tissus (GM + WM + CSF).

Pour réduire davantage la variabilité induite par la normalisation spatiale, les pipelines FSLANAT, FSLVBM et sMRIPrep ont utilisé la même normalisation. En détail, sMRIPrep et FSLANAT ont été principalement utilisés pour segmenter les données GM, WM et CSF, et les données ont ensuite été intégrées dans le pipeline FSLVBM. Pour le traitement dans ces pipelines, nous avons donc exclu les étapes initiales d'extraction du cerveau (fslvbm_1_bet) et de segmentation (première partie de fslvbm_2_template) et soumis les résultats GM segmentés (dans l'espace natif) à fslvbm_2_template et fslvbm_3_proc pour produire des données GM modulées.

Pour maintenir la cohérence du prétraitement au sein de chaque plate-forme, la fonction fslmaths a été utilisée pour lisser les données traitées FSL (FSLVBM, FSLANAT et sMRIPrep) avec des noyaux de lissage comparables (sigma = 3,5, 4,3, 5,2, correspondant approximativement à FWHM—3,5 × 2,3 = 8,05 ≈ 8 , 4,3 × 2,3 = 9,89 ≈ 10 et 5,2 × 2,3 = 11,96 ≈ 12) comme données CAT. Pour le prétraitement CAT, le lissage SPM a été effectué avec FWHM = 8, 10 et 12, respectivement.

En résumé, selon les fonctions utilisées pour traiter les données, les quatre pipelines pourraient être divisés en trois basés sur FSL (FSLANAT, FSLVBM et sMRIPrep qui utilisent la segmentation, FAST, fonction de FSL) et sur des pipelines basés sur CAT. Dans les pipelines basés sur FSL, le FSLVBM a utilisé un traitement supplémentaire après la segmentation tandis que FSLANAT a utilisé un ordre différent des étapes de traitement. Le pipeline sMRIPrep représente un pipeline interne basé sur différents packages de neuroimagerie, notamment FSL, Nipype, ANT, etc. CAT a utilisé des étapes fonctionnellement similaires telles que la correction des biais, la segmentation, la normalisation spatiale, le lissage et la modulation, mais ces étapes étaient basées sur Approches de traitement spécifiques à CAT plutôt que basées sur FSL. De plus, CAT intègre des étapes supplémentaires telles que la segmentation unifiée mise en œuvre par SPM12, et d'autres étapes d'optimisation telles que le débruitage. Les différentes étapes et fonctions de traitement peuvent introduire une variabilité dans le prétraitement des données et les résultats statistiques. Il convient de noter que notre objectif principal était de déterminer les différences pouvant résulter de l'application des étapes de traitement par défaut ou recommandées dans les différents pipelines plutôt que de séparer spécifiquement les détails techniques qui conduisent à la variabilité.

Les coefficients de corrélation de Pearson ont été utilisés pour calculer la similarité spatiale des cartes GM modulées des données prétraitées des quatre pipelines pour l'ensemble de données 1 (homme et femme) et l'ensemble de données 2, et à différents noyaux de lissage (voir Fig. S2). Des cartes de similarité spatiale à travers les pipelines de traitement ont été établies pour montrer sa distribution (Fig. S2) et ont révélé des modèles très similaires entre les données non lissées et les données traitées avec trois noyaux de lissage différents (FWHM 8, 10 et 12). D'autres analyses statistiques se sont donc concentrées sur les valeurs r transformées en z des données lissées FWHM 8. L'examen de la similarité spatiale des similarités intra-pipeline au moyen de modèles ANOVA a révélé un effet principal significatif du pipeline, en particulier une forte similarité spatiale dans les données traitées par le pipeline CAT et une forte variation entre les pipelines (Fig. S3, données non lissées voir Fig. S14) pour les ensembles de données 1 et 2 (Bonferroni corrigé p < 0,01).

La réplicabilité à travers les pipelines a été évaluée à l'aide de deux approches : (1) la réplicabilité univariée au niveau du voxel a été examinée à l'aide du coefficient de corrélation intraclasse (ICC) mis en œuvre par un modèle mixte linéaire dans DPABI63, voir le matériel supplémentaire, et (2) la réplicabilité multivariée du cerveau entier, en utilisant le coefficient de corrélation intraclasse d'image (I2C2), qui représente un modèle d'erreur de mesure d'image multivariée5. ICC (ICC (3,1) avec des modèles mixtes linéaires tels qu'utilisés dans l'étude actuelle) et I2C2 peuvent estimer la cohérence entre les différents pipelines au niveau du voxel ou du cerveau entier, respectivement5,64. La réplicabilité entre les pipelines telle qu'évaluée par le coefficient est généralement interprétée comme suit : <0,4 médiocre ; 0,4–0,59 passable ; 0,60–0,74 bon ; >0,74 excellent64,65,66.

Pour tenir compte des interactions potentielles entre le prétraitement et les procédures statistiques inférentielles, toutes les analyses univariées de la présente étude ont été menées dans SPM12 et à travers différentes corrections de comparaisons multiples. Les analyses comprenant des tests de paramètres statistiques classiques (seuil au niveau du voxel p < 0,001 et pFWE au niveau du cluster < 0,05 avec un niveau de voxel formant un cluster initial p < 0,001 respectivement) ainsi que l'amélioration des clusters sans seuil (TFCE avec 5 000 permutations, seuil à p < 0,001 et pFWE < 0,05, respectivement). Pour être complet, les résultats non corrigés au niveau du voxel (p < 0,001 et TFCE p < 0,001) sont fournis dans les Fig. S15 et S16, et résultats après exclusion de l'effet de modèle et du calcul de VTI sur la Fig. S17.

Des tests t d'échantillons indépendants ont été utilisés pour déterminer les différences significatives dans le volume régional de matière grise entre les hommes et les femmes. L'âge et le VTI ont été inclus dans les modèles, comme recommandé pour les analyses VBM, afin de contrôler les variations liées à l'âge et à la taille globale du cerveau.

Des modèles de régression linéaire multiple ont été utilisés pour explorer les associations entre l'âge et le GMV régional, y compris le sexe et le VTI comme covariables.

Un cadre d'apprentissage automatique de pointe en neuroimagerie40 a été adopté pour déterminer si l'utilisation des différents pipelines affectera la précision de la prédiction du sexe et de l'âge au moyen de variations structurelles cérébrales distribuées (cartes GMV). Pour la prédiction catégorique (sexe), les 200 participants en bonne santé de l'ensemble de données 1 ont été divisés en deux échantillons indépendants appariés selon le sexe et l'âge, qui ont servi respectivement d'ensembles de données d'entraînement et de test. Une machine à vecteurs de support (SVM, C = 1) a été utilisée pour développer un classificateur de sexe basé sur MVPA. Le SVM a été formé sur les données de formation (n = 100) avec un test d'amorçage pour trouver des caractéristiques stables (5000 permutations, pFDR < 0,05). Ensuite, ces caractéristiques ont été utilisées pour former le modèle au moyen d'une validation croisée quintuple. Les modèles résultants ont ensuite été testés dans l'échantillon de test indépendant (n = 100) pour déterminer l'exactitude de la prédiction intra- et inter-pipeline pour le sexe. Pour estimer l'ampleur de l'effet de chaque classification, le d de Cohen pour les conceptions inter-sujets a été utilisé67. Pour la prédiction d'une variable continue (âge), un modèle de régression de vecteur de support (SVR, epsilon = 0,1, C = 1) a été formé sur l'ensemble de données 2. Un test d'amorçage (5000 permutations, pFDR < 0,05) a été utilisé pour trouver des caractéristiques stables. Ces caractéristiques et une validation croisée quintuple ont été appliquées pour former le modèle. Les performances de prédiction ont ensuite été quantifiées par l'évaluation des forces de corrélation entre l'âge prédit et l'âge réel pour les conduites intra- et inter-canalisations. Des performances prédites stables après exclusion de l'effet de modèle et des modèles prédits stables ont également été fournis dans les Fig. S18 et S19.

Il convient de noter que le but de la MVPA n'était pas de déterminer un algorithme optimisé ou un ensemble de fonctionnalités pour prédire le sexe ou l'âge, mais plutôt de déterminer si différents pipelines de traitement affectent la précision de la prédiction et si les cartes GMV codent généralement des informations biologiquement significatives.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Des cartes statistiques sans seuil et des images de poids de motif sont disponibles sur OSF (https://osf.io/p5b6f/). L'ensemble de données 2 est disponible en téléchargement dans un bucket Amazon Web Services S3 de l'International Data-sharing Initiative (http://fcon_1000.projects.nitrc.org/indi/s3/index.html) sous une licence Creative Commons : Attribution Non- Commercial. D'autres données peuvent être obtenues auprès des auteurs correspondants sur demande raisonnable.

Poldrack, RA et al. Scruter l'horizon : vers une recherche en neuroimagerie transparente et reproductible. Nat. Rév. Neurosci. 18, 115-126 (2017).

Article CAS PubMed PubMed Central Google Scholar

Buimer, EEL et al. L'étude de cohorte YOUth : protocole IRM et fidélité test-retest chez l'adulte. Dév. Conn. Neurosci. 45, 100816 (2020).

Article PubMed PubMed Central Google Scholar

Madan, CR & Kensinger, EA Fiabilité test-retest des estimations de la morphologie cérébrale. Cerveau Inf. 4, 107–121 (2017).

Article Google Scholar

Melzer, TR et al. Fiabilité test-retest et estimations de la taille de l'échantillon après le déplacement du scanner IRM. Neuroimage 211, 116608 (2020).

Article PubMed Google Scholar

Shou, H. et al. Quantification de la fiabilité des études de réplication d'images : le coefficient de corrélation intraclasse image (I2C2). Conn. Affecter le comportement. Neurosci. 13, 714–724 (2013).

Article CAS PubMed PubMed Central Google Scholar

Elliott, ML et al. Quelle est la fiabilité test-retest des mesures courantes de l'IRM fonctionnelle des tâches ? de nouvelles preuves empiriques et une méta-analyse. Psychol. Sci. 31, 792–806 (2020).

Article PubMed PubMed Central Google Scholar

Becker, B. et al. Une amygdale plus petite et un cortex préfrontal médial prédisent une utilisation croissante de stimulants. Cerveau 138, 2074-2086 (2015).

Article PubMed Google Scholar

Ruigrok, AN et al. Une méta-analyse des différences entre les sexes dans la structure du cerveau humain. Neurosci. Biobehav Rev. 39, 34–50 (2014).

Article PubMed PubMed Central Google Scholar

Ritchie, SJ et al. Différences entre les sexes dans le cerveau humain adulte: preuves de 5216 participants à la biobanque britannique. Cerb. Cortex 28, 2959-2975 (2018).

Article PubMed PubMed Central Google Scholar

Lotze, M. et al. Nouvelles découvertes de 2 838 cerveaux adultes sur les différences entre les sexes dans le volume cérébral de la matière grise. Sci. Rep. 9, 1671 (2019).

Article PubMed PubMed Central CAS Google Scholar

Zhou, X. et al. Des niveaux plus élevés de symptômes du trouble du jeu (Internet) selon les cadres de l'OMS et de l'APA sont associés à un volume striatal plus faible. J. Behav. Toxicomane. 9, 598–605 (2020).

Article PubMed PubMed Central Google Scholar

Taubert, M., Lohmann, G., Margulies, DS, Villringer, A. & Ragert, P. Effets à long terme de l'entraînement moteur sur les réseaux à l'état de repos et la structure cérébrale sous-jacente. Neuroimage 57, 1492–1498 (2011).

Article PubMed Google Scholar

Miller, KL et al. Imagerie cérébrale multimodale de la population dans l'étude épidémiologique prospective de la biobanque britannique. Nat. Neurosci. 19, 1523-1536 (2016).

Article CAS PubMed PubMed Central Google Scholar

Nostro, AD, Muller, VI, Reid, AT & Eickhoff, SB Corrélations entre personnalité et structure cérébrale : un rôle crucial du genre. Cerb. Cortex 27, 3698–3712 (2017).

Google Scholar PubMed

Llera, A., Wolfers, T., Mulders, P. & Beckmann, CF Les différences interindividuelles dans la structure et la morphologie du cerveau humain sont liées à la variation de la démographie et du comportement. Elife https://doi.org/10.7554/eLife.44443 (2019).

Zhao, Z. et al. Le volume de Putamen prédit en temps réel le succès de l'apprentissage du neurofeedback IRMf à travers les paradigmes et les régions cibles du neurofeedback. Hum. Cartographie du cerveau. 42, 1879–1887 (2021).

Article PubMed PubMed Central Google Scholar

Wang, Q. et al. Substrats neuronaux dissociés sous-jacents au choix impulsif et à l'action impulsive. Neuroimage 134, 540–549 (2016).

Article PubMed Google Scholar

Premi, E. et al. À la recherche de marqueurs de neuroimagerie dans les essais cliniques sur la dégénérescence lobaire frontotemporale : une étude d'analyse de modèles multi-voxels dans la maladie de la granuline. J. Alzheimers Dis. 51, 249-262 (2016).

Article CAS PubMed Google Scholar

Solana-Lavalle, G. & Rosas-Romero, R. Classification des IRM PPMI avec morphométrie à base de voxel et apprentissage automatique pour aider au diagnostic de la maladie de Parkinson. Méthodes de calcul Prog. Biomédical. 198, 105793 (2021).

Article Google Scholar

Kharabian Masouleh, S. et al. Influence du pipeline de traitement sur la mesure de l'épaisseur corticale. Cerb. Cortex 30, 5014–5027 (2020).

Article PubMed PubMed Central Google Scholar

Popescu, V. et al. Atrophie de la substance grise dans la sclérose en plaques : l'interprétation clinique dépend du choix de la méthode d'analyse. PLoS ONE 11, e0143942 (2016).

Article PubMed PubMed Central CAS Google Scholar

Rajagopalan, V. & Pioro, EP Résultats disparates de morphométrie à base de voxels (VBM) entre les logiciels SPM et FSL chez les patients SLA atteints de démence frontotemporale : quels résultats VBM prendre en compte ? BMC Neurol. 15, 32 (2015).

Article PubMed PubMed Central Google Scholar

Pepe, A., Dinov, I. & Tohka, J. Un cadre automatique pour la validation quantitative des mesures de morphométrie basées sur les voxels de l'asymétrie cérébrale anatomique. Neuroimage 100, 444–459 (2014).

Article PubMed Google Scholar

Bookstein, FL La "morphométrie basée sur Voxel" ne doit pas être utilisée avec des images imparfaitement enregistrées. Neuroimage 14, 1454-1462 (2001).

Article CAS PubMed Google Scholar

Senjem, ML, Gunter, JL, Shiung, MM, Petersen, RC et Jack, CR Jr. Comparaison de différentes implémentations méthodologiques de la morphométrie à base de voxel dans les maladies neurodégénératives. Neuroimage 26, 600–608 (2005).

Article PubMed Google Scholar

Mechelli, A., Friston, KJ, Frackowiak, RS & Price, CJ Covariance structurelle dans le cortex humain. J. Neurosci. 25, 8303–8310 (2005).

Article CAS PubMed PubMed Central Google Scholar

Shen, S., Szameitat, AJ & Sterr, A. La détection des lésions VBM dépend du modèle de normalisation : une étude utilisant une atrophie simulée. Magn. Reson Imaging 25, 1385–1396 (2007).

Article PubMed Google Scholar

Kharabian Masouleh, S., Eickhoff, SB, Hoffstaedter, F., Genon, S. & Alzheimer's Disease Neuroimaging, I. Examen empirique de la réplicabilité des associations entre la structure cérébrale et les variables psychologiques. Elife https://doi.org/10.7554/eLife.43464 (2019).

Fjell, AM et al. Accélération de l'amincissement cortical : unique à la démence ou universel dans le vieillissement. Cerb. Cortex 24, 919–934 (2014).

Article PubMed Google Scholar

Kharabian Masouleh, S. et al. Un indice de masse corporelle plus élevé chez les personnes âgées est associé à un volume de matière grise plus faible : implications pour les performances de la mémoire. Neurobiol. 40 ans, 1 à 10 ans (2016).

Article PubMed Google Scholar

Willette, AA & Kapogiannis, D. Le cerveau rétrécit-il à mesure que la taille se dilate. Vieillissement Rés. Rév. 20, 86–97 (2015).

Article PubMed Google Scholar

Marek, S. et al. Vers des études d'association reproductibles à l'échelle du cerveau. BioRxiv. https://doi.org/10.1101/2020.08.21.257758 (2020).

Yamashita, A. et al. Harmonisation des données d'IRM fonctionnelle à l'état de repos sur plusieurs sites d'imagerie via la séparation des différences de site en biais d'échantillonnage et biais de mesure. PLoS Biol. 17, e3000042 (2019).

Article CAS PubMed PubMed Central Google Scholar

Botvinik-Nezer, R. et al. Variabilité dans l'analyse d'un seul ensemble de données de neuroimagerie par de nombreuses équipes. Nature 582, 84–88 (2020).

Article CAS PubMed PubMed Central Google Scholar

Liu, S., Seidlitz, J., Blumenthal, JD, Clasen, LS et Raznahan, A. Analyses structurelles, fonctionnelles et transcriptomiques intégratives de l'organisation cérébrale biaisée par le sexe chez l'homme. Proc. Natl Acad. Sci. États-Unis 117, 18788–18798 (2020).

Article CAS PubMed PubMed Central Google Scholar

Genon, S., Reid, A., Langner, R., Amunts, K. & Eickhoff, SB Comment caractériser la fonction d'une région du cerveau. Tendances Conn. Sci. 22, 350–364 (2018).

Article PubMed PubMed Central Google Scholar

Bien, CD et al. Une étude morphométrique basée sur les voxels du vieillissement dans 465 cerveaux humains adultes normaux. Neuroimage 14, 21–36 (2001).

Article CAS PubMed Google Scholar

Chen, X., Sachdev, PS, Wen, W. & Anstey, KJ Différences sexuelles dans la matière grise régionale chez des individus en bonne santé âgés de 44 à 48 ans : une étude morphométrique basée sur les voxels. Neuroimage 36, 691–699 (2007).

Article PubMed Google Scholar

Hebart, MN & Baker, CI Déconstruction du décodage multivarié pour l'étude de la fonction cérébrale. Neuroimage 180, 4–18 (2018).

Article PubMed Google Scholar

Kohoutova, L. et al. Vers un cadre unifié pour l'interprétation des modèles d'apprentissage automatique en neuroimagerie. Nat. Protocole 15, 1399-1435 (2020).

Article CAS PubMed Google Scholar

Radua, J., Canales-Rodriguez, EJ, Pomarol-Clotet, E. & Salvador, R. Validité de la modulation et paramètres optimaux pour la morphométrie avancée à base de voxel. Neuroimage 86, 81–90 (2014).

Article PubMed Google Scholar

Malone, IB et al. Estimation automatique précise du volume intracrânien total : une variable gênante avec moins de nuisance. Neuroimage 104, 366–372 (2015).

Article PubMed Google Scholar

Nichols, TE et al. Meilleures pratiques d'analyse et de partage de données en neuroimagerie à l'aide de l'IRM. Nat. Neurosci. 20, 299-303 (2017).

Article CAS PubMed PubMed Central Google Scholar

Hong, YW, Yoo, Y., Han, J., Wager, TD & Woo, CW Neuroimagerie faussement positive : la flexibilité non divulguée dans le test des hypothèses spatiales permet de présenter n'importe quoi comme une découverte répliquée. Neuroimage 195, 384–395 (2019).

Article PubMed Google Scholar

Milkowski, M., Hensel, WM & Hohol, M. Réplicabilité ou reproductibilité ? Sur la crise de la réplication dans les neurosciences computationnelles et ne partageant que les détails pertinents. J. Comput. Neurosci. 45, 163-172 (2018).

Article PubMed PubMed Central Google Scholar

Brown, EM et al. Fiabilité test-retest de la segmentation automatisée des sous-champs de l'hippocampe par FreeSurfer dans et entre les scanners. Neuroimage 210, 116563 (2020).

Article PubMed Google Scholar

Hedges, EP et al. Fiabilité des mesures IRM structurelles : effets de la session d'examen, de l'inclinaison de la tête, de l'intervalle entre les examens, de la séquence d'acquisition, de la version FreeSurfer et du flux de traitement. Neuroimage 246, 118751 (2022).

Article CAS PubMed Google Scholar

Takao, H., Amemiya, S., Abe, O. & Neuroimaging de la maladie d'Alzheimer, I. Fiabilité des modifications du volume cérébral déterminées par la morphométrie longitudinale à base de voxel. J. Magn. Réson. Imagerie 54, 609–616 (2021).

Article PubMed Google Scholar

Watanabe, H. et al. Variabilité du volume de matière grise chez les jeunes adultes en bonne santé : influence de la différence entre les sexes et du génotype du facteur neurotrophique dérivé du cerveau. Cereb Cortex https://doi.org/10.1093/cercor/bhab370 (2021).

Li, X. et al. Aller au-delà des variations liées au traitement et à l'analyse dans les neurosciences. bioRxiv https://doi.org/10.1101/2021.12.01.470790 (2021).

Liu, C. et al. La sérotonine et le stress précoce interagissent pour façonner l'architecture cérébrale et le comportement d'évitement anxieux - une approche génétique d'imagerie TPH2. Psychol. Méd. 51, 2476-2484 (2020).

Wei, D. et al. Scanners cérébraux structurels et fonctionnels à partir de l'ensemble de données transversales sur la durée de vie des adultes de la Southwest University. Sci. Données 5, 180134 (2018).

Article PubMed PubMed Central Google Scholar

Esteban, O. et al. MRIQC : faire progresser la prédiction automatique de la qualité d'image en IRM à partir de sites invisibles. PLoS ONE 12, e0184661 (2017).

Article PubMed PubMed Central CAS Google Scholar

Ashburner, J. & Friston, KJ Morphométrie basée sur Voxel–les méthodes. Neuroimage 11, 805–821 (2000).

Article CAS PubMed Google Scholar

Gennatas, ED et al. Effets liés à l'âge et différences entre les sexes dans la densité, le volume, la masse et l'épaisseur corticale de la matière grise de l'enfance au jeune âge adulte. J. Neurosci. 37, 5065–5073 (2017).

Article CAS PubMed PubMed Central Google Scholar

Smith, SM et al. Avancées dans l'analyse et la mise en œuvre d'images RM fonctionnelles et structurelles en tant que FSL. Neuroimage 23(Suppl 1), S208–S219 (2004).

Article PubMed Google Scholar

Jenkinson, M., Beckmann, CF, Behrens, TE, Woolrich, MW & Smith, SM Fsl. Neuroimage 62, 782–790 (2012).

Article PubMed Google Scholar

Esteban, O. et al. fMRIPrep : un pipeline de prétraitement robuste pour l'IRM fonctionnelle. Nat. Méthodes 16, 111–116 (2019).

Article CAS PubMed Google Scholar

Gorgolewski, K. et al. Nipype : un cadre de traitement de données de neuroimagerie flexible, léger et extensible en python. Devant. Neuroinform 5, 13 (2011).

Article PubMed PubMed Central Google Scholar

Tustison, NJ et al. N4ITK : amélioration de la correction du biais N3. IEEE Trans. Méd. Imagerie 29, 1310–1320 (2010).

Article PubMed PubMed Central Google Scholar

Avants, BB, Epstein, CL, Grossman, M. & Gee, JC Enregistrement d'images difféomorphes symétriques avec corrélation croisée : évaluation de l'étiquetage automatisé du cerveau âgé et neurodégénératif. Méd. Image anale. 12, 26–41 (2008).

Article CAS PubMed Google Scholar

Zhang, Y., Brady, M. & Smith, S. Segmentation d'images IRM cérébrales à l'aide d'un modèle de champ aléatoire de Markov caché et de l'algorithme de maximisation des attentes. IEEE Trans. Méd. Imagerie 20, 45–57 (2001).

Article CAS PubMed Google Scholar

Yan, CG, Wang, XD, Zuo, XN & Zang, YF DPABI : Traitement et analyse des données pour l'imagerie cérébrale (à l'état de repos). Neuroinformatique 14, 339–351 (2016).

Article PubMed Google Scholar

Noble, S., Scheinost, D. & Constable, RT Une décennie de fiabilité test-retest de la connectivité fonctionnelle : une revue systématique et une méta-analyse. Neuroimage 203, 116157 (2019).

Article PubMed Google Scholar

Noble, S. et al. Influences sur la fiabilité test-retest de la connectivité fonctionnelle IRM et sa relation avec l'utilité comportementale. Cerb. Cortex 27, 5415–5429 (2017).

Article PubMed PubMed Central Google Scholar

Cicchetti, DV & Sparrow, SA Développer des critères pour établir la fiabilité interévaluateur d'items spécifiques : applications à l'évaluation du comportement adaptatif. Suis. J.Ment. Défic. 86, 127–137 (1981).

CAS PubMed Google Scholar

Lakens, D. Calcul et rapport des tailles d'effet pour faciliter la science cumulative : une introduction pratique pour les tests t et les ANOVA. Devant. Psychol. 4, 863 (2013).

Article PubMed PubMed Central Google Scholar

Télécharger les références

Ce travail a été soutenu par le China MOST2030 Brain Project No. 2022ZD0208500, National Key Research and Development Program of China (Grant No. 2018YFA0701400), National Natural Science Foundation of China (NSFC, No 91632117, 31700998, 31530032).

Ces auteurs ont contribué à parts égales : Xinqi Zhou, Benjamin Becker.

Centre de médecine psychosomatique, Centre provincial de santé mentale du Sichuan, Hôpital populaire provincial du Sichuan, Laboratoire clé du MOE pour la neuroinformation, Laboratoire clé d'imagerie par résonance magnétique à haut champ de la province du Sichuan, Université des sciences et technologies électroniques de Chine, Chengdu, Chine

Xinqi Zhou, Renjing Wu, Yixu Zeng, Ziyu Qi, Stefania Ferraro, Lei Xu, Xiaoxiao Zheng, Jialin Li, Meina Fu, Shuxia Yao, Keith M. Kendrick et Benjamin Becker

Institut des sciences cérébrales et psychologiques, Université normale du Sichuan, Chengdu, Chine

Xinqi Zhou et Lei Xu

Département de neuroradiologie, Fondation de l'Institut neurologique Carlo Besta, Milan, Italie

Stéphanie Ferraro

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Conception de l'étude : XZ et BB ; Conception de l'étude : XZ et BB ; Réalisation de l'analyse : XZ et RW ; Interprétation des résultats : XZ, YZ, ZQ, SF, LX, XXZ, JL et MF ; A rédigé le manuscrit : XZ ; Révisions critiques du manuscrit : SY, KK et BB Tous les auteurs ont lu et approuvé le manuscrit final.

Correspondance à Xinqi Zhou ou Benjamin Becker.

Les auteurs ne déclarent aucun intérêt concurrent.

Communications Biology remercie Oscar Esteban et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Rédacteurs en chef de la manipulation principale : Jeanette Mumford, Karli Montague-Cardoso et Gene Chong.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Zhou, X., Wu, R., Zeng, Y. et al. Le choix du pipeline de traitement de la morphométrie basée sur Voxel entraîne une variabilité dans l'emplacement des marqueurs cérébraux neuroanatomiques. Commun Biol 5, 913 (2022). https://doi.org/10.1038/s42003-022-03880-1

Télécharger la citation

Reçu : 03 juillet 2021

Accepté : 23 août 2022

Publié: 06 septembre 2022

DOI : https://doi.org/10.1038/s42003-022-03880-1

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.