Une étude peut porter toutes les marques de la confiance — argent fédéral, protocole enregistré, double aveugle, revue prestigieuse — et rester construite pour livrer une conclusion décidée d'avance. Je crois que l'essai Arnold 2021 en est une, et que sa vraie fonction est de fournir un verdict citable contre le neurofeedback dans son ensemble. Sa conclusion sert aujourd'hui à refuser le remboursement. À mon avis, elle ne résiste pas à l'examen de sa propre méthode.
Les deux groupes se sont améliorés. À peu près autant.
Commençons par la statistique-phare de l'essai lui-même. Du début à la fin de l'intervention, le critère principal s'est amélioré significativement (p<.0001) dans les deux groupes — neurofeedback (d=1,51) et le prétendu « placebo » (d=1,47) — sans différence significative entre eux. Un tel résultat intra-groupe ne peut, à lui seul, prouver que le neurofeedback fonctionne ; les deux groupes pourraient s'améliorer par attente, attention ou évolution naturelle. Mais il ne peut pas davantage soutenir le titre vendu — « le neurofeedback échoue » — car, comme le montrent les critiques, le comparateur n'a jamais été inerte.
Graphique : tailles d'effet d'amélioration intra-groupe, du début à la fin de l'intervention. Neurofeedback d de Cohen = 1,51 ; « placebo » (biofeedback EMG) d = 1,47. Les deux sont quasi identiques, sans différence statistiquement significative entre les groupes.
Deux tailles d'effet intra-groupe, presque à la même hauteur. Les données disent « aucune différence entre deux groupes actifs ». On l'a publié comme « le neurofeedback ne marche pas ». C'est dans cet écart que commence mon argument.
Où j'ai déjà vu cela
En 1969, un cadre du cigarettier Brown & Williamson écrivit une phrase devenue le modèle de toute industrie ayant besoin de faire disparaître une science gênante. La stratégie n'est pas de réfuter l'adversaire — c'est de fabriquer assez de doute pour que le public, les régulateurs et les assureurs cessent de faire confiance aux preuves. Les historiens Naomi Oreskes et Erik Conway ont nommé cette pratique dans leur livre Les Marchands de doute.
« Le doute est notre produit, car c'est le meilleur moyen de rivaliser avec le "corpus de faits" présent dans l'esprit du grand public. C'est aussi le moyen d'instaurer une controverse. »— Note interne Brown & Williamson, 1969
Je n'affirme pas que les personnes impliquées fument le cigare dans une arrière-salle. J'affirme que le schéma est le même — et que, à mon avis, cet essai est un coup dans un effort coordonné pour discréditer tout un domaine, pas un test honnête au résultat malheureusement négatif. Voici la méthode, et comment je pense qu'elle s'applique ici.
Concevoir l'étude pour que la réponse soit jouée d'avance
Choisir un comparateur, une mesure et un protocole de récompense incapables de détecter l'effet que l'on prétend tester.
Reformuler le résultat après coup
Quand les données ne coopèrent pas, changer les mots pour transformer un nul en défaite.
Recourir à des experts crédibles mais en conflit d'intérêts
Laisser des personnes liées à l'industrie prononcer le verdict, pour lui prêter autorité.
Transformer le verdict en politique
Diffuser la conclusion aux régulateurs, aux recommandations et aux assureurs jusqu'à en faire un mur.
Tout ce qu'on vous apprend à croire — retournez-le
Selon les repères académiques habituels, ce devrait être une étude de haute confiance. C'est précisément ce qui la rend efficace : les marques de crédibilité restent intactes alors que, dans ma lecture, l'expérience qu'elles recouvrent est creuse. Retournez le panneau.
La critique en recense dix-neuf. Voici les plus structurantes.
Documentées dans la revue critique évaluée par les pairs de Schummer & Sguigna (NeuroRegulation, 2024 — qui réclame formellement la rétractation de l'étude) et l'analyse méthodologique de Pigott, Cannon & Trullinger (2021). Ce sont leurs constats et arguments ; ci-dessous, ceux que je trouve les plus accablants.
L'hypothèse a été reformulée une fois le résultat connu
La comparaison primaire enregistrée opposait le neurofeedback au « placebo sham ». Quand le prétendu placebo a produit une amélioration large et durable, la conclusion publiée a remplacé le terme par « traitement de contrôle ». Ce changement de vocabulaire, selon les critiques, enterre le vrai constat : le comparateur n'était pas un placebo. (L'essai a randomisé 144 enfants ; 142 sont entrés dans l'analyse principale, 84 neurofeedback / 58 contrôle.)
Le « placebo » délivrait du biofeedback EMG — une intervention active
Barth et al. (2017) ont rapporté que le biofeedback EMG seul réduit l'hyperactivité du TDAH. Comparer le neurofeedback à une seconde intervention active et conclure à « aucune différence » n'est pas une preuve d'échec — pour les critiques, cela démonte l'inférence sur laquelle repose tout l'essai. (Certains chercheurs acceptent le biofeedback EMG comme un placebo légitime ; j'aborde cette objection plus bas.)
Censé tester le conditionnement opérant — sans jamais vérifier l'apprentissage
L'essai voulait tester si des enfants pouvaient être conditionnés à modifier leur ratio thêta/bêta, mais n'a enregistré aucune courbe d'apprentissage. Rien dans les données n'indique qu'un seul enfant du groupe neurofeedback ait appris à moduler le signal. On ne peut conclure à l'échec d'une intervention jamais réellement administrée.
L'auto-ajustement du seuil, selon Pigott et al., punissait la réussite
Les seuils étaient ajustés automatiquement pour maintenir ~80 % de récompenses. Pigott et al. soutiennent qu'un enfant qui apprenait voyait son renforcement retiré, tandis qu'un enfant dont le signal se dégradait était récompensé — inversant le conditionnement opérant. (L'auto-ajustement est une pratique courante ; le débat, abordé plus bas, porte sur le fait que cette mise en œuvre précise neutralise l'apprentissage qu'elle mesure.) La démonstration interactive illustre la lecture de Pigott.
Une mesure déjà signalée comme peu fiable
Janssen et al. (2017) et Ogrim & Hestad (2013) avaient rapporté que le ratio thêta/bêta est « remarquablement stable » et ne bouge pas de façon fiable avec l'entraînement. Choisir une mesure que la littérature avait déjà jugée insensible, selon les critiques, garantit presque un résultat nul.
Techniciens non certifiés ; supervision sous le standard professionnel
Des auteurs interrogés pour la revue critique ont révélé que les techniciens manquaient des compétences de base en neurofeedback et que l'encadrement — visites annuelles plus appels hebdomadaires d'un seul expert — restait sous le standard professionnel de soin. Une intervention mal délivrée se lit comme une intervention qui ne marche pas.
Enfants médiqués et à double diagnostic laissés dans l'étude
Les psychostimulants altèrent les mesures EEG mêmes utilisées comme résultats. Inclure des participants médiqués et comorbides sans stratification injecte du bruit précisément là où le signal devait apparaître.
La récompense qui, selon Pigott, punissait l'apprentissage
Ceci rend la Critique 04 tangible. Appuyez sur le bouton : un enfant apprend réellement à augmenter le signal cérébral ciblé. Observez ce que fait l'auto-ajustement — selon la lecture de Pigott et al. — à l'instant précis où il réussit.
Le conditionnement opérant, inversé
Dans un neurofeedback tel qu'il devrait être, franchir le seuil donne une récompense et l'enfant apprend à s'y maintenir. Sous le protocole décrit par Pigott et al., chaque fois que le signal monte, le seuil est relevé pour garder ~80 % de récompenses — dès que l'apprentissage se manifeste, on le lui retire.
Une conclusion prétendument exigée avant publication
Un auteur a décrit une communication clandestine entre les auteurs de l'étude et un éditeur de la revue, indiquant que JAACAP ne publierait l'étude que si sa conclusion affirmait que le neurofeedback n'était pas meilleur qu'un placebo — après quoi, rapporte la critique, le manuscrit a été modifié pour s'y conformer.— Schummer & Sguigna (2024), rapportant un récit unique et non corroboré d'un seul auteur (le co-auteur Schummer siégeait au comité l'ayant reçu)
Je veux être précis : il s'agit d'un récit unique et non corroboré, rapporté par un critique qui n'est pas une partie neutre, nommant « un éditeur » au singulier. C'est une allégation, pas un fait établi, et je la présente comme telle. Mais si elle est vraie, c'est la clé de voûte — cela signifierait que le verdict fut décidé avant la rédaction des données, et que les problèmes méthodologiques ci-dessus ne sont pas des accidents mais le mécanisme qui l'a livré.
À qui profite l'« échec » du neurofeedback ?
Le neurofeedback concurrence le médicament psychostimulant. Selon leurs propres déclarations publiées, deux des personnes ayant façonné la portée de cette étude sont liées aux fabricants de cette gamme concurrente.
Selon les déclarations citées dans la critique : Arnold a reçu des financements de recherche de Shire (devenu Takeda, fabricant d'un stimulant TDAH de premier plan), Supernus, Otsuka, Roche/Genentech et Young Living, et a siégé aux conseils consultatifs de six laboratoires. Il a dirigé auparavant l'étude NIMH MTA (17,7 M$), dont les suivis furent critiqués pour minimiser la baisse d'efficacité des stimulants. L'éditorial cinglant de l'American Journal of Psychiatry qui a amplifié cet essai — « Neurofeedback pour le TDAH : l'heure d'arrêter ? » — fut signé par James McGough, qui, selon la critique, siégeait au conseil de Sunovion et conseillait Eli Lilly, Takeda et Tris Pharma. Un conflit déclaré n'invalide pas en soi une recherche — mais, à mon avis, il fixe l'a priori sur la direction probable des « erreurs ».
Les meilleures objections — et pourquoi elles ne me convainquent pas
Une opinion signée vous doit les contre-arguments. Voici les meilleures défenses de l'essai, et ma réponse honnête à chacune.
« Le biofeedback EMG est un placebo standard et légitime pour le neurofeedback. »
« L'auto-ajustement du seuil est courant — ce n'est pas du sabotage. »
« C'est un grand essai randomisé en double aveugle, financé par le NIH — cela bat l'anecdote clinique. »
« Vous vendez du neurofeedback — évidemment que vous diriez cela. »
Une étude contestée aux conséquences bien réelles
Un article défaillant est une note de bas de page. Un article défaillant devenu politique de santé est un préjudice — et il atteint non une étude, mais chaque clinicien et chaque famille qui s'appuient sur ce domaine.
Cité par des assureurs pour refuser le remboursement du neurofeedback — transformant un résultat contesté en mur de couverture pour les familles.
Amplifié par l'éditorial 2022 de McGough dans l'AJP, « L'heure d'arrêter ? » — par un auteur aux liens déclarés avec l'industrie des stimulants.
Aucun auteur d'origine n'a demandé de rétractation. JAACAP a refusé la lettre documentant les critiques, la jugeant non conforme à ses standards.
L'essai n'a pas prouvé l'échec du neurofeedback. Il a prouvé le sien.
Voici la lecture étroite et honnête que je défends : un essai au contrôle actif, à la mesure insensible, au schéma de récompense peut-être inversé, et à l'hypothèse reformulée après coup, était structurellement incapable de tester ce qu'il prétendait tester. La conclusion la plus forte que ses données soutiennent n'est pas « le neurofeedback a échoué ». C'est « cette étude ne peut pas le dire ». Qu'une étude aussi faible serve à exclure tout un domaine du remboursement n'est pas, à mon avis, un accident de la science. C'est du doute fabriqué, faisant exactement ce pour quoi il a été construit.