Una investigació comprova que la IA no millora els diagnòstics mèdics, però pot ser un bon complement dajuda
A l'estudi, realitzat pel doctor Andrew S. Parsons i els seus col·legues, 50 metges de medicina de família, medicina interna i medicina d'urgències van posar a prova Xat GPT Plus
Els hospitals van incorporant la intel·ligència artificial als procediments amb la intenció de millorar l'atenció al pacient. Ara, un nou estudi ha estudiat si aquesta nova eina afavoreix un diagnòstic mèdic millor.
La investigació, realitzada pel sistema sanitari de la Universitat de Virginia (Estats Units) i publicada a la revista 'JAMA Network Open', ha descobert que l'ús de Xat GPT Plus no millora significativament la precisió dels diagnòstics dels metges en comparació amb lús dels recursos habituals.
A l'estudi, realitzat pel doctor Andrew S. Parsons i els seus col·legues, 50 metges de medicina de família, medicina interna i medicina d'urgències van posar a prova Xat GPT Plus. A la meitat se li va assignar aleatòriament l'ús de Xat GPT Plus per diagnosticar casos complexos, mentre que l'altra meitat va recórrer a mètodes convencionals com ara els llocs de referència mèdica i Google.
Els investigadors van comparar els diagnòstics resultants i van comprovar que la precisió dels dos grups era similar. No obstant això, Chat GPT va superar per si sola els dos grups, cosa que suggereix que segueix sent prometedora per millorar l'atenció al pacient. Tot i això, els investigadors conclouen que els metges necessitaran més formació i experiència amb aquesta tecnologia emergent per aprofitar tot el seu potencial.
Ara com ara, els investigadors afirmen que Chat GPT s'utilitza millor com a complement que com a substitut dels metges.
"El nostre estudi demostra que la IA per si sola pot ser una eina eficaç i potent per al diagnòstic --afirma Parsons, que supervisa l'ensenyament d'habilitats clíniques als estudiants de medicina de la Facultat de Medicina de la Universitat de Virgínia i codirigeix la Clinical Reasoning Research Collaborative--. Ens va sorprendre descobrir que afegir un metge a la barreja reduïa la precisió del diagnòstic, encara que millorava l'eficàcia. resultats probablement signifiquen que necessitem formació formal sobre la millor manera dutilitzar la IA".
Els chatbots anomenats 'grans models lingüístics' que produeixen respostes similars a les humanes estan guanyant popularitat, i han demostrat una capacitat impressionant per prendre historials de pacients, comunicar-se amb empatia i fins i tot resoldre casos mèdics complexos però, per ara, segueixen necessitant la intervenció de un metge humà.
Parsons i els seus col·legues desitjaven determinar com es pot utilitzar l'eina d'alta tecnologia de la forma més eficaç, així que van posar en marxa un assaig aleatoritzat i controlat en tres hospitals capdavanters: UVA Health, Stanford i el Centre Mèdic Beth Israel Deaconess de Harvard .
Els metges participants van realitzar diagnòstics per a 'vinyetes clíniques' basades en casos reals d'atenció a pacients. Aquests estudis de casos incloïen detalls sobre els historials dels pacients, exàmens físics i resultats de proves de laboratori. A continuació, els investigadors van puntuar els resultats i van examinar la rapidesa amb què els dos grups feien els seus diagnòstics.
La precisió diagnòstica mitjana dels metges que van utilitzar Xat GPT Plus va ser del 76,3%, mentre que la dels que van utilitzar mètodes convencionals va ser del 73,7%. Els membres del grup de Xat GPT van arribar als seus diagnòstics lleugerament més ràpid a general: 519 segons davant de 565 segons.
Als investigadors els va sorprendre que bé que va funcionar Chat GPT Plus, amb una precisió diagnòstica mitjana superior al 92%. Afirmen que això pot ser degut a les indicacions utilitzades a l'estudi, cosa que suggereix que els metges probablement es beneficiaran de la formació sobre com utilitzar les indicacions de forma eficaç.
Com a alternativa, afirmen, les organitzacions sanitàries podrien adquirir instruccions predefinides per implementar-les al flux de treball clínic i la documentació.
Els investigadors també adverteixen que Xat GPT Plus probablement funcionaria pitjor a la vida real, on entren en joc molts altres aspectes del raonament clínic, sobretot a l'hora de determinar els efectes posteriors dels diagnòstics i les decisions de tractament.
Per tot això, insten a fer estudis addicionals per avaluar les capacitats dels grans models lingüístics en aquestes àrees i estan duent a terme un estudi semblant sobre la presa de decisions de gestió.
"A mesura que la IA s'integra més en l'assistència sanitària, és essencial entendre com podem aprofitar aquestes eines per millorar l'atenció al pacient i l'experiència del metge --indica Parsons--. Aquest estudi suggereix que hi ha molta feina a fer a termes d'optimitzar la nostra associació amb la IA a l'entorn clínic".
Escriu el teu comentari