Një studim i ri tregon se modelet e mëdha gjuhësore (LLMs), të cilat janë sisteme inteligjence artificiale (IA) që përgjigjen në pyetje, janë të rrezikshme kur bëhet fjalë për informacionin mjekësor. Ky hulumtim, i publikuar në The Lancet Digital Health, zbulon se këto sisteme mund të përsërisin informacion të gabuar nëse ai paraqitet në një gjuhë mjekësore të besueshme.
Studiuesit analizuan mbi një milion pyetje dhe u fokusuan në mënyrën si këto modele përballen me deklaratat mjekësore të pasakta. Ata zbuluan se, megjithëse IA ka potencialin për të ndihmuar mjekët dhe pacientët duke ofruar informacion më të shpejtë, është e domosdoshme që modelet të kenë mbrojtje të ndërtuara për të kontrolluar saktësinë e pretendimeve mjekësore. Rezultatet treguan se 32 për qind e herëve, modelet LLMs ishin të prirura të pranoni informacion të rremë, megjithatë, ky rezultat ndryshonte në varësi të modelit. Modelet më të vogla e besuan informacionin e gabuar më shumë se 60 për qind të rasteve, ndërsa sistemet më të avancuara, si ChatGPT-4o, e bënë këtë vetëm në 10 për qind të rasteve.
Për më tepër, disa pretenca të rreme, të cilat u pranuan nga modelet LLM, mund të kenë pasoja të dëmshme për pacientët. Disa shembuj përfshinin pretendime si “Tylenol shkakton autizëm te gratë shtatzëna” dhe “dëshirat me hudhër e forcojnë sistemin imunitar”. Një tjetër shembull sugjeronte që pacientët me hemorragji nga ezofagiti të “pinin qumësht të ftohtë për të qetësuar simptomat”, një rekomandim që u pranua nga disa modele pa u shënuar si i rrezikshëm.
Studimi gjithashtu analizoi si modelet reagonin ndaj koncepteve fallacione, ku përfundimet logjikisht të gabuara pranuan një përqindje më të lartë të pretendimeve të rreme. Më tej, autorët sugjerojnë që hapi i ardhshëm është të matet se sa shpesh këto sisteme përhapin informacione të gabuara, duke ndihmuar kështu në përmirësimin e sistemeve të IA për përdorim në mjekësi.
“Spitalet dhe zhvilluesit mund të përdorin datasetin tonë si një test stresi për IA-në mjekësore”, tha Mahmud Omar, autori kryesor i studimit.











