paint-brush
Si ndikojnë të dhënat e ndjeshme në drejtësinë dhe saktësinë në modelet mjekësore të AInga@demographic

Si ndikojnë të dhënat e ndjeshme në drejtësinë dhe saktësinë në modelet mjekësore të AI

nga Demographic3m2024/12/30
Read on Terminal Reader

Shume gjate; Te lexosh

Ky seksion krahason katër modele të AI duke përdorur atribute të ndjeshme në radiografinë e gjoksit, duke demonstruar efektet në drejtësi dhe performancë, me fokus në drejtësinë e shumës pozitive.
featured image - Si ndikojnë të dhënat e ndjeshme në drejtësinë dhe saktësinë në modelet mjekësore të AI
Demographic HackerNoon profile picture
0-item

Tabela e lidhjeve

  1. Abstrakt dhe hyrje

  2. Puna e lidhur

  3. Metodat

    3.1 Drejtësia e shumës pozitive

    3.2 Aplikimi

  4. Eksperimentet

    4.1 Rezultatet fillestare

    4.2 Drejtësia e shumës pozitive

  5. Konkluzioni dhe Referencat

3.2 Aplikimi

Për të vënë në praktikë këtë nocion të drejtësisë dhe për të treguar ndryshimin me drejtësinë tradicionale të grupit, ne krahasojmë tre modele që përdorin atribute të ndjeshme për një model bazë. Mënyra se si përdoren atributet e ndjeshme nga modeli dihet se ka një ndikim në drejtësinë dhe performancën e modelit [3,39,41,11]. Prandaj, ne përdorim modele që përfshijnë në mënyrë eksplicite atribute të ndjeshme, ose anasjelltas, heqim çdo kodim demografik nga të dhënat hyrëse.


Të katër modelet janë trajnuar për një problem klasifikimi me shumë etiketa të gjetjeve në radiografinë e gjoksit (CXR). Në të gjitha cilësimet, përdoret një shtyllë Densenet-121 [13], e cila u përcaktua në mënyrë empirike për të dhënë performancën më të mirë për këtë problem. Arkitekturat e sakta të modelit janë paraqitur në figurën 2 dhe përshkruhen më poshtë:


M1 : një klasifikues bazë që përdor imazhet si hyrje dhe i trajnuar për të parashikuar gjetjet e synuara CXR të lidhura me grupin tonë të të dhënave. Modeli përfshin një shtyllë kurrizore për nxjerrjen e veçorive të imazhit dhe një degë gjetjeje të përbërë nga një shtresë plotësisht e lidhur dhe një humbje binare e entropisë së kryqëzuar për çdo gjetje.


M2 : një klasifikues që përdor si hyrje imazhet ashtu edhe veçoritë e garës. Informacioni i garës vjen në formën e një ndryshoreje kategorike, të cilën e konvertojmë në një vektor të vetëm dhe e ushqejmë në një shtresë plotësisht të lidhur. Ne bashkojmë veçoritë nga shtresa plotësisht e lidhur dhe veçoritë e imazhit përpara se t'i përcjellim në gjetjen e degës. Modeli është trajnuar nga fundi në fund.


M3 : një klasifikues që përdor imazhet vetëm si hyrje, por i trajnuar për të parashikuar gjetjet e imazheve si dhe grupin e racës (dmth. ky model synon të shfrytëzojë kodimet e racës të pranishme në imazhe). Për këtë model, ne modifikojmë shtresën përfundimtare të klasifikuesit bazë duke përshtatur funksionin e humbjes për të optimizuar dy detyrat: gjetjet CXR dhe grupi i garës. Ne gjithashtu e transformojmë informacionin e garës në vektor të koduar një-hot për të aplikuar humbjen me shumë klasa. Dega e klasifikimit të garës përbëhet nga një shtresë plotësisht e lidhur dhe një funksion i humbjes së entropisë së kryqëzuar. Humbja përfundimtare llogaritet duke shtuar humbjen e gjetjes dhe humbjen e garës me një humbje peshe λ.



M4 : një klasifikues që përdor imazhet si hyrje, i trajnuar për të parashikuar gjetjet e imazhit, duke minimizuar përdorimin e informacionit të racës të koduar në imazh. Për këtë model, ne zbatojmë teknikën e kthimit të gradientit të përshkruar në [28]. Aplikojmë shtresën e kthimit të gradientit përpara degës së garës.


Fig. 2: Për të hetuar efektin e atributeve të ndjeshme në performancën dhe drejtësinë, ne vlerësojmë katër arkitektura modele të ndryshme, të shënuara M1, M2, M3 dhe M4. M1, vija bazë, ka një shtyllë dhe klasifikim. M2 ka një degë të kodimit të garës për të mësuar veçoritë e koduara nga raca direkt nga meta të dhënat. M3 dhe M4 kanë një degë shtesë gare për të parashikuar grupin e garës i cili është i koduar në mënyrë implicite në imazh, nga veçoritë e imazhit. Dallimi midis M3 dhe M4 është se ne shtojmë një shtresë kthimi të gradientit përpara degës së garës.


Autorët:

(1) Samia Belhadj∗, Lunit Inc., Seul, Republika e Koresë (samia.belhadj@lunit.io);

(2) Parku Sanguk [0009 −0005 −0538 −5522]*, Lunit Inc., Seul, Republika e Koresë (tony.superb@lunit.io);

(3) Ambika Seth, Lunit Inc., Seul, Republika e Koresë (ambika.seth@lunit.io);

(4) Hesham Dar [0009 −0003 −6458 −2097], Lunit Inc., Seul, Republika e Koresë (heshamdar@lunit.io);

(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., Seul, Republika e Koresë (tkooi@lunit.io).


Ky dokument është i disponueshëm në arxiv nën licencën CC BY-NC-SA 4.0.