paint-brush
کس طرح حساس ڈیٹا میڈیکل AI ماڈلز میں منصفانہ اور درستگی کو متاثر کرتا ہے۔کی طرف سے@demographic

کس طرح حساس ڈیٹا میڈیکل AI ماڈلز میں منصفانہ اور درستگی کو متاثر کرتا ہے۔

کی طرف سے Demographic3m2024/12/30
Read on Terminal Reader

بہت لمبا؛ پڑھنے کے لئے

یہ سیکشن سینے کی ریڈیو گرافی میں حساس صفات کا استعمال کرتے ہوئے چار AI ماڈلز کا موازنہ کرتا ہے، جس میں منصفانہ اور کارکردگی پر اثرات کو ظاہر کیا جاتا ہے، جس میں مثبت رقم کی انصاف پر توجہ دی جاتی ہے۔
featured image - کس طرح حساس ڈیٹا میڈیکل AI ماڈلز میں منصفانہ اور درستگی کو متاثر کرتا ہے۔
Demographic HackerNoon profile picture
0-item

لنکس کی میز

  1. خلاصہ اور تعارف

  2. متعلقہ کام

  3. طریقے

    3.1 مثبت رقم کی انصاف پسندی۔

    3.2 درخواست

  4. تجربات

    4.1 ابتدائی نتائج

    4.2 مثبت رقم کا انصاف

  5. نتیجہ اور حوالہ جات

3.2 درخواست

اس منصفانہ تصور کو عملی جامہ پہنانے اور روایتی گروپ کی انصاف پسندی کے ساتھ فرق ظاہر کرنے کے لیے، ہم تین ماڈلز کا موازنہ کرتے ہیں جو ایک بنیادی ماڈل سے حساس صفات کا استعمال کرتے ہیں۔ ماڈل کے ذریعہ جس طرح سے حساس صفات کا استعمال کیا جاتا ہے اس کا ماڈل کی منصفانہ اور کارکردگی پر اثر پڑتا ہے [3,39,41,11]۔ لہذا، ہم ایسے ماڈلز کا استعمال کرتے ہیں جن میں واضح طور پر حساس صفات شامل ہوں، یا اس کے برعکس، ان پٹ ڈیٹا سے کسی بھی ڈیموگرافک انکوڈنگ کو ہٹا دیں۔


چاروں ماڈلز کو سینے کی ریڈیوگرافی (CXR) میں نتائج کے ملٹی لیبل درجہ بندی کے مسئلے پر تربیت دی جاتی ہے۔ تمام ترتیبات میں، Densenet-121 [13] بیک بون استعمال کیا جاتا ہے، جو تجرباتی طور پر اس مسئلے کے لیے بہترین کارکردگی دینے کے لیے پرعزم تھا۔ عین مطابق ماڈل کے فن تعمیر کو شکل 2 میں دکھایا گیا ہے اور ذیل میں بیان کیا گیا ہے:


M1 : ایک بنیادی درجہ بندی کرنے والا جو امیجز کو بطور ان پٹ استعمال کرتا ہے اور ہمارے ڈیٹاسیٹ سے وابستہ ہدف شدہ CXR نتائج کی پیش گوئی کرنے کے لیے تربیت یافتہ ہے۔ ماڈل میں تصویر کی خصوصیات کو نکالنے کے لیے ایک ریڑھ کی ہڈی اور ایک فائنڈنگ برانچ پر مشتمل ہے جس میں مکمل طور پر جڑی ہوئی پرت اور ہر تلاش کے لیے بائنری کراس اینٹروپی نقصان شامل ہے۔


M2 : ایک درجہ بندی کرنے والا جو تصاویر اور ریس کی خصوصیات دونوں کو بطور ان پٹ استعمال کرتا ہے۔ ریس کی معلومات ایک واضح متغیر کی شکل میں آتی ہے، جسے ہم ایک گرم ویکٹر میں تبدیل کرتے ہیں اور مکمل طور پر منسلک پرت میں فیڈ کرتے ہیں۔ ہم برانچ تلاش کرنے کے لیے آگے بھیجنے سے پہلے مکمل طور پر منسلک پرت سے خصوصیات اور تصویری خصوصیات کو جوڑتے ہیں۔ ماڈل آخر سے آخر تک تربیت یافتہ ہے۔


M3 : ایک درجہ بندی کرنے والا جو تصاویر کو صرف ان پٹ کے طور پر استعمال کرتا ہے، لیکن تصویری نتائج کے ساتھ ساتھ ریس گروپ کی پیشین گوئی کرنے کے لیے تربیت یافتہ ہے (یعنی اس ماڈل کا مقصد تصاویر میں موجود ریس انکوڈنگز کا فائدہ اٹھانا ہے)۔ اس ماڈل کے لیے، ہم دو کاموں کو بہتر بنانے کے لیے نقصان کے فنکشن کو ڈھال کر بیس لائن کلاسیفائر کی آخری پرت میں ترمیم کرتے ہیں: CXR فائنڈنگز اور ریس گروپ۔ ہم کثیر طبقے کے نقصان کو لاگو کرنے کے لیے ریس کی معلومات کو ایک گرم انکوڈ شدہ ویکٹر میں بھی تبدیل کرتے ہیں۔ ریس کی درجہ بندی کی شاخ مکمل طور پر منسلک پرت اور کراس اینٹروپی نقصان کے فنکشن سے بنی ہے۔ حتمی نقصان کا حساب کھوجنے والے نقصان اور دوڑ کے نقصان کو کم وزن کے ساتھ شامل کرکے لگایا جاتا ہے۔



M4 : تصویروں کو بطور ان پٹ استعمال کرنے والا ایک درجہ بندی کرنے والا، تصویری نتائج کی پیشین گوئی کرنے کے لیے تربیت یافتہ، جبکہ تصویر میں انکوڈ شدہ نسل کی معلومات کے استعمال کو کم سے کم کرتا ہے۔ اس ماڈل کے لیے، ہم [28] میں بیان کردہ تدریجی تبدیلی کی تکنیک کو نافذ کرتے ہیں۔ ہم ریس برانچ سے پہلے گریڈینٹ ریورسل پرت کا اطلاق کرتے ہیں۔


تصویر 2: کارکردگی اور انصاف پسندی پر حساس صفات کے اثر کی چھان بین کرنے کے لیے، ہم چار مختلف ماڈل آرکیٹیکچرز کا جائزہ لیتے ہیں، جن کی نشاندہی M1، M2، M3 اور M4 ہے۔ M1، بیس لائن میں ریڑھ کی ہڈی اور درجہ بندی ہے۔ M2 میں ریس انکوڈنگ کی شاخ ہے تاکہ ریس انکوڈ شدہ خصوصیات کو براہ راست میٹا ڈیٹا سے سیکھ سکیں۔ M3 اور M4 کے پاس ریس گروپ کی پیشین گوئی کرنے کے لیے ایک اضافی ریس برانچ ہے جو تصویر میں واضح طور پر انکوڈ شدہ ہے، تصویر کی خصوصیات سے۔ M3 اور M4 کے درمیان فرق یہ ہے کہ ہم ریس برانچ سے پہلے ایک گراڈینٹ ریورسل لیئر شامل کرتے ہیں۔


مصنفین:

(1) Samia Belhadj∗, Lunit Inc., Seoul, Republic of Korea (samia.belhadj@lunit.io)؛

(2) سنگوک پارک [0009 −0005 −0538 −5522]*, Lunit Inc., Seoul, Republic of Korea (tony.superb@lunit.io)؛

(3) امبیکا سیٹھ، لونٹ انکارپوریٹڈ، سیول، جمہوریہ کوریا (ambika.seth@lunit.io)؛

(4) ہشام ڈار [0009 −0003 −6458 −2097], Lunit Inc., Seoul, Republic of Korea (heshamdar@lunit.io)؛

(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., Seoul, Republic of Korea (tkooi@lunit.io)۔


یہ کاغذ CC BY-NC-SA 4.0 لائسنس کے تحت arxiv پر دستیاب ہے۔