paint-brush
민감한 데이터가 의료 AI 모델의 공정성과 정확성에 미치는 영향~에 의해@demographic

민감한 데이터가 의료 AI 모델의 공정성과 정확성에 미치는 영향

~에 의해 Demographic3m2024/12/30
Read on Terminal Reader

너무 오래; 읽다

이 섹션에서는 흉부 방사선 촬영에서 민감한 속성을 사용하는 4가지 AI 모델을 비교하여, 양의 합 공정성에 초점을 맞춰 공정성과 성능에 미치는 효과를 보여줍니다.
featured image - 민감한 데이터가 의료 AI 모델의 공정성과 정확성에 미치는 영향
Demographic HackerNoon profile picture
0-item

링크 표

  1. 초록 및 소개

  2. 관련 작업

  3. 행동 양식

    3.1 양의 합 공정성

    3.2 응용 프로그램

  4. 실험

    4.1 초기 결과

    4.2 양의 합 공정성

  5. 결론 및 참고문헌

3.2 응용 프로그램

이 공정성 개념을 실제로 적용하고 전통적인 그룹 공정성과의 차이점을 보여주기 위해 민감한 속성을 사용하는 세 가지 모델을 기준 모델과 비교합니다. 모델에서 민감한 속성을 사용하는 방식은 모델의 공정성과 성능에 영향을 미치는 것으로 알려져 있습니다[3,39,41,11]. 따라서 우리는 민감한 속성을 명시적으로 포함하는 모델을 사용하거나 반대로 입력 데이터에서 모든 인구 통계적 인코딩을 제거합니다.


4개의 모델은 흉부 방사선 촬영(CXR)에서 발견된 다중 레이블 분류 문제에 대해 훈련되었습니다. 모든 설정에서 Densenet-121[13] 백본이 사용되었으며, 이는 이 문제에 대해 최상의 성능을 제공하는 것으로 경험적으로 확인되었습니다. 정확한 모델 아키텍처는 그림 2에 표시되어 있으며 아래에 설명되어 있습니다.


M1 : 이미지를 입력으로 사용하고 데이터 세트와 관련된 타겟 CXR 결과를 예측하도록 훈련된 기준 분류기. 이 모델은 이미지 피처를 추출하는 백본과 각 결과에 대한 완전 연결 레이어와 이진 교차 엔트로피 손실로 구성된 결과 분기로 구성됩니다.


M2 : 이미지와 인종 특징을 모두 입력으로 사용하는 분류기. 인종 정보는 범주형 변수 형태로 제공되며, 이를 원핫 벡터로 변환하여 완전 연결 계층에 공급합니다. 분기를 찾기 위해 전달하기 전에 완전 연결 계층의 특징과 이미지 특징을 연결합니다. 모델은 종단 간 학습됩니다.


M3 : 이미지를 입력으로만 사용하지만 이미지 결과와 인종 그룹을 예측하도록 훈련된 분류기(즉, 이 모델은 이미지에 있는 인종 인코딩을 활용하는 것을 목표로 함). 이 모델의 경우, 두 가지 작업, 즉 CXR 결과와 인종 그룹을 최적화하기 위해 손실 함수를 조정하여 기준 분류기의 최종 계층을 수정합니다. 또한 인종 정보를 원핫 인코딩된 벡터로 변환하여 다중 클래스 손실을 적용합니다. 인종 분류 분기는 완전 연결 계층과 교차 엔트로피 손실 함수로 구성됩니다. 최종 손실은 결과 손실과 인종 손실을 손실 가중치 λ와 함께 추가하여 계산합니다.



M4 : 이미지를 입력으로 사용하는 분류기로, 이미지에 인코딩된 레이스 정보 사용을 최소화하면서 이미지 결과를 예측하도록 훈련되었습니다. 이 모델의 경우 [28]에 설명된 그래디언트 반전 기술을 구현합니다. 레이스 분기 전에 그래디언트 반전 레이어를 적용합니다.


그림 2: 민감한 속성이 성능과 공정성에 미치는 영향을 조사하기 위해 M1, M2, M3 및 M4로 표시된 네 가지 다른 모델 아키텍처를 평가합니다. 기준선인 M1에는 백본과 분류가 있습니다. M2에는 메타데이터에서 직접 레이스 인코딩된 피처를 학습하는 레이스 인코딩 분기가 있습니다. M3 및 M4에는 이미지 피처에서 이미지에 암묵적으로 인코딩된 레이스 그룹을 예측하는 추가 레이스 분기가 있습니다. M3과 M4의 차이점은 레이스 분기 전에 그래디언트 반전 레이어를 추가한다는 것입니다.


저자:

(1) Samia Belhadj∗, Lunit Inc., 서울, 대한민국 (samia.belhadj@lunit.io);

(2) 박상욱 [0009 −0005 −0538 −5522]*, Lunit Inc., 대한민국 서울 (tony.superb@lunit.io);

(3) Ambika Seth, Lunit Inc., 서울, 대한민국 (ambika.seth@lunit.io);

(4) Hesham Dar [0009 −0003 −6458 −2097], Lunit Inc., 서울, 대한민국 (heshamdar@lunit.io);

(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., 대한민국 서울 (tkooi@lunit.io).


이 논문은 CC BY-NC-SA 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다 .