이 공정성 개념을 실제로 적용하고 전통적인 그룹 공정성과의 차이점을 보여주기 위해 민감한 속성을 사용하는 세 가지 모델을 기준 모델과 비교합니다. 모델에서 민감한 속성을 사용하는 방식은 모델의 공정성과 성능에 영향을 미치는 것으로 알려져 있습니다[3,39,41,11]. 따라서 우리는 민감한 속성을 명시적으로 포함하는 모델을 사용하거나 반대로 입력 데이터에서 모든 인구 통계적 인코딩을 제거합니다.
4개의 모델은 흉부 방사선 촬영(CXR)에서 발견된 다중 레이블 분류 문제에 대해 훈련되었습니다. 모든 설정에서 Densenet-121[13] 백본이 사용되었으며, 이는 이 문제에 대해 최상의 성능을 제공하는 것으로 경험적으로 확인되었습니다. 정확한 모델 아키텍처는 그림 2에 표시되어 있으며 아래에 설명되어 있습니다.
– M1 : 이미지를 입력으로 사용하고 데이터 세트와 관련된 타겟 CXR 결과를 예측하도록 훈련된 기준 분류기. 이 모델은 이미지 피처를 추출하는 백본과 각 결과에 대한 완전 연결 레이어와 이진 교차 엔트로피 손실로 구성된 결과 분기로 구성됩니다.
– M2 : 이미지와 인종 특징을 모두 입력으로 사용하는 분류기. 인종 정보는 범주형 변수 형태로 제공되며, 이를 원핫 벡터로 변환하여 완전 연결 계층에 공급합니다. 분기를 찾기 위해 전달하기 전에 완전 연결 계층의 특징과 이미지 특징을 연결합니다. 모델은 종단 간 학습됩니다.
– M3 : 이미지를 입력으로만 사용하지만 이미지 결과와 인종 그룹을 예측하도록 훈련된 분류기(즉, 이 모델은 이미지에 있는 인종 인코딩을 활용하는 것을 목표로 함). 이 모델의 경우, 두 가지 작업, 즉 CXR 결과와 인종 그룹을 최적화하기 위해 손실 함수를 조정하여 기준 분류기의 최종 계층을 수정합니다. 또한 인종 정보를 원핫 인코딩된 벡터로 변환하여 다중 클래스 손실을 적용합니다. 인종 분류 분기는 완전 연결 계층과 교차 엔트로피 손실 함수로 구성됩니다. 최종 손실은 결과 손실과 인종 손실을 손실 가중치 λ와 함께 추가하여 계산합니다.
– M4 : 이미지를 입력으로 사용하는 분류기로, 이미지에 인코딩된 레이스 정보 사용을 최소화하면서 이미지 결과를 예측하도록 훈련되었습니다. 이 모델의 경우 [28]에 설명된 그래디언트 반전 기술을 구현합니다. 레이스 분기 전에 그래디언트 반전 레이어를 적용합니다.
저자:
(1) Samia Belhadj∗, Lunit Inc., 서울, 대한민국 (samia.belhadj@lunit.io);
(2) 박상욱 [0009 −0005 −0538 −5522]*, Lunit Inc., 대한민국 서울 (tony.superb@lunit.io);
(3) Ambika Seth, Lunit Inc., 서울, 대한민국 (ambika.seth@lunit.io);
(4) Hesham Dar [0009 −0003 −6458 −2097], Lunit Inc., 서울, 대한민국 (heshamdar@lunit.io);
(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., 대한민국 서울 (tkooi@lunit.io).
이 논문은 CC BY-NC-SA 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다 .