[mjkwon] Lung Pattern Classification for Interstitial Lung Diseases Using a Deep Convolutional Neural Network

논문작성일: 2016.05

논문 리뷰일: 2025.03.08

Abstract

이 논문은 간질성 폐질환(ILDs)의 자동 조직 특성화를 위한 심층 신경망 기반 접근법을 제안하고 평가합니다. 연구에서는 ILD 패턴을 분류하기 위해 5개의 합성곱 층과 LeakyReLU 활성화 함수를 포함하는 CNN(Convolutional Neural Network)을 설계하였습니다. 네트워크의 최종 출력층은 7개의 클래스를 포함하며, 정상 조직, 간유리 혼탁(GGO), 미세결절, 침윤음영(consolidation), 망상(reticulation), 벌집(honeycombing), 그리고 GGO/망상의 조합을 분류하도록 설계되었습니다.

모델의 학습과 검증을 위해 120개의 CT 스캔에서 추출된 14,696개의 이미지 패치를 사용하였으며, 다양한 병원과 스캐너에서 수집된 데이터를 활용하여 신뢰성을 높였습니다. 실험 결과, 제안된 CNN 모델이 기존 방법들보다 우수한 성능을 보였으며, ILD 패턴 분석에서 CNN의 가능성을 입증하였습니다. 향후 연구 방향으로는 3차원 CT 볼륨 데이터를 활용한 확장과 CAD(Computer-Aided Diagnosis) 시스템에 모델을 통합하여 방사선과 전문의의 진단을 보조하는 도구로 활용하는 방안을 제시하고 있습니다.

Introduction

이 논문에서는 간질성 폐질환(ILDs)의 정의와 진단 과정, 그리고 컴퓨터 보조 진단(CAD) 시스템의 필요성에 대해 설명합니다. ILD는 200개 이상의 만성 폐질환을 포함하는 질환군으로, 폐 조직의 염증과 섬유화(fibrosis)를 특징으로 합니다. 이러한 변화는 폐의 탄성을 감소시키고 산소 교환 기능을 저하시켜 결국 호흡 능력 상실로 이어질 수 있습니다. ILD의 원인은 자가면역 질환, 유전적 요인, 유해 물질 노출 등 다양하지만, 대부분의 경우 원인이 명확하지 않아 특발성 간질성 폐렴(IIP)으로 분류됩니다.

진단 과정에는 환자의 병력 조사, 신체검진, 폐 기능 검사, 흉부 X-ray 및 고해상도 컴퓨터단층촬영(HRCT)이 포함됩니다. 특히 HRCT는 폐 조직의 방사선 감쇠 특성을 정확히 분석할 수 있어 가장 적절한 영상 촬영 기법으로 간주됩니다. ILD의 대표적인 CT 영상 패턴으로는 망상(reticulation), 벌집(honeycombing), 간유리 혼탁(GGO), 침윤음영(consolidation), 미세결절(micronodules)이 있으며, 이러한 패턴을 기반으로 진단이 이루어집니다. 그러나 ILD는 병리학적으로 이질적인 특성을 가지면서도 서로 유사한 임상 증상을 보이는 경우가 많아 감별 진단이 어렵습니다. 또한 영상 판독 시 방사선과 전문의 간(혹은 동일 전문의의 반복 판독 간) 일관성이 낮으며, 진단 정확도가 50%에 불과하다는 보고도 있습니다.

이 논문에서는 기존의 ILD 패턴 분류 연구들을 정리한 후, CNN을 활용한 새로운 접근 방식을 제안합니다.

최근에는 딥러닝, 특히 CNN이 이미지 분류 분야에서 뛰어난 성과를 보이며 의료 영상 분석에도 적용되기 시작했습니다. CNN은 기존의 특징 학습 기법과 달리, 특징을 자동으로 학습하면서 동시에 분류기까지 최적화할 수 있다는 장점이 있습니다. 초기 연구에서는 비교적 단순한 CNN 구조를 사용하여 ILD 패턴을 분류하였으며, 일부 연구에서는 사전 학습된 대규모 CNN(AlexNet)을 폐 CT 영상에 적용하기도 했습니다. 그러나 일반적인 컬러 이미지와 의료 영상은 데이터 특성이 다르므로, 기존 CNN을 그대로 적용하는 것이 최적의 방법이 아닐 수 있습니다. 또한 단순히 전체 폐 단면을 분류하는 방식은 질환의 정밀한 분포를 파악하는 데 한계가 있습니다.

CNN(Convolutional Neural Networks)은 생물학적 시각 시스템에서 영감을 받아 설계된 인공신경망으로, 이미지의 픽셀 데이터를 직접 학습하여 특징을 추출하고 분류를 수행합니다. 주요 구성 요소로는 합성곱 층, 활성화 층, 풀링 층, 완전 연결 층이 있으며, 특히 가중치 공유와 국소 연결 방식을 통해 연산량을 줄이고 학습 효율을 높입니다. CNN의 학습은 경사 하강법과 역전파 알고리즘을 활용하여 수행됩니다.

최근에는 GPU 가속과 대규모 데이터셋 활용, ReLU 활성화 함수 등의 기술이 발전하면서 딥러닝 기반 CNN이 본격적으로 활용되기 시작했습니다. 2012년 ImageNet 대회에서 Krizhevsky 등이 제안한 AlexNet이 높은 성능을 보이며 딥러닝의 가능성을 입증하였습니다. 그러나 대부분의 연구가 컬러 이미지 분류에 집중되었으며, 텍스처 분석 및 의료 영상 분석에 대한 연구는 상대적으로 부족한 상황입니다.

본 연구에서는 ILD(간질성 폐질환) 패턴 분류를 위한 딥 CNN 모델을 제안하며, 120건의 환자 데이터를 활용한 실험을 통해 기존 방법보다 우수한 성능을 입증하였습니다. 또한, 의료 영상 및 텍스처 분석을 위한 CNN 설계 원칙을 제시하고 있습니다.

Methods

본 연구에서는 ILD(간질성 폐질환) 패턴 분류를 위한 CNN을 제안하며, 이를 위한 데이터셋을 구축하고 전처리 과정을 수행하였습니다. 연구에 사용된 데이터는 스위스의 두 대학병원에서 수집된 HRCT 스캔으로 구성됩니다.

첫 번째 데이터베이스는 제네바 대학병원의 공개 ILD 멀티미디어 데이터베이스로, 109개의 HRCT 스캔과 17개 폐 패턴의 수동 주석 데이터를 포함합니다. 두 번째 데이터베이스는 베른 대학병원에서 제공된 26개의 HRCT 스캔으로 구성됩니다. CT 스캐너의 해상도 차이를 보정하기 위해 모든 스캔을 0.4mm 픽셀 간격으로 리스케일하였으며, 영상 강도 값을 HU [-200, 200] 범위로 조정한 후 [0, 1]로 정규화하였습니다.

방사선 전문의들이 두 데이터베이스의 영상을 다시 주석하여 GGO, 망상음영(reticulation), 경화(consolidation), 미세결절(micronodules), 벌집양(honeycombing), GGO-망상 조합 및 정상 조직을 포함한 7개 클래스의 패턴을 정의하였습니다. 주석은 명확한 패턴을 중심으로 이루어졌으며, 기관지혈관 구조는 CAD 시스템에서 제거될 것으로 가정하고 배제하였습니다.

최종적으로 120개의 환자 사례에서 총 14,696개의 32×32 크기의 비중첩 이미지 패치를 추출하였으며, 클래스별 불균형을 보정하기 위해 데이터 증강 기법을 적용하였습니다. 데이터 증강 과정에서는 좌우 반전 및 회전 등의 15가지 변형을 활용하여 희귀 클래스의 학습 샘플 수인 5,008개에 맞추어 총 35,056개의 균형 잡힌 학습 패치를 생성하였습니다.

본 연구에서는 ILD(간질성 폐질환) 패턴 분류를 위해 CNN(합성곱 신경망)을 설계합니다. ILD 패턴은 컬러 이미지의 일반적인 물체와 달리 특정 방향성을 가지는 고수준 구조보다는 국소적인 질감(texture) 특성이 주요한 특징입니다. 따라서 CNN을 활용하여 질감 분석을 최적화하기 위해 몇 가지 핵심 요소를 고려합니다.

먼저 국소 구조를 보존하기 위해 합성곱 뉴런의 총 수용영역(receptive field)이 질감의 대표적인 지역적 구조보다 크지 않도록 합니다. 과도한 수용영역이 비질감적 정보를 학습하는 것을 방지하기 위해 이를 제한합니다. 또한 질감은 미세한 저수준(local) 특징들로 구성되므로 합성곱 층 사이에서 풀링을 수행하면 중요한 정보가 손실될 수 있습니다. 이는 풀링 연산이 이미지의 공간적 해상도를 낮추면서 일부 세부적인 정보를 축소하기 때문입니다. 따라서 풀링을 최소화하여 원본 정보를 최대한 유지합니다. 마지막으로 ILD 패턴은 회전 및 반전에 대해 유효한 특성을 유지하므로, 마지막 합성곱 층 이후 단일 풀링 연산을 수행하여 위치 변화에 대한 불변성을 확보합니다.

이는 풀링 연산이 이미지의 공간적 변환에 대한 불변성을 강화하는 역할을 하기 때문입니다. 풀링은 보통 이미지의 특정 부분에서 중요한 특징을 추출하고, 이를 요약하여 크기를 줄여주는 연산입니다. 특히, 평균 풀링(average pooling)은 이미지 내에서 특징들의 평균을 계산하여 지역적인 정보를 압축합니다. 이 과정에서 원본 이미지의 위치와 크기 변화에 대해 어느 정도의 불변성을 유지하게 됩니다. 이미지가 회전되거나 반전되더라도 풀링 연산을 통해 핵심적인 특징이 보존되기 때문에, 위치 변화에 강한 모델을 만들 수 있습니다. 따라서, 마지막 합성곱 층 이후 풀링을 적용하는 이유는, 이미지의 공간적 변화(Ex. 회전, 반전)로부터 발생할 수 있는 민감성을 줄여주고, 해당 특징들이 여전히 해당 클래스의 특징으로 인정될 수 있도록 만들기 위해서입니다. 이러한 과정은 특히 질감 분석처럼 국소적인 패턴을 인식해야 하는 작업에서 중요합니다.

네트워크 구조는 위의 원칙을 바탕으로 5개의 합성곱 층을 포함하는 CNN으로 설계합니다. 네트워크의 입력은 32×32 크기의 이미지 패치이며, 각 합성곱 층의 커널 크기는 2×2로 설정합니다. 이와 같은 작은 커널 크기는 VGG-Net에서 제안된 방식과 유사하며, 더 많은 비선형 활성화 함수를 포함할 수 있어 더 복잡한 패턴을 인식할 수 있게 되고 학습 효율성을 높입니다. 전체 수용영역은 6×6으로 유지하여 지역적 질감 특성만을 반영하도록 설계합니다. 각 합성곱 층의 커널 개수는 뉴런의 수용영역 크기에 비례하여 증가하며, 실험을 통해 적절한 파라미터 값을 결정합니다. 마지막 합성곱 층 이후에는 평균 풀링(average pooling)을 수행하여 특성 맵의 크기를 27로 축소합니다. 이후, 특징 벡터는 3개의 완전 연결(Dense) 층으로 전달되며, 각각의 크기는 512, 128, 7로 설정됩니다. 마지막 층에서는 7개의 출력 노드를 사용하여 ILD 패턴 7종류에 대한 확률을 예측하도록 합니다. 과적합 방지를 위해 각 완전 연결 층 앞에 드롭아웃(Dropout)을 적용합니다.

활성화 함수 선택은 학습 속도와 네트워크의 표현 능력에 중요한 영향을 미칩니다. 기존 연구에서 ReLU(Rectified Linear Unit)가 학습 속도를 크게 향상시키는 것이 확인되었으며, 본 연구에서도 이를 확인하였습니다. 그러나 ReLU는 음수 값을 완전히 차단하여 뉴런이 비활성화되는 문제(dead neurons)가 발생할 수 있습니다. 이를 보완하기 위해 LeakyReLU를 사용합니다. LeakyReLU는 음수 입력 값에도 작은 기울기를 부여하여 작은 값의 정보를 유지할 수 있도록 합니다. 이를 통해 네트워크의 수렴 속도를 향상시키고, 더 풍부한 특징 표현이 가능하도록 합니다.

LeakyReLU 활성화 함수는 "dying ReLU" 문제를 해결하기 위해 도입되었습니다. ReLU에서는 큰 기울기 업데이트 후 뉴런이 비활성화될 수 있는데, 이는 음수 입력 값을 완전히 차단하기 때문입니다. LeakyReLU는 이를 수정하여 음수 입력 값에 작은 기울기를 부여함으로써 뉴런이 완전히 비활성화되지 않도록 합니다. 원래는 매우 낮은 음수 기울기를 사용하는 것이 제안되었지만, 본 연구에서는 이 기울기를 0.3으로 증가시켜 성능을 크게 향상시켰습니다. 비슷한 연구 결과도 여러 차례 보고되었습니다. 매우 "leaky"한 ReLU는 합성곱 층에 적용될 경우 과적합에 더 강한 저항력을 보이는 것처럼 보이며, 이 현상에 대한 정확한 메커니즘은 추가 연구가 필요합니다. 완전 연결(Dense) 층에서는 첫 두 층에 표준 ReLU 활성화 함수를 사용하였습니다.

학습 방법

인공 신경망(ANN)의 학습은 두 가지 주요 요소로 구성됩니다: 손실 함수(또는 학습 목표)와 이 함수를 최소화하는 최적화 알고리즘입니다. 본 연구에서는 Adam 최적화 알고리즘을 사용하여 범주형 교차 엔트로피를 최소화하였습니다. 교차 엔트로피는 예측된 출력 분포(softmax 이후)와 실제 라벨 분포 사이의 차이를 측정합니다.

Adam 최적화 알고리즘은 1차 기울기 기반 알고리즘으로, 하위 차수 모멘트를 기반으로 가중치 업데이트를 적응적으로 수행하여 확률적 목표 함수 최적화를 지원합니다. Adam은 세 가지 주요 매개변수를 가지고 있습니다: 학습률, 기울기의 이동 평균과 기울기 제곱의 이동 평균에 대한 지수 감소율입니다. 실험 후, 이 매개변수들을 기본값으로 설정하였으며, 학습률은 0.001, 기울기와 기울기 제곱에 대한 감소율은 각각 0.9와 0.999로 설정하였습니다.

합성곱 층은 직교 행렬을 사용하여 초기화하고, 스케일링 인자는 1.1로 설정하였으며, 완전 연결 층은 균등 분포를 사용하여 초기화하고, 이 분포는 각 층의 입력 수에 비례하여 조정되었습니다. 가중치 업데이트는 미니 배치 방식으로 수행되었고, 배치 크기는 128로 설정하였습니다.

훈련은 네트워크가 검증 세트에서 성능 향상이 미미해질 때까지 진행됩니다. 이 횟수는 200 epochs로 설정하였으며, 모델 성능은 각 클래스별 평균 F-점수를 기준으로 평가하였습니다. 성능 향상은 0.5% 이상일 경우 의미 있는 개선으로 간주됩니다.

결과

1. Tuning of Hyper-Parameters: 표 II에서는 네트워크 아키텍처의 다양한 구성과 훈련 시간에 따른 분류 성능을 보여줍니다. 제안된 구성(굵게 표시된 부분)은 0.8547의 성능을 기록했습니다. 원래 제안된 파라미터로 LeakyReLU를 사용하면 성능이 약 5% 감소하며, 표준 ReLU를 사용하면 추가로 2%가 더 떨어졌습니다. 커널 크기를 3×3으로 늘리면 성능이 4% 떨어지고, 에폭 시간이 크게 증가했습니다. 큰 커널은 네트워크의 총 수용 영역을 11×11로 확장시켰고, 이는 고려된 질감의 특성에 비해 너무 커서 성능 저하를 초래했습니다. 커널 크기를 3×3으로 유지하고 이미지를 50% 크기만큼 해상도를 늘리면, 각 훈련 에폭 시간이 20% 이상 느려졌지만 제안된 성능에는 도달하지 못했습니다. 입력 이미지만 업샘플링하고 2×2 커널을 사용할 경우, 성능이 크게 떨어졌으며, 이는 상대적인 수용영역이 최적보다 작았기 때문입니다. 합성곱 층의 수를 변경했을 때, 최적의 아키텍처는 5-6개의 층을 가지며, 총 수용 영역은 6×6-7×7로 설정되었습니다. 본 연구에서는 성능의 소폭 향상을 선호하여 5개의 합성곱 층을 제안합니다. 커널 수에 대한 최적 값을 찾기 위해 실험한 결과, 커널 수 4 성능과 효율성 측면에서 최적의 선택으로 나타났습니다.

논문에서는 몇 가지 실험을 통해 각 합성곱 층에서 커널 수를 일정하게 유지했을 때의 효과를 연구했습니다. 첫 번째로, 제안된 구성의 에폭 시간과 일치하도록 17개의 커널을 선택한 결과, 성능이 약 1% 감소했습니다. 각 층에 36개의 커널을 사용할 경우, 성능은 제안된 방법과 비슷했지만 에폭 시간이 거의 3배 길어졌습니다. 이 실험은 합성곱 층에서 커널의 분포 선택이 기본적으로 효율성 문제에 해당하며, 충분한 수의 커널이 사용될 경우 시스템의 정확도에 큰 영향을 미치지 않음을 보여주었습니다.

풀링 층의 크기를 마지막 피처 맵의 100%에서 50% 또는 25%로 변경했을 때는 각각 성능이 6%와 9% 이상 감소했습니다. 피처 맵을 여러 개의 풀링 영역으로 나누면 이미지의 다양한 영역에서 다른 특징이 생성되어 CNN이 뒤집기나 회전과 같은 공간적 변환에 대해 높은 불변성을 가지지 않게 됩니다. 또 다른 실험에서는 평균 풀링 대신 최대 풀링을 사용했을 때 성능이 약 4% 떨어졌습니다. 최대 풀링은 대부분의 CNN에서 일반적으로 사용되며 수렴 속도가 빠르지만, 본 문제에서는 평균 풀링이 더 효과적이었습니다. 마지막으로, 드롭아웃 층을 제거했을 때 성능이 6% 이상 감소했으며, 이는 과적합의 효과로 보입니다.

Figure 4에서는 세 가지 최적화 알고리즘의 수렴 속도를 에폭을 기준으로 검증 손실을 통해 비교한 결과를 보여줍니다. AdaGrad는 빠른 하강을 시작하지만, 학습률이 급격히 감소하면서 더 이상 개선되지 않았습니다. Adam과 SGD는 거의 동일한 성능을 보였으나, Adam이 약간 더 나은 성능을 보였고, 파라미터와 관계없이 안정적인 동작을 보였기 때문에 Adam을 선택했습니다.

2. Comparison With the State of the Art: 표 IV는 제안된 CNN을 기존의 수작업 특징을 사용하는 최신 방법들과 비교한 결과를 제공합니다. 각 방법에 대해 검증 세트를 사용하여 하이퍼파라미터를 튜닝했습니다. 결과적으로 제안된 방법은 나머지 방법들보다 8%에서 14% 더 우수한 성능을 보였습니다.

표 V에서는 다른 CNN들과의 비교를 제공합니다. 첫 번째 행은 하나의 합성곱 층과 세 개의 완전 연결 층을 가진 얕은 네트워크로, 현재까지 문제에 대한 첫 번째 CNN 기반 접근법입니다.

두 번째로 테스트한 CNN은 문자 분류를 위해 설계된 LeNet으로, 두 개의 합성곱 층과 각 층 뒤에 풀링, 세 개의 완전 연결 층을 가집니다. 첫 번째 층은 6개의 커널을, 두 번째 층은 16개의 커널을 사용하며, 두 층 모두 5×5 크기를 가집니다. 이 네트워크는 데이터셋에서 비슷한 이유로 이전 CNN과 유사한 성능을 보였습니다.

먼저 AlexNet을 처음부터 학습시켰으나 성능이 좋지 않았습니다. 정확도는 약 70%였고, 첫 번째 컨볼루션 레이어에서 얻은 필터들은 노이즈가 많고 디테일이 부족하여 네트워크의 크기와 스케일이 문제였음을 알 수 있었습니다. 이를 해결하기 위해, ImageNet에서 사전 학습된 AlexNet을 미세 조정하여 성능을 약 5% 향상시켰습니다. 그러나 첫 번째 레이어 필터들의 스케일은 여전히 문제였고, 입력 이미지에 비해 너무 큰 필터들이 사용되었습니다.

그다음, VGG-Net을 사전 학습된 상태에서 미세 조정하여 성능을 비교했으나, AlexNet에 비해 약 2% 향상되었지만 여전히 제안된 방법보다 성능이 낮았습니다. VGG-Net은 더 작은 커널 크기를 사용하여 더 많은 컨볼루션 레이어를 사용할 수 있었지만, 전체 성능은 최적화되지 않았습니다. 분석 결과, 제안된 CNN이 7개 클래스 모두에서 AUC가 가장 높았으며, 통계적으로 유의미한 성능 차이를 보였습니다. 특히 consolidation, reticulation, honeycombing, reticulation/GGO와 같은 어려운 패턴에서는 제안된 CNN이 뛰어난 성능을 보였고, GGO와 같은 쉬운 패턴에서는 성능 차이가 통계적으로 유의미하지 않았습니다.

마지막으로 전체 CT 스캔에서 병리학을 인식하는 효율성을 비교한 실험에서, 제안된 CNN은 평균 크기의 HRCT 스캔 30장의 폐 영역을 분류하는 데 20초가 걸렸습니다. 반면 AlexNet은 136초, VGG-Net은 160초가 걸렸습니다. 슬라이딩 윈도우의 간격을 2로 늘렸을 때, 모든 방법의 분류 시간은 4배 빨라졌습니다.

결론적으로, AlexNet과 VGG-Net은 제안된 방법에 비해 성능이 떨어졌습니다. 이들 네트워크는 (i) 전체 수용 필드가 입력 이미지에 비해 너무 크고, (ii) 컨볼루션 레이어 사이에 풀링이 있어 정보 손실이 발생하며, (iii) 마지막 풀링 레이어가 작은 크기여서 추출된 특징이 위치 의존적이었습니다. 또한 표준 ReLU와 맥스 풀링 등의 알고리즘 선택이 성능에 영향을 미쳤으며, 이들 큰 네트워크는 예측 속도가 느려 실제 임상에서는 비효율적입니다.

3. Analysis of the System's Performance: Figure 7에서는 시스템 훈련 중 손실 함수 값과 성능 곡선을 보여줍니다. 훈련 세트와 검증 세트에 대한 손실 함수 값은 파란색과 주황색으로 나타내어졌으며, 두 곡선은 약 100번째 에폭 이후 서로 차이를 보이기 시작하지만, 검증 손실은 약 200번째 에폭까지 계속해서 조금씩 감소합니다. 회색 세로선은 최적의 모델을 나타냅니다. 노란색과 보라색 곡선은 검증 세트에서의 정확도를 나타내며, 몇 에폭 후 두 곡선은 거의 완전히 겹쳐져 네트워크가 충분히 훈련되면 각 클래스를 균형 있게 처리함을 보여줍니다.

최고 모델의 첫 번째 컨볼루션 레이어에서 16개의 커널을 Figure 8에서 보여주고 있습니다. 작은 수와 크기의 커널들이 큰 논의거리는 아니지만, 커널들의 차별적인 특성은 기본적인 엣지 패턴을 포착하는 것을 알 수 있습니다. 이러한 패턴은 연속적인 컨볼루션 레이어를 거치면서 크기와 복잡성이 커지며 마지막 레이어는 질감을 나타내는 미세 구조를 설명합니다.

Figure 9(a)에는 제안된 방법에 대한 혼동 행렬이 7개의 고려된 클래스에 대해 제시되어 있습니다. GGO/reticulation 조합 패턴과 개별 GGO 및 reticulation 패턴 간의 높은 잘못 분류율은 후자의 조합이 전자의 중첩으로 구성된다는 사실로 설명할 수 있습니다. 이 조합 패턴은 모든 분류 방식에서 특히 어려운 문제이며, 대부분의 이전 연구에서는 고려되지 않았습니다. 그러나 이 패턴은 특발성 폐섬유증(IPF)과 비특이적 간질성 폐렴(NSIP)을 구별하는 데 매우 중요하기 때문에 이 논문에서는 포함했습니다.

Figure 9(b)에는 Sorensen et al. [13]의 방법에 대한 혼동 행렬이 나타나 있습니다. 결과는 reticulation 패턴에서 더 높은 잘못 분류율이 발생하는 주된 원인이, 질감의 정확한 설명이 첫 번째 차수의 강도 값 설명을 넘어서 요구된다는 점에서 발생함을 보여줍니다.

Conclusion

본 논문에서는 폐 CT 이미지 패치를 7개의 클래스로 분류하는 깊은 CNN을 제안했습니다. 이 네트워크는 6가지 다른 ILD 패턴과 건강한 조직을 포함하는 분류를 목표로 합니다. 본 연구에서 제시한 새로운 네트워크 아키텍처는 폐 조직의 저수준 질감 특성을 효과적으로 포착할 수 있도록 설계되었습니다. 네트워크는 2x2 커널을 사용한 5개의 컨볼루션 레이어와 LeakyReLU 활성화 함수, 그 후 마지막 특성 맵 크기와 동일한 크기의 평균 풀링을 1개 사용하며, 세 개의 밀집층이 존재합니다. 훈련은 Adam 옵티마이저를 사용하여 범주형 교차 엔트로피를 최소화하는 방식으로 수행되었습니다. 제안된 방법은 120개의 CT 스캔 데이터 세트에서 우수한 성능을 보여주었으며, 기존의 최첨단 방법을 능가하는 성과를 보였습니다.

이 방법은 추가적인 폐 질감 패턴에 대해 쉽게 훈련할 수 있으며, 파라미터를 더 면밀히 조사함으로써 성능을 더욱 향상시킬 수 있습니다. 다만, 많은 수의 파라미터와 상대적으로 느린 훈련 시간과 같은 단점이 있으며, 동일한 입력에 대해 가중치 초기화에 따른 결과의 미세한 변동성도 문제점입니다. 향후 연구에서는 이 방법을 MDCT 볼륨 스캔의 3D 데이터로 확장하고, 궁극적으로 ILD의 차별 진단을 위한 CAD(컴퓨터지원진단) 시스템에 통합할 계획이라고 합니다.

'Paper_Review' 카테고리의 다른 글

[nyyoon] 논문리뷰 - X-Recon: Learning-based Patient-specific High-Resolution CT Reconstruction from Orthogonal X-Ray Images (0)	2025.03.15
[syju] Maximum Entropy Inverse Reinforcement Learning ofDiffusion Models with Energy-Based Models (0)	2025.03.10
[nyyoon] 논문 리뷰 - A deep convolutional neural network model for automated identification of abnormal EEG signals (0)	2025.03.08
[hsjung] [논문리뷰]- A Machine Learning Based Discharge Prediction of Cardiovascular Diseases Patients in Intensive Care Units (0)	2025.03.08
[shpark] XProspeCT: CT Volume Generation from Paired X-Rays 논문 리뷰 (0)	2025.03.07

'Paper_Review' 카테고리의 다른 글

티스토리툴바