[nyyoon] 논문 리뷰 - A deep convolutional neural network model for automated identification of abnormal EEG signals

논문 작성일 : 2018.11.23

논문 원본 링크 : https://link.springer.com/article/10.1007/s00521-018-3889-z

리뷰 작성일: 2025.03.06

1 Introduction

EEG(Electroencephalogram)는 뇌의 전기적 활동을 모니터링하는 기계로, 다양한 신경 질환을 감지하는 유용하게 사용되고있습니다. 그러나 사람이 EEG 신호를 평가하는데 많은 시간이 소요되기 때문에 이를 자동화하는 기술 개발이 필수적인 상황입니다.

EEG 신호 분석을 위해서 딥러닝이 주로 사용되고 있으며, 특히 Acharya와, Oh의 연구를 따르면 CNN 기반 모델이 간질, 우울증, 파킨슨병 진단에 있어 높은 정확도를 보이고 있음을 확인할 수 있습니다.

본 연구에서는 정상과 비정상 EEG 신호를 자동으로 인식하는 딥러닝 기반 접근법을 제안하고 있습니다. 다른 연구와는 달리 수동적 특징 추출 없이 end-to-end 1D-CNN 기반 모델을 제안하였으며, TUH(Temple University Hospital) 데이터셋을 기반으로 학습을 진행하였습니다.

2 Materials and methods

본 연구에서는 CNN을 사용하여 정상 및 비정상 EEG 신호을 구분하는 모델을 만드는 것을 목적으로 하며, 특징 추출 과정없이 end-to-end 구조를 가지고 있다. Fig.1 은 EEG 신호 구분 시스템의 block diagram을 보여준다.

Fig.1 Steps involved in the automated detection of abnormal EEG signals

2.1 EEG dataset description

TUH EEG Abnormal Corpus database는 28,000개 이상의 EEG 기록을 포함하는 세계에서 가장 큰 규모의 데이터 베이스로, EEG 신호마다 임상의가 제공한 report가 있다는 것이 특징이며, 본 연구에서는 이 데이터를 가지고 모델의 학습 및 평가를 진행하였습니다. Table 1에서는 TUH EEG Abnormal Corpus에서 사용된 환자와 세션 분포를 나타냅니다.

Table.1 Distributions of patients and sessions employed in TUH EEG Abnormal Corpus (v2.0.0)

데이터셋 중 일부는 학습, 나머지는 평가에 사용되었기에 학습 데이터셋과 평가 데이터셋 간에 환자가 중복되지 않습니다. 여기서 세션은 한 환자에게 수행된 EEG 기록을 구분한 단위로 사용되며, 한 환자당 여러 개의 세션이 존재할 수 있습니다. 평가 데이터셋에는 하나의 환자 기록만 사용되며, 학습 데이터셋에는 일부 환자의 기록이 여러 번 사용되었습니다. 이러한 데이터 베이스의 환자 분포는 아래의 Table 2에서 확인할 수 있습니다.

Table 2 Gender distribution of patients in the EEG data set

EEG 신호 센서 위치는 아래의 왼쪽 그림에서, abnormal기록의 첫 60초 신호 샘플은 오른쪽 그림에서 확인해 볼 수 있습니다. 기본적으로 EEG 시스템은 19개 전극을 사용하지만, 공간해상도를 높이기 위해 더 많은 전극을 추가할 수도 있습니다.

Fig.2 Electrode locations and channel samples used during the acquisition of EEG records

2.2 Proposed 1D Convolutional Neural Network Model

1D CNN 모델은 정상과 비정상 EEG 모델을 분류하기 위해 사용되었고, 이는 입력 layer를 포함하여 총 23개의 layer로 구성되어 있습니다. 개발된 모델에는 1D Covolution과 MaxPooling, dropout, bact normalization, dense layer가 포함되어 있으며, 아래의 그림에서 확인해 볼 수 있습니다.

Fig 3. Block representation of the proposed deep 1D CNN model

모델의 첫 번째 층은 원본 EEG 신호로 구성되어 있고, 입력층 다음에 위치해 있는 Conv 층은 stride가 3이고, 8개의 필터를 사용해 합성곱 연산을 수행되며, 연산 후에는 입력 신호의 feature map이 생성됩니다. MaxP 층에서는 feature map의 두 개의 유닛 영역 중 가장 큰 값만 선택되어, 입력 feature map의 크기가 절반으로 줄어들게 됩니다.

딥러닝 구조에서 가장 큰 문제는 overfitting인데, 이를 방지하기 위해 dropout이 사용되었습니다. batch normalization 층은 각 batch에서 이전 층의 활성화 값을 정규화하는 역할을 하며, dense layer에서는 이전 층의 특징들을 처리하게 됩니다. 가장 마지막 층은 SoftMax로 분류 연산을 수행합니다. 이와 관련된 세부 사항의 아래의 표에 제시되어 있습니다.

Table 3 Detailed information about the layers and parameters used in the proposed 1D CNN model

3 Experimental results

3.1 Experimental setup

TUH EEG 데이터베이스의 비정상 EEG corpus 데이터가 사용되었으며, 실험의 설정은 Lopez 등이 제안한 방식인 첫 60초 샘플을 사용하는 방식을 따르고 있습니다. EEG 기록에는 24~36개의 채널에서 수집된 신호가 포함되어 있으며, 후측 측두엽에서 후두엽까지의 T5–O1 채널 신호와 우측 전두엽에서 중심부까지의 F4–C4 채널 신호만 사용되었습니다. 수동 해석 시 가장 많이 사용하는 채널은 T5-O1이며, 비교 연구를 위해 F4-C4 채널도 분석되었습니다.

Fig 4. Graphical representation of the acquisition of T5–O1 and F4–C4 EEG signals in the TCP assembly

앞서 언급했듯 본 연구에서는 각 EEG 기록의 첫 60초 구간이 사용되며, 이들은 15,000개의 샘플로 구성되어 있습니다. 신호에 대해 별도의 특징 추출은 수행되지 않았고, 전처리 단계에서 신호가 0~1 범위로 정규화 되었습니다. Fig.5는 T5-O1 채널의 EEG 기록에서 첫 60초 구간을 보여주고 있습니다.

Fig.5 Waveforms of first 60 s sections of T5–O1 channel EEG signals: a normal EEG samples, b abnormal EEG samples

본 모델은 Python 기반의 Keras 라이브러리를 사용하여 개발되었고, 사용된 주요 하이퍼-파라미터는 표 4에서 확인할 수 있습니다.

Table 4 Hyper-parameter values of the proposed deep CNN model

3.2 Results

EEG 데이터베이스는 학습과 평가 부분으로 나뉘어 사용되었는데, 학습 데이터셋은 학습 과정에서 사용되었고, 평가 데이터는 테스트 단계에서 사용되었습니다. 또, 학습 데이터의 80%는 CNN 모델을 훈련하는데 사용되었고, 나머지 20%는 검증 데이터로 사용되었습니다. 본 연구에서 사용된 데이터의 구성은 Fig. 6에서 확인할 수 있습니다.

Fig.6 The illustration of data used to develop the proposed model

전문가들이 분석 시에 자주 사용하는 T5-O1 채널로부터 결과를 얻어냈고 이 채널을 150 epoch 동안 학습하여 나타낸 성능 그래프는 Fig.7에서 확인할 수 있습니다.

Fig.7 Performance graphs of the model during the training phase with T5–O1 channel EEG signals: a model accuracy, b model loss

성능 그래프를 확인해 보면, 모델에서 overfitting 문제가 발생하지 않았음을 확인할 수 있고, training 정확도는 78-79%이며 validation 정확도는 78-80%로 측정되었습니다. 또, 학습 손실의 경우 0.78에서 0.46으로 감소했음을 확인할 수 있습니다. 그러나 복잡한 데이터 때문에 모델이 학습을 완전회 성공하지 못했고, 다른 하이퍼-파라미터 실험에서는 overfluctuation과 overfitting 문제가 발생하였습니다.

테스트 데이터에서의 성능을 파악하기 위해 네 가지 기준을 세웠는데, 각각 정확도, 정밀도, 재현도, F1-Score 입니다. 각 기준에 대한 수식은 아래와 같습니다.

여기서 TP는 True positive, FP는 False positive, TN은 True negative, FN은 False negative을 의미합니다.

T5-O1 신호를 가지고 학습된 모델은 276개의 세션으로 평가되었으며, 아래 표는 모델에 대해 계산된 성능을 제시합니다.

Table 5 Performance measures of the proposed model using T5–O1 channel test data

개발된 CNN 모델은 테스트 EEG 신호를 평균 정밀도 79.64% 및 재현율 78.91%로 분류하였습니다. 더불어 테스터 데이터에 대한 모델의 Confusion matrix는 Table 6에서 확인해 볼 수 있습니다.

Table 6 Confusion matrix obtained for the developed model using T5–O1 channel EEG data

즉, 276개의 EEG 신호 중에서 219개를 정확히 분류하였고, 이때 정확도는 79.34% 이며, 오차율은 20.66%입니다.

F4-C4 채널에 대해서도 모델의 성능을 평가하였고, 이에 대한 성능 그래프는 Fig 8.에서 확인해 볼 수 있습니다.

Fig.8 Performance graphs of the model during the training phase with F4–C4 channel EEG signals: a model accuracy, b model loss

F4–C4 채널 EEG 데이터를 사용하여 학습된 모델에서는 학습 과정에서 overfitting 문제가 발생하지 않았으며, 검증 정확도는 73~74%로 측정되었습니다. loss value 또한 0.7에서 0.51로 감소하였으며, 성능 측정값과 Confusion matrix는 각각 Table 7과 Table 8에서 확인할 수 있습니다.

Table 7 Performance measures of the proposed model using F4–C4 channel test data

Table 8 Confusion matrix obtained for the developed model using F4–C4 channel EEG data

모델은 150개의 F4–C4 채널 EEG 신호 중 136개를 정확히 분류하였고, 74.63%의 정확도를 보여주었습니다. 또, 비정상 EEG 신호를 인식하는 데 있어서는 다소 낮은 성능을 보이는 것을 확인할 수 있습니다.

연구 결과에 따르면, 개발된 모델은 F4–C4 채널 EEG 데이터보다 T5–O1 채널 EEG 데이터를 사용할 때 더 우수한 성능을 보이고 있습니다. Fig. 9 각 채널의 신호를 사용한 모델의 성능 비교 그래프 입니다.

Fig.9 Performance graphs of the developed model during training level using T5–O1 and F4–C4 channel EEG signals

4 Discussion

본 연구는 1D CNN 모델을 사용하여 정상 및 비정상 EEG를 분류하는데 목적을 두었으며, Table 9는 그 연구 결과를 요약하여 보여주고 있습니다.

Table 9 Performance comparison of the proposed recognition system with other works reported using the same dataset

Lopez et al. 연구에서는 0.1초 프레임을 사용해 PCA+kNN/RF 분류기를 적용했으며, kNN의 오차율은 41.8% RF의 경우 3.17%을 보이고 있습니다. Lopez의 연구에서는 4채널 EEG와 7초 프레임을 적용하였고, 2D CNN을 사용하였으며, 이때의 오차율은 21.2%입니다. 본 연구에서는 단일 채널(T5-O1)과 60초 프레임을 사용하여 1D CNN을 적용해 오차율 20.6%를 보였습니다. 이를 통해 프레임 길이가 길어질 수록 오차율이 감소하고 정확도가 증가하고, 단일 채널 EEG만으로도 높은 정확도로 분류할 수 있음을 파악할 수 있습니다. 그러나 23개의 layer를 가진 대형구조라는 점에서 연산 부담이 크고, EEG 기록에서 첫 60초만 사용하여 전체 데이터를 전부 활용하지 못한다는 점에서 한계를 가집니다.

따라서 향후 연구에서는 더 긴 EEG 데이터를 분석하여 성능을 개선해볼 수 있으며, 멀티 채널을 적용하여서 분류의 정확도를 높일 수 있습니다. 또한, LSTM, CNN+LSTM 등의 다른 딥러닝 모델을 적용하여 실험해볼 수도 있습니다.

5 Conclusion

본 연구에서는 1D CNN을 기반으로 한 자동 비정상 EEG 탐지 시스템을 제안하였습다. EEG 신호를 활용한 뇌질환 탐지에 있어, 정확한 탐지는 조기 진단과 치료를 가능하게 하여 환자의 삶의 질을 향상시킬 수 있습니다. 연구에서 개발된 모델은 79.34%의 정확도, 79.64%의 정밀도, 78.71%의 재현율을 달성하였으며, 이는 의료진이 EEG 신호를 분석하고 검증하는 데 도움이 될 수 있습니다. 향후 연구에서는 Long Short-Term Memory(LSTM)과 같은 딥러닝 모델과 결합하여 성능을 더욱 향상시키는 것을 목표로 하고 있습니다.

'Paper_Review' 카테고리의 다른 글

[syju] Maximum Entropy Inverse Reinforcement Learning ofDiffusion Models with Energy-Based Models (0)	2025.03.10
[mjkwon] Lung Pattern Classification for Interstitial Lung Diseases Using a Deep Convolutional Neural Network (0)	2025.03.08
[hsjung] [논문리뷰]- A Machine Learning Based Discharge Prediction of Cardiovascular Diseases Patients in Intensive Care Units (0)	2025.03.08
[shpark] XProspeCT: CT Volume Generation from Paired X-Rays 논문 리뷰 (0)	2025.03.07
[syju] MAISI: Medical AI for Synthetic Imaging (0)	2025.03.07

1 Introduction

2 Materials and methods

2.1 EEG dataset description

2.2 Proposed 1D Convolutional Neural Network Model

3 Experimental results

3.1 Experimental setup

3.2 Results

4 Discussion

5 Conclusion

'Paper_Review' 카테고리의 다른 글

티스토리툴바