-딥러닝 기반의 기침 인식 모델 개발

연구실 환경에서 기침 인식 카메라의 기침 발생 위치표시. (사진=KAIST)
연구실 환경에서 기침 인식 카메라의 기침 발생 위치표시. (사진=KAIST)

[데일리비즈온 김소윤 기자] 기계학습의 일종인 딥러닝을 기반으로 한 실시간 ‘기침 인식 카메라’가 국내 연구진에 의해 개발됐다. 이 카메라는 기침 소리와 횟수를 인식하고 환자의 위치를 기록해 코로나19와 같은 감염병의 조기 진단과 치료에 도움이 될 것으로 기대된다.

한국과학기술원(KAIST)은 이 대학 기계공학과 박용화 교수 연구팀이 에스엠인스트루먼트와 실시간으로 기침 소리를 인식하고 기침하는 사람의 위치를 이미지로 표시해주는 ‘기침 인식 카메라’를 공동으로 개발했다고 3일 밝혔다.

코로나19의 대표적인 증상은 발열과 기침이다. 발열의 경우 열화상 카메라를 이용해 직접 접촉을 하지 않고도 체온을 쉽게 판별할 수 있지만 이런 방식으로는 기침하는 사람의 증상을 파악하기는 어려운 실정이다.

연구팀은 이러한 문제를 해결하기 기침 소리를 실시간으로 인식하는 딥러닝 기반의 기침 인식 모델을 개발했다. 이들은 또 열화상 카메라와 같은 원리로 기침 소리와 기침하는 사람의 시각화를 위해 기침 인식 모델을 음향 카메라에 적용했다.

기침 인식 카메라의 외형 및 신호처리 블록선도. (그림=KAIST)
기침 인식 카메라의 외형 및 신호처리 블록선도. (그림=KAIST)

기침 인식 모델 개발을 위해 연구팀은 합성 곱 신경망을 기반으로 지도학습을 적용했다. 1초길이 음향신호의 특징을 입력 신호로 받아 1(기침) 또는 0(그 외)의 2진 신호를 출력하고 학습률의 최적화를 위해 일정 기간 학습률이 정체되면 학습률 값을 낮추도록 설정했다는 설명이다.

연구팀은 기침 인식 모델의 훈련 및 평가를 위해 구글과 유튜브 등에서 연구용으로 활발히 사용 중인 공개 음성데이터 세트인 오디오세트를 비롯해 디맨드, 이티에스아이, 티미트 등에서 데이터 세트를 수집했다.

모델 최적화를 위해 스펙트로그램 등 5개의 음향 특징과 7개의 최적화 기기를 사용해 학습을 진행하고 시험 데이터 세트의 정확도를 측정해 성능을 확인한 결과 87.4%의 시험 정확도를 얻을 수 있었다고 연구팀은 밝혔다.

학습된 기침 인식 모델을 소리를 수집하는 마이크로폰 어레이와 카메라 모듈로 구성되는 음향 카메라에 적용한 결과 수집된 데이터를 음원의 위치를 계산하는 빔 형성 과정을 거쳐 기침 인식 모델이 기침 소리로 인식할 경우 기침 소리가 난 위치에 기침 소리임을 나타내는 등고선과 라벨이 각각 표시된다.

박 교수는 “병실에 적용하면 환자의 상태를 24시간 기록해 치료에 활용할 수 있기 때문에 의료진의 수고를 줄이고 환자 상태를 더 정밀하게 파악할 수 있을 것”이라고 말했다.

저작권자 © 데일리비즈온 무단전재 및 재배포 금지