-예측·정확도 높인 기술 개발

 심층 신경망 동작 개념도. (사진=KAIST)
심층 신경망 동작 개념도. (사진=KAIST)

[데일리비즈온 김소윤 기자] 최근 인공지능(AI) 기술의 발전이 지속되고 빅데이터양이 증가해 딥러닝(심층학습)이 다양한 데이터 분석에 쓰인다. 이 가운데 국내 연구진이 딥러닝의 정확도와 속도 향상 기술을 개발해 해당 분야가 더 활용될 것으로 보인다.

20일 한국과학기술원(KAIST)는 이 대학 전산학부 이재길 교수 연구팀이 심층 학습 모델의 예측정확도와 훈련 속도가 대폭 향상된 새로운 모델 학습 기술을 개발했다고 밝혔다.

이에 따르면 심층 학습 모델을 학습하는 과정은 반복적으로 모델의 매개변수를 최적화하는 단계로 이뤄진다. 반복마다 훈련 데이터로부터 일부 데이터를 선정해 최적화에 사용하는데 이때 선정된 데이터 샘플을 배치(batch)라 부른다.

무작위로 배치를 선택하면 최고의 정확도가 항상 보장되지 않기 때문에 이런 문제점을 개선하기 위해 최근 인공지능 학계에서는 더 나은 배치 선택 방법에 관한 연구가 활발히 진행되고 있다는 설명이다.

연구팀이 개발한 기술은 심층 학습 모델의 학습 진행 상황에 맞게 최적의 배치를 구성하도록 하는 기술이다. 배치 선택에서는 현재 모델 학습 단계에 가장 도움이 되는 데이터를 효과적으로 선택해야 한다. 도움이 될지를 판단하기 위해 이재길 교수팀이 개발한 방법은 해당 데이터에 대한 이전 추론 결과를 활용한다.

이재길 교수. (사진=KAIST)
이재길 교수. (사진=KAIST)

단계별 추론단계에서 결과가 매우 일관적일 경우 해당 데이터가 너무 쉬어 계속 맞추거나 반대로 너무 어려워 전혀 맞추지 못한다고 볼 수 있다. 즉 이러한 데이터는 결코 도움이 되지 않는 데이터라 할 수 있는 셈이다.

이 반대로 최근 몇 단계에서의 추론 결과가 그다지 일관적이지 않다면 해당 데이터에 대한 추론이 혼동되고 있는 것인데 현재 시점에서 꼭 필요한 데이터라는 설명이다.

연구팀은 새로 개발한 배치 선택 방법론을 최신 편향(Recency Bias)이라고 명명했다. 또 이미지 데이터에 널리 활용되는 다양한 합성 곱 신경망(CNN)의 학습에 적용했다.

이 결과 기존 방법론 대비, 예측정확도(이미지 분류 문제)에서 최대 21% 오류를 감소시켰다. 한편 훈련 속도(심층 신경망 미세 조정 문제)에서는 최대 59% 시간을 단축할 수 있었다.

연구팀 관계자는 “이 기술이 텐서플로우(TensorFlow) 혹은 파이토치(PyTorch)와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급 효과를 낼 수 있다”고 기대했다.

연구팀에서 개발한 ‘최신 편향(Recency Bias)’에서 불확실성을 계산하는 방식. (사진=KAIST)
연구팀에서 개발한 ‘최신 편향(Recency Bias)’에서 불확실성을 계산하는 방식. (사진=KAIST)

딥러닝 기술은 교육, 경제, 의료 분야 등 광범위한 분야에서 활용되고 있다. 4월 분당서울대학교병원 안과 박상준 교수팀은 망막안저사진을 보고 나이와 성별을 예측하는 딥러닝 알고리즘을 개발하기도 했다.

연구팀은 딥러닝 알고리즘으로 망막안저사진에 담긴 정보를 분석해 대표적 신체정보인 나이와 성별을 예측할 수 있었다. 이들은 분당서울대병원 건강검진센터에 축적된 412026장의 망막안저사진을 이용해 알고리즘이 사진만 보고도 연령과 성별을 분석할 수 있도록 학습시켰다.

표본에는 일반인뿐만 아니라 안구의 병증을 유발하는 대표 인자인 당뇨 및 고혈압이 있는 환자, 흡연자도 포함해 기저질환에 상관없이 정확하게 예측할 수 있도록 설계했다.

이 결과 개발된 딥러닝 알고리즘은 정상인을 대상으로 성별에 상관없이 평균 3.1세의 오차로 실제 연령을 파악했다. 당뇨병이나 고혈압이 있는 경우에도 평균오차가 3.6세를 넘지 않는 높은 예측성능을 보였다.

저작권자 © 데일리비즈온 무단전재 및 재배포 금지