전통적 특징점 기반의 접근과 함께 기계학습 & 딥러닝 방법의 접근이 늘어가는중
하지만 데이터 부족의 문제는 계속해서 함께 따라다니고 있다.
이를 보완하는 측면에서 소량의 데이터를 가지고 인위적으로 학습데이터를
재생성하여 확장하는 방법이 사용되고 있다.
Data Augmentation 종류
데이터 확장(augmentation) 방법은 크게 기하적 변환과 태스크 기반(task-specific 또는 guided) 확장으로 나뉜다.
기하적 변환은 크기조절, 반전, 자르기, 회전, 이동, 윈도우 분할 등이 있다.
태스크 기반 확장은 데이터를 합성 시 분류에 대한 척도를 고려하여 학습을 수행한다. 물체 인식에 대해서 자르기(crop)와 반전(flip)만을 사용하여 다양한 CNN 네트워크에 대해서 성능 비 교를 한 연구가 있다[6]. 자르기와 색 조절은 학습 데이터 확장 에, 크기 변환과 다각도관점 변환은 테스트 데이터 확장에 사용 하여 성능 향상을 보인 논문도 있다[7].
기하적 변환 외에 GAN[8]을 이용한 태스크 기반의 데이터 확장도 시도되고 있 다[9]. 이들 모두가 물체 인식 분야에서의 데이터 확장 문제들 로서, 물체와 특성이 다른 표면 결함에 대해서는 아직 분석이 미 비한 편이다. 표면 결함의 종류는 스크래치(scratch), 찍힘(stamped), 짙은 얼룩(stain) 등이 존재한다. 이들 결함에 따라서 적용 가능한 데 이터 확장 방법이 다를 수 있으며, 효과도 상이할 수 있다. 즉, 물체 인식과 결함 인식의 차이가 존재하므로, 대상 문제에 따른 데이터 확장 방법도 유효성이 다를 수 있다. 지금까지 이에 대한 분석이나 체계적인 접근이 시도되지 않고 있다.
[*참고 : 표면 결함 검출을 위한 데이터 확장 및 성능분석 (Performance Analysis of Data Augmentation for Surface Defects Detection) , 김준봉(JunbongKim), 서기성(KisungSeo) / The Transactions P of the Korean Institute of Electrical Engineers KIEEP Vol. 67, No. 5, p.669-674 ]
-url : http://journal.auric.kr/kiee/XmlViewer/f379131
How to use Deep Learning when you have Limited Data.
( 한정된 데이터를 가지고있을때 Deep Learning을 사용하는 방법 )
part 1.
part 2.
작은 데이터셋으로 강력한 이미지 분류 모델 설계하기:
https://keraskorea.github.io/posts/2018-10-24-little_data_powerful_model/