Source: Paper
- Summary
본 논문은 Exhaustive Search와 Segmentation 방법을 모두 사용한 Selective Search를 통하여 후보 영역에서 Object의 위치를 찾고 SVM을 통해 이미지를 Classification 하였다.
Object Detection 분야에서는 R-CNN, SPPNet, Fast R-CNN 등에서 성능을 개선하는 방법으로 활용되었으나 End-to-End Machine Learning※ 방식으로 학습하기 어렵고 속도가 느려 실시간 Search가 어렵다.
※ End-to-End Machine Learning: 끝과 끝을 연결하는 기계 학습으로 입력(Input)에서 출력(Output)까지 하나의 파이프라인(Pipeline)으로 처리하는 것을 말한다. - Abstract
Exhaustive Search와 Segmentation을 통한 Selective Search를 진행하였다.- Exhaustive Search: Object가 있을 수 있는 모든 영역의 위치를 찾아내는 것
Segmentation: 이미지 구조를 사용하여 샘플링 프로세스를 Guide하는 것
Selective Search: Greedy Algorithm※을 사용하여 유사한 영역을 결합하여 더 큰 영역을 만들고 분할된 영역을 사용하여 후보 객체 위치를 생성한다.
※ Greedy Algorithm
1. 지역 집합에서 가장 유사한 두 가지를 선택
2. 하나의 더 큰 영역으로 결합
3. 추가로 결합할 영역이 없을 때까지 1~2 단계를 여러 번 반복
- Exhaustive Search: Object가 있을 수 있는 모든 영역의 위치를 찾아내는 것
- Introduction
영역을 그룹화 하는데 있어 최적화된 단일 전략이 없으므로, 색상, 재질, 크기 등 다양한 조건을 고려해야 한다.
(a) 다양한 크기의 물체, (b) 재질(texture)은 유사하지만 색상이 다른 고양이
(c) 색상이 동일하지만, 재질이 다른 카멜레온, (d) 색상과 재질이 유사하지 않지만 차량의 일부인 바퀴
- Similarity in Segmentation
초기 작은 분할을 더 큰 분할로 결합할 때 네 가지 유형의 유사성을 고려한다.- Color Similarity
각 영역에 대해 이미지에 있는 색상 채널(R, G, B)의 히스토그램을 생성하고 각 채널 별 25개의 Bin, 총 75개의 Bin의 값(c)으로 영역별 유사성을 찾는다. - Texture Similarity
8개의 가우시안 이미지 파생물을 사용하여 텍스쳐 유사성을 계산하고 색상 채널 별 히스토그램을 생성하고 10개의 Bin의 값(t)으로 영역별 유사성을 찾는다. - Size Similarity
더 작은 영역을 쉽게 병합하도록 한다. - Fill Similarity
두 영역의 바운딩 박스(BB)가 서로 얼마나 잘 맞아 떨어지는지(fit) 측정하고, fit하면 병합하고, fit하지 않으면 병합하지 않는다.
- Color Similarity
- Selective Search in Object Recognition
Ground Truth와 20~50% 겹치는 샘플 예제(Negative Example)을 SVM Classifier에 False Positive를 식별하도록 학습하였다.