[Object Detection] Selective Search for Object Recognition (IJCV 2013)

Source: Paper

Summary
본 논문은 Exhaustive Search와 Segmentation 방법을 모두 사용한 Selective Search를 통하여 후보 영역에서 Object의 위치를 찾고 SVM을 통해 이미지를 Classification 하였다.
Object Detection 분야에서는 R-CNN, SPPNet, Fast R-CNN 등에서 성능을 개선하는 방법으로 활용되었으나 End-to-End Machine Learning^※ 방식으로 학습하기 어렵고 속도가 느려 실시간 Search가 어렵다.
_{※ End-to-End Machine Learning: 끝과 끝을 연결하는 기계 학습으로 입력(Input)에서 출력(Output)까지 하나의 파이프라인(Pipeline)으로 처리하는 것을 말한다.}
Abstract
Exhaustive Search와 Segmentation을 통한 Selective Search를 진행하였다.
- Exhaustive Search: Object가 있을 수 있는 모든 영역의 위치를 찾아내는 것
  Segmentation: 이미지 구조를 사용하여 샘플링 프로세스를 Guide하는 것
  Selective Search: Greedy Algorithm^※을 사용하여 유사한 영역을 결합하여 더 큰 영역을 만들고 분할된 영역을 사용하여 후보 객체 위치를 생성한다.
  _{※ Greedy Algorithm
  1. 지역 집합에서 가장 유사한 두 가지를 선택
  2. 하나의 더 큰 영역으로 결합
  3. 추가로 결합할 영역이 없을 때까지 1~2 단계를 여러 번 반복}
Introduction
영역을 그룹화 하는데 있어 최적화된 단일 전략이 없으므로, 색상, 재질, 크기 등 다양한 조건을 고려해야 한다.
(a) 다양한 크기의 물체, (b) 재질_(texture)은 유사하지만 색상이 다른 고양이
(c) 색상이 동일하지만, 재질이 다른 카멜레온, (d) 색상과 재질이 유사하지 않지만 차량의 일부인 바퀴

image 2 [Object Detection] Selective Search for Object Recognition (IJCV 2013) 머신러닝 — Source: Selective Search for Object Recognition

Similarity in Segmentation
초기 작은 분할을 더 큰 분할로 결합할 때 네 가지 유형의 유사성을 고려한다.
- Color Similarity
  
  각 영역에 대해 이미지에 있는 색상 채널_{(R, G, B)}의 히스토그램을 생성하고 각 채널 별 25개의 Bin, 총 75개의 Bin의 값_(c)으로 영역별 유사성을 찾는다.
- Texture Similarity
  
  8개의 가우시안 이미지 파생물을 사용하여 텍스쳐 유사성을 계산하고 색상 채널 별 히스토그램을 생성하고 10개의 Bin의 값_(t)으로 영역별 유사성을 찾는다.
- Size Similarity
  
  더 작은 영역을 쉽게 병합하도록 한다.
- Fill Similarity
  
  두 영역의 바운딩 박스_(BB)가 서로 얼마나 잘 맞아 떨어지는지_(fit) 측정하고, fit하면 병합하고, fit하지 않으면 병합하지 않는다.
Selective Search in Object Recognition

Ground Truth와 20~50% 겹치는 샘플 예제(Negative Example)을 SVM Classifier에 False Positive를 식별하도록 학습하였다.

[Object Detection] Selective Search for Object Recognition (IJCV 2013)

Related

Leave a Reply Cancel reply