[Object Detection] Selective Search for Object Recognition (IJCV 2013)

Posted by

Source: Paper

  • Summary
    본 논문은 Exhaustive SearchSegmentation 방법을 모두 사용한 Selective Search를 통하여 후보 영역에서 Object의 위치를 찾고 SVM을 통해 이미지를 Classification 하였다.
    Object Detection 분야에서는 R-CNN, SPPNet, Fast R-CNN 등에서 성능을 개선하는 방법으로 활용되었으나 End-to-End Machine Learning 방식으로 학습하기 어렵고 속도가 느려 실시간 Search가 어렵다.
    ※ End-to-End Machine Learning: 끝과 끝을 연결하는 기계 학습으로 입력(Input)에서 출력(Output)까지 하나의 파이프라인(Pipeline)으로 처리하는 것을 말한다.

  • Abstract
    Exhaustive SearchSegmentation을 통한 Selective Search를 진행하였다.
    • Exhaustive Search: Object가 있을 수 있는 모든 영역의 위치를 찾아내는 것
      Segmentation: 이미지 구조를 사용하여 샘플링 프로세스를 Guide하는 것
      Selective Search: Greedy Algorithm을 사용하여 유사한 영역을 결합하여 더 큰 영역을 만들고 분할된 영역을 사용하여 후보 객체 위치를 생성한다.
      ※ Greedy Algorithm
      1. 지역 집합에서 가장 유사한 두 가지를 선택
      2. 하나의 더 큰 영역으로 결합
      3. 추가로 결합할 영역이 없을 때까지 1~2 단계를 여러 번 반복


  • Introduction
    영역을 그룹화 하는데 있어 최적화된 단일 전략이 없으므로, 색상, 재질, 크기 등 다양한 조건을 고려해야 한다.
    (a) 다양한 크기의 물체, (b) 재질(texture)은 유사하지만 색상이 다른 고양이
    (c) 색상이 동일하지만, 재질이 다른 카멜레온, (d) 색상과 재질이 유사하지 않지만 차량의 일부인 바퀴
Source: Selective Search for Object Recognition
  • Similarity in Segmentation
    초기 작은 분할을 더 큰 분할로 결합할 때 네 가지 유형의 유사성을 고려한다.
    • Color Similarity

      각 영역에 대해 이미지에 있는 색상 채널(R, G, B)의 히스토그램을 생성하고 각 채널 별 25개의 Bin, 총 75개의 Bin의 값(c)으로 영역별 유사성을 찾는다.

    • Texture Similarity

      8개의 가우시안 이미지 파생물을 사용하여 텍스쳐 유사성을 계산하고 색상 채널 별 히스토그램을 생성하고 10개의 Bin의 값(t)으로 영역별 유사성을 찾는다.

    • Size Similarity

      더 작은 영역을 쉽게 병합하도록 한다.

    • Fill Similarity

      두 영역의 바운딩 박스(BB)가 서로 얼마나 잘 맞아 떨어지는지(fit) 측정하고, fit하면 병합하고, fit하지 않으면 병합하지 않는다.

  • Selective Search in Object Recognition

    Ground Truth와 20~50% 겹치는 샘플 예제(Negative Example)을 SVM Classifier에 False Positive를 식별하도록 학습하였다.

Leave a Reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다