• 제목/요약/키워드: Invariant Recognition

검색결과 291건 처리시간 0.025초

목표물의 고속 탐지 및 인식을 위한 효율적인 신경망 구조 (Effcient Neural Network Architecture for Fat Target Detection and Recognition)

  • 원용관;백용창;이정수
    • 한국정보처리학회논문지
    • /
    • 제4권10호
    • /
    • pp.2461-2469
    • /
    • 1997
  • 목표물 탐지 및 인식은 신경망의 적용이 활발한 하나의 분야로서, 일반적인 형태인식 문제들의 요구 사항에 추가적으로 translation invariance와 실시간 처리를 요구한다. 본 논문에서는 이러한 요구 사항을 만족하는 새로운 신경망의 구조를 소개하고, 이의 효과적인 학습 방법을 설명한다. 제안된 신경망은 특징 추출 단계와 형태 인식 단계가 연속(Cascade)된 가중치 공유 신경망(Shared-weight Neural Network)을 기본으로하여 이를 확장한 형태이다. 이 신경망의 특징 추출 단계는 입력에 가중치 창(weight kernel)으로 코릴레이션 형태의 연산을 수행하며, 신경망 전체를 하나의 2차원 비선형 코릴레이션 필터로 볼 수 있다. 따라서, 신경망의 최종 출력은 목표물 위치에 첨예(peak)값을 갖는 코릴레이션 평면이다. 이 신경망이 갖는 구조는 병렬 또는 분산 처리 컴퓨터로의 구현에 매우 적합하며, 이러한 사실은 실시간 처리가 중요한 요인이 되는 문제에 적용할 수 있음을 의미한다. 목표물과 비목표물간의 숫자상 불균형으로 인하여 초래되는 오경보(false alarm) 발생의 문제를 극복하기 위한 새로운 학습 방법도 소개한다. 성능 검증을 위하여 제안된 신경망을 주차장내에서 이동하는 특정 차량의 탐지 및 인식 문제에 적용하였다. 그 결과 오경보 발생이 없었으며, 중형급 컴퓨터를 이용하여 약 190Km로 이동하는 차량의 추적이 가능한 정도의 빠른 처리 결과를 보여 주었다.

  • PDF

음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정 (Visual Voice Activity Detection and Adaptive Threshold Estimation for Speech Recognition)

  • 송태엽;이경선;김성수;이재원;고한석
    • 한국음향학회지
    • /
    • 제34권4호
    • /
    • pp.321-327
    • /
    • 2015
  • 본 연구에서는 음성인식기 성능향상을 위한 영상기반 음성구간 검출방법을 제안한다. 기존의 광류기반 방법은 조도변화에 대응하지 못하고 연산량이 많아서 이동형 플렛홈에 적용되는 스마트 기기에 적용하는데 어려움이 있고, 카오스 이론 기반 방법은 조도변화에 강인하지만 차량 움직임 및 입술 검출의 부정확성으로 인해 발생하는 오검출이 발생하는 문제점이 있다. 본 연구에서는 기존 영상기반 음성구간 검출 알고리즘의 문제점을 해결하기 위해 지역 분산 히스토그램(Local Variance Histogram, LVH)과 적응적 문턱값 추정 방법을 이용한 음성구간 검출 알고리즘을 제안한다. 제안된 방법은 조도 변화에 따른 픽셀 변화에 강인하고 연산속도가 빠르며 적응적 문턱값을 사용하여 조도변화 및 움직임이 큰 차량 운전자의 발화를 강인하게 검출할 수 있다. 이동중인 차량에서 촬영한 운전자의 동영상을 이용하여 성능을 측정한 결과 제안한 방법이 기존의 방법에 비하여 성능이 우수함을 확인하였다.

실내 자율주행 로봇의 구현 및 라인 히스토그램을 이용한 환경인식 (Implementation of an Indoor Mobile Robot and Environment Recognition using Line Histogram Method)

  • 문찬우;이영대
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권2호
    • /
    • pp.45-50
    • /
    • 2009
  • 청소로봇이나 경비로봇과 같이 실내에서 이동하며 작업하는 로봇에서는 센서를 통한 환경의 인식이 필수적이다. 사무실 빌딩이나 공동주택의 경우 기본적인 환경이 동일하므로 설계도와 같은 공통된 지도를 이용하면 개별 환경마다 지도를 재작성하는 것보다 유리한 점이 있다. 이때 가구나 장애물 등 위치가 바뀔 수 있는 대상의 정보는 제거하고, 벽, 문, 창 등 불변의 대상을 인식하는 것이 중요하다. 이 논문에서는 사무실이나 가정환경에서 사용할 수 있는 실험용 이동로봇을 구현하고, 레이저스캐너의 정보와 세그먼트의 방향, 위치에 의한 히스토그램 방법을 이용하여 이와 같은 불변의 특징을 추출한다. 로봇에는 레이저스캐너, 자이로 센서, 초음파 센서, 적외선 센서 등이 탑재되며 제어프로그램은 C 프로그램으로 작성되었다.

  • PDF

PPIV 인식기반 2D 호모그래피와 LM방법을 이용한 카메라 외부인수 산출 (Camera Extrinsic Parameter Estimation using 2D Homography and LM Method based on PPIV Recognition)

  • 차정희;전영민
    • 전자공학회논문지SC
    • /
    • 제43권2호
    • /
    • pp.11-19
    • /
    • 2006
  • 본 논문에서는 사영과 치환불변 점 특징을 기반으로 카메라의 외부인수를 산출하는 방법을 제안한다. 기존 연구에서의 특징 정보들은 카메라의 뷰 포인트에 따라 변화하기 때문에 대응점 산출이 어렵다. 따라서 본 논문에서는 카메라 위치에 무관한 불변 점 특징을 추출하고 시간 복잡도 감소와 정확한 대응점 산출을 위해 유사도 평가함수와 Graham 탐색 방법을 이용한 새로운 정합방법을 제안한다. 또한 카메라 외부인수 산출단계에서는 LM 알고리즘의 수렴도를 향상시키기 위해 2단계 카메라 동작인수 산출방법을 제안한다. 실험에서는 다양한 실내영상을 이용하여 기존방법과 비교, 분석함으로써 제안한 알고리즘의 우수성을 입증하였다.

극좌표계에서 회전에 강인한 LDAr을 이용한 얼굴 인식 (Rotation invariant face recognition in a polar coordinate system using LDAr)

  • 오재현;곽노준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.195-197
    • /
    • 2010
  • 본 논문은 기존 평행좌표를 이용하는 얼굴 영상 대신 극좌표계 변환을 이용한 얼굴 영상을 이용하여 회전에 강인한 얼굴인식 방법을 제안한다. 극좌표계 변환 방법은 얼굴의 중심부분의 한 점을 극으로 삼아 이 점을 기준으로 360도 각 방향으로 일정 길이만큼 얼굴 영상을 샘플링 하여 새로운 얼굴 영상을 제작하는 방법이다. 이 극좌표계 변환 방법을 이용해 재구성된 영상에 대해 회귀( regression )문제 해결을 위해 변형된 LDA인 LDAr(LDA for regression)을 이용하여 얼굴의 중심부분의한 점인 극을 중심으로 임의의 각도로 회전된 영상의 회전 정도를 추정하여 이를 정규화 시키는 방법을 통해 얼굴 인식의 인식률을 향상시키고자 한다. LDAr은 LDA의 기본개념인 각 클래스 간 떨어진 정도를 최대화하는 것이 목적으로 클래스간 분산과 클래스내 분산의 비율을 최대화 하는 방법을 응용하여 이를 회귀문제에 적용할 수 있게 변형을 한 것이다. 즉, LDAr은 목표값(target)의 차이가 큰 샘플들과 목표값의 차이가 작은 샘플들 간의 거리의 비율을 최대화 하는 것을 목적으로 하게 된다. 제안된 방법을 Yale데이터에 적용하여 임의의 각도로 회전시킨 영상에 대해 회전 각도를 정확히 찾아내는 것을 확인할 수 있었다.

  • PDF

모달 스트레인 에너지를 이용한 3차원 형상 비교 (3D Shape Comparison Using Modal Strain Energy)

  • 최수미
    • 한국멀티미디어학회논문지
    • /
    • 제7권3호
    • /
    • pp.427-437
    • /
    • 2004
  • 3차원 모델간의 형상을 비교하는 것은 형상을 기반으로 하는 인식, 검색, 분류 등을 위해 매우 중요하다. 본 논문에서는 모델의 이동, 회전, 스케일 변화에 영향받지 않고, 모델을 구성하는 정점들이 비균일 하고 불완전한 경우에도 강인한 3차원 형상 비교 방법을 제안한다. 먼저 입력 데이터로부터 고유 모드를 이용한 모달 모델을 구성하고 모달 스트레인 에너지를 이용하여 형상 간의 유사성을 비교한다. 제안된 방법은 고유 진동수에 따라 고유 모드들을 순서화 함으로써 형태 변형을 전역적인 것에서부터 지역적인 것으로 체계화한다. 이렇게 체계화된 형상 표현과 모달 스트레인 에너지를 이용함으로써 국부적인 형태에 치우치지 않고 전체적인 형태의 유사성을 평가하였다.

  • PDF

해안 광학영상 자료를 이용한 쇄파지역 연안류 측정기술 (Remote Sensing of Nearshore Currents using Coastal Optical Imagery)

  • 유제선;김선신
    • Ocean and Polar Research
    • /
    • 제37권1호
    • /
    • pp.11-22
    • /
    • 2015
  • In-situ measurements are labor-intensive, time-consuming, and limited in their ability to observe currents with spatial variations in the surf zone. This paper proposes an optical image-based method of measurement of currents in the surf zone. This method measures nearshore currents by tracking in time wave breaking-induced foam patches from sequential images. Foam patches in images tend to be arrayed with irregular pixel intensity values, which are likely to remain consistent for a short period of time. This irregular intensity feature of a foam patch is characterized and represented as a keypoint using an image-based object recognition method, i.e., Scale Invariant Feature Transform (SIFT). The keypoints identified by the SIFT method are traced from time sequential images to produce instantaneous velocity fields. In order to remove erroneous velocities, the instantaneous velocity fields are filtered by binding them within upper and lower limits, and averaging the velocity data in time and space with a certain interval. The measurements that are obtained by this method are comparable to the results estimated by an existing image-based method of observing currents, named the Optical Current Meter (OCM).

Visual Servoing을 위한 3차원 물체의 인식 및 자세 추정 (Recognition and Pose Estimation of 3-D Objects for Visual Servoing)

  • 양재호;정문호;박민용
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.1931-1932
    • /
    • 2006
  • 로봇이 어떤 물체를 인지하고 그 물체에 대해 어떤 작업을 하고자 할 때 특정 물체의 인식 문제, 3차원 정보를 획득하는 문제, 자세를 추정하는 문제 등 해결해야 될 문제들이 있다. 물체를 인식하는 과정에서는 주위 배경과 물체의 크기의 변화, 회전, 가려짐 등으로 인해 물체 인식을 어렵게 만드는 요소들이 있다. 2차원 이미지를 통해 3차원 정보를 추출하는 과정은 일반적으로 두 대의 카메라를 이용하여 스테레오 이미지를 통해 얻는다. 이 때 좌우 영상간의 매칭의 과정이 필요하다. 자세 추정의 문제는 카메라 좌표와 물체의 좌표간의 관계를 알아야 한다. Visual Servoing을 어렵게 만드는 많은 요인들이 있으며 본 논문에서는 물체의 크기, 회전, 이동에 불변인 디스크립터(descriptor)를 사용하는 SIFT(Scale Invariant Feature Transform)를 통해 3차원 물체의 인식과 자세를 추정하는 방법을 제시한다. 또한 자세 추정을 위해 2차원 Keypoint들의 매칭을 3차원 정보를 통해 검증하는 방법을 제시한다. (SIFT에 의해 추출된 point를 Keypoint라 명한다.)

  • PDF

주차장 자동차번호 인식 시스템에 관한 연구 (A Study of Car Plate Recognition System on The Park)

  • 신강호
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.87-91
    • /
    • 2003
  • 본 논문에서는 현재 주차장에서 사용되는 입출 차량의 관리를 정기권 카드나 티켓발행기와 병행하여 사용될 수 있는 자동차 번호 인식 시스템을 개발하였다. 주차장은 차량의 흐름을 원활하고 신속하게 처리해야 하기 때문에 많은 자동차 번호 인식시스템을 도입했으나 운영 면에서 여러 가지 문제점을 가지고 있었다. 본 논문에서는 이러한 단점을 보완하기 위하여 기존의 시스템을 바탕으로 유동적인 시스템을 개발하였다. 자동차 번호 인식시스템은 주차장에 설치될 경우 99%의 성능을 가져야 하지만 날씨의 변화와 계절이 변동함에 따라 많은 영향을 받고 있다. 따라서 본 논문에서는 4계절과 날씨에 민감함을 고려하여 차량번호판 영역을 히스토그램 모폴로지를 사용하여 번호판 영역을 추출하고 신경망을 사용하여 숫자만을 인식하는 시스템을 개발하였다.

  • PDF

얼굴 회전에 강인한 다인종 얼굴 검출 (Rotation Invariant Multiracial Face Detection)

  • 김광수;김진모;곽수영;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.945-952
    • /
    • 2007
  • 얼굴 검출은 얼굴 인식을 위한 첫번째 단계로써, 입력 영상에서의 얼굴의 존재 유무와 얼굴의 위치 및 크기를 알아내야 한다. 얼굴의 위치를 찾아내는 것은 크기변화, 조명변화, 회전과 같은 다양한 상황이 발생하기 때문에 쉽지 않다. 본 논문에서는 다양한 문제 중 얼굴이 회전되었을 때 얼굴을 검출하는 방법에 초점을 맞추었다. 먼저, 다인종 얼굴 데이타로부터 얼굴의 존재 유무와 얼굴의 위치 및 크기를 알아낸 뒤, 후보영역에서 두 눈을 검출하다. 두 눈을 이용하여 회전각도를 찾아내고 베이지안 분류기를 이용하여 정면얼굴이 되도록 다시 회전시키는 방법을 이용하였다. 다인종에 데이타를 이용한 회전된 얼굴에 대해서 얼굴검출 알고리즘을 실험하여 결과를 제시하였다.