• 제목/요약/키워드: 특징점 매칭

검색결과 231건 처리시간 0.026초

포즈 인식에서 효율적 특징 추출을 위한 3차원 데이터의 차원 축소 (3D Data Dimension Reduction for Efficient Feature Extraction in Posture Recognition)

  • 경동욱;이윤리;정기철
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.435-448
    • /
    • 2008
  • 사용자 포즈의 3차원 데이터 생성을 통한 3차원 포즈 인식은 2차원 포즈 인식의 문제점을 해결하기 위해서 많이 연구되고 있지만, 3차원 표면 데이터의 방대한 양으로 포즈 인식에서 중요한 특징 추출(feature extraction)이 어렵고 수행 시간이 많이 걸리는 문제점을 가지고 있다. 본 논문에서는 3차원 포즈 인식의 두 가지 문제점인 특징 추출의 어려움과 느린 처리속도를 개선하기 위해서 3차원 형상복원 기술로 모델의 3차원 표면 점들로 구성된 데이터를 2차원 데이터로 변환하는 차원 축소(dimension reduction) 방법을 제안한다. 실린더형 외곽점을 이용한 메쉬없는 매개변수화(meshless parameterization) 방법은 방대한 데이터인 3차원 포즈 데이터를 2차원 데이터로 변환하여 특징 추출과 매칭과정의 연산 속도를 향상 시키며, 특징 추출의 효율성 검증을 위해 간단한 환경에서 실험이 가능한 손 포즈 인식 및 인간 포즈 인식에 적용하였다.

축구 경기 분석 I : 영상 모자익을 통한 축구 선수의 운동장 궤적 추출 (Soccer Game Analysis I : Extraction of Soccer Players' ground traces using Image Mosaic)

  • 김태원;홍기상
    • 전자공학회논문지S
    • /
    • 제36S권1호
    • /
    • pp.51-59
    • /
    • 1999
  • 본 논문에서는 축구 경기 자동 분석을 위한 첫걸음으로 일반적인 축구 경기 영상열에서 선수 및 공을 추적하고 영상 모자의 기법을 이용해서 운동장 모델 상에서 선수가 움직인 궤적을 알아내는 기법을 제시한다. 여기서 일반걱인 축구 경기 영상열이란 극도의 zoom-in 또는 zoom-out 아닌 경우로 TV 카메라가 공을 쫓아 자연스럽게 움직이는 상황의 영상을 말한다. 이러한 영상열로부터 선수의 궤적을 구하기 위해선 다음과 같이 크게 세 가지 문제를 해결해야한다. 첫째로 입력 영상에서 운동장 부분을 추출하는 문제, 둘째로 선수 및 공을 추적하고 선수들의 팀을 구분하는 문제, 마지막으로 영상에서의 선수의 위치를 실제 운동장 좌표로의 변환을 통해 선수가 움직인 자취를 운동장 모델 상에서 구하는 문제가 그것이다. 운동장의 추출은 칼라 정보를 이용하였고 이 추출된 운동장 영역 하에서 템플릿 매칭과 Kalman 필터링을 이용하여 선수와 공을 추적했다. 선수간 겹침 문제에 대해서는 CHBP(Color Histogram Back-Projection) 기법을 적용했다. 특히 선수가 운동장에서 움직인 궤적을 구하기 구하기 위해서 입력 영상에서 보이는 특징점들을 이용하여 운동장 모델 좌표와 입력 영상 좌표간의 변환을 구하고 이를 통해 운동장 모델에서의 선수의 위치를 구했다. 이때에 입력 영상에서 특징점이 충분치 않을 경우 영상 모자익 기법을 이용하여 특징점이 보이는 영상과의 좌표 변환 관계를 구함으로써 해결하였다. 실험적으로 실제 TV에서 방영된 축구 경기 영상열에 제안된 방법을 적용하여 얻어진 결과를 보인다.

  • PDF

신경망을 이용한 지문인식 임베디드 시스템 설계에 관한 연구 (Study on Design of Fingerprint Recognition Embedded System using Neural Network)

  • 이재현;김동한
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.775-782
    • /
    • 2006
  • 지문인식 알고리즘에서 전처리 과정 중 방향성이 추출된 지문에서 블록을 형성하여 각 블록에서의 방향성 특징들을 신경회로망의 입력패턴으로 사용하여 학습을 시켜, 특이점을 추출하여 매칭에 이용했다. 이를 바탕으로 지문인식 임베디드 시스템을 설계하여 다양한 응용 시스템에 이용될 수 있도록 하기 위해 컨트롤 보드와 시리얼 통신을 통해 테스트한 결과 충분한 신뢰성을 입증할 수 있었다.

견고한 입술 영역 추출을 이용한 립리딩 시스템 설계 및 구현 (Design & Implementation of Lipreading System using Robust Lip Area Extraction)

  • 이은숙;이호근;이지근;김봉완;이상설;이용주;정성태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.524-527
    • /
    • 2003
  • 최근 들어 립리딩은 멀티모달 인터페이스 기술의 응용분야에서 많은 관심을 모으고 있다. 동적 영상을 이용한 립리딩 시스템에서 해결해야 할 주된 문제점은 상황 변화에 독립적인 얼굴 영역과 입술 영역을 추출하는 것이다. 본 논문에서는 움직임이 있는 영상에서 화자의 얼굴영역과 입술영역을 컬러, 조명등의 변화에 독립적으로 추출하기 위해 HSI 모델과 블록 매칭을 이용하였고 특징 점 추출에는 이미지 기반 방법인 PCA 기법을 이용하였다. 추출된 입술 파라미터와 음성 데이터에 각각 HMM 기반 패턴 인식 방법을 개별적으로 적용하여 단어를 인식하였고 각각의 인식 결과를 가중치를 주어 합병하였다. 실험 결과에 의하면 잡음으로 음성 인식률이 낮아지는 경우에 음성인식과 립리딩을 함께 사용함으로써 전체적인 인식 결과를 향상시킬 수 있었다.

  • PDF

Java Bytecode에서 MSIL로의 번역기 (Translator for Java Bytecode to MSIL)

  • 민정현;오세만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.349-351
    • /
    • 2001
  • 자바는 객체지향언어이고, 한번 자바로 작성된 프로그램은 자바가상기계가 있는 모든 곳에서 수정없이 실행될 수 있기 때문에 소프트웨어의 개발과 유지보수에 많은 장점을 가진 언어이다. 이러한 특징으로 인하여 현재 개발되는 제품들이 자바로 개발되는 경우가 많다. 그러나 이는 결국 주 운영체제에서 사용되는 실행화일 이외에 자바의 실행화일만을 위한 자바가상기계가 공존해야 하므로 시스템에 있어서는 이중부담을 안을 수 밖에 없고, 더욱이 아직 대다수의 소프트웨어 개발자들은 주로 C언어나 C++언어를 사용하고 있으며, 최근에는 C#이라는 언어를 사용하고 있다. 결국 자바가 플랫폼에 독립적이라는 장점은 가지고 있지만, 다수의 개발자가 마이크로소프트의 윈도우 운영 체제를 사용하고 있다는 점을 감안하면, 커다란 장점만은 될 수 없다. 따라서, 본 논문에서는 자바의 클래스화일을 자바가상기계가 없이도, 마이크로소프트 윈도우의 .NET Framework에서 실행 될 수 있는 실행 화일로의 변환을 할 수 있는 중간언어인 MSIL(Microsoft Intermediate Language)로 바꿀 수 있는 번역기를 설계 및 구현 하였다. 이를 위한 방법으로는 자바 바이트코드와 MSIL의 어셈블리 형태에서의 명령어 매칭과정을 명령어들의 매핑테이블을 이용하여 변환하였고, MSIL에서 자바 바이트코드의 함수와 같은 기능을 하는 메소드의 변환을 위하여 마크로 변환 기법을 사용하였다.

  • PDF

복수 모델영상의 상위도 패턴을 이용한 손형상 인식 (Hand Shape Recognition with Disparity Pattern of Multiple Model Images)

  • 이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제2권4호
    • /
    • pp.400-408
    • /
    • 1999
  • 본 논문에서는 복수 모델영상 간의 휘도치의 차이(이를 상위도라고 정의함)를 기본으로 영상매칭의 기준이 되는 "상위도 패턴"을 만드는 방법과, 이를 이용하여 입력영상과 모델영상간의 거리 계산에 의해 손의 형상을 인식하는 알고리듬에 대해 기술한다 이 방법의 특징은 인식과정에서 에지나 코너 등과 같은 기하학적 형상특징을 이용하는 것이 아니고, 영상전체를 하나의 처리단위로 하여 다수의 영상으로부터 구한 단순한 휘도치 차이를 2차원의 형상으로 패턴화 하여 인식과정에 사용한다는 점이다. 따라서 대량의 모델이 상호간에 갖는 상관관계가 인식과정에서 동시에 적용되기 때문에 대규모의 영상을 비교할 필요가 있는 인식 알고리즘의 실현에 매우 적합하다.

  • PDF

단일 카메라를 이용한 3차원 공간 정보 생성 (3D Reconstruction Using a Single Camera)

  • 권오영;서경택
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2943-2948
    • /
    • 2015
  • 경제성을 얻기 위해 단일 카메라를 이용하여 3차원 복원을 수행한 뒤 그 정보를 토대로 운전자에게 전방에 존재하는 장애물의 통과 여부를 알려줄 수 있는 운전 보조 장치에 관한 연구를 진행한다. 그 결과 depth 정보는 떨어지나 직진상의 장애물을 통과 할 수 있는 정보를 제공할 수 있다. 3차원 복원을 위해서는 내부파라미터를 측정하고, 특징점을 찾아 매칭하여 기본행렬을 계산하고 이를 토대로 삼각측량을 수행하여 얻는다. 실험을 통해 결과를 확인해 보면 depth 정보는 불완전하나, 장애물 통과 여부를 판단 할 수 있는 X, Y 축의 정보는 신뢰성을 가진다.

RLC를 이용한 지문영상의 배경 분리 (Background segmentation of fingerprint image using RLC)

  • 박정호;송종관;윤병우
    • 한국정보통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.866-872
    • /
    • 2004
  • 지문이미지에서 특징점 추출 및 매칭을 위해서 지문영역과 배경을 분리 하여야 한다. 지문영역과 배경을 분리하기 위해서 Sobel 마스크를 이용해 x축 y축의 자기의 편차와 분산을 계산해서 문턱치보다 적은 값을 분리하게 된다. 하지만 이러한 방법만으로는 지문영역과 배경이 두 영역으로 정확히 분리되기 어려우며, 이러한 결과는 지문인식에 영향을 주게 된다. 본 논문에서는 지문 이미지에서 배경을 효율적으로 분리하기 위해 RLC(Run Length Connectivity)를 이용하는 방법을 제시하였다. 제시된 방법은 지문 이미지의 분산을 계산하고 문턱치를 적용하여 이진 이미지를 구한다. 이 이진 이미지는 일반적으로 여러 개의 영역으로 분할된다. RLC를 고려하여 run이 작은 영역부터 차례로 반전 시켜서 최종적으로 2개의 영역으로 분리되는 이진 이미지를 구하게 된다. 또한, 실험을 통하여 제시된 알고리즘이 지문이미지에서 효율적으로 적용되어짐을 보인다.

SIFT를 이용한 장면전환 검출 및 필터링 기술 (Scene Change Detection and Filtering Technology Using SIFT)

  • 문원준;유인재;이재청;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.939-947
    • /
    • 2019
  • 미디어 시장의 활성화로 영상의 압축, 검색, 편집, 저작권 보호등의 필요성이 높아지고 있다. 본 논문에서는 이 모든 분야에 사용되는 영상의 장면 전환을 검출하는 방법을 제안한다. 유통 과정에서 발생 가능한 해상도 변환, 자막 삽입, 압축, 영상 반전등의 변형이 추가되더라도 동일하게 장면 전환을 검출하기 위해 전처리 과정과 SIFT를 이용한 특징점 추출, 변형을 고려한 매칭 알고리즘을 제시한다. 또한 이를 필터링 기술에 적용하여 알고리즘에서 고려한 변형 이외의 변형에도 유효함을 확인한다.

영상 검색을 위한 점진적 블록 크기 기반의 효율적인 손실 좌표 압축 기술 (Gradual Block-based Efficient Lossy Location Coding for Image Retrieval)

  • 최경민;정현일;김해광
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.319-322
    • /
    • 2013
  • MPEG-7 CDVS (Compact Descriptor for Visual Search)분야에서 표준화하고 있는 현대의 모바일 디바이스 및 서버에서 사용되는 영상검색과 매칭 알고리즘들은 SIFT(scale invariant feature transform)와 SURF(speeded up robust features) 같은 강인한 디스크립터를 기반으로 하는 특징 점에 의한 알고리즘으로 이루어진다. 이러한 특징 점들은 크게 좌표와 디스크립터로 나누어져 있다. 빠르고 정확한 검색을 위해서 특징 점들은 디바이스에서 서버, 또는 서버에서 디바이스로 자유롭게 전송이 되어야 하므로 과거에 여러 압축 알고리즘들이 제안 되었다. 이 논문에서는 특징 점들의 분포 및 연관성 등을 관찰하고 연구하여 좌표의 정보를 효율적으로 압축하면서 정확도를 보존할 수 있는 점진적 블록 크기 기반의 손실 좌표 압축 알고리즘을 제안한다. 실험 결과로부터 현재 가장 효율이 좋은 알고리즘 보다 특징 점당 비트가 평균적으로 0.3~0.4bit(5%~6%) 감소하고 정확도(TP,FP,TN)가 데이터 종류에 따라 유지되거나 미약하게 상승하는 결과를 얻었다.