• 제목/요약/키워드: feature-based warping

검색결과 50건 처리시간 0.023초

영상 분할을 이용한 반자동 제어선 정합에 의한 필드 기반 모핑 (A Field-based Morphing with Semi-automatic Control Lines Matching Using Image Segmentation)

  • 이형진;곽노윤
    • 디지털콘텐츠학회 논문지
    • /
    • 제5권4호
    • /
    • pp.269-274
    • /
    • 2004
  • 필드 기반 영상 모핑은 제어선을 지정하는 과정의 대부분을 사용자의 수작업에 의존하기 때문에 작업 시간이 많이 소요될 뿐만 아니라 양질의 결과를 얻기 위해서는 숙련을 요하는 불편함이 있다. 본 논문은 소스 영상과 목표 영상에서 모핑 대상체 쌍의 형상 정보를 획득한 상태에서 사용자가 수동으로 최소한의 특징점 쌍만을 지정하면 이렇게 지정된 특징점 쌍을 기준 삼아 다각형 기반 정점 탐색에 의해 소스 영상과 목표 영상에 상호 대응되는 제어선들을 자동적으로 설정한 후, 제어선 길이의 비율과 제어선으로부터의 이격 거리를 이용하여 영상 모핑을 수행함으로써 영상 모핑의 반자동화를 실현할 수 있는 방법을 제안한다. 제안된 방법에 따르면, 사용자가 제어선을 설정하는 시간을 단축할 수 있고 비숙련자도 최소의 제어선만을 지정하여 자연스러운 모핑 결과를 획득할 수 있는 이점이 있다.

  • PDF

Development of Audio Melody Extraction and Matching Engine for MIREX 2011 tasks

  • 송재종;장달원;이석필;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.164-166
    • /
    • 2012
  • In this paper, we proposed a method for extracting predominant melody of polyphonic music based on harmonic structure. Harmonic structure is an important feature parameter of monophonic signal that has spectral peaks at the integer multiples of its fundamental frequency. We extract all fundamental frequency candidates contained in the polyphonic signal by verifying the required condition of harmonic structure. Then, we combine those harmonic peaks corresponding to each extracted fundamental frequency and assign a rank to each after calculating its harmonic average energy. We run pitch tracking based on the rank of extracted fundamental frequency and continuity of fundamental frequency, and determine the predominant melody. For the query by singing/humming (QbSH) task, we proposed Dynamic Time Warping (DTW) based matching engine. Our system reduces false alarm by combining the distances of multiple DTW processes. To improve the performance, we introduced the asymmetric sense, pitch level compensation, and distance intransitiveness to DTW algorithm.

  • PDF

관성 센서 데이터를 활용한 3 DoF 이미지 스티칭 향상 (Enhancement on 3 DoF Image Stitching Using Inertia Sensor Data)

  • 김민우;김상균
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.51-61
    • /
    • 2017
  • 본 논문은 수평을 유지하여 촬영해야 한다는 기존 이미지 스티칭을 이용한 영상 정합 과정의 단점을 극복하기 위하여, 스마트폰의 가속도 센서와 자기장 센서 데이터를 사용하여 3가지 자유도(3 DoF)에 강인한 이미지 스티칭 방법을 제안한다. 이미지를 붙이는 작업인 이미지 스티칭은 크게 이미지 특징점 추출, 추출된 특징점에서 매칭에 필요한 참인 점(inlier)을 선별, 참인 점을 호모그래피(homography) 행렬로 변환, 호모그래피 행렬을 사용하여 이미지를 왜곡(warping), 왜곡된 이미지와 다른 이미지를 합하는 과정으로 이루어져 있다. 본 논문에서는 일반적으로 사용하는 SIFT, SURF 등의 알고리즘뿐만 아니라 MPEG에서 표준화한 MPEG-7 CDVS(Compact Descriptor for Visual Search) 표준의 특징점 추출 알고리즘을 사용하여 이미지의 특징점을 추출한다. 또한 각 알고리즘의 특징점 추출시간, 추출된 특징점 개수, 선별된 참인 점의 개수를 비교하고, 스티칭 정확도를 판단하여 본 연구에서 활용한 데이터에 어느 알고리즘이 효율적인지 살펴본다.

이동하는 단안 카메라 환경에서 이동물체 검출을 위한 격자 기반 배경 움직임 보상방법 (Lattice-Based Background Motion Compensation for Detection of Moving Objects with a Single Moving Camera)

  • 명윤석;김경환
    • 한국통신학회논문지
    • /
    • 제40권1호
    • /
    • pp.52-54
    • /
    • 2015
  • 본 논문은 이동하는 단안 카메라 환경에서 차영상 기반 이동물체 검출 시스템을 위한 새로운 배경 움직임 보상방법을 제안한다. 제안하는 방법은 특징점 대응쌍의 움직임 정보와 카메라 움직임 추정결과를 통해 입력영상에 배치한 격자점들의 배경 움직임을 추정하며 각각의 개별적인 대응 패치간의 영상워핑을 수행한다. 기존 방법과의 비교실험 결과는 약 50% 빠른 처리속도와 약 8dB 더 높은 PSNR을 보였다.

특징 점 기반의 ICP 알고리즘을 이용한 2차원 격자지도 보정 (2D Grid Map Compensation Using ICP Algorithm based on Feature Points)

  • 황요섭;이동주;유호윤;이장명
    • 제어로봇시스템학회논문지
    • /
    • 제21권10호
    • /
    • pp.965-971
    • /
    • 2015
  • This paper suggests a feature point-based Iterative Closest Point (ICP) algorithm to compensate for the disparity error in building a two-dimensional map. The ICP algorithm is a typical algorithm for matching a common object in two different images. In the process of building a two-dimensional map using the laser scanner data, warping and distortions exist in the map because of the disparity between the two sensor values. The ICP algorithm has been utilized to reduce the disparity error in matching the scanned line data. For this matching process in the conventional ICP algorithm, pre-known reference data are required. Since the proposed algorithm extracts characteristic points from laser-scanned data, reference data are not required for the matching. The laser scanner starts from the right side of the mobile robot and ends at the left side, which causes disparity in the scanned line data. By finding the matching points between two consecutive frame images, the motion vector of the mobile robot can be obtained. Therefore, the disparity error can be minimized by compensating for the motion vector caused by the mobile robot motion. The validity of the proposed algorithm has been verified by comparing the proposed algorithm in terms of map-building accuracy to conventional ICP algorithm real experiments.

임베디드 직렬 다중 생체 인식 시스템 개발에 관한 연구 (A Study on the Development of Embedded Serial Multi-modal Biometrics Recognition System)

  • 김정훈;권순량
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.49-54
    • /
    • 2006
  • 현재의 지문 인식 시스템은 지문 패턴의 복제와 지문 특징점의 해킹이라는 불안한 요소가 잠재되어 있어, 시스템 오동작의 주요 원인이 되기도 한다. 이에 본 논문에서는 신체의 일부인 지문을 주 핵심 인식기로 사용하고, 여기에 최근 널리 이용 되고 있는 화자 인증을 이용하여 직렬 형태의 다중 생체인식 시스템을 구현하였다. 구현된 시스템은 다중생체인식시스템으로 먼저 음성에 대한 인증과정이 성공하면 지문에 대한 인식과정을 수행하는 구조로 되어있다. 또한 효율적인 실시간 인증 처리를 위해 기존의 음성 인식 알고리즘 중에서 화자 종속형인 DTW(Dynamic Time Waning) 알고리즘을 사용하였으며, 지문 인식 알고리즘으로는 계산량을 고려하여 인공지능 기법인 KSOM(Kohonen Self-Organizing feature Map) 알고리즘을 적용하였다. 본 논문에서 구현한 다중생체 인식시스템을 실험한 결과 지문과 음성을 각각 이용한 단일인식시스템보다 본인거부율은 $2\~7\%$정도 떨어졌지만, 인식시스템에서 가장 중요한 요소인 타인수락율은 전혀 발생하지 않음을 확인하였다. 아울러 인식테스트 시간 또한 기존의 단일 생체 인식 시스템과 차이가 거의 없었으며, 인식에 걸린 시간은 평균 1.5초 정도였다. 이에 구현된 다중 생체 인의 시스템은 여러 가지 실험 결과 단일 인식 시스템보다 더 효율적인 보안 시스템임을 증명하였다.

인공신경망을 이용한 마커 검출 및 인식의 정확도 개선 (Enhancement of the Correctness of Marker Detection and Marker Recognition based on Artificial Neural Network)

  • 강선경;김영운;소인미;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.89-97
    • /
    • 2008
  • 본 논문에서는 인공신경망을 이용하여 사각형 형태 마커 검출 및 인식의 성능을 향상시키는 방법을 제안한다. 본 논문의 방법에서는 입력 영상으로부터 객체의 윤곽선을 찾은 다음에 선분으로 근사화한다. 근사화된 선분으로부터 기하학적 특징을 이용하여 사각형을 찾고 워핑 기법과 확대/축소 변환을 이용하여 사각형 영상을 정사각형 형태로 정규화 한다. 정사각형 형태로 정규화 한 다음에는 주성분 분석을 적용하여 특징 벡터의 크기를 줄인 다음에 인공신경망을 이용하여 마커 영상인지 아닌지를 검사한다. 마커 영상으로 판별된 영상에 대하여 인공신경망을 이용하여 마커의 종류를 인식한다. 인식 실험 결과 인공신경망을 사용함으로써 마커 검출의 오류 줄일 수 있었고 인식의 정확도를 개선할 수 있었다.

  • PDF

감정 음성 인식을 위한 강인한 음성 파라메터 (Robust Speech Parameters for the Emotional Speech Recognition)

  • 이규현;김원구
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.681-686
    • /
    • 2012
  • 본 논문에서는 강인한 감정 음성 인식 시스템을 개발하기 위하여 감정의 영향을 적게 받는 음성 파라메터에 대한 연구를 수행하였다. 이러한 목적을 위하여 다양한 감정이 포함된 데이터를 사용하여 감정이 음성 인식 시스템과 음성 파라메터에 미치는 영향을 분석하였다. 본 연구에서는 멜 켑스트럼, 델타 멜 켑스트럼, RASTA 멜 켑스트럼, 루트 켑스트럼, PLP 계수와 성도 길이 정규화 방법에서 주파수 와핑된 멜 켑스트럼 계수를 사용하였다. 또한 신호 편의 제거 방법으로 CMS 방법과 SBR 방법이 사용되었다. 실험결과에서 성도정규화 방법을 사용한 RASTA 멜 켑스트럼, 델타 멜 켑스트럼 및 CMS 방법을 사용한 경우가 HMM 기반의 화자독립 단독음 인식 실험 결과에서 가장 우수한 결과를 나타내었다.

3차원 위성영상과 센서영상의 정합에 의한 가상표적 Overlay 기법 (Virtual Target Overlay Technique by Matching 3D Satellite Image and Sensor Image)

  • 차정희;장효종;박용운;김계영;최형일
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1259-1268
    • /
    • 2004
  • 제한된 훈련장안에서 실전에 대비한 훈련이 되려면, 다양한 전투상황이 부여된 현실감 있는 모의훈련이 필수적이다. 본 논문에서는 현실감 있는 모의훈련을 위해 가상영상이 아닌 지상기반 CCD 카메라영상에 지정된 시나리오대로 가상표적을 전시하는 방법을 제안한다. 이를 위해 고해상도 GeoTIFF(Geographic Tag Image File Format) 위성 영상과 DTED(Digital Terrain Elevation Data)를 이용하여 현실감 있는 3차원 모델을 생성(운용자용)하고, 입력된 CCD 영상(운용자, 훈련자용)으로부터 도로를 추출하였다. 위성영상과 지상기반 센서영상은 관측위치, 분해능, 스케일 등에 많은 차이가 있어 특징기반 정합이 어렵다. 따라서 본 논문에서는 영상 워핑함수인 TPS(Thin-Plate Spline) 보간 함수를 일치하는 두개의 제어점 집합에 적용하여 3차원 모델에 표시된 이동경로를 따라 CCD 영상에서도 표적이 전시되는 이동 동기화 방법을 제안하였다. 실험환경은 Pentium4 1.8MHz(RAM 512M)의 PC 2대를 사용하였으며, 실험 영상은 대전지역의 위성영상과 CCD 영상을 이용, 제안한 알고리즘의 유효성을 입증하였다.

비선형 피부색 변화 모델을 이용한 실감적인 표정 합성 (Synthesis of Realistic Facial Expression using a Nonlinear Model for Skin Color Change)

  • 이정호;박현;문영식
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.67-75
    • /
    • 2006
  • 얼굴의 표정은 얼굴의 구성요소같은 기하학적 정보와 조명이나 주름 같은 세부적인 정보들로 표현된다. 얼굴 표정은 기하학적 변형만으로는 실감적인 표정을 생성하기 힘들기 때문에 기하학적 변형과 더불어 텍스처 같은 세부적인 정보도 함께 변형해야만 실감적인 표현을 할 수 있다. 표정비율이미지 (Expression Ratio Image)같은 얼굴 텍스처의 세부적인 정보를 변형하기 위한 기존 방법들은 조명에 따른 피부색의 변화를 정확히 표현할 수 없는 단점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 서로 다른 조명 조건에서도 실감적인 표정 텍스처 정보를 적용할 수 있는 비선형 피부색 모델 기반의 표정 합성방법을 제안한다. 제안된 방법은 동적 외양 모델을 이용한 자동적인 얼굴 특징 추출과 와핑을 통한 표정 변형 단계, 비선형 피부색 변화 모델을 이용한 표정 생성 단계, 유클리디 거리 변환 (Euclidean Distance Transform)에 의해 계산된 혼합 비율을 사용한 원본 얼굴 영상과 생성된 표정의 합성 등 총 3 단계로 구성된다. 실험결과는 제안된 방법이 다양한 조명조건에서도 자연스럽고 실감적인 표정을 표현한다는 것을 보인다.