• 제목/요약/키워드: Feature-based Warping

검색결과 51건 처리시간 0.026초

윤곽선 기반 메쉬 최적화를 이용한 효율적인 스테레오 영상 데이터 표현 (Efficient Data Representation of Stereo Images Using Edge-based Mesh Optimization)

  • 박일권;변혜란
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.322-331
    • /
    • 2009
  • 본 논문은 윤곽선 기반 메쉬 최적화를 이용한 스테레오 영상의 효율적인 데이터 표현 방법을 제안한다. 스테레오 영상에 대한 메쉬 기반 2차원 워핑은 주로 제어점 선택과 선택된 제어점들의 시차 정보 추정 성능에 의존한다. 따라서 제안된 방법은 제어점 선택을 위하여 강한 윤곽선과 객체의 경계선만으로 구성된 특징 지도를 생성하고 이를 기반으로 격자형 메쉬를 생성한다. 또한, 지역단위로 2차원 워핑을 수행하며 목적영상과의 오차를 최소로 하는 제어점의 위치를 반복적으로 추정하게 된다. 최적화된 제어점 위치를 찾기 위한 반복적 2차원 워핑 과정은 많은 계산 시간을 요구하기 때문에 이를 개선하기 위하여 입력된 스테레오 영상은 수평 시차만 존재하고 최적의 제어점 위치는 객체의 경계선을 포함한 윤곽선 위에 존재함을 가정한다. 따라서 제안한 윤곽선 기반 워핑 방법은 수평선 위에 윤곽선만을 따라 반복적으로 최적화된 제어점 위치를 탐색한다. 본 논문의 실험에서는 스테레오 영상에 대하여 제어점 수에 따른 신호에 대한 잡음비(PSNR)를 측정하여 기존 방법과 제안한 방법의 품질을 비교 하였다. 뿐만 아니라 최적의 메쉬 생성을 위한 수행시간을 비교하여 평가하였다. 실험 결과를 통하여 제안한 방법은 적은 수의 제어점을 이용하여 품질의 저하를 줄이고 빠르게 최적의 메쉬를 생성함으로써 효율적인 스테레오 영상 표현 방법을 제공하였다.

DTW와 퓨전기법을 이용한 비유사도 기반 분류법의 최적화 (On Optimizing Dissimilarity-Based Classifications Using a DTW and Fusion Strategies)

  • 김상운;김승환
    • 전자공학회논문지CI
    • /
    • 제47권2호
    • /
    • pp.21-28
    • /
    • 2010
  • 본 논문에서는 동적시간교정법(dynamic time warping: DTW)과 다중퓨전기법(multiple fusion strategy: MFS)을 연속 적용하여 비유사도기반 분류법(dissimilarity-based classification: DBC)을 최적화시키는 방법의 실험결과를 보고한다. DBC란 샘플패턴을 분류하기 위하여 샘플의 특징 값을 이용하는 대신에 샘플들 사이의 비유사도를 측정하여 분류기를 설계하는 방법이다. DTW에서는 다음과 같이 두 단계로 나누어 비유사도를 측정한다. 먼저 상관계수를 이용하여 객체 샘플들을 대응시키기 위한 최적의 대응경로를 찾을 수 있도록 샘플들을 조정한다. 그리고 기존의 거리측정법으로 조정된 샘플들 사이의 비유사도를 측정한다. MFS에서는 분류기결합 뿐만 아니라 비유사도 행렬생성에서도 퓨전기법을 적용한다. 즉, DTW 기법으로 작성한 다수의 비유사도 행렬들을 결합하여 새로운 비유사도 행렬을 생성한 다음, 이 행렬공간에서 여러 개의 베이스 분류기를 학습하여 다시 결합한다. 본 논문에서 제안한 방법을 벤취마크 영상 데이터베이스를 대상으로 실험한 결과, 기존의 방법과 비교하여 분류성능을 향상시킬 수 있음을 확인하였다. 이와 같은 실험결과로 볼 때, 제안 방법을 멀티미디어 정보검색 등과 같은 다른 고차원 응용에도 활용할 수 있을 것으로 사료된다.

Tiled Stereo Display System for Immersive Telemeeting

  • Kim, Ig-Jae;Ahn, Sang-Chul;Kim, Hyoung-Gon
    • Journal of Information Display
    • /
    • 제8권4호
    • /
    • pp.27-31
    • /
    • 2007
  • In this paper, we present an efficient tiled stereo display system for tangible meeting. For tangible meeting, it is important to provide immersive display with high resolution image to cover up the field of view and provide to the local user the same environment as that of remote site. To achieve these, a high resolution image needs to be transmitted for reconstruction of remote world, and it should be displayed using a tiled display. However, it is hard to transmit high resolution image in real time due to the limit of network bandwidth, and so we receive multiple images and reconstruct a remote world with received images in advance. Then, we update only a specific area where remote user exists by receiving low resolution image in realtime. We synthesize the transmitted image to the existing environmental map of remote world and display it as a stereo image. For this, we developed a new system which supports GPU based real time warping and blending, automatic feature extraction using machine vision technique.

바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템 (Phoneme Similarity Error Correction System using Bhattacharyya Distance Measurement Method)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.73-80
    • /
    • 2010
  • 어휘 인식 시스템은 부정확한 어휘 제공과 유사한 음소 인식으로 인식률이 저하되며 이는 유사한 음소인식 오인식과 효율적 특징 추출 처리를 위한 방법을 필요로 한다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템을 제안하였다. 음소 유사율은 모노폰으로 훈련시킨 훈련 데이터의 음소에 HMM 특징 추출 방법을 이용하였으며 유사한 음소는 바타챠랴 거리 측정법을 이용하여 정확한 음소로 인식할 수 있도록 유도하여 인식률 향상 효과를 얻을 수 있었다. 이를 유클리디안 거리 측정법과 동적타임 워핑 시스템에 비교한 시스템 성능 평가 결과 1.2%의 향상된 97.91% 인식률을 보였다.

DTW 거리 기반 kNN을 활용한 시계열 데이터 정보 추출 및 회귀 예측 (Exploring Time Series Data Information Extraction and Regression using DTW based kNN)

  • 양현준;임채국;정우혁;우지환
    • 경영정보학연구
    • /
    • 제26권2호
    • /
    • pp.83-93
    • /
    • 2024
  • 본 연구는 도금욕 공정의 완성도 예측을 위한 시계열 데이터의 효과적인 표현을 목표로, Dynamic Time Warping(DTW) 및 k-Nearest Neighbors(kNN) 기반의 전처리 방법론을 제안한다. 제안된 DTW 기반 kNN 전처리 방법을 다양한 회귀 모델에 적용하여 비교한 결과, 기존 결정 나무(Decision tree) 대비 최대 RMSE에서 43%과 MAE에서 24% 개선된 성능 향상을 보였으며, 신경망 구조를 갖는 회귀 모델과 결합했을 때 성능 향상이 두드러졌다. 본 논문에서 제안하는 전처리 방법과 회귀 모델을 결합한 구조는 길이가 긴 시계열 데이터와 제한된 데이터 샘플이 있는 상황에서 적합할 것으로 사료되며, 데이터가 부족한 상황에서도 과적합의 위험을 감소시키며, 합리적인 예측을 가능하게 함을 시사한다. 그러나 DTW 및 kNN 알고리즘은 데이터 샘플이 많아질수록 연산량이 늘어난다는 한계가 존재하며, 향후 연구를 통해 이러한 계산 효율성의 문제를 개선할 수 있는 연구가 필요할 것으로 보인다.

GPU를 이용한 특징 기반 영상모핑의 가속화 (Acceleration of Feature-Based Image Morphing Using GPU)

  • 김은지;윤승현;이지은
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제20권2호
    • /
    • pp.13-24
    • /
    • 2014
  • 본 논문에서는 특징 기반 영상모핑(feature-based image morphing)을 위한 GPU (Graphics Processing Unit) 기반의 가속화 기법을 제시한다. 제안된 기법은 모핑과정에서 픽셀과 제어선 사이의 최단거리를 효율적으로 계산하기 위해 그래픽스 하드웨어의 깊이 버퍼(depth-buffer)를 이용한다. 먼저 원본영상(source image)과 최종영상(destination image)에 사용자입력을 통해 특징을 표현하는 제어선들을 지정하고, 각 제어선의 거리함수(distance function)를 서로 다른 색상을 갖는 두개의 사각형과 원뿔로 렌더링한다. 그래픽스 파이프라인(graphics pipeline)을 통해 각 픽셀에서 가장 가까운 제어선까지의 거리는 깊이 버퍼에 저장되고, 이는 모핑연산을 효율적으로 수행하는데 사용된다. 본 논문에서는 픽셀 단위의 모핑 연산을 CUDA(Compute Unified Device Architecture)를 이용하여 병렬화함으로써 모핑의 속도를 더욱 향상시키며, 다양한 크기의 입력영상에 대하여 각각 CPU와 GPU를 이용한 영상모핑 실험을 통해 제안된 기법의 효율성을 입증한다.

역전가능 메쉬워프 알고리즘에 의한 정면 얼굴 영상의 포즈 변형 (Pose Transformation of a Frontal Face Image by Invertible Meshwarp Algorithm)

  • 오승택;전병환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.153-163
    • /
    • 2003
  • 본 논문에서는 기하학적인 3차원 모델을 사용하지 않고 정면이 얼굴 영상 및 2차원 메쉬만으로 얼굴의 포즈 변형을 수행하는 영상기반 렌더링(Image Based Rendering; IBR) 기법을 제안한다. 3차원 기하학적 모델을 대신하기 위해, 먼저 표준 인물의 정면, 좌우 반측면, 좌우 측면의 얼굴 영상에 대한 표준 메쉬를 작성한다. 합성하고자 하는 임의의 인물에 대해서는 주어진 정면 얼굴 영상의 메쉬만을 작성하고, 그 밖의 메쉬는 표준 메쉬 집합을 근거로 자동 생성된다. 그런 다음, 메쉬 제어점들의 중첩 및 역전을 허용하도록 개선한 역전가능 메쉬워프 알고리즘(invertible meshwarp algorithm)을 이용하여 얼굴의 입체적인 회전 변형을 수행한다. 또한, 눈이나 입의 개폐 변형도 동일한 워핑 알고리즘으로 구현한다. 얼굴 변형 성능을 평가하기 위해, 총 10명으로부터 머리를 수평으로 회전하면서 동영상을 취득한 후, 실제 영상과 변형 영상마다 양 눈의 중간 위치인 기준점에서 각 특징점까지의 거리를 계산하여 평균 차이를 구하였다. 그 결과, 기준점에서 입의 중간 위치까지의 거리에 비해 약 7.0%의 평균 위치 오차만이 발생하였다.

고음질을 갖는 음색변경에 관한 연구 (A Study on the Voice Conversion Algorithm with High Quality)

  • 박형빈;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.157-160
    • /
    • 2000
  • In the generally a voice conversion has used VQ(Vector Quantization) for partitioning the spectral feature and has performed by adding an appropriate offset vector to the source speaker's spectral vector. But there is not represented the target speaker's various characteristics because of discrete characteristics of transformed parameter. In this paper, these problems are solved by using the LMR(Linear Multivariate Regression) instead of the mapping codebook which is determined to the relationship of source and target speaker vocal tract characteristics. Also we propose the method for solved the discontinuity which is caused by applying to time aligned parameters using Dynamic Time Warping the time or pitch-scale modified speech. In our proposed algorithm for overcoming the transitional discontinuities, first of all, we don't change time or pitch scale and by using the LMR change a speaker's vocal tract characteristics in speech with non-modified time or pitch. Compared to existed methods based on VQ and LMR, we have much better voice quality in the result of the proposed algorithm.

  • PDF

Chessboard and Pieces Detection for Janggi Chess Playing Robot

  • Nhat, Vo Quang;Lee, GueeSang
    • International Journal of Contents
    • /
    • 제9권4호
    • /
    • pp.16-21
    • /
    • 2013
  • Vision system is an indispensable part of constructing the chess-playing robot. Chessboard detection and pieces localization in the captured image of robot's camera are important steps for processes followed such as pieces recognition, move calculation, and robot controlling. We present a method for detecting the Janggi chessboard and pieces based on the edge and color feature. Hough transform combined with line extraction is used for segmenting the chessboard and warping it to form the rectangle shape in order to detect and interpolate the lines of chessboard. Then we detect the existence of pieces and their side by applying the saliency map and checking the color distribution at piece locations. While other methods either work only with the empty chessboard or do not care about the piece existence, our method could detect sufficiently side and position of pieces as well as lines of the chessboard even if the occlusion happens.

Simple Application Cases of Morphing Method using Geo-spatial Data

  • Lee, Ki-Won;Park, Yong-Jae
    • 대한원격탐사학회지
    • /
    • 제24권3호
    • /
    • pp.251-256
    • /
    • 2008
  • Morphing method, one of classic image processing algorithms, has been used in various application fields. The motivation of this work is to investigate its applicability in consideration to geo-spatial data including airborne or space-borne images. For this purpose, the Beier and Neely morphing algorithm is tentatively implemented in the form of a prototype with user interface. As the results, this feature-based morphing with paired image sets can be used for general users: image simulation using two or more images and construction of color-blending image between source image and destination image in different types. Some simple application cases were demonstrated. This scheme is the simple and useful approach for those who want to utilize both geo-spatial data sets and airborne/space-borne image sets.