• 제목/요약/키워드: feature-based tracking

검색결과 315건 처리시간 0.027초

증강현실을 위한 히스토그램 기반의 손 인식 시스템 (Histogram Based Hand Recognition System for Augmented Reality)

  • 고민수;유지상
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1564-1572
    • /
    • 2011
  • 본 논문에서는 증강현실을 위한 히스토그램 기반의 손 인식 기법을 제안한다. 손동작 인식은 사용자와 컴퓨터 사이의 친숙한 상호작용을 가능하게 한다. 하지만, 비젼 기반의 손동작 인식은 복잡한 손의 형태로 인한 관찰 방향 변화에 따른 입력 영상의 다양함으로 인식에 어려움이 따른다. 따라서 본 논문에서는 손의 형태적인 특징을 이용한 새로운 모델을 제안한다. 제안하는 기법에서 손 인식은 카메라로부터 획득한 영상에서 손 영역을 분리하는 부분과 인식하는 부분으로 구성된다. 카메라로부터 획득한 영상에서 배정을 제거하고 피부색 정보를 이용하여 손 영역을 분리한다. 다음으로 히스토그램을 이용하여 손의 특징점을 구하여 손의 형태를 계산한다. 마지막으로 판별된 손인식 정보를 이용하여 3차원 객체를 제어하는 증강현실 시스템을 구현하였다. 실험을 통해 제안한 기법의 구현 속도가 빠르고 인식률도 91.7%로 비교적 높음을 확인하였다.

개별차량 주행패턴 분석을 통한 교통사고 위험도 분석 기법 (Methodology for Evaluating Collision Risks Using Vehicle Trajectory Data)

  • 김준형;송태진;오철;성낙문
    • 대한교통학회지
    • /
    • 제26권5호
    • /
    • pp.51-62
    • /
    • 2008
  • 최근 각종 센서 및 통신기술의 발달은 다양한 교통류의 정보를 실시간으로 수집하고 관리, 제공 할 수 있는 환경을 제공하게 되었다. 본 연구에서는 이러한 실시간 모니터링 환경에서 차량추종 및 차로변경 이벤트 발생 시 안전도를 평가할 수 있는 방법론을 개발하였다. 이를 위해 이미지 트랙킹을 통해 추출된 개별차량 주행 정보와 기존 교통상충분석기법을 응용하였다. 차량 간 안전거리 개념을 반영한 RSI(Real-time Safety Index)와 첨단안전차량의 효과 및 성능평가 등에 주로 사용되는 TTC(Time-to-Collision), 모멘텀 보존의 법칙을 이용한 충돌에너지 개념을 추출된 개별차량의 주행정보에 적용하여 교통사고 위험도를 분석하였다. 본 연구에서 제시된 방법론은 향후 교통사고 분석 및 실시간 안전평가를 위한 자료수집이 가능한 검지시스템의 개발과 평가 등에 효과적으로 활용될 것으로 기대된다.

스마트폰을 이용한 위치정보기반 AR 시스템에서의 부정합 현상 최소화를 위한 기법 (Error Correction Scheme in Location-based AR System Using Smartphone)

  • 이주용;권준식
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.179-187
    • /
    • 2015
  • 스마트폰의 보급 확산으로 다양한 콘텐츠가 등장하고 있다. 이러한 콘텐츠 중에서 위치 기반 서비스를 이용한 증강현실 응용프로그램의 필요성이 널리 대두되고 있다. 본 논문에서는 안드로이드 스마트폰을 이용한 위치정보기반 AR 시스템에서 발생하는 정합 오차를 컴퓨터 비전 기술을 이용하여 효과적으로 줄이는 방법을 제안한다. 위치정보 오차 누적 때문에 객체가 정확하게 정합되지 않는 부정합 현상 최소화를 위해 연산 속도는 유지하면서 연산량을 줄여 성능을 향상한 방법인 SURF(Speeded Up Robust Features)를 사용해 초기 특징점을 검출하고 검출된 특징점을 추적하여 모바일 환경에 적용한다. 위치정보 검색을 위해 GPS 정보를 사용하고 자세추정 및 방향 정보를 위해 자이로 센서, G-센서 등을 이용한다. 하지만 위치정보의 누적된 오차는 객체가 고정되지 않는 부정합 현상을 유발한다. 또한, 증강현실 기술은 구현하면서 많은 연산량이 필요하므로 모바일 환경에서 구현하는데 어려움이 발생한다. 제안된 방법은 모바일 환경에서 성능 저하를 최소화하고 비교적 간단하게 구현할 수 있어 기존 시스템 및 다양한 모바일 환경에서 유용하게 이용될 수 있다.

동공과 글린트의 특징점 관계를 이용한 시선 추적 시스템 (Gaze Tracking System Using Feature Points of Pupil and Glints Center)

  • 박진우;권용무;손광훈
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.80-90
    • /
    • 2006
  • 본 논문에서는 한 대의 카메라와 푸르킨예 영상을 이용한 간편한 2차원 시선 추적 시스템을 제안한다. 이 시스템은 사용자의 한쪽 눈 영상을 얻기 위해 적외선 필터가 장착된 카메라와, 사용자가 모니터 상에 바라보고 있는 응시 점을 알아내기 위해 각 막의 표면에 반사점을 만들기 위한 두 개의 적외선 광원이 사용되었다. 카메라나 적외선 광원, 사용자의 머리는 자유롭게 움직일 수 있다. 따라서 본 시스템은 여타 불편한 고정된 장치나 사용자의 머리 고정이 필요 없는 간단하고 유연성 있는 시스템이다. 본 시스템은 또한 간편하고 정확한 사용자 캘리브레이션 과정을 포함하고 있다. 시스템을 사용하기에 앞서, 각 사용자는 각 사용자는 시스템이 시선 추적 알고리즘 상의 개인 요소들을 초기화할 수 있도록 두 개의 점을 잠시 바라보기만 하면 된다. 제안된 시스템은 XGA $(1024{\sim}768)$ 해상도에서 10 fps 이상 실시간으로 동작된다. 3명의 피 실험자와 9개의 실험 물체로 진행된 실험 결과는 시스템이 평균 l도의 시선 추적 오차를 보여 주고 있다.

Georeferencing 동영상정보를 이용한 건축물안전관리 (Building Safety Management using Georeferencing Video Data)

  • 박기연;김기태;손덕재;유환희
    • 대한공간정보학회지
    • /
    • 제17권3호
    • /
    • pp.81-87
    • /
    • 2009
  • 본 연구는 GPS기반의 비디오시스템에 의해 노후 건축물을 어떻게 효과적으로 관리할 것인가에 연구목적을 두고 수행되었다. 휴대용 GPS기반 비디오시스템에 의한 Georeferencing 비디오자료는 신속한 검색과 도시지역의 복잡다양한 노후건축물을 효과적으로 관리하는데 도움을 주며 다음과 같은 결론을 얻었다. Georeferencing 자료는 비디오와 GPS가 연계되어 관측위치를 추적할 수 있고 건물의 안전진단을 위한 균열정보를 제공하며, 균열정보는 연속영상의 특징점 추적과 영상모자�掠茱珦� 융합된 방법에 의해 측정되도록 제시하였다. 본 연구를 통해 Georeferencing 비디오 기술은 건물안전진단을 위해 보다 효율적인 정보를 제공할 수 있어서 도시건축물관리에 유용한 기술로 사용될 것으로 판단된다.

  • PDF

얼굴 및 눈 위치 추적을 통한 IPTV 화면 인터페이스 제어에 관한 연구 (A Study on Controlling IPTV Interface Based on Tracking of Face and Eye Positions)

  • 이원오;이의철;박강령;이희경;박민식;이한규;홍진우
    • 한국통신학회논문지
    • /
    • 제35권6B호
    • /
    • pp.930-939
    • /
    • 2010
  • 최근 HCI 분야에서 사용자의 시선 추적을 통해 보다 편리한 입력 장치를 개발하려는 연구가 활발히 진행되고 있다. 하지만 기존의 시선 추적 방법들은 부가적인 사용자 착용형 장비를 필요로 하거나 원거리에서 작동되지 않는 문제 등으로 인해 IPTV 환경에서 적용하기 어려운 실정이다. 이에 본 연구에서는 사용자 착용없이 고정된 하나의 카메라를 이용하여 얼굴을 취득하고, 취득된 얼굴 영역 내에서 눈의 위치를 검출하여 IPTV의 화면 인터페이스를 제어할 수 있는 새로운 방법을 제안한다. 또한, Adaboost 방법으로 얼굴이나 눈이 성공적으로 검출되지 못했을 경우에도, 계층적 KLT (Kanade-Lucas-Tomasi)특징 추적 방법을 통해 구해진 모션 벡터를 이용하여 화면 인터페이스를 제어할 수 있는 방법을 제안한다. 이처럼, 본 논문의 방법은 기존의 방법과는 달리 실제 IPTV의 시청거리인 2m 정도의 원거리에서도 사용가능하며, 카메라 이외에 별도의 장치를 착용할 필요가 없으므로 편의성이 높고 얼굴 움직임의 제약이 없다는 장점이 있다. 실험결과, 입력되는 얼굴 영상을 초당 15프레임의 속도로 실시간 처리함을 확인할 수 있었으며, 기존 입력 장치의 역할을 충분히 대신할 수 있음을 알 수 있었다.

큰 수의 법칙 시뮬레이션에서 중학생의 안구 운동 분석 (An Analysis of Middle School Student's Eye Movements in the Law of Large Numbers Simulation Activity)

  • 최인용;조한혁
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제56권3호
    • /
    • pp.281-300
    • /
    • 2017
  • This study analyzed the difficulties of middle school students in computer simulation of the law of large numbers through eye movement analysis. Some students did not attend to the simulation results and could not make meaningful inferences. It is observed that students keep the existing concept even though they observe the simulation results which are inconsistent with the misconceptions they have. Since probabilistic intuition influence student's thinking very strongly, it is necessary to design a task that allows students to clearly recognize the difference between their erroneous intuitions and simulation results. In addition, we could confirm through eye movements analysis that students could not make meaningful observations and inferences if too much reasoning was needed even though the simulation included a rich context. It is necessary to use visual representations such as graphs to provide immediate feedback to students, to encourage students to attend to the results in a certain intentional way to discover the underlying mathematical structure rather than simply presenting experimental data. Some students focused their attention on the visually salient feature of the experimental results and have made incorrect conclusion. The simulation should be designed so that the patterns of the experimental results that the student must discover are not visually distorted and allow the students to perform a sufficient number of simulations. Based on the results of this study, we suggested that cumulative relative frequency graph showing multiple results at the same time, and the term 'generally tends to get closer' should be used in learning of the law of large numbers. In addition, it was confirmed that eye-tracking method is a useful tool for analyzing interaction in technology-based probabilistic learning.

손의 기하학적인 특성을 적용한 실시간 비전 기반 증강현실 시스템 (A Real-time Augmented Reality System using Hand Geometric Characteristics based on Computer Vision)

  • 최희선;정다운;최종수
    • 한국멀티미디어학회논문지
    • /
    • 제15권3호
    • /
    • pp.323-335
    • /
    • 2012
  • 본 논문에서는 손을 이용한 컴퓨터 비전 기술 기반의 증강 현실 시스템을 제안한다. 입력 영상에 가상의 물체를 정합하기 위해서는 정확한 특징점 추출과 추적 기술이 중요하다. 기존의 마커를 이용한 증강현실 시스템은 매우 안정성이 있지만 마커가 없이는 증강이 불가능하고 증강된 물체를 조작하는데 제한적인 상황을 제공하는 경향이 있다. 제안한 시스템은 손의 기하학적인 특성을 고려하여 적응적 최적 타원 검출 방법을 통해 손끝점을 특징점으로 추출한다. 그리고 손바닥 중심점을 기준으로 한 최단 거리 검출 방법을 이용하여 손끝점의 움직임을 추출해 가상의 객체를 안정적으로 정합한다. 실험을 통하여 특징점 추출이 약 82.0%의 정확도를 보였고 특징점 판별과 추적 성능 평가에서는 단지 약 1.8%와 2.0%의 오류를 보였다. 또한 제안한 시스템이 가상 객체의 안정적인 증강 측면에서, 효과적으로 카메라 사영 행렬을 획득하여 마커를 이용한 시스템을 대체할 수 있음을 확인하였다.

A Novel Two-Level Pitch Detection Approach for Speaker Tracking in Robot Control

  • Hejazi, Mahmoud R.;Oh, Han;Kim, Hong-Kook;Ho, Yo-Sung
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.89-92
    • /
    • 2005
  • Using natural speech commands for controlling a human-robot is an interesting topic in the field of robotics. In this paper, our main focus is on the verification of a speaker who gives a command to decide whether he/she is an authorized person for commanding. Among possible dynamic features of natural speech, pitch period is one of the most important ones for characterizing speech signals and it differs usually from person to person. However, current techniques of pitch detection are still not to a desired level of accuracy and robustness. When the signal is noisy or there are multiple pitch streams, the performance of most techniques degrades. In this paper, we propose a two-level approach for pitch detection which in compare with standard pitch detection algorithms, not only increases accuracy, but also makes the performance more robust to noise. In the first level of the proposed approach we discriminate voiced from unvoiced signals based on a neural classifier that utilizes cepstrum sequences of speech as an input feature set. Voiced signals are then further processed in the second level using a modified standard AMDF-based pitch detection algorithm to determine their pitch periods precisely. The experimental results show that the accuracy of the proposed system is better than those of conventional pitch detection algorithms for speech signals in clean and noisy environments.

  • PDF

하모닉 구조를 이용한 다성 음악의 주요 멜로디 검출 (Extracting Predominant Melody from Polyphonic Music using Harmonic Structure)

  • 윤제열;이석필;서경학;박호종
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.109-116
    • /
    • 2010
  • 본 논문에서는 하모닉 구조를 이용하여 다성 음악의 주요 멜로디를 검출하는 방법을 제안한다. 다성 음악은 다수의 음원을 동시에 포함하므로 주요 멜로디를 검출하기 위하여 다중 기본 주파수를 추출하고 각 기본 주파수의 성질을 기반으로 주요 멜로디를 구하는 과정으로 구성된다. 하모닉 구조는 기본 주파수의 배음관계를 나타내고 단일 음원 신호의 중요한 특성 파라미터이다. 따라서 제안하는 방법은 하모닉 구조의 정확도를 기준으로 다성 음악에 존재하는 모든 기본 주파수 후보를 추출하고, 추출된 기본 주파수 후보에 대하여 하모닉 성분을 조합하여 하모닉 평균 에너지를 구하여 기본 주파수 후보의 중요도 순위를 결정한다. 마지막으로 기본 주파수 후보의 순위와 기본 주파수의 연속성을 기반으로 피치 트래킹을 진행하여 최종 주요 멜로디에 해당하는 기본 주파수를 검출한다. 제안한 방법의 성능을 ADC 2004 DB와 가요 100곡에 대하여 MIREX 2005 측정 방법에 따라 측정하였으며, ADC 2004 DB에 대하여 90.42%의 검출 정확도를 가진다.