• 제목/요약/키워드: 화자 위치 추적

검색결과 9건 처리시간 0.024초

Hybrid Window 알고리듬을 이용한 마이크로폰 어레이 시스템의 성능 개선 (An Enhancement of Microphone Array System Using Hybrid Window Algorithm)

  • 이학주;김기만;이원철;차일환;윤대희;이충용
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.185-188
    • /
    • 2000
  • 본 연구에서는 화자의 음성신호를 이용하여 추출된 공간정보를 통해 화자의 위치를 실시간으로 추적하는 시스템을 제안하고 실시간 구현하였다. 기존의 대표적인 화자 위치 추출 알고리듬인 CPSP(Cross Power Spectrum Phase)는 실내환경에서 심각하게 일어나는 반향신호에 취약한 단점을 갖고 있으므로 구현된 시스템에서는 위치 추적 성능 개선을 위하여 반향신호에 강인한 hybrid window 알고리듬을 제안하여 적용하였다. Hybrid window 알고리듬은 실내 환경에 적합한 hybrid window를 설계하여 수신된 음성신호에 적용함으로써 반향신호에 의한 상호 상관관계를 줄이고 직접 경로에 의한 신호들의 상관관계를 높임으로써 보다 정확한 시간 지연 추정을 가능하게 한다. 제안된 시스템의 성능분석을 위해 DSP를 이용해 실시간 구현된 하드웨어를 이용해 기존의 CPSP 알고리듬과 제안된 hybrid window를 적용한 시스템을 실제 환경에서의 실험하였고 제안한 알고리듬을 적용한 시스템이 $22\%$ 이상 성공적으로 화자의 위치를 추적하였다.

  • PDF

저주파 위상 복원 알고리듬을 이용한 화자 위치 추적 시스템의 성능 개선과 구현 (An Enhancement of Speaker Location System Using the Low-frequency Phase Restoration Algorithm and Its Implementation)

  • 이학주;차일환;윤대희;이충용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.22-28
    • /
    • 2001
  • 본 논문에서는 마이크로폰 어레이를 통해 수신한 화자의 음성신호를 이용하여 추출된 공간정보를 통해 화자의 위치를 실시간으로 추적하는 알고리듬을 개선하고 이를 실시간으로 구현하였다. 기존의 대표적인 화자 위치 추정 알고리듬인 CPSP (Cross Power, Spectrum Phase) 함수는 상호 상관관계 (Cross Correlation)가 정규화 되어있는 형태를 갖는데, CPSP 함수의 최대값 인덱스로부터 화자의 공간정보인 TDOA(Time Difference Of Arrival)를 추출하게 된다. 그러나 CPSP함수를 이용한 공간정보 추정 알고리듬은 실내환경에서 심각하게 일어나는 반향신호에 대해서 취약한 단점을 갖고 있다. 본 논문에서 제안하는 저주파 위상 복원 알고리듬은 주파수 측면에서 반향신호가CPSP함수에 미치는 영향을 분석하여 반향으로 인하여 왜곡된 위상 성분을 복원함으로써 보다 신뢰도 있는 TDOA 추정을 가능하게 한다. 반향신호로 인한 CPSP의 위상은 저주파보다 고주파에서 심하게 왜곡되는데, 각각의 반향신호의 도달 시간을 기하학적 분포를 갖는 확률변수로 모델링하여 이를 수학적으로 증명하였다. 제안한 시스템의 성능분석을 위해 DSP를 이용한 실시간 시스템을 구현하여 기존 CPSP 알고리듬과 제안된 알고리듬을 적용한 시스템을 실제 환경에서 비교 실험을 수행한 결과 제안된 알고리듬을 적용한 시스템에서 약 15샘플 이상 TDOA 추정 오차가 줄어들고 있음을 확인하였다.

  • PDF

Microsoft-Kinect 센서를 활용한 화자추적 시스템 (Microsoft-Kinect Sensor utilizing People Tracking System)

  • 반태학;이상원;김재민;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.611-613
    • /
    • 2015
  • 멀티미디어 강의실에서는 자동 강의 저장뿐 아니라 카메라의 추적도 자동으로 추적하여 저장되도록 발전하고 있다. 기존의 추적 시스템은 별도의 센서를 몸에 부착하여 추적하거나 전면에 센서를 시공하여 추적하는 불편함이 있었고 동시에 여러명이 전면에 나타나면 에러가 발생하여 추적이 안된다거나 하는 문제점이 있었다. 본 논문에서는 Microsoft-Kinect 센서를 이용하여 화자(강사)의 위치 및 행동을 분석하며, 이를 PTZ 카메라 및 강의 저장 수업녹화 시스템과 연동하여 강의실 수업 녹화시에 효과적인 콘텐츠 생산을 가능하도록 하는 무인화자 추적 솔루션에 대하여 기술하였다.

  • PDF

스테레오 시청각 기반의 화자 검출 시스템 (A Speaker Detection System based on Stereo Vision and Audio)

  • 안준호;홍광석
    • 인터넷정보학회논문지
    • /
    • 제11권6호
    • /
    • pp.21-29
    • /
    • 2010
  • 본 논문에서 다수의 사용자 중에서 현재 발성하고 있는 화자를 검출하는 스테레오 시청각 기반의 화자 검출 시스템을 제안한다. 제안한 시스템은 두 개의 마이크를 이용한 음원 위치추정, 스테레오 카메라를 이용한 영상정합 및 발화자 후보 위치 추정, 그리고 모바일 기반의 화자 검출 정보 획득으로 구성되어 있다. 스테레오 카메라로부터 획득한 화자의 영상정보를 바탕으로 Adaboost 알고리즘과 Haar-like 특징을 이용하여 발화자 후보들의 얼굴을 검출하고 이를 기반으로 삼각측량법을 이용하여 발화자 후보들의 위치를 추정한다. 그리고 2개의 마이크로부터 획득한 화자의 음성정보를 바탕으로 CPSP(Cross Power Spectrum Phase)기반의 TDOA(Time Differnce of Arrival)추정을 통해 음원의 방향을 추정한다. 최종적으로 스테레오 카메라를 통해 측정된 정보와 마이크를 통해 얻은 정보를 비교 분석하여 현재 발화자를 검출한다. 검출된 화자 정보에 대한 보다 차별화 된 서비스 제공을 위해 TCP 서버/클라이언트 구조 기반의 모바일 화자 검출 정보 획득 시스템을 구현하고 평가하였다.

얼굴 인식 및 화자 정보를 이용한 오프라인 회의 기록 지원 시스템 (Recording Support System for Off-Line Conference using Face and Speaker Recognition)

  • 손윤식;정진우;박한무;계승철;윤종혁;정낙천;오세만
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.33-37
    • /
    • 2007
  • 최근 멀티미디어 서비스는 동영상 압축 기술 및 네트워크의 발달을 기반으로 하여 다양한 응용 서비스를 제공하고 있으며, 이 중 화상 회의 시스템은 이 두 가지 기술이 효과적으로 사용된 대표적인 예이다. 원격 사용자간의 원활한 의사전달을 위해 고려된 화상회의 시스템은 효과적인 응용 서비스로 분류되고 있지만, 이러한 서비스 제공을 위한 기술을 이용하여 빈도가 훨씬 많은 일반적인 회의를 지원하는 응용서비스는 드문 편이다. 본 논문에서는 얼굴 정보와 화자 정보를 기반으로 오프라인 회의를 보조하는 시스템을 제안한다. 제안된 시스템은 소규모의 마이크와 캠을 이용하여 화자의 위치를 파악하고 캠에서 얻어진 정보를 이용하여 얼굴 영역 정보를 분석하고 인식한 후 화자 정보를 추출하여 발언자들을 추적 하여 기록하는 기능을 제공한다.

  • PDF

CPSP의 저주파 위상 복원을 이용한 화자 위치 추적 알고리듬의 성능 개선 (An Enhancement of Microphone Array System Using Hybrid Window Algorithm)

  • 이학주;김기만;이원철;이충용
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.213-216
    • /
    • 2000
  • 본 연구에서는 마이크로폰 어레이를 이용하여 화자의 음성신호로부터 화자의 위치를 추정하는 기존의 대표적인 알고리듬인 CPSP(Cross Power Spectrum Phase)로부터 보다 반향에 강인한 알고리듬인 저주파 위상 복원 알고리듬을 제안한다. CPSP 함수는 상호 상관관계(Cross Correlation)가 정규화 되어있는 형태를 갖는데, CPSP 함수의 최대 값 인덱스로부터 화자의 공간정보인 TDOA(Time Difference Of Arrival)를 추출한다. 그러나 CPSP 함수를 이용한 공간정보 추정 알고리듬은 실내환경에서 심각하게 일어나는 반향신호에 대해서 취약한 단점을 갖고 있다. 본 논문에서 제안하는 저주파 위상복원 알고리듬은 주파수 측면에서 반향신호가 CPSP 함수에 미치는 영향을 분석하여 반향으로 인하여 왜곡된 위상 성분을 복원함으로써 보다 신뢰도 있는 TDOA 추정을 가능하게 한다. 반향신호로 인한 CPSP의 위상은 저주파보다 고주파에서 심하게 왜곡되는데, 각각의 반향신호의 도달 시간을 기하학적 분포를 갖는 확률변수로 모델링하여 이를 수학적으로 증명하였다. 또한 실제 환경에서 채집한 음성신호를 이용한 모의 실험을 통해 개선된 알고리듬의 성능 개선을 확인하였다.

  • PDF

마이크로폰 배열 구조를 이용한 음원의 위치 측정에 관한 연구 (A Study on Sound Source Localization Using a Microphone Array)

  • 김진성;김도윤;유범재;김광배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 제36회 하계학술대회 논문집 D
    • /
    • pp.2753-2755
    • /
    • 2005
  • 최근 들어 공장에서만 사용되는 로봇을 탈피하여, 사람과 함께 생활하면서 서비스를 제공할 수 있는 인간 친화적인 로봇이 전 세계적으로 개발되고 있다. 인간과 자연스런 상호작용을 위하여, 화자를 바라보고, 깨끗한 음성신호를 얻는 과정에서 음원의 위치 추적은 필연적이다. 본 연구는 마이크로폰에 도달되는 동일 신호의 도착시간지연(Time Delay of Arrival)정보를 이용하여, 음원 위치를 구하는 기존의 수학적인 방법론[1]을 소개하고 검토한다. 모의실험을 통하여, 방법론[1]이 허상음원을 생성하는 음원 위치 측정임을 보인다.

  • PDF

얼굴 인식 및 화자 정보를 이용한 오프라인 회의 기록 지원 시스템 (Recording Support System for Off-Line Conference using Face and Speaker Recognition)

  • 손윤식;정진우;박한무;계승철;윤종혁;정낙천;오세만
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.66-71
    • /
    • 2008
  • 최근 멀티미디어 서비스는 동영상 압축 기술 및 네트워크의 발달을 기반으로 하여 다양한 응용 서비스를 제공하고 있으며, 이 중 화상 회의 시스템은 이 두 가지 기술이 효과적으로 사용된 대표적인 예이다. 원격 사용자간의 원활한 의사전달을 위해 고려된 화상회의 시스템은 효과적인 응용 서비스로 분류되고 있지만, 이러한 서비스 제공을 위한 기술을 이용하여 빈도가 훨씬 많은 일반적인 회의를 지원하는 응용서비스는 드문 편이다. 본 논문에서는 얼굴 정보와 화자 정보를 기반으로 오프라인 회의를 보조하는 시스템을 제안한다. 제안된 시스템은 3개의 마이크와 웹캠을 이용하여 화자의 위치를 파악하고 웹캠에서 얻어진 정보를 이용하여 얼굴 영역 정보를 분석하고 인식한 후 화자 정보를 추출하여 발언자들을 추적하여 기록하는 기능을 제공한다.

안구이동추적을 통해 살펴본 관계절의 통사처리 과정 (Processing of syntactic dependency in Korean relative clauses: Evidence from an eye-tracking study)

  • 이미선;용남석
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.507-533
    • /
    • 2009
  • 관계절의 공백과 채움어의 의존관계(gap-filler dependencies)가 어떻게 해결되는지에 대한 가설은 '채움어촉발 처리전략(filler-driven parsing strategy)'과 '공백촉발 처리전략(gap-driven parsing strategy)'으로 요약할 수 있다. 두 가설의 언어보편적 타당성을 알아보기 위해, 본 연구는 안구이동추적법(eyetracking)을 이용하여, 한국어 화자들이 후핵언어(head-final language)인 한국어의 주격관계절과 여격관계절을 실시간으로 처리하는 과정을 살펴보았다. 그 결과, 피험자들이 관계절 내 공백의 위치에서 채움어에 상응하는 그림을 거의 응시하지 않았으나, 관계사와 결합한 관계절동사를 들은 시점부터는 채움어 그림을 응시하는 비율이 큰 폭으로 증가하기 시작하여 머리어를 들은 시점에서 가장 많이, 가장 오래 채움어 그림을 응시하였다. 이 결과는 공백이 관계절의 처리를 촉발하는 것이 아니라, 관계사와 결합한 관계절 동사에서 관계절의 통사처리가 시작되어 채움어가 인지된 시점에서 완성됨을 보여주는 것이다. 또한 주격관계절과 여격관계절 간의 상이한 안구이동 양상은 관계절 내의 논항과 결합한 격조사의 통사정보에 기인하는 것으로 보여서, 한국어의 관계절은 채움어촉발 처리전략을 따르기는 하지만 영어와 같은 선핵언어와는 다른 처리전략이 사용됨을 알 수 있다.

  • PDF