• 제목/요약/키워드: 끝점 검출

검색결과 74건 처리시간 0.03초

최소자승법과 전 처리를 이용한 원호 검출의 간단한 접근 (A simple approach for circular Arc detection using a least squares fitting and preprocessing)

  • ;김종남
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.840-843
    • /
    • 2016
  • 원호는 산업 환경에서 객체의 검출 및 인식에 매우 유용한 특성이다. 본 논문에서는 새로운 원호 검색 방법을 제안한다. 원호 검출은 중점과 원호의 반지름, 두 개의 호 끝점이 필요하다. 제안하는 새로운 검출 방법은 호를 따라 지정한 세 점을 이용하여 가장 좋은 부분을 결정한다. 최소자승법을 적용하여 원호의 최적점과 중점 그리고 반지름을 얻는다. 남은 모서리 점들의 거리와 반지름은 원호의 두 끝점을 찾는데 이용된다.

  • PDF

Keyword spotting에서의 후처리 과정에 관한 연구 (A Study on the Postprocessing In Keyword Spotting)

  • 송화전
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.249-252
    • /
    • 1994
  • Keyword spotting 이란 음성인식의 한 분야로서 컴퓨터가 사람의 음성을 입력받아 이 음성에 미리 정해진 특정단어 또는복수개의 단어들 중 어느 것이 포함되어 있는지의 여부를 찾아내고 이 단어를 식별해 내는 작업을 의미한다. 이러한 keyword spotting 시스템의 인식 오류들을 감소시키는 방법의 하나로 keyword spotting 시스템에 후처리 과정을 둠으로써 잘못 검출된 keyword 들을 제거시키는 방법이 사용될 수 있다. 본 논문에서는 keyword로 검출된 영역에 대한 keyword 모델의 likeihood와 그 여역에 대한 filler 모델의 likelihood의 ratio 와 second best keyword 의 likelihood 그리고, 끝점존재 영역의 구간 길이등 여러 가지 정보를 이용한 후처리과정을 검토하고 인식실험을 통해 이들의 성능을 비교하였다. 6개의 부서명을 keyword로 하는 불특정 화자 keyword spotting 실험을 수행한 결과 baseline 시스템의 경우 고립단어 및 문장 형태의 음성에 대해 95.0%의 keyword 인식률을 얻었으며, 본 논문에서 검토된 네 가지 후처리 방법에 의해 keyword rejection ratio를 0%에서 5%까지 변화시켜 나갈 경우 최저 95.3%에서 최고 97.1%까지 keyword 인식률이 향상된 결과를 얻었다. 특히 성능과 계산량을 종합적으로 고려할 때 끝점 존재 영역의 구간 길이 정보를 이용한 방법이 가장 우수하였다.

  • PDF

이산 HM을 이용한 실시간 음성인식 다이얼링 시스템 개발 (Development of a Read-time Voice Dialing System Using Discrete Hidden Markov Models)

  • 이세웅;최승호;이미숙;김홍국;오광철;김기철;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.89-95
    • /
    • 1994
  • 본 논문에서는 화자독립으로 100단어를 인식할 수 있는 실시간 음성인식 다이얼링 시스템의 개발에 대하여 기술하였다. 이 시스템에서 음성인식 알고리즘은 전화선 인터페이스를 갖춘 DSP 보드상에 구현되었으며, IBM PC AT/486 상에서 작동된다. DSP 보드에서는 단어의 시작점이 검출된 후에 특징추출, 벡터양자화 그리고 끝점검출 과정이 실시간으로 10 msec의 프레임 구간마다 수행된다. 또한, 본 시스템에서는 인식시간과 기억용량을 줄이기 위해 VQ 코드북의 크기와 끝점검출 과정을 최적화하였다. 본 실시간 음성인식 다이얼링 시스템은 데모 시스템으로 구현되어 대전엑스포‘93에서 한국이동통신의 MOBILAB 내에 전시되었다.

  • PDF

잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법 (Voice Activity Detection Method Using Psycho-Acoustic Model Based on Speech Energy Maximization in Noisy Environments)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.447-453
    • /
    • 2009
  • 이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다.

실시간 영상에서의 Hough Circle Transform기반 눈동자 검출 시 연산량 축소 방법 (Operation Reduction Method for Iris Detection based on Hough Circle Transform in Real-Time Image)

  • 김성훈;허환;채일문;한기태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.338-341
    • /
    • 2013
  • 눈동자 검출은 운전 부주의 검출, 졸음 검출, 시선 검출 등 다양한 상황 인지에 이용되고 있다. 이러한 상황 인지를 위해 본 논문에서는 원 허프 변환(Hough Circle Transform)을 이용한 눈동자 검출방법을 제안한다. 이것은 영상 내 원을 검출하는 방법으로 연산량이 많아 실시간 처리에 문제가 된다. 이러한 문제를 해결하기 위해 눈 검출 후 눈 영역의 크기를 일정한 눈 크기로 정규화 하고 눈의 양쪽 끝점간 거리에 따른 대략적인 눈동자의 반지름 값 범위를 추정한다. 그 추정된 반지름 값 범위 내에서 Hough Circle Transform을 수행하면 연산량의 축소가 가능하며 그 결과 초당 21frames 정도의 눈동자 검출이 가능하였다.

손 자세 인식을 이용한 MPEG-U 기반 향상된 사용자 상호작용 인터페이스 시스템 (MPEG-U based Advanced User Interaction Interface System Using Hand Posture Recognition)

  • 한국희;이인재;최해철
    • 방송공학회논문지
    • /
    • 제19권1호
    • /
    • pp.83-95
    • /
    • 2014
  • 최근 손과 손가락을 인식하는 기술은 HCI(human computer interaction)에서 자연스럽고 친숙한 환경을 제공하기 위한 기술로 주목 받고 있다. 본 논문에서는 깊이 카메라를 이용하여 손과 손가락의 모양을 검출 및 인식하는 방법을 제안하고, 그 인식 결과를 활용하여 다양한 기기와 상호연동 할 수 있는 MPEG-U 기반 향상된 사용자 상호작용 인터페이스 시스템을 제안한다. 제안하는 시스템은 깊이 카메라를 이용하여 손을 검출한 후, 손목의 위치를 찾아 최소 손 영역을 검출한다. 이어서 검출된 최소 손 영역으로부터 손가락 끝점을 검출 한 후, 최소 손 영역의 중심점과 손가락 끝점간의 뼈대를 만든다. 이렇게 만든 뼈대의 길이와 인접 뼈대간의 각도차를 분석하여 손가락을 판별한다. 또한, 제안하는 시스템은 사용자가 MPEG-U에서 정의하는 다양한 심벌들을 손 자세로 취하였을 때 제안 방법을 이용하여 손 자세를 인식하고, 인식 결과를 상호연동 가능한 MPEG-U 스키마 구조로 표현한다. 실험에서는 다양한 환경에서 제안하는 손 자세 인식 방법의 성능을 보인다. 또한, 제안 시스템의 상호연동성을 보이기 위해 인식 결과를 MPEG-U part2 표준에 맞는 XML 문서로 표현하고, MPEG-U 참조 소프트웨어를 이용하여 그 표현 결과에 대한 표준 부합성을 검증한다.

웨이브렛 변환을 이용한 음성신호처리 (Speech Signal Processing Using Wavelet Transform)

  • 배건성;석종원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.661-666
    • /
    • 1999
  • 웨이브렛 이론은 응용수학에서 처음 소개된 후 다중해상도 표면 및 이산신호의 부대역 분해방법 등에 대한 단일화된 이론을 제공하고 있으며 최근 신호처리 전반에 걸쳐 널리 이용되고 있는 이론이다. 본 논문에서는 최근 들어 신호저리분야의 새로운 기법으로 제시된 웨이브렛 이론에 대한 소개와 더불어 이를 이용하여 음성개선, 유성음/무성음/묵음 판별, 끝점검출, 피치 및 성문 폐쇄시점 검출 등의 음성신호처리에 적용한 예들을 소개한다.

  • PDF

음향반향제거기에서 보조필터를 이용한 동시통화 검출 성능 개선 (Applying an Auxiliary Filter in the Adaptive Echo Canceller for Performance Improvement of Double-Talk Detection)

  • 김시호;권홍석;배건성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.249-252
    • /
    • 2002
  • 본 논문에서는 음향반향제거기에서 상관계수를 이용하여 동시통화 구간을 검출하는 방법에서 검출 오류로 인해 발생되는 문제점에 대해서 다룬다. 상관계수(correlation coefficient)를 이용한 DT 검출 방법에서 동시통화 구간과 반향경로의 변화를 명확하게 구분 짓는 문턱값 설정이 어렵기 때문에 때때로 검출 오류가 발생한다. 즉, 동시통화 중간에 반향경로가 변함으로써 동시통화 구간의 끝점 검출에 실패하거나 반항경로 변화를 DT로 잘못 인식하는 경우가 발생하는데, 이럴 경우 더 이상 적응필터의 계수를 갱신을 할 수 없는 상태에 빠지기도 한다. 본 논문에서는 반향제거기에 보조필터를 사용하여 이러한 문제점을 해결하고자 한다. 이는 보조필터가 기준입력신호(reference signal)를 이용하여 변화된 반향신호 성분은 추정할 수 있지만 근단화자 신호는 추정할 수 없다는 점을 이용한다 실험을 통해 제안한 알고리즘이 검출 오류로 인해 발생되는 문제를 효율적으로 해결할 수 있음을 확인하였다.

  • PDF

조기심실수축 분류를 위한 위상 변이 추적 기반의 QRS 특징점 검출 (Detection of QRS Feature Based on Phase Transition Tracking for Premature Ventricular Contraction Classification)

  • 조익성;윤정오;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.427-436
    • /
    • 2016
  • 일반적으로 QRS간격은 시작점을 기준으로 끝점까지의 간격을 말하지만 그 기준이 모호하고 Q와 S의 검출이 정확하지 않아 부정맥 분류 성능을 저하시키는 경우가 발생한다. 본 연구에서는 심전도신호 중 가장 큰 피크인 R파를 정확히 검출한 후 이를 기준으로 위상 변이 추적 기법을 적용하여 Q와 S의 시작점과 끝점을 추출하는 방법을 제안한다. 먼저 전처리 과정을 통해 잡음이 제거된 정확한 R파를 검출한다. 이후 심전도신호의 미분값을 통해 QRS패턴을 분류하고, R파를 기준으로 위상이 변화되는 방향과 횟수를 추적함으로써 Q, S의 시작점과 끝점을 추출하는 방법이다. 제안한 방법의 우수성을 입증하기 위해 MIT-BIH 부정맥 데이터베이스 48개의 레코드를 대상으로 R파 검출율은 99.60%의 성능을 나타내었고, 위상 변이 추적 기법의 경우 조기심실수축(PVC)이 30개 이상 포함된 MIT-BIH 10개의 레코드를 대상으로 조기심실수축 분류율을 각각 비교 분석한 결과 94.12%로 우수하게 나타났다.

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현 (Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32)

  • 정익주;정훈
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF