• 제목/요약/키워드: 환경음 인식

검색결과 110건 처리시간 0.031초

상황인식 기반의 공황장애 증상 관리 시스템 (Panic Disorder Symptom Care System Based on Context Awareness)

  • 최동운;맹환;강윤정
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권4호
    • /
    • pp.63-70
    • /
    • 2019
  • 상황 인식 환경에서 공황장애의 증상을 추출하고자 일상생활을 통해 자연스런 음직임에서 발생하는 신체 상황정보를 추출하여 공황장애의 구성요소를 찾아내고 온톨로지 이론을 적용하여 의미를 추론 과정을 거쳐 공황장애에 증상의 정도에 대해 정보를 제공할 수 있다. 온톨로지 기반의 정보 처리를 위해 공황장애의 구성요소는 클래스로 정의하고 공황장애의 상태를 이해할 수 있도록 온톨로지 모델링을 통해 공황장애지수를 도출하였다. 공황장애 구성요소와 공황장애 지수의 도출은 공황장애에 대한 상황 인식 기반의 정보 서비스를 가능할 것이며, 상황인식 기반 디바이스와 결합되어 상황정보는 주기적으로 동기화된다. 공황장애 지수의 결과를 관찰할 수 있으며 공황장애의 요인이 되는 생활습관을 개선하는데 적용할 수 있을 것이다.

한국어 음성인식을 위한 음성 데이터 수집 (Speech Data Collection for korean Speech Recognition)

  • 박종렬;권오욱;김도영;최인정;정호영;은종관
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.74-81
    • /
    • 1995
  • 본 논문에서는 한국과학기술원(KAIST) 통신연구실에서 개발한 한국어 음성 데이터베이스의 개발에 관하여 기술한다. 음성 데이터베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 음성인식 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phoneme-balanced75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.

  • PDF

잡음환경에서의 숫자음 인식을 위한 특징파라메타 (Features for Figure Speech Recognition in Noise Environment)

  • 이재기;고시영;이광석;허강인
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.473-476
    • /
    • 2005
  • 본 논문은 잡음에 강한 다양한 특징 파라메타를 제안한다. 기존의 음성인식에서 사용되는 특징 파라메타 MFCC(Mel Frequency Cepstral Coeeficient)는 좋은 성능을 보인다. 그러나 잡음에 보다 강인한 성능을 위해 기존에 사용되는 파라메타 MFCC의 특징공간을 변형시키는 알고리즘인 PCA(Principal Component Analysis)와 ICA(Independent Component Analysis)를 사용하여 특징 공간을 변형시킨 파라메타와 기존의 파라메타 MFCC의 성능을 비교하였다. 그 결과 ICA에 의해 변형된 특징 파라메타가 PCA로 변형된 파라메타와 MFCC보다 우수한 성능을 보였다.

  • PDF

졸음 인식과 안전운전 보조시스템 구현 (Implementation of A Safe Driving Assistance System and Doze Detection)

  • 송혁;최진모;이철동;최병호;유지상
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.30-39
    • /
    • 2012
  • 본 논문에서는 검출된 운전자의 얼굴영역에서 눈의 형태를 인식하여 졸음 상태를 감지하는 기법을 개발하고 감지 결과에 따라 위험 상태를 알려주는 경보 시스템을 구현하고자 한다. 먼저 얼굴 검출에는 Haar 변환 기법을 이용하고 실험실환경, 차량환경 및 적외선 영상을 획득하여 다양한 조명 환경에서도 강인하도록 전처리 및 후처리 과정을 적용한다. 눈 검출에는 보통 한국인이라는 가정하에 눈의 위치 및 크기의 비례 구조 특성 등을 이용하여 후보 영역을 제한하고 트리구조에 대한 실험 결과로 고속 알고리즘을 구현하였다. 또한 졸음 상태를 인식하기 위해서는 눈의 개폐 형태를 검출할 수 있는 Hough 변환을 이용한 기법과 눈의 계폐에 따른 눈의 형태 비율을 이용한 기법을 새로이 제안하며, 눈이 감겨있는 시간을 측정하여 졸음 여부를 판단한다. 1단계 졸음 상태로 판단될 경우 통합 모니터링 인터페이스에서 운전자에게 경고음을 울리며 2단계 졸음 상태로 판단될 경우에는 CAN(Controller Area Network)을 통하여 안전벨트를 진동하게 함으로써 운전자에게 경고를 하는 시스템을 구현한다. 본 논문에서 제안하는 기법은 기존의 기법들과 비교하여 실험실 환경에서 평균 83.64% 이상의 검출률을 달성 하였으며, 실제 차량환경에서도 실험 결과를 통하여 평균적으로 우수한 결과를 보였다.

다중대역 음성인식을 위한 부대역 신뢰도의 추정 및 가중 (Estimation and Weighting of Sub-band Reliability for Multi-band Speech Recognition)

  • 조훈영;지상문;오영환
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.552-558
    • /
    • 2002
  • 최근에 Fletcher의 HSR (human speech recognition) 이론을 기초로 한 다중대역 (multi-band) 음성인식이 활발히 연구되고 있다. 다중대역 음성인식은 주파수 영역을 다수의 부대역으로 나누고 별도로 인식한 뒤 부대역들의 인식결과를 부대역 신뢰도로 가중 및 통합하여 최종 판단을 내리는 새로운 음성인식 방식으로서 잡음환경에 특히 강인하다고 알려졌다. 잡음이 정상적인 경우 무음구간의 잡음정보를 이용하여 부대역 신호대 잡음비(SNR)를 추정하고 이를 가중치로 사용하기도 하였으나, 비정상잡음은 시간에 따라 특성이 변하여 부대역 신호대 잡음비를 추정하기가 쉽지 않다. 본 논문에서는 깨끗한 음성으로 학습한 은닉 마코프 모델과 잡음음성의 통계적 정합에 의해 각 부대역에서 모델과 잡음음성 사이의 거리를 추정하고, 이 거리의 역을 부대역 가중치로 사용하는 ISD (inverse sub-band distance) 가중을 제안한다. 1500∼1800㎐로 대역이 제한된 백색잡음 및 클래식 기타음에 대한 인식 실험 결과, 제안한 방법은 정상 및 비정상대역제한잡음에 대하여 부대역의 신뢰도를 효과적으로 표현하며 인식 성능을 향상시켰다.

웨이브렛 계수의 표준편차를 이용한 음성신호의 적응 잡음 제거 (Adaptive Noise Reduction using Standard Deviation of Wavelet Coefficients in Speech Signal)

  • 황향자;정광일;이상태;김종교
    • 감성과학
    • /
    • 제7권2호
    • /
    • pp.141-148
    • /
    • 2004
  • 일상생활의 대화중에 포함되는 잡음, 특히 모든 주파수 대역에 포함되는 백색잡음에 의해 오염된 음성신호는 청각적으로 심한 불쾌감과 거부감을 주며 대화의 명료성을 저해시키는 요인으로 작용할 수 있다. 본 논문은 이러한 잡음환경 하에서 음성인식을 위하여 음성에 부가된 잡음을 제거하는 방범으로 프레임 단위로 웨이브렛 변환을 하여 웨이브렛 계수의 표준편차를 이용하여 시간 적응 임계값을 정하는 새로운 방법을 제안한다. 음성의 특성을 고려하기 위하여 고주파 성분을 많이 가지는 무성음의 경우는 cD1 신호에서, 저주파 성분을 많이 가지는 유성음의 경우는 cA3 신호의 표준편차를 이용하여 시간 적응 임계값을 설정하였다. 실험을 통해 제안한 방법이 일반적인 웨이브렛 변환과 웨이브렛 패킷 변환을 이용한 방법보다 SNR과 MSE 측면에서 향상됨을 확인할 수 있었다. 또한 웨이브렛 변환과 웨이브렛 패킷 변환에서는 파열음, 마찰음 및 파찰음 성분이 많이 제거되는 반면 제안한 방법은 본래 신호와 유사하게 복원됨을 실험 결과 확인할 수 있었다.

  • PDF

소수 불균형 데이터의 심층학습을 통한 능동소나 다층처리기의 표적 인식성 개선 (Improving target recognition of active sonar multi-layer processor through deep learning of a small amounts of imbalanced data)

  • 류영우;김정구
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.225-233
    • /
    • 2024
  • 능동소나는 은밀하게 기동하는 수중 물체를 탐지하기 위해 음파를 송신하여 표적에서 반사되어 돌아오는 신호를 탐지한다. 그러나 능동소나의 수신 신호에는 표적의 반향음 외에도 해저면/해수면의 잔향, 생물 소음 및 기타 잡음 등이 섞여 있어 표적 인식을 어렵게 한다. 기존의 문턱값 이상의 신호를 탐지하는 기법은 설정한 문턱값에 따라 오탐지가 발생하거나 표적을 놓치는 경우가 발생할 뿐 아니라 다양한 수중환경마다 적절한 문턱값을 설정해야하는 문제가 있다. 이를 극복하기 위해 Constant False Alarm Rate(CFAR) 등의 기법을 이용한 문턱값의 자동산출과 진보된 형태의 추적 필터 및 연계 기법을 적용한 연구가 수행되었지만, 상당수의 탐지가 발생하는 환경에서는 그 한계가 있다. 최근 심층학습 기술이 발달함에 따라 수중 표적 탐지분야에도 이를 적용하기 위한 노력이 있었으나, 분류기 학습을 위한 능동소나 데이터의 획득이 매우 어려워 데이터가 희소할 뿐 아니라, 극소수의 표적과 상대적 다수의 비표적으로 인한 데이터의 불균형성으로 어려움이 있다. 본 논문에서는 탐지 신호의 에너지 분포 영상을 이용하되, 데이터의 불균형성을 고려한 방식으로 분류기를 학습하여 표적과 비표적을 구분하는 기법을 기존 소나처리 기법에 추가하여 표적의 오분류를 최소화하면서 비표적을 제거하여 능동소나 운용자의 표적 인식을 용이하게 하였다. 그리고 동해에서 수행한 해상실험에서 획득한 능동소나 데이터를 통해 제안 기법의 유효성을 검증하였다.

웨이브렛 변환을 이용한 음성의 적응 잡음 제거 (Adaptive Noise Reduction of Speech Using Wavelet Transform)

  • 이창기;김대익
    • 한국전자통신학회논문지
    • /
    • 제4권3호
    • /
    • pp.190-196
    • /
    • 2009
  • 본 논문은 잡음 환경의 음성 인식을 위하여 음성에 부가된 잡음을 제거하는 방법으로 프레임 단위로 웨이브렛 변환을 하여 웨이브렛 계수의 표준편차를 이용하여 시간 적응 임계값을 정하는 새로운 방법을 제안한다. 음성의 특성을 고려하기 위하여 고주파 성분을 많이 가지는 무성음의 경우는 첫 번째 스케일의 detail 신호에서, 저주파 성분을 많이 가지는 유성음의 경우는 세 번째 스케일의 approximation 신호의 표준편차를 이용하여 시간 적응 임계값을 설정하였다 또한 제안한 방법으로 잡음을 제거한 후에도 묵음구간에 잔여 잡음이 존재하게 되므로 묵음구간을 검출하여 묵음구간의 잔여 잡음을 제거하였다 실험을 통해 제안한 방법이 일반적인 웨이브렛 변환과 웨이브렛 패킷 변환을 이용한 방법보다 SNR과 MSE측면에서 향상됨을 확인 할 수 있었다.

  • PDF

웨이브렛 변환을 이용한 음성의 적응 잡음 제거 (Adaptive Noise Reduction of Speech using Wavelet Transform)

  • 임형규;김철수
    • 한국컴퓨터산업학회논문지
    • /
    • 제6권2호
    • /
    • pp.271-278
    • /
    • 2005
  • 본 논문은 잡음 환경의 음성 인식을 위하여 음성에 부가된 잡음을 제거하는 방법으로 프레임 단위로 웨이브렛 변환을 하여 웨이브렛 계수의 표준편차를 이용하여 시간 적응 임계값을 정하는 새로운 방법을 제안한다. 음성의 특성을 고려하기 위하여 고주파 성분을 많이 가지는 무성음의 경우는 첫 번째 스케일의 detail 신호에서, 저주파 성분을 많이 가지는 유성음의 경우는 세 번째 스케일의 approximation 신호의 표준편차를 이용하여 시간 적응 임계값을 설정하였다. 또한 제안한 방법으로 잡음을 제거한 후에도 묵음구간에 잔여 잡음이 존재하게 되므로 묵음구간을 검출하여 묵음구간의 잔여 잡음을 제거하였다. 실험을 통해 제안한 방법이 일반적인 웨이브렛 변환과 웨이브렛 패킷 변환을 이용한 방법보다 SNR과 MSE측면에서 향상됨을 확인 할 수 있었다.

  • PDF

합성음성평가를 위한 다음절 무의미단어 생성과 이용에 관한 연구 (A Study on the Generation of Multi-syllable Nonsense Wordset for the Assessment of Synthetic Speech)

  • 조철우;김경태;이용주
    • 한국음향학회지
    • /
    • 제13권5호
    • /
    • pp.51-58
    • /
    • 1994
  • 인간과 기계의 가장 자연스러운 의사소통의 형태인 음성을 통한 인터페이스를 위하여 여러가지 음성합성, 인식기법들이 제안되고 실용화되고 있다. 특히 음성합성의 경우는 실용화가 상당히 이루어지고 있음에도 불구하고 평가기법에 관하여는 아직도 초보적인 단계에 머물고 있다. 본 논문에서는 무의미 단어에 의한 합성음 평가법에 사용할 수 있는 다음절 무의미 단어군 작성법을 제안하고 실제로 구현되어 있는 규칙합성기를 제안된 단어군에 의해 평가한 사례를 소개하고자 한다. 제안된 단어군 작성방식은 음소단위 명료도 및 음소환경에 관한 평가를 행할 경우 유용하게 사용될 수 있다.

  • PDF