• 제목/요약/키워드: 음향출력

검색결과 394건 처리시간 0.025초

대용량 한국어 TTS의 결정트리기반 음성 DB 감축 방안 (UA Tree-based Reduction of Speech DB in a Large Corpus-based Korean TTS)

  • 이정철
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권7호
    • /
    • pp.91-98
    • /
    • 2010
  • 대용량 음성 DB를 사용하는 음편접합 TTS는 부가적인 신호처리 기술을 거의 사용하지 않고, 문맥을 반영하는 여러 합성유닛들을 결합해 합성음을 생성하기 때문에 높은 자연성을 가진다는 장점이 있다. 그러나 자연성, 개인성, 어조, 감정구현 등에서 활용성을 높이기 위해서는 음성DB의 크기가 비례적으로 증가하게 되므로 음운환경과 음향적 특성이 유사한 다수의 음편들을 제거하여 음성DB의 크기를 감축하기 위한 연구가 필수적이다 본 논문에서는DB감축을 위해 결정 트리 기반의 새로운 음소 군집화 방법을 이용하여 한국어 TTS용 합성단위음편 데이터베이스 구축 방법을 제안한다. 그리고 클러스터링방법에 대한 성능 평가를 위해서 언어 처리기, 운율 처리기, 음편 선택기, 합성음 생성기, 합성단위 음편데이터베이스, 음성신호 출력기로 구성되는 한국어 TTS 기본 시스템을 이용하여 합성음을 생성하였고 트리 클러스터링 방법 CM1, CM2와 전체 DB (Full DB)와 감축된 DB(Reduced DB)의 4가지 조합별로 제작된 음편 데이터베이스를 이용하여 각 조합에 대한 MOS 테스트를 수행하였다. 실험결과 제안된 방법을 사용할 경우 전체 음성DB의 크기를 23%로 줄일 수 있었고, 청취실험 결과 높은 MOS를 보이므로 향후 소용량 DB TTS에 적용 가능성을 보였다.

이중 마이크로폰을 이용한 비음수 행렬분해 기반 다중음원 도래각 예측 (Nonnegative Matrix Factorization Based Direction-of-Arrival Estimation of Multiple Sound Sources Using Dual Microphone Array)

  • 전광명;김홍국;유승우
    • 전자공학회논문지
    • /
    • 제54권2호
    • /
    • pp.123-129
    • /
    • 2017
  • 본 논문에서는 이중 마이크로폰 배열을 이용하여 비음수 행렬분해(nonnegative matrix factorization, NMF) 기반으로 다중음원의 도래각을 추정하는 새로운 방법을 제안한다. 우선 이중 마이크로폰 배열에 들어온 음향 신호들을 연속된 분석프레임으로 분할한 후, 각 프레임에 대해 조향응답파워 위상변환(steered-response power phase transform, SRP-PHAT) 빔형성기를 적용하여 스테레오 신호들을 시간-방향 영역으로 표현한다. 이러한 SRP-PHAT의 시간-방향 출력값들은 사전에 정의된 프레임 수만큼 누적하여 시간-방향 블록으로 정의한다. 다음으로, 잡음에 강건한 도래각 추정을 위하여, 각 시간-방향 블록을 블록차감 기법을 사용하여 매 프레임에 대해 정규화한다. 이후, 다중음원 환경에서 각 음원의 방향을 클러스터링하기 위해 정규화된 시간-방향 블록에 비지도(unsupervised) NMF를 적용한다. 구체적으로, 음원의 개수와 이들의 도래각을 추정하는데 각각 활성 및 기저 행렬들을 사용한다. 제안된 방법의 도래각 추정 성능을 평가하기 위해 이중 마이크로폰 배열로부터 입력된 [$-35{\circ}$, 5m], [$12{\circ}$, 4m], 그리고 [$38{\circ}$, 4.m]에 각각 위치한 세 가지 음원들에 대한 추정 오차의 절대 평균(mean absolute error, MAE) 및 오차의 표준편차를 측정하였다. 실험 결과. 제안된 방법은 기존의 SRP-PHAT 기반 도래각 추정방법에 비해 상대적으로 MAE를 56.83% 줄일 수 있었다.

PC 기반 순음청력검사기를 위한 자동보정시스템 개발 (Development of Automatic Calibration System for PC-Based Pure Tone Audiometer)

  • 김진동;강덕훈;송복득;이일우;공수근;권순복;전계록;신범주;왕수건
    • 한국산학기술학회논문지
    • /
    • 제11권7호
    • /
    • pp.2586-2594
    • /
    • 2010
  • 순음청력검사기는 정확한 주파수와 음압을 갖는 순음과 차폐 음을 생성하여 출력할 수 있어야 한다. 이를 위해 일정한 기간마다 보정을 하는 것이 불가피하다. 그러나 수동 보정을 사용하는 일반 순음청력검사기의 음향 보정은 집중력이 필요할 뿐 아니라 시간이 많이 걸리는 단점이 있다. 반면, PC 기반 순음청력검사기의 경우 소프트웨어를 이용하여 자동으로 보정을 수행하는 것이 가능하다. 본 논문에서는 PC 기반 순음청력검사기의 자동 보정을 지원하기 위해 PC 사운드카드를 이용하여 구현한 음압측정기와 이를 이용한 순음청력검사기의 자동보정모듈을 기술한다. 자동 보정모듈을 이용하여 보정한 PC 기반 순음청력검사기를 국제표준기구가 제공하는 기준등가역치음압수준과의 적합 여부를 검증한다.

햅틱 피드백 장치를 이용한 치과 수술 시뮬레이션 (Dental Surgery Simulation Using Haptic Feedback Device)

  • 윤상연;성수경;신병석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.275-284
    • /
    • 2023
  • 가상 현실 시뮬레이션은 다양한 분야에서의 교육과 훈련에 활용이 되며, 특히 최근에는 의료 분야에서 많이 사용되고 있다. 교육/훈련용 시뮬레이터는 의사가 실제 수술 도구를 이용하여 실제 환자에 대해 처치를 하는 것과 같은 느낌이 나게 하는 촉감/역감 생성 및 영상/음향 출력 하드웨어와 여기에 실감 나는 영상과 촉감을 생성해주는 소프트웨어로 이루어진다. 기존의 시뮬레이터들은 수술 시에 사용되는 다양한 수술 도구들을 모사하기 위해 다양한 형태의 하드웨어들을 사용해야 하므로 복잡하고 비용이 많이 소요되는 문제가 있다. 이 논문에서는 포스 피드백 장치와 변형 가능한 햅틱 컨트롤러를 이용한 치과 수술 시뮬레이션 시스템을 제안한다. 햅틱 하드웨어들은 수술 도구와 수술 부위의 충돌 여부를 파악하고 그에 따른 저항감과 진동감을 제공한다. 특히 길이 변화, 굽힘과 같은 변형이 가능한 햅틱 컨트롤러는 여러 수술 도구들의 형태에 따라 느껴지는 다양한 감각을 표현할 수 있다. 사용자가 햅틱 피드백 장치를 조작하면 햅틱 피드백 장치의 움직임이나 버튼 클릭 등의 이벤트가 시뮬레이션 시스템에 전달되어 치과용 수술 도구와 구강 내부 모델들 사이의 상호작용이 발생하고 이에 따른 햅틱 피드백이 햅틱 피드백 장치로 전달된다. 이러한 기반 기술들을 활용하여 정교한 3차원 모델로 표현된 가상 환경에서 대표적인 치과 수술기법인 매복 사랑니 발치 수술의 현실적인 훈련 경험을 제공한다.