• 제목/요약/키워드: 음성분석 프로그램

검색결과 130건 처리시간 0.03초

SFSWin을 이용한 음성분석 방법

  • 양병곤
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.159-161
    • /
    • 2003
  • 일상생활 중에 많은 사람들이 과도한 음성을 사용하게 되어 자신도 모르는 사이에 발성기관의 이상이 생기는 경우를 본다. 이러한 병적인 음성을 분석하기 위해서는 정상적인 음성의 특징을 먼저 객관적으로 분석하고 이들의 기준치를 잡은 다음 병적인 음성의 특징이 그 기준에서 얼마나 벗어났는지를 밝히는 과정이 필요하다. 사람의 음성을 지문과 같이 나타내는 음성분석 소프트웨어가 다양하게 개발되어 왔다. 시중에는 너무 간단하여 사용하기는 편하나 학술 논문을 작성할 때 사용할 만큼 정확한 데이터를 제공하지 못하는 프로그램이 있고, 반면에 매우 복잡한 기능들이 들어가 있어서 단순한 분석을 위해 그 모든 기능들을 익혀야 하는 불편한 프로그램도 나와 있다. 특히, 비싼 하드웨어를 동반한 소프트웨어들은 가격에 비해 사용자의 편의를 고려하지 않는 프로그램들도 있다. (중략)

  • PDF

방송 프로그램의 성향에 따른 진행자의 음성 정보 특징 추출 및 분석 (Extraction and Analysis of Voice Information Feature of the MC According to Propensity of Broadcasting Program)

  • 김봉현;이세환;가민경;조동욱
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.719-722
    • /
    • 2009
  • 방송 산업은 IT 기반의 통신, 디지털 기술 등과의 융합을 통해 급격한 발전을 이루고 있다. 그러나, 하드웨어적인 기술적 분야의 발전과는 달리 방송 프로그램의 특징에 따라 원활한 진행을 유도하고 있는 방송 진행자의 역할은 거의 변화가 없는 부분이다. 즉, 방송 프로그램의 성향에 따라 시청자의 관심을 유도할 수 있는 능력을 보유하고 있는 것이 방송 진행자의 자질이다. 따라서, 본 논문에서는 방송 진행자들이 방송 프로그램의 성향에 따라 표현하는 음성적 정보의 특징을 추출하고 이를 기반으로 상호간에 비교, 분석을 통해 방송 프로그램에 따른 진행자의 음성적 특징을 분석하였다. 이를 통해 방송 프로그램과 진행자의 음성간에 상호 유의적 연관성을 분석하고 방송 프로그램의 성공 여부를 판단할 수 있는 진행자의 음성 정보 특징을 도출하였다.

  • PDF

청각장애학생의 영어 발성 주파수별 특징 분석 (Feature analysis of deaf students' English language by frequency)

  • 이근민;박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.819-828
    • /
    • 2014
  • 본 논문에서는 청각장애학생들의 영어 발성의 특징을 분석하여 그 특징들을 반영할 수 있는 맞춤형 영어 학습 보조 도구를 개발하기 위한 기초자료를 제시하고자 한다. 본 논문에서는 청각장애학생들의 영어 발성의 특징을 분석하기 위해서 서울과 대구에 있는 청각특수학교의 학생들을 대상으로 직접 방문하여 녹음하였으며, 음성파일을 분석하기 위해 음성분석 전문 프로그램인 플라트 프로그램을 활용하였다. 청각장애학생들의 영어 발성의 특징은 플라트 프로그램을 통해 음성학에서 사용하는 음성의 특징 값들을 추출하여, 그 특징 값들을 이용하여 비장애학생의 영어 발성의 특징과 비교분석하였다.

노인음성신호처리에서의 젠더 분석 (Gender Analysis in Elderly Speech Signal Processing)

  • 이지연
    • 디지털융복합연구
    • /
    • 제16권10호
    • /
    • pp.351-356
    • /
    • 2018
  • 화로 인한 성대의 변화는 음성의 주파수를 변화시킬 수 있으며, 그 노인음성 신호는 다양한 분석을 통해 정상음성 신호와 자동으로 구분할 수 있다. 본 연구의 목적은 기존 스마트 의료 시스템의 노령자 음성 인식 성능을 향상시키고, 음성을 이용한 편리한 인터페이스를 제공함으로써 빠르게 변화하고 있는 기술사회에서 제외될 수 있는 노인과 장애인들에게 쉽게 접근 할 수 있는 도구를 제공하는 것이다. 본 연구에서는 성 분석으로서, 연구 대상의 성별을 보고했고, 여성과 남성 음성 샘플 개수를 동일하게 사용하였다. 또한 젠더 분석을 적용하여 모든 연령의 목소리를 사용하지 않고 노령자의 목소리를 목표로 설정하여 실험을 수행하였다. 마지막으로, 우리는 성별 및 젠더 편견을 줄이기 위한 표준 및 참조 모델의 재검토 방법을 적용하였다. 본 연구에서는 70세에서 80세까지의 한국인 여성 10명과 남성 10명의 노령자 음성을 사용했다. 파형을 보고 직접 추출한 F0 값과 TF32와 Wavesufer 음성 분석 프로그램에서 추출된 F0를 비교했을 때, TF32보다 Wavesufer가 노인음성의 F0를 더 잘 분석하는 것을 알 수 있었다. 그러나 노령자 대상 노인음성용 음성분석프로그램이 필요하며, 노령자의 음성을 분석함으로써 기존 스마트 의료 시스템의 음성 인식 및 합성 성능을 향상시킬 수 있을 것으로 기대한다.

음성처리 IC 제적용 PIC 임베디드 시스템 설계 및 제작 (Design And Implementation of Embedded System Board for Voice Processor Control)

  • 황인섭;공휘식
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.123-126
    • /
    • 2000
  • 본 논문에서는 음성 신호 처리 IC를 제어하는 임베디드 시스템을 Micro-controller를 이용하여 설계하고 제어 프로그램을 구성/제작하여 기능을 분석한다. 선택한 음성처리용 IC 중에서 ISD2560은 내장된 EEPROM에, T6668은 외부에 D-RAM을 연결하여 음성 메시지를 저장하고 있다. PIC16F84는 음성데이터의 입출력과 저장과 재생, 초기화를 위한 회로의 동작과 순서 제어, 시작과 종료하는 메모리 번지의 생성과 같은 제어 프로그램을 수행한다.

  • PDF

ARS와 신경회로망을 이용한 장애음성의 수집, 분석 및 식별에 관한 연구 (Collection, Analysis and Classification of Pathological Voice from ARS using Neural Network)

  • 김광인;조철우;김대현;왕수건;전계록;안시훈;김기련;김용주
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.955-958
    • /
    • 2000
  • 본 논문은 음성신호를 이용해 성대의 질환이 있는 환자를 진단하고 병명을 판별하게끔 유도하는 자동 진단 시스템을 개발하기 위한 연구의 일부로, 그중 ARS를 이용하여 환자의 음성을 수집, 분석, 식별의 실험에 대한 연구이다. 본 연구 팀에서는 이미 CSL을 이용한 장애음성 데이터의 수집과 식별에 관한 연구 결과를 발표한바 있다. 하지만 선행연구에서는 방음실에서 디지털 녹음기를 이용하여 수집한 음성을 사용했기 때문에, ARS를 통하여 녹음한 음성과는 샘플링 주파수나 대역폭, 잡음성분등의 데이터의 특성이 상당한 차이가 있다. 이러한 이유로 ARS를 통하여 녹음한 음성에 보다 적합한 파라미터 분석프로그램을 작성하여 파라미터를 구하였다. 이 파라미터들은 Kay사의 MDVP를 기초로하여 작성하였고, 대부분 80%정도의 신뢰성을 가졌다. 수집한 음성의 식별은 정상음성과 양성음성의 두가지 경우로 분리하였다. 식별기법으로는 신경망을 이용하였고, 식별파라미터는 구한 파라미터중 6개의 파라미터를 선별하여 식별한 결과 약 90%정도의 식별율을 가졌다.

  • PDF

IMT-2000 음성 부호화 알고리즘의 실시간 DSP 구현 (Real-time DSP implementation of IMT-2000 speech coding algorithm)

  • 서정욱;권홍석;박만호;배건성
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.68-68
    • /
    • 2001
  • 본 논문에서는 3GPP와 ETSI에서 IMT-2000의 음성부호화 방식 표준안으로 채택한 AMR 음성부호화 알고리즘을 분석하고 C 컴파일러와 어셈블리 언어를 이용한 최적화 과정을 거친 후, 고정 소수점 DSP 칩인 TMS320C6201을 이용하여 실시간 구현하였다. 구현된 codec의 프로그램 메모리는 약 31.06 kWords, 데이터 RAM 메모리는 약 9.75 kWords, 그리고 데이터 ROM 메모리는 약 19.89 kWords 정도를 가지며, 한 프레임(20 ms)을 처리하는데 약 4.38 ms가 소요되어 TMS320C6201 DSP 칩의 전체 가용한 clock의 21.94%만 사용하여도 충분히 실시간으로 동작 가능함을 확인하였다. 또한, DSP 보드상에서 구현한 결과가 ETSI에서 공개한 ANSI C 소스 프로그램의 수행 결과와 일치함을 검증하였고, 구현된 AMR 음성부호화기를 sound I/O 모듈과 결합하여 실험한 결과, 어떠한 음질의 왜곡이나 지연 없이 실시간으로 충분히 동작함을 확인하였다. 마지막으로, Host I/O와 LAN 케이블을 이용하여 AMR 음성부호화 알고리즘을 통한 쌍방간 실시간 통신을 full-duplex 모드로 확인하였다.

장애 음성 판별을 위한 의료/전자 융복합 소프트웨어 개발 (Development of medical/electrical convergence software for classification between normal and pathological voices)

  • 문지혜;이지연
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.187-192
    • /
    • 2015
  • 장애음성을 판별할 수 있는 소프트웨어가 개발 될 경우, 원격의료와 언어치료 등 여러 융복합 분야에서의 활용도가 매우 높다. 본 논문은 성대 진동에 대한 변화율을 나타내는 의료정보인 음향학적 파라미터와 신호처리 기반 고차 통계량에 기반을 둔 파라미터를 융합하여, CART(Classification And Regression Trees) 분석을 통해서 정상/장애음성 판별 프로그램을 구현하였다. 사용된 음향학적 파라미터는 Jitter(%)와 shimmer(%)이다. 그리고 본 연구에서 제안된 고차통계량 기반 파라미터는 왜도(Skewness)와 첨도(Kurtosis)의 평균과 분산이다. Kay Elemetrics의 데이터베이스에서 무작위로 발췌된 정상음성 53명, 장애 음성 173명의 /아/ 발화를 이용하여 결정트리(Decision tree) 기반장애음성 판별을 위해 평균적으로 83.15%의 성능을 보이는 알고리즘을 구현하였다. 그 결과를 바탕으로 추후 상용화를 고려하여 사용자 친화적인 프레임 워크에 의해 컨텐츠를 생성하는 융복합형 기능이 포함된 장애음성 판별 프로그램을 개발하였다.

발성 검사 및 치료를 위한 통합 장치 (Integrated Analysis System for Monitoring and Therapy of Phonation)

  • 남기창;김수찬;김한수;남지인;남도현;김덕원;최홍식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 V
    • /
    • pp.2883-2886
    • /
    • 2003
  • 좋은 발성을 위하여 음성이 만들어지려면, 뇌의 언어중추의 명령에 의하여 신경망을 통하여 ‘호흡기관(폐와 흉곽. 호흡관련 근육들)’과 ‘발성기관(주로 후두 즉 성대)’ 그리고 ‘조음, 공명기관(인두, 구강 및 비강)’의 근육들이 유기적으로 작용하여야 한다. 이런 협력 체제에 문제가 생기면, 다양한 종류의 질환이 유발될 수 있다[1,2]. 현재 임상에서 음성 분석을 위해 사용되는 시스템은 대부분 성대의 진동을 측정하기 위해 stroboscopy, 전기성문파형검법 (EGG, electroglottography), 후두근전도 중의 한 방법과 음성 분석을 위한 분석 프로그램으로 구성되어 있다. 그러나, 발성은 호흡과 매우 밀접한 관계가 있어 음성, 성대의 진동, 호흡 관계를 종합적으로 관찰할 필요가 있다. 본 연구에서는 발성 시 성대 점막의 접촉 양상은 ECG 로 측정하며, 발성의 주 에너지원이 되는 호흡의 변화를 2 channel 인덕턴스 호흡감시 장치(RIP: repiratory inductive plethymography)를 이용하여 흉곽의 움직임과 상 복강의 움직임에 대하여 측정하며, 발성되는 음성은 마이크로폰을 통하여 측정하는 ‘EGG, 음성, 호흡 통합검사 장치’를 개발하였다.

  • PDF