• Title/Summary/Keyword: 음성자료분석

Search Result 258, Processing Time 0.035 seconds

A study on the vocal characteristics of spoken emotional expressions (구어체 정서표현에 있어서의 음성 특성 연구)

  • 이수정;김명재;김정수
    • Science of Emotion and Sensibility
    • /
    • v.2 no.2
    • /
    • pp.53-66
    • /
    • 1999
  • 현 연구에서는 음성합성의 기초자료 수집을 위하여 대화체 감정표현의 음성적인 패러미터를 찾아내려고 시도하였다. 이를 이하여 일단 가장 자주 사용되는 대화체 감정표현자료가 수집되었고 이들 표현을 발화할 때 가장 주의를 기울이는 발성의 특징들이 탐색되었다. 구어체적 감정표현의 타당한 데이터베이스를 작성하기 위하여 20대와 30대로 연령층을 구분하여 자료를 수집, 분석하였다. 그 결과 다양한 감정표현의 발화특성들은 음의 강도, 강도변화, 그리고 음색이 중요한 기준으로 작용하는 것으로 나타났다. 다차원분석 결과 산출된 20대와 30대의 음성표현이 도면은 개별정서들이 음성의 잠재차원 상에서 상당한 일관된 특징을 지님을 보여 주었다.

  • PDF

A study on the vocal characteristics of spoken emotional expressions (구어체 정서표현에 있어서의 음성 특성 연구)

  • 이수정
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1999.11a
    • /
    • pp.277-291
    • /
    • 1999
  • 현 연구에서는 음성합성의 기초자료 수집을 위하여 대화체 감정표현의 음성적인 패러미터를 찾아내려고 시도하였다. 이를 위하여 일단 가장 자주 사용되는 대화체 감정 표현자료가 수집되었고 이들 표현을 발화할 때 가장 주의를 기울이는 발성의 특징들이 탐색되었다. 구어체적 감정표현의 타당한 데이타베이스를 작성하기 위하여 20대와 30로 연령층을 구분하여 자료를 수집, 분석하였다. 그 결과 다양한 감정표현의 발화특성들은 음의 강도, 강도변화, 그리고 음색이 중요한 기준으로 작용하는 것으로 나타났다. 다차원 분석 결과 산출된 20대와 30대의 음성표현의 도면은 개별정서들이 음성의 잠재차원 상에서 상당한 일관된 특징을 지님을 보여 주었다.

  • PDF

Telephone Speech Recognition Using Laboratory Environment Speech Data (실험실 환경 음성을 이용한 전화음성 인식에 관한 연구)

  • 윤상호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.391-394
    • /
    • 1994
  • 본 연구에서는 전화선을 통한 음성인식을 위해 저잡음의 실험실 환경에서 수집된 음성 자료를 이용하는 접근을 하였다. 전화 음성과 실험실 음성 간의 특성 차이를 보정하기 위해 선형 회귀 분석법을 이용한 SDCN을 제안하였다. 두 자료간의 보정은 동시 녹음된 실험실 환경의 음성과 전화음성의 SNRDP 따른 두 자료간의 차이를 최소화하는 변환행렬을 구해, 이를 학습자료의 변환에 이용한다. 제안된 방법의 타당성을 확인하기 위해 두가지 인식 알고리즘인 DTW와 이산 HMM 에 대해 실험하였다. DTW를 통한 인식에서개선된 SDCN 에 의한 특징벡터의 변환은 기존의 SDCNDP 따른 특징변환보다 8~17%의 인식률이 향상되었다. 이산 HMM으로 인식할 때는 개선된 SDCNDP 의한 전화음성과 실험실 음성과의 유사도를 보다 잘 나타내기 위해 개선된 SDCN을 적용하고, VQ 코드열 상에서이 코드 사상법을 사용하여 인식률의 향상시켰다.

  • PDF

편측 성대마비와 성대폴립 환자의 수술 전후 음성검사와 이미지 화상분석의 상관관계에 대한 객관적 비교연구

  • 김시찬;최홍식;홍정표;오종석
    • Proceedings of the KSLP Conference
    • /
    • 1999.11a
    • /
    • pp.199-199
    • /
    • 1999
  • 각종 음성질환에 있어서 음성검사는 진단뿐 아니라 치료를 위한 중요한 방법으로 알려져 왔다. 특히 수술전후 음성질환의 평가에는 음성검사 뿐 아니라, 후두스트로보스코피를 이용하여 비교함으로써 가능하다. 이중 후두스트로보스코피는 방법이 간단하여 직접 수술전후의 변화를 알 수 있는 장점이 있으나, 객관적인 자료로는 이용하기가 어려운 문제점이 있다. 후두스트로보스코피의 영상자료를 컴퓨터에 연결, 영상신호를 디지털화하여 후두의 움직임을 객관적으로 관찰하려고 시도되어왔다 특히 편측 성대마비 환자에서는 성대의 위치가 외전 될뿐만 아니라 피열연골의 위치가 마비 후 시간이 경과됨에 따라 외회전 하고 성대가 전방으로 위축되어 성대 막성부의 길이가 짧아지는 틀의 후두스트로보스코피의 영상을 보이고, 성대폴립환자에서는 수술전후에 폴립의 크기와 성문면적에 변화를 보이게 된다. 본 연구의 목적은 편측 성대마비와 성대폴립과 같은 각기 다른 두 질병에서 음성경사와 후두스트로보스코피를 이용한 이미지 화상분석을 통해 각 성대의 길이, 각도, 성문틈의 면적과 폴립의 크기등을 측정함으로써 수술전후의 차이를 알아보고, 이미지 화상분석과 음성검사 사이에 어떠한 상관관계가 있는지를 알아보고자 하였다. (중략)

  • PDF

A Study on the Improvement of Retrieval Efficiency Based on the CRFMD (공통기술표현포맷에 기반한 다매체자료의 검색효율 향상에 관한 연구)

  • Park, Il-Jong;Jeong, Ki-Tai
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.3 s.61
    • /
    • pp.5-21
    • /
    • 2006
  • In recent years, theories of image and sound analysis have been proposed to work with text retrieval systems and have progressed quickly with the rapid progress in data processing speeds. This study proposes a common representation format for multimedia documents (CRFMD) composed of both images and text to form a single data structure. It also shows that image classification of a given test set is dramatically improved when text features are encoded together with image features. CRFMD might be applicable to other areas of multimedia document retrieval and processing, such as medical image retrieval, World Wide Web searching, and museum collection retrieval.

성대 결절 환자를 대상으로 한 음성치료의 효과

  • 표화영;김명상;최홍식
    • Proceedings of the KSLP Conference
    • /
    • 1997.11a
    • /
    • pp.252-252
    • /
    • 1997
  • 성대결절은 음성 과다 사용으로 유발되는 후두의 만성적 질환 중 가장 대표적인 질환 가운데의 하나로서, 이에 대한 치료는 수술적 처치 또는 음성치료로 시행된다. 본 논문에서는 이러한 성대 결절의 치료법 중 음성치료에 초점을 맞추어, 음성치료를 실시한 성대 결절 환자의 음성에 대한 변화를 음향학적, 공기역학적으로 분석하여, 치료 전과 후를 비교함으로써 그 효과에 대한 객관적 자료를 제시하고자 한다. (중략)

  • PDF

Analysis of Speech Signals According to the Various Emotional Contents (정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구)

  • Jo, Cheol-Woo;Jo, Eun-Kyung;Min, Kyung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.3
    • /
    • pp.33-37
    • /
    • 1997
  • This paper describes experimental results from emotional speech materials, which is analysed by various signal processing methods. Speech materials with emotional informations are collected from actors. Analysis is focused to the variations of pitch informations and durations. From the analysed results we can observe the characteristics of emotional speech. The materials from this experiment provides valuable resources for analysing emotional speech.

  • PDF

A Loglet Analysis of Voice and Data Service Diffusion Pattern (Loglet 분석을 이용한 음성 및 데이터 서비스의 수요 확산 패턴 차이)

  • 김문수
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.69-73
    • /
    • 2000
  • 정보통신기술의 역사는 다른 산업 기술에 비해 매우 일천하다. 그러나 현재 가장 빠르게 진보하고 있는 기술이며, 기업활동과 개인의 일상 생활에 커다란 영향 요소로 대두되고 있다. 특히 인터넷의 영향은 지대하다. 인터넷을 이용하여 기업의 생산성을 증대하거나 전자 상거래와 같은 새로운 형태의 사업 기회 제공의 장이 되고 있다. 또한 개인은 매우 다양하고 방대한 정보를 획득, 이용함으로써 자신의 효용을 극대화할 수 있다. 이는 사회, 경제의 새로운 패러다임의 출현으로까지 표현되고 있다. 따라서 과거의 음성통신 서비스 수요와 현재 및 미래의 데이터 통신 수요의 패턴에는 많은 차이가 존재할 수 있다. 본 논문은 대표적 음성 서비스인 전화 서비스 그리고 데이터 서비스라 할 수 있는 인터넷 서비스를 대상으로 수요 속성별 즉, 업무용과 가정용 수요의 확산 패턴을 Logier 분석을 이용하여 고찰하였다. 분석 결과 전체적으로 음성보다는 데이터 수요 확산 속도가 컸으며, 수요 속성별로는 데이터 서비스에서 업무용보다 가정용확산이 음성의 경우보다 훨씬 빠르게 이루어지고 있었다. 그리고 인터넷 가입에 대한 여러 결과를 얻었으며, 이는 정보통신관련 기업과 정책 당국자에게 매우 중요한 자료로 활용할 수 있을 것으로 기대된다.

  • PDF

Acoustics of Young People's In Busan : Developmental Changes of Spectral Parameters (부산 지역 청소년 음성의 연령별 특징 변화 분석)

  • Back Sung-Kwan;Ro Yong-Ju;Yoon Jong-Rak
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.49-52
    • /
    • 2001
  • 부산지역 청소년 음성의 지속시간, 피치주파수 포만트 주파수 특성을 연령별, 성별로 분석하였다. 실제 발음 환경에서의 음성 패턴은 발성화자 개인 및 화자별로 다양하게 변화한다. 이를 모델 화하기 위해서는 다량의 음성 데이터로부터 통계적 방법에 의한 변화 요인별 파라미터 분석이 선행되어야 할 것이다. 실험에 사용된 데이터는 부산지역에 거주하는 청소년(초등학생, 중학생, 고등학생)들이 연령별로 3회 발성한 우화의 일부와 단모음(/아/,/이/,/우/,/에/,/오/)이다 실험 결과로부터 얻어진 지속시간, 주파수 특성 변화 패턴을 연령별, 성별로 구분하여 통계적으로 분석한 뒤 이를 정량화 하였다. 실험 결과로부터 부산 지역 청소년 음성의 지속시간, 주파수 특성은 예측된 바와 같이 기 연구된 성인 음성과 많은 차이를 보였으며 이는 부산 지역 방언의 DB 구축 시 설계자가 고려해야 할 기초자료로 활용 될 수 있을 것이다.

  • PDF

Acoustic Analysis of Respiration and Phonation Method

  • 문영일;정성민;김문정
    • Proceedings of the KSLP Conference
    • /
    • 1998.11a
    • /
    • pp.180-180
    • /
    • 1998
  • 목소리를 많이 사용하는 사람들에서 발생되는 음성장애는 대부분 잘못된 발성방법으로 인한 후두의 과긴장으로 인해 야기되는 것으로, 흡기 및 호기를 자발적으로 조절할 수 있는 호흡방법과 성대 및 주변 근육의 긴장을 줄이도록 하는 훈련하는 음성치료가 주된 치료 방법으로 대두되고 있다. 지금까지 음성치료의 효과는 주로 청음인지적(perceptual) 측면에서 많이 논의되어 왔으며 객관적인 자료는 아직까지 별로 없는 상태이다. 더욱이 호흡 및 발성 방법에 따른 음성 분석은 미진한 상황이다. (중략)

  • PDF