• Title/Summary/Keyword: 연속발화

Search Result 38, Processing Time 0.019 seconds

Adaptive Korean Continuous Speech Recognizer to Speech Rate (발화속도 적응적인 한국어 연속음 인식기)

  • Kim, Jae-Beom;Park, Chan-Kyu;Han, Mi-Sung;Lee, Jung-Hyun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.6
    • /
    • pp.1531-1540
    • /
    • 1997
  • In this paper, we presents automatic Korean continuous speech recognizer which is improved by the speech rate estimation and the compensation methods. Automatic continuous speech recognition is significantly more difficult than isolated word recognition because of coarticulatory effects and variations in speech rate. In order to recognize continuous speech, modeling methods of coarticulatory effects and variations in speech rate are needed. In this paper, the speech rate is measured by change of format, and the compensation is peformed by extracting relatively many feature vectors in fast speech. Coarticulatory effects are modeled by defining 514 Korean diphone set, and ETRI's 445 word DB is used for training speech material. With combining above methods, we implement automatic Korean continuous speech recognizer, which shows improved recognition rate, based on DHMM(Discrete Hidden Markov Model).

  • PDF

The Continuous Speech Recognition with Prosodic Phrase Unit (운율구 단위의 연속음 인식)

  • 강지영;엄기완;김진영;최승호
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.8
    • /
    • pp.9-16
    • /
    • 1999
  • Generally, a speaker structures utterances very clearly by grouping words into phrases. This facilitates the listener's recovery of the meaning of the utterance and the speaker's intention. To this purpose, a speaker uses, among other things, prosodic information such as intonation pause, duration, intensity, etc. The research described here is concerned with the relationship between the strength of prosodic boundaries in spoken utterances as perceived by untrained listeners(Perceptual boundary strength, PBS)-In this paper, the preceptual boundary strength is used as the same meaning of the prosodic boundary strength-and prosodic information. We made a rule determinating the prosodic boundaries and verified the usefulness of the prosodic phrase as a recognition unit. Experiments results showed that the performance of speech recognition(SR) is improved in aspect of recognition rate and time compared with that using sentences as recognition unit. In the future we will suggest the methods that estimate more appropriate boundaries and study more various methods of prosody assisted SR.

  • PDF

A Study on Speaker Adaptation of HMM in a Continous Speech Recognition System (HMM을 이용한 연속음성인식 시스템의 화자적응화에 관한 연구)

  • 김상범
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.100-104
    • /
    • 1995
  • 일반적으로 화자적응화는 이미 학습되어 있는 불특정 화자 모델을 표준모델로 하고 소량의 적응화용 발화로 추가적인 학습을 실시하여 특정화자 모델의 성능에 가깝게 하는 기술로서 연속음성 인식에 있어서 매우 중요하다. ML 추정법을 이용한 화자적응화는 카테고리마다 모델의 학습패턴들을 다수개 준비한 후 학습시에 일괄적으로 적용시켜 모델 파라메터를 추정 갱신하므로 추가되는 화자데이터에 대해 데이터를 모두 공급하여야 한다. 본 연구에서는 문발화 데이터의 음절단위를 자동추출한 후 추가되는 화자데이터가 주어질 때 마다 적응화할 수 있는 화자적응화 방법을 검토하였다. 이 방법은 문발화 데이터를 잘라내지 않고 음절 단위를 자동추출시켜 추가 데이터마다 최대 사후확률 추정법을 이용하여 적응화 시키는 것으로 수소의 데이터로서도 적응화를 가능하게 하는 것이다. 본 연구에서 사용되는 음성데이터는 신문사설에서 발췌한 연속음성 10문장을 사용하고, 이 음성 데이터중 6명분은 HMM 학습용으로 하고 나머지 3명분은 적응화용 및 평가용 데이터로 사용하였다. 6명의 화자를 DDCHMM으로 학습하고 나머지 3명분을 MAP법으로 적응화시켰다. 그 결과 적응전과 비교해 볼 때 약 32%의 인식율 향상을 얻을 수 있었다.

  • PDF

A study on the clinical utility of voiced sentences in acoustic analysis for pathological voice evaluation (장애음성의 음향학적 분석에서 유성음 문장의 임상적 유용성에 관한 연구)

  • Ji-sung Kim
    • The Journal of the Acoustical Society of Korea
    • /
    • v.42 no.4
    • /
    • pp.298-303
    • /
    • 2023
  • This study aimed to investigate the clinical utility of voiced sentence tasks for voice evaluation. To this end, we analyzed the correlation between perturbation-based acoustic measurements [jitter percent (jitter), shimmer percent (shimmer), Noise to Harmonic Ratio (NHR)] using sustained vowel phonation, and cepstrum-based acoustic measurements [Cepstral Peak Prominence (CPP), Low/High spectral ratio (L/H ratio)] using voiced sentences. As a result of analyzing data collected from 65 patients with voice disorders, there was a significant correlation between the CPP and jitter (r = -.624, p = .000), shimmer (r = -.530, p = .000), NHR (r = -.469, p = .000).This suggests that the cepstrum measurement of voiced sentences can be used as an alternative to the analysis limitations of the pathological voice such as not possible perturbation-based acoustic measurement, and result difference according to the analysis section.

The Effect of Heat on the Spiking Patterns of the Cells in Aplysia (군소 세포의 발화 형태에 미치는 열자극 효과)

  • Hyun, Nam-Gyu
    • Progress in Medical Physics
    • /
    • v.18 no.2
    • /
    • pp.73-80
    • /
    • 2007
  • Fruitful findings have been produced from five out of sixty cells which were obtained from each 63 individual Aplisia caught at the Jeju coast. Spiking patterns of three out of five cells, such as relaxation oscillator, bursting within a short time of the inter-burst interval, chaotic bursting, period doubling sequences, bursting with long trains of action potentials separated by short silent periods, regular repeated beating or elliptic bursting, and silent states had been changed in order as the temperature was lowered to $10^{\circ}C\;from\;32^{\circ}C$. In the intervals of every about 40 minutes repeated ups and downs of temperature produced similar firing patterns at the allowable temperature ranges. The other two cells showed difference from these. The amplitudes of the action potentials of the two cells will not be highly decreased in 24 hours. Average spike frequencies, the inter-burst interval, peak to peak spike amplitude of action potentials, minimum potential values are compared and analyzed by using the computer programme. The spike frequencies according to temperature show the distribution of bell type, with maximal spike frequencies at intermediate temperatures and minimal ones at either end. The most common pattern consist of high spike frequency during failing and low one during rising temperatures.

  • PDF

Aerodynamic Characteristics of Young and Elderly Adult Patients with Voice Disorders during Continuous Speech (젊은 성인 및 노인 음성장애 환자의 연속발화시 공기역학적 특성 비교)

  • Pyo, Hwa-young
    • The Journal of the Korea Contents Association
    • /
    • v.19 no.12
    • /
    • pp.270-278
    • /
    • 2019
  • This study was performed to compare the aerodynamic characteristics of young and elderly adult male patients with voice disorders during continuous speech. Aerodynamic measurements were obtained after 12 young male patients and 9 elderly male patients read a paragraph. The elderly group showed longer duration, lower airflow rate and air volume than the younger group, but the differences were not significant except phonation time. So, when interpreting the meaning of aerodynamic measures of elderly voice disorder patients in the aspects of airflow and air volume, it should take into account various conditions(e. g. reading materials, pulmonary functions) as well as age.

Topic Continuity in Naturalistic Speech Data by Korean High-Functioning Autistic Children (한국 고기능 자폐 아동의 자연발화에 나타난 주제 지속성)

  • Jee, Min-Jung;Hong, Eun-Mi;Song, Young-Wan;Park, Sun-Eon;Cho, Sook-Whan
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.261-266
    • /
    • 2005
  • 본 논문은 고기능 자폐 아동들이 담화 주제어 연속성(topic continuity)을 어떻게 습득하는지에 대해 검토하였다. 연구의 목적을 위하여 세 고기능 자폐 아동(9;11-12:2)의 자연 발화를 관찰 분석하였다. 사전 연구에 의하면, 자폐아동들은 의사소통의 기본적인 규칙을 잘 이해하지 못할 뿐만 아니라 타인의 사고와 기대 등에 민감하지 못하여 담화 주제를 적절히 유지하거나 전환하는(topic shift) 일에 많은 어려움을 겪는다. 본 연구는 한국 자폐아동들이 주제어의 유지와 전환 등, 담화 화용적(discourse-pragmatic) 기능의 발달 양상을 규명하는 것을 주요 목표로 한다. 본 연구의 자료는 세 자폐 아동의 자연 발화 내용으로서 1주-2주에 한번씩 매번 방문 시 120분 동안 녹음하였다. 분석 결과 다음의 몇 가지 습득 양상을 발견하였다. 첫째, 세 자폐 아동들에게서 발견된 주제 유지 빈도는 정상 아동들에 비해 낮았다. 한편. 이 아이들은 가끔 화제를 자신의 담화 주제로 돌려 자신의 주제 중심으로 대화를 지속했다. 이 아동들은 대화 상대자의 주제에 대해서는 민감하지 않지만 자신의 주제를 유지하려는 경향을 보이기도 한다. 둘째, 개별 아동을 검토한 결과, 담화 주제의 지속성이 높은 발화를 하는 아동은 현재 담화 주제에 더 민감하고 반향어를 산출할 때에도 자기 자신의 말 반복과 담화 상대자의 말을 반복하는 빈도가 별로 차이가 나지 않았다. 반면, 담화 주제의 지속성이 낮은 발화를 하는 아동은 이전 담화 주제에 더 민감하고, 반향어는 담화 상대자의 말 보다는 자기 자신의 말을 반복하는 비율이 더 높았다. 본 연구의 결과는 자폐 아동들이 담화 주제를 지속하는 능력이 많이 부족하지만, 담화 주제의 연속성은 다른 발화 유형과 상호 작용을 하면서 발달될 수 있다는 가능성을 보여 주었다. 따라서 본 연구 결과는 앞으로 자폐 아동의 연구가 집단 간의 연구뿐만 아니라 개별 아동의 발화에 쓰인 유형 간의 상호 관계를 주목함으로써 자폐 아동의 개별적 언어 치료에 새로운 시각을 심어 줄 가능성을 시사한다.

  • PDF

A PZrosodic Characteristics of Korean Read Sentences in Discourse Context (한국어 낭독체 담화문의 운율적 특징)

  • 성철재
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.209-213
    • /
    • 1998
  • 50개의 담화단독 문장과 연속발성 문장을 대상으로 무장의 첫 어절과 마지막 어절에서의 첫 음절과 마지막 음절의 운율특징을 조사하였다. 이를 체계적으로 살펴 보기 위하여 각 어절에서의 마지막 음절의 음향변수에 대한 첫 음절의 음향변수의 비율을 얻은 뒤 이를 대상으로 하여 평균값과 분포를 구하였다. 지속시간의 경우 두 스타일 간에 주목할 만한 큰 차이점은 없었으나 담화 연속 문장의 문두에서 화자의 조음시간 프로그래밍이 약간 조화롭지 못함을 알 수 있었다. Fo는 마지막 어절 부분의 비율값이 두 스타일간 통계적으로 유의한 차이를 보였으며 운율자질로 기능할 수 있는 가능성을 보였다. 에너지는 Fo와 유사한 분포경향을 보인다. 문미 어절의 마지막 음절이 첫 음절의 약 85% 정도의 힘으로 발성됨을 알 수 있고, 담화 연속 발화의 마지막 어절에서 단독 발화문보다 상대적으로 강하게 조음되었음을 알 수 있었다.

  • PDF

Analysis of Discourse Structure using Neural Network in Dialogue Sentences (신경망을 이용한 대화체 문장의 담화 구조 분석)

  • 김학수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.419-424
    • /
    • 1998
  • 담화 구조를 파악하기 위한 대표적인 방법으로 Litman과 Allen 의 계획 기법에 의한 것과 RDTN을 이용한 것을 들 수 있다. 그 중에서도 RDTN을 이용하여 대화의 흐름을 파악하려는 시도는 간단하며, 결정적이라는 장점이 있는 반면에 몇 가지 단점도 가지고 있다. RETN을 이용한 대화 분석의 가장 큰 단점은 정확히 분석된 화행을 입력으로 사용한다는 것이다. 즉, 현 상태에서 다음 상태로의 전이에 정의된 화행 이외의 화행이 입력으로 사용되면 분석을 실패하게 된다. 또 하나의 단점은 RDTN 이 어느정도 영역에 의존적인 특성을 보인다는 것이다. 본 논문에서는 이러한 확장성에 대한 문제점을 해결하고, 화행 분석의 어려움을 덜기 위해 신경망을 이용한 새로운 대화 전이망을 제안한다. 제안된 대화 전이 신경망은 지역적 대화 전이 신경망과 전역적 대화 전이 신경망은 이전의 두 발화와 현재 발화와의 관계를 살펴서 현재 발화가 이전 대화의 연속인지, 새로운 대화이 시작인지, 아니면 부대화의 시작인지를 결정하는 역할은 한다.전역적 대화전이 신경망은 담화 스택과의 상호 작용을 통해 담화의 전체구조를 살피고,전체 담화 구조에서 현재 발화가 어떤 역할을 하는지를 결정한다.

  • PDF

사고 사례 - 방직공장 화재사례

  • Kim, In-Tae
    • 방재와보험
    • /
    • s.111
    • /
    • pp.58-61
    • /
    • 2006
  • 방직 공장은 섬유의 착화 용이성, 원료의 밀집도, 연속공정으로 발화순간 전체 공정으로 연소가 확대되기 쉬우며, 착화되면 다량의 연기와 유독가스를 발생하기 때문에 항상 화재에 대한 각별한 주의가 요구되는 곳이다. 공장 화재 사례를 통해 문제점 및 각종 대책에 대해 알아보자.

  • PDF