• 제목/요약/키워드: spoken word

검색결과 111건 처리시간 0.023초

신경인성과 발달성 말더듬의 비유창성 발생 자리에 대한 연구 (A Comparative Study on the Occurrence Loci of Disfluency between Neurogenic and Developmental Stuttering)

  • 신명선;권도하;윤치연
    • 음성과학
    • /
    • 제13권3호
    • /
    • pp.185-195
    • /
    • 2006
  • This study aims to clarify disfluency loci in a neurogenic stuttering group and to examine how the characteristics are different from a developmental stuttering group. For the study, spoken language samples were collected from 11 adults with developmental stuttering and 11 adults with neurogenic stuttering in the course of speaking tasks including reading, monologue and conversation. Using the collected samples, disfluency characteristics of the two groups were to be investigated by analyzing adaptation effect, consistency effect and frequency of disfluency occurrence according to word position, which are related to the occurrence loci of disfluency. Results of this study were as follows: First, while the neurogenic stuttering group did not show any adaptation effect, the developmental stuttering group showed the adaptation effect that the percent of disfluency word reducing as they read the same materials repeatedly. Second, there was no meaningful difference of consistency effect between the two stuttering groups. Third, the neurogenic stuttering group showed more disfluency frequency in final sounds among the word position compared to the developmental stuttering group.

  • PDF

체언말 자음의 음성적 교체 현상에 대한 연구 (A Study on Sound Changes affecting Noun-final Consonant)

  • 오재혁;신지영
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.193-198
    • /
    • 2005
  • The aim of this paper is to exam why the nouns that used /kh, ph, ts, th/, as the final phoneme changed. Assuming that these change related to the aspects of the word usage, we collected the word frequency and the phonetic form of words. The results are as follows : ① The realization of standard phonetic form is related to the frequency of case marker that could not be omitted, combined with the word. ② The changing into /s/ in a coronal consonant is related to the case marker [i].

  • PDF

문형구조의 분류에 따른 대화음성의 의도분석에 관한 연구 (Analysis of Intention in Spoken Dialogue based on Classifying Sentence Patterns)

  • 최환진;송창환;오영환
    • 한국음향학회지
    • /
    • 제15권1호
    • /
    • pp.61-70
    • /
    • 1996
  • 화자에 의해서 발성된 문장은 대화가 이루어지고 있는 화제나 발화이도에 따라 문장에 사용되는 단어의 구성 및 문장의 구조에 차이를 보이므로, 본 논문에서는 무형을 기반으로하여 문장의 구조와 의도사이의 관계를 사용하여 화자의 의도를 효과적으로 분석할 수 있는 통계적인 방법인 IDT(intention decision table)를 제안한다. IDT는 문장을 이루는 구성요소를 5가지로 분류하고, 입력문장에 대한 분석을 통해서 얻어진 구성요소들과 의도간의 통계적인 분석을 통해서 얻어진 의도 결정표를 이용하여 문장의 의도를 결정한다. 실험결과, 문장을 구성하는 단어와 이도간의 상관관계를 고려한 경우에 비해서 IDT를 사용하는 경우 10~18%정도의 의도 인식율 향상이 있었으며, 단어의 의도와의 관계 이외에 단어들간의 전이관계를 함께 모델링한 MIG 경우에 비해서도 3~12%의 향상된 의도 인식율을 보임으로써, 본 논문에서 제안한 IDT가 유효함을 알 수 있었다.

  • PDF

seq2seq 주의집중 모델을 이용한 형태소 분석 및 품사 태깅 (Word Segmentation and POS tagging using Seq2seq Attention Model)

  • 정의석;박전규
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.217-219
    • /
    • 2016
  • 본 논문은 형태소 분석 및 품사 태깅을 위해 seq2seq 주의집중 모델을 이용하는 접근 방법에 대하여 기술한다. seq2seq 모델은 인코더와 디코더로 분할되어 있고, 일반적으로 RNN(recurrent neural network)를 기반으로 한다. 형태소 분석 및 품사 태깅을 위해 seq2seq 모델의 학습 단계에서 음절 시퀀스는 인코더의 입력으로, 각 음절에 해당하는 품사 태깅 시퀀스는 디코더의 출력으로 사용된다. 여기서 음절 시퀀스와 품사 태깅 시퀀스의 대응관계는 주의집중(attention) 모델을 통해 접근하게 된다. 본 연구는 사전 정보나 자질 정보와 같은 추가적 리소스를 배제한 end-to-end 접근 방법의 실험 결과를 제시한다. 또한, 디코딩 단계에서 빔(beam) 서치와 같은 추가적 프로세스를 배제하는 접근 방법을 취한다.

  • PDF

한국어 연속음성에서의 조사 및 어미 인식에 관한 연구 (A Study on Recognition of Korean Postpositions and Suffixes in Continuous Speech)

  • 송민석;이기영
    • 음성과학
    • /
    • 제6권
    • /
    • pp.181-195
    • /
    • 1999
  • This study proposes a method of recognizing postpositions and suffixes in Korean spoken language, using prosodic information. We detect grammatical boundaries automatically at first, by using prosodic information of the accentual phrase, and then we recognize grammatical function words by backward-tracking from the boundaries. The experiment employs 300 sentential speech data of 10 men's and 5 women's voice spoken in standard Korean, in which 1080 accentual phrases and 11 postpositions and suffixes are included. The result shows the recognition rate of postpositions in two cases. In one case in which only correctly detected boundaries are included, the recognition rate is 97.5%, and in the other case in which all detected boundaries are included, the recognition rate is 74.8%.

  • PDF

현대 서울말 평서문에 나타나는 억양 연구 - 어말어미 "-아/어, -지요" 와 "-ㅂ/습니다" 를 중심으로 - (An Intonation Study of Predicate ending in Current Korean - From final endings of ${\ulcorner}$-a/e, $t{\int}ijo$${\lrcorner}$ and ${\ulcorner}$p/simnida${\lrcorner}$ -)

  • 유기원
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 춘계 학술대회 발표논문집
    • /
    • pp.3-7
    • /
    • 2005
  • This research is for finding prototypes and characteristics of intonation found in ${\ulcorner}$-a/e, $t{\int}ijo$<${\lrcorner}$ and ${\ulcorner}$p/simnida${\lrcorner}$ among modern Korean predicate statements by constructing spoken corpus based on the current radio broadcast. So the result of the study is as follows. : (1) The construction of the balanced spoken corpus and the standard for boundary determination of rhythm are needed for the intonation model of speech synthesis. (2) Korean intonation units have the splited word tone which includes the nuclear tone and the pre-nuclear tone makes unclear tone more detailed. (3) I made man and woman intonation models individually through t-test of SPSS. (4) The standard intonation model is devided '-ajo'type and '-nida'type

  • PDF

음성망을 이용한 한국어 연속 숫자음 인식에 관한 연구 (Study on the Recognition of Spoken Korean Continuous Digits Using Phone Network)

  • 이강성;이형준;변용규;김순협
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.624-627
    • /
    • 1988
  • This paper describes the implementation of recognition of speaker - dependent Korean spoken continuous digits. The recognition system can be divided into two parts, acoustic - phonetic processor and lexical decoder. Acoustic - phonetic processor calculates the feature vectors from input speech signal and the performs frame labelling and phone labelling. Frame labelling is performed by Bayesian classification method and phone labelling is performed using labelled frame and posteriori probability. The lexical decoder accepts segments (phones) from acoustic - phonetic processor and decodes its lexical structure through phone network which is constructed from phonetic representation of ten digits. The experiment carried out with two sets of 4continuous digits, each set is composed of 35 patterns. An evaluation of the system yielded a pattern accuracy of about 80 percent resulting from a word accuracy of about 95 percent.

  • PDF

seq2seq 주의집중 모델을 이용한 형태소 분석 및 품사 태깅 (Word Segmentation and POS tagging using Seq2seq Attention Model)

  • 정의석;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.217-219
    • /
    • 2016
  • 본 논문은 형태소 분석 및 품사 태깅을 위해 seq2seq 주의집중 모델을 이용하는 접근 방법에 대하여 기술한다. seq2seq 모델은 인코더와 디코더로 분할되어 있고, 일반적으로 RNN(recurrent neural network)를 기반으로 한다. 형태소 분석 및 품사 태깅을 위해 seq2seq 모델의 학습 단계에서 음절 시퀀스는 인코더의 입력으로, 각 음절에 해당하는 품사 태깅 시퀀스는 디코더의 출력으로 사용된다. 여기서 음절 시퀀스와 품사 태깅 시퀀스의 대응관계는 주의집중(attention) 모델을 통해 접근하게 된다. 본 연구는 사전 정보나 자질 정보와 같은 추가적 리소스를 배제한 end-to-end 접근 방법의 실험 결과를 제시한다. 또한, 디코딩 단계에서 빔(beam) 서치와 같은 추가적 프로세스를 배제하는 접근 방법을 취한다.

  • PDF

코퍼스 기반 한국어 합성기의 억양 구현 방안 (A Method of Intonation Modeling for Corpus-Based Korean Speech Synthesizer)

  • 김진영;박상언;엄기완;최승호
    • 음성과학
    • /
    • 제7권2호
    • /
    • pp.193-208
    • /
    • 2000
  • This paper describes a multi-step method of intonation modeling for corpus-based Korean speech synthesizer. We selected 1833 sentences considering various syntactic structures and built a corresponding speech corpus uttered by a female announcer. We detected the pitch using laryngograph signals and manually marked the prosodic boundaries on recorded speech, and carried out the tagging of part-of-speech and syntactic analysis on the text. The detected pitch was separated into 3 frequency bands of low, mid, high frequency components which correspond to the baseline, the word tone, and the syllable tone. We predicted them using the CART method and the Viterbi search algorithm with a word-tone-dictionary. In the collected spoken sentences, 1500 sentences were trained and 333 sentences were tested. In the layer of word tone modeling, we compared two methods. One is to predict the word tone corresponding to the mid-frequency components directly and the other is to predict it by multiplying the ratio of the word tone to the baseline by the baseline. The former method resulted in a mean error of 12.37 Hz and the latter in one of 12.41 Hz, similar to each other. In the layer of syllable tone modeling, it resulted in a mean error rate less than 8.3% comparing with the mean pitch, 193.56 Hz of the announcer, so its performance was relatively good.

  • PDF

말뭉치 자원 희소성에 따른 통계적 수지 신호 번역 문제의 해결 (Addressing Low-Resource Problems in Statistical Machine Translation of Manual Signals in Sign Language)

  • 박한철;김정호;박종철
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.163-170
    • /
    • 2017
  • 통계적 기계 번역을 이용한 구어-수화 번역 연구가 활발해짐에도 불구하고 수화 말뭉치의 자원 희소성 문제는 해결되지 않고 있다. 본 연구는 수화 번역의 첫 번째 단계로써 통계적 기계 번역을 이용한 구어-수지 신호 번역에서 말뭉치 자원 희소성으로부터 기인하는 문제점들을 해결할 수 있는 세 가지 전처리 방법을 제안한다. 본 연구에서 제안하는 방법은 1) 구어 문장의 패러프레이징을 통한 말뭉치 확장 방법, 2) 구어 단어의 표제어화를 통한 개별 어휘 출현 빈도 증가 및 구어 표현의 번역 가능성을 향상시키는 방법, 그리고 3) 수지 표현으로 전사되지 않는 구어의 기능어 제거를 통한 구어-수지 표현 간 문장 성분을 일치시키는 방법이다. 서로 다른 특징을 지닌 영어-미국 수화 병렬 말뭉치들을 이용한 실험에서 각 방법론들이 단독으로 쓰일 때와 조합되어 함께 사용되었을 때 모두 말뭉치의 종류와 관계없이 번역 성능을 개선시킬 수 있다는 것을 확인할 수 있었다.