• 제목/요약/키워드: phonemes

검색결과 226건 처리시간 0.023초

한글 음절의 유형 분석 정보에 의한 낱자 폰트의 설계 (Design of Phoneme Fonts using an Analized Information of Hangul Syllable Forms)

  • 이계영;김규식;이상범
    • 전자공학회논문지B
    • /
    • 제29B권9호
    • /
    • pp.17-26
    • /
    • 1992
  • This paper proposed an analysis method of common form for phonemes which is able to construct a Hangul syllable and designed the Choseong, Jungseong, and Jongseong phoneme fonts based on analized information. Also, It presents the algorithm which is able to construct the output of all Hangul syllables using 473 phoneme fonts. Through the experiment, an analized information and output algorithm could be applied to the design of Hangul fonts, effectively.

  • PDF

A STUDY ON THE RECOGNITION OF SPOKEN KOREAN LOCAL-NAMES USING SPATIO TEMPORAL

  • Song, Do-Sun;Kim, Suk-Dong;Lee, Haing-Sei
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1003-1008
    • /
    • 1994
  • This paper is about an experiment of speaker-independent automation Korean spoken words recognition using Multi-Layered Perceptron and Error Back-propagation algorithm. The words were not segmented into syllables or phonemes, and some feature components extracted from the words in equal gap were applied to the neural network. This paper tried to find out the optimum conditions through various experiment which are comparison between total and pre-classified training.

  • PDF

한국어 인식을 위한 인식 단위와 학습 데이터 분류 방법에 대한 연구 (A Study on Recognition Units and Methods to Align Training Data for Korean Speech Recognition))

  • 황영수
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.40-45
    • /
    • 2003
  • 본 연구는 한국어 분절음 인식을 위한 인식 단위 설정과 학습시 학습 데이터 분할 방법에 대한 연구이다 대용량 음성 인식을 수행할 경우, 표준 패턴의 인식 단위를 단어나 음절이 아닌 분절음 단위로 사용하여야 효율적인 음성 인식을 수행할 수 있다. 본 연구는 이와 같은 분절음 인식을 수행하기 위한 연구로서, 인식 단위 설정 변화와 학습시 학습 데이터 분할 방법에 따른 인식 결과를 미국 OGI 연구소의 speech toolkit을 이용하여 검토한다. 인식 단위에 관해서 특히 모음의 경우 철자에 기초한 음소별 인식 단위 설정과 현대어 발음에 기초한 인식 단위 설정을 비교했으며, 그 결과 발음에 기초해 몇 개의 모음을 통합한 경우가 더 우수한 결과를 보였으며, 학습 데이터 분할 방법에 따른 인식 결과는 손으로 분할한 방법이 자동 분할 방법보다 약 2-3%의 인식 향상을 보였다. 또한 인식 단위의 설정에 있어서 독립된 분절음으로 설정한 경우보다 앞, 뒤의 소리의 상황을 고려한 바이폰(bipbone)을 이용할 경우가 5.7%-25.9%의 향상된 인식 결과를 보였다 인식 방법에 있어서는 HMM 만을 이용한 방법보다 신경회로망과 HMM을 결합한 인식 방법이 6.1%-7.5%의 더 좋은 인식률을 나타내었다.

  • PDF

자소 및 음소 정보를 이용한 영어-한국어 음차표기 모델 (An English-to-Korean Transliteration Model based on Grapheme and Phoneme)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.312-326
    • /
    • 2005
  • 최근 정보검색과 기계번역과 같은 자연언어응용에서 영-한 자동 음차표기에 대한 관심이 높아지고 있다. 지금까지의 영-한 자동 음차표기 연구에는 $<영어자소{\rightarrow}$한글자소>의 직접방식, <영어자소${\rightarrow$음소$\rightarrow$한글자소>의 피봇방식이 있다 기존의 영-한 음차표기 연구들은 주로 직접방식에 대한 연구가 활발히 진행되어 찼다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소 뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 $60\%$의 단어 정확도를 나타내었다.

신경망을 이용한 고립단어에서의 피치변화곡선 발생기에 관한 연구 (A Study on the Pitch Contour Generator with Neural Network in the Isolated Words)

  • 임운천;곽진구;장석왕
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 2월 학술대회지
    • /
    • pp.137-155
    • /
    • 1996
  • The purpose of this paper is to generate a pitch contour which is affected by tile phonetic environment and the number of syllables in each Korean isolated word using a neural network. To do this, we analyzed a set of 513 Korean isolated words, consisting of 1-4 syllables and extracted the pitch contour and the duration of each phoneme in all the words. The total number of phonemes we analyzed is about 3800. After that we approximated the pitch contour with a 1st order polynominal by a regression analysis. We could get the slope, the initial pitch and the duration of each phoneme. We used these 3 parameters as the target pattern of the neural network and let the neural network learn the rule of the variation of the pitch and duration, which was affected by the phonetic environment of each phoneme. We used 7 consecutive phoneme strings as an input pattern for a neural network to make the network learn the effect of phonetic environment around the center phoneme. In the learning phase, we used 3545 items(463 words) as target patterns which contained the phonetic environment of front and rear 3 phonemes and the neural network showed the correctness rate of 98.43%, 98.59%, 97.7% in the estimation of the duration, the slope, the initial pitch. In the recall phase, we tested the performance of tile neural network with 251 items(50 words) which weren't need as learning data and we could get the good correctness rate of 97.34%, 95.45%, 96.3% in the generation of the duration, the slope, and the initial pitch of each phoneme.

  • PDF

단계식 입력 체계를 이용한 시선 추적 기반의 한글 입력 인터페이스 설계 (Design of Korean eye-typing interfaces based on multilevel input system)

  • 김호중;우성경;이건우
    • 한국HCI학회논문지
    • /
    • 제12권4호
    • /
    • pp.37-44
    • /
    • 2017
  • Eye-typing은 인간-컴퓨터 상호작용의 일종으로 시선의 위치 정보를 기반으로 하는 입력 체계이다. 눈동자의 움직임 이외의 물리적 행위를 필요로 하지 않아 거동이 어려운 전신마비 환자들을 위한 입력 수단으로 널리 사용된다. 하지만 eye-typing을 위한 한글 기반의 인터페이스는 거의 제시되지 않은 것이 현실이다. 이에 본 연구에서는 한글 입력에 최적화된 eye-typing 입력 체계를 구현하였다. 우선 큰 잡음과 Midas touch problem으로 대표되는 eye-typing의 특성을 고려하여 설계 목표를 정립하였다. 잡음 문제를 해결하기 위해 개별 버튼의 크기를 극대화하기 위해 단계식 입력 체계를 도입하였고 Midas touch problem을 해결하기 위해 입력 영역 중간에 시선 보류 영역을 두었다. 다음으로 각 음절이 자음과 모음의 조합으로 생성되는 한글의 언어학적 특성에 대한 고찰을 바탕으로 두 종류의 eye-typing 인터페이스를 설계하였다. 각각 자모 일체형, 자모 분리형 인터페이스로 정의한 두 인터페이스는 한글의 자모음을 유형화하여 단계적으로 입력하도록 구현되었다. 그리고 이들의 성능을 검증하기위해 한글 두벌식자판과 비교하고 입력 과정에서 시선의 동선을 분석하는 실험을 수행하였다. 그 결과, 제시한 인터페이스가 실용적인 eye-typing 수단으로 활용될 가능성이 충분함을 확인하였다.

PAM 행렬 모델을 이용한 음소 간 유사도 자동 계산 기법 (Automatic Inter-Phoneme Similarity Calculation Method Using PAM Matrix Model)

  • 김성환;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권3호
    • /
    • pp.34-43
    • /
    • 2012
  • 두 문자열 간의 유사도를 계산하는 문제는 정보 검색, 오타 교정, 스팸 필터링 등 다양한 분야에 응용될 수 있다. 동적 계획법 기반의 유사도 계산 방법을 통하여 한글 문자열의 유사도 계산을 위해서는 우선 음소간의 유사도에 대한 정의가 필요하다. 그러나 기존의 방법들은 수동적 설정에 의한 유사도 점수를 사용하고 있다는 한계점이 있다. 본 논문에서는 PAM(Point Accepted Mutation) 행렬과 유사한 확률 모델을 이용하여 변형 단어 집합으로부터 음소 간의 유사도를 자동적으로 계산하는 기법을 제안한다. 제안 기법은 주어진 변형 단어의 집합 내 유사한 단어 쌍을 찾아 문자열 정렬(Text Alignment)을 수행함으로써 음소 변형 규칙을 도출하고, 이로부터 각 음소 쌍의 상호 변형 빈도에 따른 유사도 점수를 계산한다. 실험 결과 특이도(Specificity) 77.2~80.4% 수준에서 불일치 여부에 따른 단순 점수 부여 방식에 비해서는 10.4~14.1%, 수동으로 음소 간 유사도를 직접 설정하는 방식에 비해서는 8.1~11.8%의 민감도(Sensitivity) 향상이 있음을 확인하였다.

SOM과 LVQ에 의한 자음의 분류 (Classification of Consonants by SOM and LVQ)

  • 이채봉;이창영
    • 한국전자통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.34-42
    • /
    • 2011
  • 음성타자기의 구현에 접근하려는 노력의 일환으로서, 우리는 본 논문에서 자음의 분류에 대해 연구한다. 많은 자음들은 시간에 따른 주기적 거동을 보이지 않고 따라서 그들에 대한 푸리에 해석의 타당성에 확신을 갖기 어렵다. 그러므로, 우선 음성 신호로부터 추출되는 MFCC와 LPCC 특징벡터들이 자음에 대해 어느 정도의 의미가 있는지를 파악하기 위하여 LBG 클러스터링을 통한 벡터양자화를 수행한다. VQ의 실험적 결과는 자음에 대한 푸리에 해석의 타당성에 관해 분명한 결론을 내리는 것이 쉽지 않음을 보여주었다. 자음의 분류를 위해 SOM과 LVQ의 두 가지 신경망이 사용되었다. SOM의 결과는 몇 쌍의 자음들이 나뉘어 분류되지 않음을 보여주었다. LVQ에서는 본질적으로 이 문제가 사라지지만 자음의 분류 정확도는 낮은 수준이었다. 이로부터, LVQ에 의한 자음 분류에 있어서는 MFCC 및 다른 특징 벡터들이 함께 사용되어야 함이 사료된다. 하지만 본 연구에서 도입한 MFCC/LVQ의 결합은 기존의 언어모델을 기반으로 하는 음소 분류에 비해 그 결과가 나쁘지 않은 것으로 나타났다. 모든 경우에 LPCC 특징벡터는 MFCC에 비해 그 결과가 좋지 않았다.

설소대 단축증 아동의 설소대 절개술 전 후 치조음 발음 양상의 변화 (Effect of Frenulotomy in Tongue-Tie : Focused on Alveolar Sounds)

  • 안서지;양해동;김병철;신지철;고중화
    • 대한후두음성언어의학회지
    • /
    • 제11권1호
    • /
    • pp.5-11
    • /
    • 2000
  • Background and Objectives : Tongue-tie, or partial ankyloglossia, is manifested by an abnormally short and thick lingual frenulum. Degree of tongue-tie varies from the mild to the rare, severe and its treatment of choice is frenulotomy. Theoretically tongue-tie can affect expression of alveolar sounds. The purpose of this study is to evaluate the degree of articulation problem and to evaluate the efficacy of frenulotomy itself on alveolar sounds in tongue-tie patients. Materials and Methods : Prospectively, the authors performed preoperative and postoperative speech evaluation using picture consonants test for tongue-tie patients. Percentage of consonants correct(PCC), mean value of each alveolar phoneme depends on articulation site were evaluated. for exclusion of other articulatory improving factors except of frenulotomy itself, postoperative picture consonants test was performed 1 month after surgery. Results : Preoperative speech evaluation was performed to 37(male 21, female 16) patients and postoperative speech evaluation was performed to 17(male 9, female 8) patients, the other 20 patients were follow-up loss. Low PCC was observed in tongue-tie patients and PCC of female was higher an at of male in 2-4 years old patients. Overall PCC was improved after frenulotomy. Preoperative mean value of liquids and fricatives was lower than the other alveolar phonemes(p<0.05) and it was improved postoperatively(p<0.05). Conclusion : Frenulotomy itself can improve the articulation of liquids and fricatives on short follow-up. Speech therapy would be needful for improvement of the other alveolar phonemes.

  • PDF

Sentence design for speech recognition database

  • Zu Yiqing
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.472-472
    • /
    • 1996
  • The material of database for speech recognition should include phonetic phenomena as much as possible. At the same time, such material should be phonetically compact with low redundancy[1, 2]. The phonetic phenomena in continuous speech is the key problem in speech recognition. This paper describes the processing of a set of sentences collected from the database of 1993 and 1994 "People's Daily"(Chinese newspaper) which consist of news, politics, economics, arts, sports etc.. In those sentences, both phonetic phenometla and sentence patterns are included. In continuous speech, phonemes always appear in the form of allophones which result in the co-articulary effects. The task of designing a speech database should be concerned with both intra-syllabic and inter-syllabic allophone structures. In our experiments, there are 404 syllables, 415 inter-syllabic diphones, 3050 merged inter-syllabic triphones and 2161 merged final-initial structures in read speech. Statistics on the database from "People's Daily" gives and evaluation to all of the possible phonetic structures. In this sentence set, we first consider the phonetic balances among syllables, inter-syllabic diphones, inter-syllabic triphones and semi-syllables with their junctures. The syllabic balances ensure the intra-syllabic phenomena such as phonemes, initial/final and consonant/vowel. the rest describes the inter-syllabic jucture. The 1560 sentences consist of 96% syllables without tones(the absent syllables are only used in spoken language), 100% inter-syllabic diphones, 67% inter-syllabic triphones(87% of which appears in Peoples' Daily). There are rougWy 17 kinds of sentence patterns which appear in our sentence set. By taking the transitions between syllables into account, the Chinese speech recognition systems have gotten significantly high recognition rates[3, 4]. The following figure shows the process of collecting sentences. [people's Daily Database] -> [segmentation of sentences] -> [segmentation of word group] -> [translate the text in to Pin Yin] -> [statistic phonetic phenomena & select useful paragraph] -> [modify the selected sentences by hand] -> [phonetic compact sentence set]

  • PDF