• Title/Summary/Keyword: vowel system

검색결과 142건 처리시간 0.029초

악리론으로 본 정음창제와 정음소 분절 알고리즘 (Ortho-phonic Alphabet Creation by the Musical Theory and its Segmental Algorithm)

  • 진용옥;안정근
    • 음성과학
    • /
    • 제8권2호
    • /
    • pp.49-59
    • /
    • 2001
  • The phoneme segmentation is a very difficult problem in speech sound processing because it has found out segmental algorithm in many kinds of allophone and coarticulation's trees. Thus system configuration for the speech recognition and voice retrieval processing has a complex system structure. To solve it, we discuss a possibility of new segmental algorithm, which is called the minus a thirds one or plus in tripartitioning(삼분손익) of twelve temporament(12 율려), first proposed by Prof. T. S. Han. It is close to oriental and western musical theory. He also has suggested a 3 consonant and 3 vowel phonemes in Hunminjungum(훈민정음) invented by the King Sejong in the 15th century. In this paper, we suggest to newly name it as ortho-phonic phoneme(OPP/정음소), which carries the meaning of 'the absoluteness and independency'. OPP also is acceptable to any other languages, for example IPA. Lastly we know that this algorithm is constantly applicable to the global language and is very useful to construct a voice recognition and retrieval structuring engineering.

  • PDF

CAI 응용프로그램 작성시 자료공유를 위한 한자 코드 체계 정의에 관한 연구 (A Study on Data Sharing Codes Definition of Chinese in CAI Application Programs)

  • 고대곤
    • 정보교육학회논문지
    • /
    • 제2권2호
    • /
    • pp.162-173
    • /
    • 1998
  • CAI 프로그램 작성시 자료 공유를 위한 한자 공통코드 정의를 위하여 주요 한자문화권 국가의 한자 코드에 대한 고찰 결과, 한자코드 정의시 발음순과 부수순을 혼용 및 동일 한자에 대한 간체자(중국 GB)와 이체자(일본 Shift JIS)의 개발, 사용이 많아 정체자(KSC 한국)간의 자료 호환시 적절한 변환 장치가 요한다. 발음순 원칙은 동차 이음어가 다른 코드로 인식되어 코드 영역의 낭비가 있고, 부수순 원칙은 자국의 두음법칙에 맞지 않으나 중복 코드를 방지할 수 있어 자료의 복원시 유리하다. KSC 제1수준과 제2수준 한자 영역은 학계 및 업계의 요구를 수용할 수준으로 확대시킬 필요가 있다. 유니코드는 시스템의 호환, 확장에 유리하고, 다양한 문자 표현이 가능하여 교육목적 코드의 일시적인 대안이 될 수 있다.

  • PDF

소형 정보통신 단말기를 위한 한글 입력 방법 (Hangul Input Method for Small Electronic Networking Devices)

  • 강승식;한광수
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.287-295
    • /
    • 2005
  • 정보통신 단말기에서 한글을 쉽고 빠르게 입력 할 수 있는 방법을 모색하기 위해 한글 자음과 모음의 표기법 및 조합 원리를 분석하여 한글 자모 집합보다 작은 크기의 기본 자모 집합으로 한글을 입력하는 방법을 제시하였다 그 결과로 자음의 경우 기본 자음과 기능키를 이용하여 자음들을 조합하고, 모음은 8개의 기본모음으로부터 모음의 조합 원리 및 가획 원리에 의해 입력키가 할당되지 않은 모음을 조합하는 방식을 제안하였다. 특히, 유사 자소간의 에러 발생시에 지움 버튼을 사용하는 불편함을 해소하기 위해 자소간의 전환이 가능한 오류 수정 방식을 도입하였을 뿐만 아니라, 사용자가 입력 방식에 쉽게 익숙해질 수 있도록 입력방식을 다양화함으로써 사용자 편의 성 을 추구하였다 기존의 천지인, 나랏글 방식과 비교했을 때 사용자 편의성과 입력의 신속성, 에러 수정의 용이성 측면에서 매우 효율적임을 확인하였다.

  • PDF

구개인두부전증 환자와 모의 음성의 모음과 자음 분석 (Analysis on Vowel and Consonant Sounds of Patent's Speech with Velopharyngeal Insufficiency (VPI) and Simulated Speech)

  • 성미영;김희진;권택균;성명훈;김우일
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1740-1748
    • /
    • 2014
  • 본 논문에서는 구개인두부전증 (VPI) 환자 발음과 정상인의 모의 발음에 대한 듣기 평가와 음향 분석을 실시한다. 본 연구를 위해 음성 데이터 수집을 위해 50개의 단어, 모음 및 단음절로 이루어진 발음 목록을 설정한다. 듣기 평가실험의 편의를 위해 웹 기반의 듣기 평가 시스템을 구축한다. 듣기 평가 결과는 실제 VPI 환자의 발음에 대한 오인식 경향과 모의 발음의 오인식 경향이 유사함을 나타낸다. 이러한 유사성은 모음의 포먼트 위치와 자음의 스펙트럼의 비교를 통해서도 확인할 수 있다. 실험 결과는 본 연구에서 사용한 정상인의 VPI 모의 발화 기법이 실제 환자의 음성을 비교적 효과적으로 모의하는 것을 반영하는 결과이다. 향후 VPI 환자의 음성 인식 과정에서 정상인의 모의 발화음성 데이터를 음향 모델의 적응 기법과 같은 분야에 유용하게 사용할 수 있을 것으로 기대한다.

다단계 신경 회로망을 이용한 블랙박스 영상용 차량 번호판 인식 알고리즘 (A License Plate Recognition Algorithm using Multi-Stage Neural Network for Automobile Black-Box Image)

  • 김진영;허서원;임종태
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.40-48
    • /
    • 2018
  • 본 논문은 차량과 함께 카메라의 위치가 이동하는 블랙박스 영상을 위한 차량 번호판 인식 알고리즘을 제안한다. 카메라의 흔들림이나 빛의 변화가 많은 블랙박스 영상에서 다단계 신경 회로망을 사용하여 한글 문자의 인식률을 높여 전체적인 차량 번호판의 인식률을 높이고자 한다. 제안한 알고리즘은 차량 번호판의 한글 문자의 모음과 자음을 분리하여 인식한다. 먼저, 1차 신경 회로망으로 모음을 인식하고, 종모음('ㅏ','ㅓ')과 횡모음('ㅗ','ㅜ')로 구분한 뒤 각각의 모음군에 2차 신경 신경회로망을 이용하여 자음을 구분한다. 실제 블랙박스 영상을 획득하여 차량 번호판 인식 시뮬레이션을 수행하였으며, 그 결과 제안한 인식 시스템이 기존의 신경 회로망 기법을 사용한 차량 번호판 인식 시스템보다 높은 인식률을 보임을 확인하였다.

Feasibility of Revision Cochlear Implant Surgery for Better Speech Comprehension

  • Hwang, Kyurin;Lee, Jae Yong;Oh, Hyeon Seok;Lee, Byung Don;Jung, Jinsei;Choi, Jae Young
    • Journal of Audiology & Otology
    • /
    • 제23권2호
    • /
    • pp.112-117
    • /
    • 2019
  • Background and Objectives: The purpose of this study was to evaluate the efficacy of revision cochlear implant (CI) surgery for better speech comprehension targeting patients with low satisfaction after first CI surgery. Subjects and Methods: Eight patients who could not upgrade speech processors because of an too early CI model and who wanted to change the whole system were included. After revision CI surgery, we compared speech comprehension before and after revision CI surgery. Categoies of Auditory Performance (CAP) score, vowel and consonant confusion test, Ling 6 sounds, word and sentence identification test were done. Results: The interval between surgeries ranged from eight years to 19 years. Same manufacturer's latest product was used for revision surgery in six cases of eight cases. Full insertion of electrode was possible in most of cases (seven of eight). CAP score (p-value=0.01), vowel confusion test (p-value=0.041), one syllable word identification test (p-value=0.026), two syllable identification test (p-value=0.028), sentence identification test (p-value=0.028) had significant improvement. Consonant confusion test (p-value=0.063), Ling 6 sound test (p-value=0.066) had improvement but it is not significant. Conclusions: Although there are some limitations of our study design, we could identify the effect of revision (upgrade) CI surgery indirectly. So we concluded that if patient complain low functional gain or low satisfaction after first CI surgery, revision (device upgrade) CI surgery is meaningful even if there is no device failure.

Feasibility of Revision Cochlear Implant Surgery for Better Speech Comprehension

  • Hwang, Kyurin;Lee, Jae Yong;Oh, Hyeon Seok;Lee, Byung Don;Jung, Jinsei;Choi, Jae Young
    • 대한청각학회지
    • /
    • 제23권2호
    • /
    • pp.112-117
    • /
    • 2019
  • Background and Objectives: The purpose of this study was to evaluate the efficacy of revision cochlear implant (CI) surgery for better speech comprehension targeting patients with low satisfaction after first CI surgery. Subjects and Methods: Eight patients who could not upgrade speech processors because of an too early CI model and who wanted to change the whole system were included. After revision CI surgery, we compared speech comprehension before and after revision CI surgery. Categoies of Auditory Performance (CAP) score, vowel and consonant confusion test, Ling 6 sounds, word and sentence identification test were done. Results: The interval between surgeries ranged from eight years to 19 years. Same manufacturer's latest product was used for revision surgery in six cases of eight cases. Full insertion of electrode was possible in most of cases (seven of eight). CAP score (p-value=0.01), vowel confusion test (p-value=0.041), one syllable word identification test (p-value=0.026), two syllable identification test (p-value=0.028), sentence identification test (p-value=0.028) had significant improvement. Consonant confusion test (p-value=0.063), Ling 6 sound test (p-value=0.066) had improvement but it is not significant. Conclusions: Although there are some limitations of our study design, we could identify the effect of revision (upgrade) CI surgery indirectly. So we concluded that if patient complain low functional gain or low satisfaction after first CI surgery, revision (device upgrade) CI surgery is meaningful even if there is no device failure.

한글 언어 교습 시스템 (Korean language teaching system)

  • 정재원;이종원
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.367-371
    • /
    • 2008
  • 이 시스템은 한국의 언어인 한글을 모르는 외국인뿐만 아니라 국내의 남녀노소 막론하고 불특정 다수를 위한 것이다. 앞서 말한 대상자들이 한글을 조력자 없이 혼자 배우는 것은 사실상 불가능 하다고 할 수 있다. 집안에서 혼자서도 문자를 이해하고 발음을 청취할 수 있는 시스템으로 한글의 자음과 모음이라는 특징을 활용한 AR환경에 입각한 시스템을 보여준다. 나아가 이 시스템을 이용한 단어학습 방법도 제시한다. 또한 현 수준은 데스크톱 기반 시스템이지만 PDA등의 hand-held 기반의 시스템으로의 발전을 기약할 수 있으며 적은 수의 마커를 사용하여 편리함을 도모하면서 인간과 컴퓨터 사이에 쉽게 상호작용하는 시스템을 선보인다.

  • PDF

안면 움직임 분석을 통한 단음절 음성인식 (Monosyllable Speech Recognition through Facial Movement Analysis)

  • 강동원;서정우;최진승;최재봉;탁계래
    • 전기학회논문지
    • /
    • 제63권6호
    • /
    • pp.813-819
    • /
    • 2014
  • The purpose of this study was to extract accurate parameters of facial movement features using 3-D motion capture system in speech recognition technology through lip-reading. Instead of using the features obtained through traditional camera image, the 3-D motion system was used to obtain quantitative data for actual facial movements, and to analyze 11 variables that exhibit particular patterns such as nose, lip, jaw and cheek movements in monosyllable vocalizations. Fourteen subjects, all in 20s of age, were asked to vocalize 11 types of Korean vowel monosyllables for three times with 36 reflective markers on their faces. The obtained facial movement data were then calculated into 11 parameters and presented as patterns for each monosyllable vocalization. The parameter patterns were performed through learning and recognizing process for each monosyllable with speech recognition algorithms with Hidden Markov Model (HMM) and Viterbi algorithm. The accuracy rate of 11 monosyllables recognition was 97.2%, which suggests the possibility of voice recognition of Korean language through quantitative facial movement analysis.

한국어 음성 인식용 biphone 구성을 위한 기초 연구 (The Basic Study on making biphone for Korean Speech Recognition)

  • 황영수;송민석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.99-102
    • /
    • 2000
  • In the case of making large vocabulary speech recognition system, it is better to use the segment than the syllable or the word as the recognition unit. In this paper, we study on the basis of making biphone for Korean speech recognition. For experiments, we use the speech toolkit of OGI in U.S.A. The result shows that the recognition rate of the case in which the diphthong is established as a single unit is superior to that of the case in which the diphthong Is established as two units, i.e. a glide plus a vowel. And also, the recognition rate of the case in which the biphone is used as the recognition unit is better than that of the case in which the mono-phoneme is used.

  • PDF