통합 검색 | Korea Science

한국어 음성 인식에서 변동성과 벌크 지표에 기반한 음소 경계 검출 (Phoneme Segmentation based on Volatility and Bulk Indicators in Korean Speech Recognition)

이재원
- 정보과학회 컴퓨팅의 실제 논문지
- /
- 제21권10호
- /
- pp.631-638
- /
- 2015
최근 모바일 환경에서 작동 가능한 음성 인식 시스템에 대한 수요가 급격히 증대되고 있다. 본 논문은 음소 기반 한국어 음성 인식 시스템에 적용하기 위한 새로운 한국어 음소 경계 검출 방안을 제안한다. 먼저 입력 신호는 동일한 크기의 블록들을 구성한다. 제안하는 방식은 입력 음성 신호의 각 블록에 대해 계산되는 변동성 지표와, 부호가 동일한 인접 샘플들의 집합인, 블록 내의 각 벌크에 대해 계산되는 벌크 지표를 음소 경계 검출의 기반 지표로 사용한다. 두 가지 기반 지표를 결합하여 활용하는 세 개의 전용 인식 알고리즘을 사용하여, 모음, 유성 자음, 그리고 무성 자음을 차례로 인식하여 음소 간 경계를 검출한다. 실험 결과를 통해, 제안하는 방식을 사용함으로써 기존의 경계 검출 방식에 비해 오류율을 현저히 감소시킬 수 있음을 확인하였다.
https://doi.org/10.5626/KTCP.2015.21.10.631 인용 KSCI

ZCR과 PARCOR 계수를 이용한 숫자음성 인식 (Spoken digit recognition Using the ZCR and PARCOR Coefficient)

김학윤
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1985년도 학술발표회 논문집
- /
- pp.75-78
- /
- 1985
본 연구는 시간 영역의 parament를 이용하여 한국어 숫자음(영, 일, 이, 삼, 사, 오, 육, 칠, 팔, 구)을 인식했다. 입력 음성 신호 X(n)의 Beginning Point와 Ending point를 ZCR(Zero-crossing Rate), Magnitude, Energy, Autocorrelation을 이용 Beginning point와 Ending point를 구하고 자음부의 인식은 위 계수들을 이용하여 행했다. 또, 유성음 부분에서는 PARCOR(Partial Autocorrelation), LPC(Linear Predictive Coding)를 이용 모음부와 유성자음을 인식하여 모음을 6개 부류(ㅏ, ㅑ, ㅗ, ㅜ, ㅠ, ㅣ)로 구분 인식했다. 이 방법에 의하면 입력 음성 신호 X(n)의 B.P(Beginning Point)와 E.P(Ending Point)를 쉽게 추출 가능하며 또한 각 Parameter를 이용하여 94.4%의 인식율을 얻었다.
PDF

한국어 고립 단어 음성의 자음/모음/유성자음 음가 분할 및 인식에 관한 연구 (A Study on Consonant/Vowel/Unvoiced Consonant Phonetic Value Segmentation and Recognition of Korean Isolated Word Speech)

이준환;이상범
- 한국정보처리학회논문지
- /
- 제7권6호
- /
- pp.1964-1972
- /
- 2000
For the Korean language, on acoustics, it creates a different form of phonetic value not a phoneme by its own peculiar property. Therefore, the construction of extended recognition system for understanding Korean language should be created with a study of the Korean rule-based system, before it can be used as post-processing of the Korean recognition system. In this paper, text-based Korean rule-based system featuring Korean peculiar vocal sound changing rule is constructed. and based on the text-based phonetic value result of the system constructed, a preliminary phonetic value segmentation border points with non-uniform blocks are extracted in Korean isolated word speech. Through the way of merge and recognition of the non-uniform blocks between the extracted border points, recognition possibility of Korean voice as the form of the phonetic vale has been investigated.
PDF

한국어 연속음인식에 관한 연구(유성음 분류 및 단모음 인식 ) (On the Classification of Voice Sound and the Recognition of Vowels for Korean Continuous Speech)

하판봉;이철희;방승찬;안수길
- 한국음향학회지
- /
- 제5권3호
- /
- pp.28-35
- /
- 1986
우리나라 음성의 유성음을 모음, 비음 및 유성화 자음으로 분류하는 알고리즘을 기술하였다. 먼 저 기존의 PITCH 검출 알고리즘에 의하여 음성을 유성음과 무성음으로 나눈 뒤, 단지 정규화된 1차 상 관계수, 영교차율, LOG 에너지 및 LPG 에너지의 골짜기 검출만을 이용하여, 유성음은 모음, 비음 및 유 성화자음으로 분류하고 무성음은 실제의 무성음과 묵음으로 분류하였다. 그리고 이렇게 분류된 모음에 대하여 단모음 인식을 행하였다. 단지 한 FRAME으로 모음을 대표하였기 때문에 메모리 크기와 인식 시간을 줄였다. 여기서 UP & DOWN 및 수정된 영교차율을 새로이 정의하여 적용한 결과 만족한 결과 를 얻을 수 있었다. LPC 매개변수 및 전력 스펙트럼도 단모음 인식의 FEATURE로 사용하였다. 그리고 각 FEATURE 의 성능을 비교하였다. 이들 FEATURE을 잘 조합하여 2단계 인식을 행한 결과 92%의 높은 인식율을 얻을 수 있었다.
PDF

모음 우선 인식에 의한 즐단위 필기체 한글의 인식 (Recognition of Handprinted Hangul Line using Vowel Pre-Recognition Method)

함경수
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
- /
- pp.195-200
- /
- 1994
본 논문에서는 글자 구분선 없이 자유로이 쓰여진 필기체 한글의 인식 방안을 보인다. 즐단위의 한글 입력 영상에서 글자의 골격선을 추출하는 새로운 방법과 골격선들 간의 접촉점과 끝점을 그래프의 노드로 표현하고, 획은 그래프의 가지로 표현하는 방안을 보인다. 한글의 글자 구성 원리는 모음을 중심으로 모아쓰므로, 그래프로 표현된 즐단위의 한글에서 모음의 시작위치 및 속성을 가지는 로드로부터 한글의 모음을 가장 먼저 유도하여 인식하고, 우측 글자 및 자소끼리의 접촉을 분리하여 초성 자음 및 종성 자음을 인식하여, 좌에서 우의 방향으로 한 문자씩 인식해 나간다. 본 논문에서의 자유로이 필기된 한글의 인식 실험은 우리나라의 주소 50개를 서로 다른 25인이 필기한 영상 데이터를 사용하였고 한글 문자의 인식율은 89%이다.
PDF

한국어 양순 파열음 발음시 구강내압과 폐쇄기, VOT에 대한 연구 (The Study on Intraoral Pressure, Closure Duration, and VOT During Phonation of Korean Bilabial Stop Consonants)

표화영;최홍식
- 대한음성언어의학회:학술대회논문집
- /
- 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
- /
- pp.89-89
- /
- 1996
정상인 20명을 대상으로 하여, 우리말의 양순 파열음인 /ㅂ, ㅃ, ㅍ/의 발음시, 각각의 음소에서의 구강내압의 크기와 폐쇄기 및 VOT의 길이를 측정하고, 목표 자음이 어두에 나올 때 및 음절 초에 나올 때, 그리고 어음을 보통 소리로 말했을 때와 큰 소리로 말했을 때, 그 세 측정치가 어떻게 변화하는지를 파악하기 위한 실험을 실시하였다 채취된 어음의 구강내압은 발음시 Pressure sensor를 사용함으로써 산출된 파형을 이용하여 측정하였고, 폐쇄기와 VOT는 컴퓨터에 입력된 음성신호를 Spectrogram으로 분석하여 측정하였다. 그 결과, 양순 파열음 중 구강내압은 /ㅍ/＞/ㅃ/＞/ㅂ/의 순이었고, 폐쇄기의 길이는 /ㅃ/＞/ㅍ/＞/ㅂ/, 그리고, VOT의 길이는 /ㅍ/＞/ㅂ/＞/ㅃ/의 순이었다. 양순 파열음이 어두에 올 패보다 음절 초에 올 때 더 큰 구강내압을 보였으며, 폐쇄기의 길이는 더 짧아지는 경향을 보였고, VOT의 길이도 폐쇄기와 마찬가지로 짧아지는 경향을 보였다 그리고, 양순 파열음을 큰 소리로 발음했을 때, 목표 자음의 위치에 상관없이, 구강내압의 크기는 의미 있게 커졌으며, 폐쇄기와 VOT는 짧아지는 경향을 보였다.
PDF

이집트 한국어 학습자들의 한국어 음소 학습용이성 (Egyptian learners' learnability of Korean phonemes)

;이호영;황효성
- 말소리와 음성과학
- /
- 제11권4호
- /
- pp.19-33
- /
- 2019
이 연구는 한국어 자음과 모음 대해 단기간의 지각 훈련을 받은 이집트인 학습자들이 학습 수준별로 어떠한 지각 개선 양상을 보이는지 조사하고, 각 음소 쌍의 학습용이성 정도를 파악해 이집트인 학습자들을 대상으로 하는 한국어 발음교육에 실질적인 기여를 하는 것을 목적으로 한다. 이를 위해 50명의 한국어 학습자를 대상으로 이집트 현지에서 고변이 음성 훈련을 실시하였다. 한국어 수준에 따라 학습자를 초급 집단과 중고급 집단으로 나누었고, 2주간에 걸쳐 각 집단에 대해 30~40분의 지각 훈련을 10회 진행하였다. 고변이 음성 훈련용 자료는 다수의 한국어 원어민 화자가 발화한 자연음이었으며, 최소대립 쌍을 이루는 단어와 문장으로 최대한 다양하게 구성하였다. 사전과 사후 테스트 비교 결과, 이집트인 초급과 중고급 집단의 한국어 모음과 초성에 대한 지각 능력이 뚜렷하게 향상된 것을 확인할 수 있었다. 종성에 대한 지각 능력 역시 향상되었지만 훈련 전부터 정확도가 높아 향상폭은 다소 낮게 나타났다. 각 음소에 대한 지각 정확도와 향상도를 바탕으로 음소 쌍별 학습용이성을 측정하고, 이집트인 학습자를 위한 학습용이성 위계를 학습 단계별로 설정하였다.
https://doi.org/10.13064/KSSS.2019.11.4.019 인용 PDF KSCI

베트남 한국어 학습자를 위한 한국어 자음 지각 훈련 연구 (Perceptual training on Korean obstruents for Vietnamese learners)

황효성
- 말소리와 음성과학
- /
- 제15권4호
- /
- pp.17-26
- /
- 2023
이 연구는 베트남인 성인 학습자들이 학습 단계별로 한국어 어두 초성 장애음을 어떻게 지각하는지 밝히고, 지각 훈련을 통해 오류가 교정될 수 있는지를 밝히는 것을 목적으로 한다. 이를 위해 베트남인 초급, 중급, 고급 학습자 105명을 대상으로 한국어 초성 장애음에 대한 지각 훈련을 실시하였다. 훈련 자료는 원어민 음성으로 녹음한 자연 자극으로 한국어의 최소대립쌍을 적극적으로 활용하여 제작하였다. 실험 집단에 속한 학습자들은 약 2주간에 걸쳐 20-40분의 자기주도적 지각 훈련을 5회 수행했고, 통제 집단에 속한 학습자들은 사전 테스트와 사후 테스트에만 참여하였다. 실험 결과 훈련 전에 잘 구분되지 않았던 음들에 대한 지각이 많이 개선되었고, 초급뿐만 아니라 고급 집단의 학습자들도 끝까지 교정이 잘 되지 않았던 음에 대한 효과를 보았다. 이 연구에서는 대규모의 지각 훈련을 통해 베트남인 학습자들이 한국어의 서로 다른 음을 구별하는 적절한 음향 단서를 학습하는 데 지각 훈련이 중요한 역할을 할 수 있음을 확인하였다.
https://doi.org/10.13064/KSSS.2023.15.4.017 인용 PDF

Modified ISODATA 집단화방법을 이용한 불특정화자 단독어 인식 (Speaker-Independent Isolated Word Recognition Using A Modified ISODATA Method)

황우근
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1987년도 학술발표회 논문집
- /
- pp.66-69
- /
- 1987
본 논문은 불특정화자의 한국어 단독음인식에 관한 연구로써 새로운 집단화 방법인 Modified-ISODATA 집단화방법을 제안한다.본 알고리즘의 목적은 종래의 ISODATA 알고리즘에서 외부 고립점 처리 및 분리과정을 단순화 하고, Lumping 과정을 제거하여 정확하고도 자동화된 집단의 중심점을 찾는 것이다. 본 알고리즘을 적용한 결과, 10명의 남성 화자와 4명의 여성 화자가 발음한 11개의 ltnt자음에 대하여, 최근에 발표된 Modified K-means 방법보다 좋은 인식율을 나타내어, 보다 정확한 집단의 중심점을 찾아 내었음을 입증해보였다.
PDF

VCV 연쇄음성상에 존재하는 한국어 자음의 분류에 관한 연구 (A Study on the Classification of the Korean Consonants in the VCV Speech Chain)

최윤석;김기석;김원준;황희영
- 대한전기학회논문지
- /
- 제39권6호
- /
- pp.607-615
- /
- 1990
In this paper, I propose the experimental models to classify the consonants in the Vowel-Consonant-Vowel (VCV) speech chain into four phonemic groups such as nasals, liquids, plosives and the others. To classify the fuzzy patterns like speech, it is necessary to analyze the distribution of acoustic feature of many training data. The classification rules are maximum 4 th order polynomial functions obtained by regression analysis, contributing collectively the result. The final result shows about 87% success rates with the data spoken by one man.

검색결과 125건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)