• 제목/요약/키워드: Language Variation

검색결과 135건 처리시간 0.024초

형태소 발음변이를 고려한 음성인식 단위의 성능 (Performance of speech recognition unit considering morphological pronunciation variation)

  • 방정욱;김상훈;권오욱
    • 말소리와 음성과학
    • /
    • 제10권4호
    • /
    • pp.111-119
    • /
    • 2018
  • This paper proposes a method to improve speech recognition performance by extracting various pronunciations of the pseudo-morpheme unit from an eojeol unit corpus and generating a new recognition unit considering pronunciation variations. In the proposed method, we first align the pronunciation of the eojeol units and the pseudo-morpheme units, and then expand the pronunciation dictionary by extracting the new pronunciations of the pseudo-morpheme units at the pronunciation of the eojeol units. Then, we propose a new recognition unit that relies on pronunciation by tagging the obtained phoneme symbols according to the pseudo-morpheme units. The proposed units and their extended pronunciations are incorporated into the lexicon and language model of the speech recognizer. Experiments for performance evaluation are performed using the Korean speech recognizer with a trigram language model obtained by a 100 million pseudo-morpheme corpus and an acoustic model trained by a multi-genre broadcast speech data of 445 hours. The proposed method is shown to reduce the word error rate relatively by 13.8% in the news-genre evaluation data and by 4.5% in the total evaluation data.

Reasons for Variation in Sensitivity and Specificity of Visual Inspection with Acetic Acid (VIA) for the Detection of Pre-Cancer and Cancer Lesions of Uterine Cervix

  • Parashari, Aditya;Singh, Veena
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권12호
    • /
    • pp.7761-7762
    • /
    • 2013
  • Alternative strategies such as visual inspection of cervix with acetic acid, are real time, economical and easily implemented methods for cervical cancer screening. However, variable sensitivity and specificity have been observed in various community based studies. The possible reasons could include variation in man power training, light source used for visualization, and preparation of diluted (4-5%) acetic acid and its storage. A standardized protocol for training, teaching material (easy to understand in the local language) for trainees, supervision and reinforcement by intermittent and supplementary training to check the quality of their observation, a standard protocol for preparation dilute acetic acid and its storage and a standard good light source (equivalent to day light) are needed to minimize the variation in sensitivity and specificity of VIA in community settings.

Statistical Patterns in Consonant Cluster Simplification in Seoul Korean: Within-dialect Interspeaker and Intraspeaker Variation

  • Cho, Tae-Hong;Kim, Sa-Hyang
    • 말소리와 음성과학
    • /
    • 제1권1호
    • /
    • pp.33-40
    • /
    • 2009
  • This study examines how young speakers of Seoul Korean produce tri-consonantal clusters /1kt/ and /1pt/ as in palk-ta ('to be bright') and palp-ta ('to step on'). Production data were collected from 20 speakers of Seoul Korean. The results of narrow transcription of the data showed that simplification is not obligatory as some speakers often preserve all three consonants. When simplified, there was a clear asymmetry between /1kt/ and /1pt/. Speakers showed no clear preference for either C1 preservation (C1=/1/) or C2 preservation (C2=/k/ in /1kt/ and /p/ in /1pt/) in production of /1kt/, but in production of /1pt/, strong preference was found for C1-preserved to C2-preserved variant. When compared with production data in Cho (1999), simplification patterns appear to have changed over the past 10 years, in a direction to preserve the first member of the cluster (/1/) more often, especially with /1kt/. There was no substantial between-item variation, indicating that simplification patterns are not lexically specified. Finally, the results suggest that the process of tri-consonantal simplification has not been fully phonologized in the grammar of the language as evident in substantial inter- and intra-speaker variation.

  • PDF

운율 정보를 이용한 한국어 위치 정보 데이터의 발음 모델링 (Pronunciation Variation Modeling for Korean Point-of-Interest Data Usins Prosodic Information)

  • 김선희;박전규;전재훈;나민수;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-56
    • /
    • 2006
  • 일반적으로 운율 정보를 음성인식에 이용한 연구들에 있어서는 대부분 운율의 음향적 정보를 이용하는데 반하여, 본 연구에서는 운율어나 음절수와 같은 운율의 구조적 정보가 인식률 향상에 기여함을 보인다. 본 논문은 두 가지 운율 정보, 즉 운율어와 음절수를 이용하여 발음모델링을 할 경우에 음성인식기의 성능을 평가하는 것을 목표로 하는 것으로, 먼저, 운율어를 이용하여 위치 정보데이터의 가능한 모든 발음을 생성하고, 다시 음절 수를 기준으로 발음변이 수를 조절하는 방법을 제시한 다음, 제안한 방법에 의하여 생성한 발음사전을 이용하여 음성인식의 성능을 평가하였다. 실험결과 운율어를 이용하여 발음 사전을 제작한 모든 경우에 베이스라인과 비교하여 성능이 향상됨을 보였는데, 베이스라인의 WER 4.63% 에서 최대 8.4%의 WER 가 감소하였다. 위치 정보 데이터의 음절수에 따라서 발음 변이의 수를 조절한 결과도 전체적으로는 3 음절로 그 수를 제한한 경우, 6 음절이상 단어에서는 4음절로 제한한 경우에 가장 좋은 인식 성능을 얻을 수 있어서, 음절수에 따른 발음변이 수의 조절이 효과적임을 알 수 있었다.

  • PDF

An Analysis of Reaction Time in the Perception of Korean and English Words Utilizing the E-Prime Program

  • Cha, Kyung-Whan;Youn, Young-Chul;Yu, Hyeon;Shim, Jae-Hwang
    • 음성과학
    • /
    • 제14권1호
    • /
    • pp.63-72
    • /
    • 2007
  • In this study, the researchers evaluate the hypothesis that the reaction time (RT) in the brain is largely dependent on age and gender. The researchers tested English and Korean words using two types: reading as visual stimuli, and listening as auditory stimuli. The E-Prime program installed in functional magnetic resonance imaging (f-MRI) was used. There are 136 Korean subjects in three groups: 30 children (5th and 6th grade elementary school students), 76 young adults (college students), and 30 adults (35-53 years old). In the listening test, the variation for the two languages was different among the three age groups, regardless of gender, whereas the data did not show meaningful differences in the reading test. The findings will provide some meaningful information regarding perception and acquisition of a foreign language.

  • PDF

확장된 변이 규칙을 이용한 용어의 점진적 획득 (An Incremental Acquisition of Terms Using Extended Variation Rules)

  • 정한민;김영길;최승권
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-117
    • /
    • 1998
  • 자연어 처리 응용 분야에서 다양하게 이용할 수 있는 용어들을 자동적으로 획득하고, 나아가 이 과정을 점진적으로 반복하여 수행함으로써 획득할 수 있는 용어의 수를 증가 시키고 그 용어들 간의 의미적 관계도 얻을 수 있다. 점진적인 용어 획득을 위하여 용어의 형태에 변이 규칙을 적용하여 새로운 용어를 획득하는 과정을 반복한다. 우리는 변이의 종류를 단어간의 변이 뿐만 아니라 단어 내의 변이 그리고 이 둘을 결합한 복합 변이로까지 확장하여 새로운 용어 획득 과정을 더욱 다양화하는 기법을 제시한다. 실험은 확장된 변이 규칙으로부터 얻은 용어들 중에서 기존의 단어간의 변이로부터 획득한 용어들의 비율이 전체의 38.6%라는 사실로부터 변이의 종류 및 규칙의 확장이 획득할 수 있는 용어들의 수를 증가 시킬 수 있다는 것을 보여준다.

  • PDF

From Opposition to Cooperation: Semantic Change of with

  • Rhee, Seongha
    • 한국영어학회지:영어학
    • /
    • 제4권2호
    • /
    • pp.151-174
    • /
    • 2004
  • A historical investigation reveals that English preposition with underwent a change from OPPOSITION to ASSOCIATION and further to ACCOMPANIMENT, where the first stage shows peculiarity in that the two concepts involved comprise an unusual set to form an extensional chain. Intrigued by this oddity, this paper aims to investigate the semantic structure of English preposition with from a grammaticalization perspective. We review mechanisms and models of semantic change and evaluate their adequacy with the semantic structure and change shown by with. Drawing upon the observed fact that with underwent the apparent antonymic semantic change, it is argued that such semantic change mechanisms as metaphor, metonymy, subjectification, and generalization have difficulties explaining the change, and that only the Frame-of-Focus Variation can effectively account for this peculiar change type. In terms of semantic change models, we argue that the Bleaching Model cannot effectively provide an explanation; that the Loss and Gain Model has problems in explaining the motivation of change directions; that the Metonymic-Metaphoric Model cannot be assessed at the current level of investigation; and that the Overlap Model and the Prototype Extension Model excellently account for the macro-level changes.

  • PDF

엔트로피 변화를 이용한 문자 영상 데이타의 변형량 (A Variation Measure of Character Image Data Using Entropy Changes)

  • 김은정;김대환;방승양
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.451-460
    • /
    • 1993
  • 본 논문에서는 문자 인식을 위해 수집된 문자 영상 데이타들의 변형 정도를 측정하는 변형량의 필요성과 변형량이 가져야 할 조건들을 알아본다. 지금까지 연구된 5가지 변형량들이 이 조건을 모두 만족시키지는 않음을 보이고 이 조건을 만족시키는 새로운 변형량, 평균 엔트로피 변화량을 제안한다. 이 변형량은 여백이나 문자의 두께에 무관하며 같은 문자 뿐만아니라 다른 문자 간에도 비교할 수 있는 특성을 가진다.

  • PDF

Alternating the Non-Alternate: A Probabilistic Approach to Dative Alternation

  • Choi Hye-Won
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권1호
    • /
    • pp.51-68
    • /
    • 2005
  • This paper proposes an informational approach to the dative alternation in English following up on the Stochastic Optimality- Theoretic (OT) model by Bresnan and Nikitina (2003). While Bresnan and Nikitina's stochastic OT model resolves the crucial problem of 'gradience' unavoidably implicated in variation phenomena by applying the notion of probability to linguistic problems, it fails to account for the details of the unusually alternating examples, which normally would not alternate. More importantly, it fails to capture the focus effect involved in the alternation. This paper has worked out all the problematic examples by modifying the Bresnan and Nikitina model. This new account captures not only the unusual behavior of the less-alternating verbs and idioms but also the special focus effect of the common alternating verbs.

  • PDF

음운 변동 실현 오류의 예측 인자 분석 (Analysis of Predictors of Phonological Variation Realization)

  • 안성민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.498-500
    • /
    • 2021
  • 본 연구에서는 음운 변동에서 나타나는 오류가 어떤 변수에 영향을 받는지 확인하여 음운 변동 연구 및 교육의 기초 자료를 제공하고자 하는 데에 목적이다. 이를 위해 유음화 발음 데이터를 이용하여 성별, 유음화의 방향, 품사, 단어의 빈도, 단어의 음절수와 유음화의 발음 적격 유무를 변수로 설정하였다. 유음화 적격률에 영향을 줄 수 있는 독립변수를 찾기 위해 카이제곱 검정과 다중공선성의 팽창계수를 먼저 확인하였다. 이후 다중 로지스틱 회귀분석과 오즈비를 통해 유의한 예측인자를 검토하였다. 그 결과 5개의 독립 변수 중 성별과 유음화의 방향, 품사가 결과를 오류에 영향을 주는 주요한 인자가 되는 것을 확인할 수 있었다.

  • PDF