• 제목/요약/키워드: Syllable Number

검색결과 84건 처리시간 0.022초

한국어 용언 어절 재인에 미치는 어휘 변인의 영향 -모어 화자와 고급 학습자의 예- (The Influence of Lexical Factors on Verbal Eojeol Recognition: Evidence from L1 Korean Speakers and L2 Korean Learners)

  • 김영주;이선진;이은하;남기춘;전현애;이선영
    • 한국어교육
    • /
    • 제29권3호
    • /
    • pp.25-53
    • /
    • 2018
  • This study examined the influence of lexical factors on verbal Eojeol recognition. To meet the goal, forty-five L2 Korean learners and twenty-two Korean native speakers took Eojeol decision tasks measured with the lexical factors such as 'number of strokes', 'number of consonants and vowels', 'number of syllables', 'number of morphemes', 'whole Eojeol frequency', 'root frequency', 'first-syllable-sharing frequency', and 'number of dictionary meanings.' As a result, 'whole Eojeol frequency' was the most effective factor to predict Eojeol recognition reaction time for native speakers and L2 learners, which supports the full-list model. Other lexical factors influencing Eojeol recognition reaction time in L2 learners were different following their proficiency level.

세계 담배이름의 유형에 따른 지역적 분포와 어원에 관한 연구 (Study on regional Distribution and Etymology according to the Type in the World's Tobacco Name)

  • 정기택
    • 한국연초학회지
    • /
    • 제37권1호
    • /
    • pp.8-17
    • /
    • 2015
  • The purpose of this study is to classify the tobacco names in the world, to investigate the regional distribution of the classified type, and to show origin of names according to the type. The names of tobacco used in this study was 50. The type of tobacco names was classified by the presence or absence of nasal sound(morn) on the first syllable, the Number of syllable, and the structure of consonants and vowels of tobacco names. Type I (Dambago) has the nasal sound on the first syllable. The proportion of Type I(Dambago) was 28%. And the rest(Type I~Type V ; 72%) has no nasal sound. Type II(Tabaco) has three syllables, and its proportion was 20%. Type III(Tabac) has the two syllables and the structure of T+vowels+B+vowels. And its proportion was 30%. Type IV(Tutun) has the two syllables and the structure of T+vowels+T+vowels. And its proportion was 12%. Type V(Duhan) has the two syllables and the structure of D+vowels+H(V)+vowels. And its proportion was 10%. The world's most widely distributed type was Type I(Dambago). regional distribution of the world's tobacco names were clustered by the type. 72% of Type I(Dambago) was distributed in Asia. The etymology of Type I(Dambago) was only 14% Tambaku and the other is not yet known. The etymology of Type I(Dambago) seems to be derived from the Haitian Tambaku(meaning a tobacco pipe). 88% of Type II(Tabaco) and III(Tabac) were distributed in Europe. The etymology of Type II(Tabaco) and Type III(Tabac) were 84% Spanish "Tabaco". 100% of Type IV(Tutun) and V(Duhan) were distributed in Europe. The etymology of Type IV(Tutun) and Type V(Duhan) were 100% Turkish tutun and duhan, respectively. This finding suggests that the etymology of Type I(Dambago) is certainly may be Haitian "Tambaku(meaning a tobacco pipe)".

  • PDF

음절수에 따른 한국어 복합 명사 분리 방안 (A Division Method of Korean Compound Noun by number of syllable)

  • 최재혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-267
    • /
    • 1996
  • 한국어 맞춤법 검사기는 문서내에서 발생되는 비표준어 오류, 띄어쓰기/붙여쓰기 오류, 조사/어미 오류, 외래어 오류, 철자 오류 등에 대해서 이에 적합한 대치어를 제시해 준다. 일반적으로 한국어의 맞춤법 오류 중 가장 빈번하게 발생되는 것이 띄어쓰기 오류이며, 이 중에서도 복합 명사에 대한 띄어쓰기 오류가 가장 많이 발생한다. 본 논문에서는 복합 명사에 대한 띄어쓰기 교정 방안으로 복합명사의 음절수에 따라 1개의 결과만을 출력하도록 하는 복합 명사 분리 방안을 제시하며, 또한 복합 명사 분리 시의 사전 참조 횟수를 줄이는 방법을 제안한다.

  • PDF

The Study on Korean Phoneme for Korean Speech Recogintion

  • Hwang, Young-Soo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.629-632
    • /
    • 2000
  • In this paper, we studied on the phoneme classification for Korean speech recognition. In the case of making large vocabulary speech recognition system, it is better to use phoneme than syllable or word as recognition unit. And, In order to study the difference of speech recognition according to the number of phoneme as recognition unit, we used the speech toolkit of OGI in U.S.A as recognition system. The result showed that the performance of diphthong being unified was better than that of seperated diphthongs, and we required the better result when we used the biphone than when using mono-phone as recognition unit.

  • PDF

음절을 기반으로한 한국어 음성인식 (Korean Speech Recognition Based on Syllable)

  • 이영호;정홍
    • 전자공학회논문지B
    • /
    • 제31B권1호
    • /
    • pp.11-22
    • /
    • 1994
  • For the conventional systme based on word, it is very difficult to enlarge the number of vocabulary. To cope with this problem, we must use more fundamental units of speech. For example, syllables and phonemes are such units, Korean speech consists of initial consonants, middle vowels and final consonants and has characteristic that we can obtain syllables from speech easily. In this paper, we show a speech recognition system with the advantage of the syllable characteristics peculiar to the Korean speech. The algorithm of recognition system is the Time Delay Neural Network. To recognize many recognition units, system consists of initial consonants, middle vowels, and final consonants recognition neural network. At first, our system recognizes initial consonants, middle vowels and final consonants. Then using this results, system recognizes isolated words. Through experiments, we got 85.12% recognition rate for 2735 data of initial consonants, 86.95% recognition rate for 3110 data of middle vowels, and 90.58% recognition rate for 1615 data of final consonants. And we got 71.2% recognition rate for 250 data of isolated words.

  • PDF

마음의 메인보드를 작동시키는 전도체로서의 정격 시조에 관한 문학치료 연구 (A Study of Literary Therapy on the Rated Sijo as a Conductor that Works the Motherboard of Mind)

  • 박인과
    • 문화기술의 융합
    • /
    • 제2권4호
    • /
    • pp.31-40
    • /
    • 2016
  • 인체라는 하드웨어는 전기적 신호에 의한 세포 활성화에 대한 프로그램이 입력되는 생리적 소프트웨어인 문장에 의해서 생명력이 부여된다. 본 연구는 뉴런과 뉴런으로 전달되는 생리적 인지적 시스템의 오류로 신음하는 인체의 보다 나은 치료적 환경 조성을 위해 인간의 정신계에 희노애락(喜怒哀樂)의 정서를 전기적 신호 체계로 접속시킬 수 있는 전도체로서의 기능을 가진 인체의 소프트웨어인 정격 시조의 문장 프로그램을 통해 정격 시조의 문장뉴런이 인체의 뉴런 시스템에 시냅스 되어 마음의 메인보드를 작동시키는 원리를 인문학적으로 규명해보고자 하였다. 이 원리가 규명되면 어떻게 부작용을 최소한으로 줄이고 인체를 치료적 프로그램으로 이끌어 갈 수 있을 지에 대한 방법을 구상할 수 있게 된다. 연구 결과 정격 시조에서 아주 빠르게 마음의 메인보드를 작동시키는 강렬한 에너지원이 존재하는 것으로 판단될 수 있는 근거를 찾게 되었다. 한 수의 정격 시조를 접하고 혹은 한 음보의 정격 시조를 접하고 곧바로 원작인 정격 시조의 신호 체계를 이어받은 또 다른 문장으로의 새로운 부호화 및 재부호화가 치료적으로 재빠르게 형성됨이 확인되었기 때문이다. 이로써 인류에게는 미래에 부작용 없이 인체에 시냅스 되는 전도체로서의 문장과 인체에 장치된 마음의 메인보드 간의 상호작용의 기능을 통해 인간의 정신계를 풍요롭게 업그레이드 할 수 있는 문학치료의 가능성이 도출되었다.

독서교육시스템을 위한 텍스트수준 측정 공식 구성에 관한 연구 (A Study on Modelling Readability Formulas for Reading Instruction System)

  • 최인숙
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.213-232
    • /
    • 2005
  • 본 고의 목적은 초등학생용 독서자료의 텍스트수준에 영향을 미치는 요인들을 규명하여 텍스트수준 측정 공식을 구성함으로써 텍스트의 수준 평가를 자동화하는 데에 있다. 컴퓨터로 계량화할 수 있는 언어적 요인들을 대상으로 표본집단에 부여된 텍스트수준 점수와의 상관관계를 검토한 결과 글자수, 어절수, 이형어절수, 문장수, 단락수 요인이 텍스트수준을 결정하는 요인으로 드러났다. 단순회귀분석을 통해 도출된 회귀방정식들 중에서 이형어절수 모형이 최적의 공식으로 드러났으나, 중회귀분석을 한 결과 이형어절수요인과 새 어절출현비율요인을 결합한 모형은 설명력이 더욱 향상된 공식으로 밝혀졌다. 공식에 따라 측정된 텍스트수준 점수는 학년 내에서 매우 세분된 단계까지 나타내고 있으므로 각 학생별로 그들의 독서능력에 적합한 자료를 추천할 수 있다.

회귀신경망을 이용한 음성인식에 관한 연구 (A Study on Speech Recognition using Recurrent Neural Networks)

  • 한학용;김주성;허강인
    • 한국음향학회지
    • /
    • 제18권3호
    • /
    • pp.62-67
    • /
    • 1999
  • 본 논문은 회귀신경망을 이용한 음성인식에 관한 연구이다. 예측형 신경망으로 음절단위로 모델링한 후 미지의 입력음성에 대하여 예측오차가 최소가 되는 모델을 인식결과로 한다. 이를 위해서 예측형으로 구성된 신경망에 음성의 시변성을 신경망 내부에 흡수시키기 위해서 회귀구조의 동적인 신경망인 회귀예측신경망을 구성하고 Elman과 Jordan이 제안한 회귀구조에 따라 인식성능을 서로 비교하였다. 음성DB는 ETRI의 샘돌이 음성 데이터를 사용하였다. 그리고, 신경망의 최적모델을 구하기 위하여 예측차수와 은닉층 유니트 수의 변화에 따른 인식률의 변화와 문맥층에서 자기회귀계수를 두어 이전의 값들이 문맥층에서 누적되도록 하였을 경우에 대한 인식률의 변화를 비교하였다. 실험결과, 최적의 예측차수, 은닉층 유니트수, 자기회귀계수는 신경망의 구조에 따라 차이가 나타났으며, 전반적으로 Jordan망이 Elman망보다 인식률이 높았으며, 자기회귀계수에 대한 영향은 신경망의 구조와 계수값에 따라 불규칙하게 나타났다.

  • PDF

A Study on the Syllable Recognition Using Neural Network Predictive HMM

  • Kim, Soo-Hoon;Kim, Sang-Berm;Koh, Si-Young;Hur, Kang-In
    • The Journal of the Acoustical Society of Korea
    • /
    • 제17권2E호
    • /
    • pp.26-30
    • /
    • 1998
  • In this paper, we compose neural network predictive HMM(NNPHMM) to provide the dynamic feature of the speech pattern for the HMM. The NNPHMM is the hybrid network of neura network and the HMM. The NNPHMM trained to predict the future vector, varies each time. It is used instead of the mean vector in the HMM. In the experiment, we compared the recognition abilities of the one hundred Korean syllables according to the variation of hidden layer, state number and prediction orders of the NNPHMM. The hidden layer of NNPHMM increased from 10 dimensions to 30 dimensions, the state number increased from 4 to 6 and the prediction orders increased from 10 dimensions to 30 dimension, the state number increased from 4 to 6 and the prediction orders increased from the second oder to the fourth order. The NNPHMM in the experiment is composed of multi-layer perceptron with one hidden layer and CMHMM. As a result of the experiment, the case of prediction order is the second, the average recognition rate increased 3.5% when the state number is changed from 4 to 5. The case of prediction order is the third, the recognition rate increased 4.0%, and the case of prediction order is fourth, the recognition rate increased 3.2%. But the recognition rate decreased when the state number is changed from 5 to 6.

  • PDF

7학년 국어교과서의 어휘 통계조사 -노미숙, 김태철 교과서를 중심으로- (Statistical Survey of Vocabulary in Korean Textbook for 7th-Grade -Focus on the No's and the Kim's Textbooks-)

  • 김철수
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.491-499
    • /
    • 2014
  • 본 연구는 중학교 7학년 국어교과서 4종에 나타나는 어휘들에 대한 통계(음절 개수, 음절 종류, 음절 출현 빈도, 어절 개수, 어절 종류, 어절 평균 길이, 어절 출현 빈도 등)를 조사하였다. 전체 한글 음절 개수는 286,801개, 한글 음절 종류는 1,350개, 음절 평균 출현빈도는 212.4회이다. 어절 개수는 109,393개, 어절 종류는 29,356개, 어절 평균 출현빈도는 3.7회이다. 평균 음절 길이는 2.7음절이며, 한글 어절 중 가장 긴 어절길이는 8이다.