• 제목/요약/키워드: a word boundary

검색결과 76건 처리시간 0.024초

대학생의 영어 리듬과 억양구조 인식에 대한 연구 (A Study on the Perception of English Rhythm and Intonation Structure by Korea University Students)

  • 박주현
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1997년도 7월 학술대회지
    • /
    • pp.92-114
    • /
    • 1997
  • This study is aimed to grasp the actual problems of the perception of English rhythm and intonation structure by Korean University students who have studied English in the secondary schools for the past six years, and to establish the systems of English rhythm and intonation structure for the Korean students of English. For this study, the listening test is provided, and 100 students are chosen as the subjects of the study. The noticeable findings are summarized as follows: (1) Koreans perceive the words stress comparatively well in nonsense words, unfamiliar place names, and familiar word. (2) Koreans do not perceive the isochrony of English rhythm well enough. The perception of the sentence stress is very unstable, especially in the sentence involved in polysyllabic words, compound words, and 'emphatic stress' pr 'contrastive stress'(or in the different rhythmic patterns). (3) Koreans do not perceive the nucleus well enough. The perception of the nucleus is more stable in content words than in function words, at the end of a sentence than in the middle of a sentence, and in monosyllabic words than in the polysyllabic words. (4) Koreans do not perceive the boundary(or pause) of intonation group well enough. The perception of the pause is unstable in the long or complex sentence. (5) Koreans discriminate the meaning of English word stress comparatively well, especially in disyllabic words. But the discrimination is somewhat unstable in polysyllabic words and between 'adjective' and 'verb' (6) Koreans' discrimination of the intonation meaning is below the level. Koreans do not perceive the differences of intonation meaning according to the pitch accent or the focus. In conclusion, the writer will propose the procedures for the teaching of rhythm and intonation in the following order: word stress drill longrightarrowstressed and reduced syllables drilllongrightarrowrhythm group drilllongrightarrowthe varying rhythm drilllongrightarrowsentence stress drilllongrightarrownucleus drill longrightarrowintonation group drilllongrightarrowlong utterance drill of more than two intonation group.

  • PDF

모호성을 포함하고 있는 시계열 패턴인식을 위한 새로운 모델 RFAM과 그 응용 (A Novel Model, Recurrent Fuzzy Associative Memory, for Recognizing Time-Series Patterns Contained Ambiguity and Its Application)

  • 김원;이중재;김계영;최형일
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.449-456
    • /
    • 2004
  • 본 논문에서는 모호성을 포함하고 있는 시계열 패턴인식을 위한 새로운 인식모델인 순환퍼지기억장치를 제안한다. 순환퍼지기억장치는 기존의 퍼지기억장치에 순차적인 입력패턴를 처리하고 시간적 관련성을 표현할 수 있는 순환층을 추가함으로써 확장된 모델이다. 본 논문에서 제안하는 순환퍼지기억장치는 입력과 출력사이의 관련정도를 설정하기 위해 헤비안 방식의 학습알고리즘을 사용한다. 그리고 순환퍼지기억장치의 순환층에 필요한 가중치를 학습하기 위해서 오류역전파 알고리즘을 이용한다. 본 논문에서는 제안하는 모델을 음성신호의 경계를 추출하는 문제에 적용하여 성능을 평가한다.

운율구 경계현상 분석 및 텍스트에서의 운율구 추출 (Analysis and Prediction of Prosodic Phrage Boundary)

  • 김상훈;성철재;이정철
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.24-32
    • /
    • 1997
  • 이 논문에서는 첫 번째로 운율구 경계를 자동으로 추출하고자 할 때 인간의 지각과 관련하여 어떠한 자질을 이용하는 것이 좋은가 하는 점을 밝혀 보았다. 운율구 경계의 유형은 크게 경계가 없는 강도(zero), 약한 경계 강도(minor break strength), 강한 경계 강도(major break strength) 3 단계로 정하는 것이 통계적으로 의의가 있으며 지속시간의 정보가 강한 경계 유형의 결정에 중요하게 작용하는 자질이었음을 알 수 있었다. 두 번째로는 운율구 경계현상 분석결과를 바탕으로 운율구 경계의 경계 강도를 약한 경계 강도(zero를 포함)와 강한 경계 강도로 나누고, 2단계의 경계 강도를 텍스트상에서 문장성분의 bigram, trigram을 정보를 이용하여 자동으로 할당하였다. Bigram의 경우 Test-I, Test-II 텍스트 DB에 대해 각각 46.0%, 38.2%의 강한 경계 강도 예측정확률과 22.8%, 8.4%의 삽입오류율의 성능을 내었으며, Trigram인 경우 Test-I, Test-II 텍스트 DB 각각에 대해 58.3%, 42.8%의 강한 경계 강도 예측정확률과 30.0%, 11.8%의 삽입오류율를 나타냈다.

  • PDF

웹 문서를 위한 개선된 문장경계인식 방법 (Improved Sentence Boundary Detection Method for Web Documents)

  • 이충희;장명길;서영훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.455-463
    • /
    • 2010
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반하여 개선한 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 종결어미를 대상으로 학습하여 문장경계 인식을 수행하였다. 또한 문장경계인식 성능을 최대화하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 문서별 성능 측정을 위해서 구두점이 주로 문장경계로 사용된 문어체 위주의 평가셋1(신문기사와 블로그 문서)과 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서 위주의 평가셋2(웹 사이트의 게시판 글)를 대상으로 성능을 측정하였다. 평가 척도로는 F-measure를 사용하였으며, 기존 연구와 동일하게 구두점만을 문장경계 대상으로 학습한 기본 모델을 만들어서 실험한 결과, 평가셋1에 대해서 96.5%의 성능을 보였지만, 평가셋2에 대해서는 56.7%로 매우 저조한 성능을 보였다. 제안하는 개선 방법은 기본 모델을 웹 문서의 특징을 반영시키도록 자질 및 엔진을 개선시켰고, 최종 모델을 평가셋2로 평가한 결과, 96.3%의 성능을 보여서 39.6%의 성능 향상이 있음을 확인하였다.

연속 은닉 마코프 모델을 이용한 한국어 음성 인식을 위한 효율적 음절 모델링 (Effective Syllable Modeling for Korean Speech Recognition Using Continuous HMM)

  • 김봉완;이용주
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.23-27
    • /
    • 2003
  • 최근 연속 음성 인식에서의 성능 향상을 위해 음절을 인식 단위로 사용하고자 하는 노력들이 보고되고 있다. 그러나 음절의 경우 음소에 비해 학습성이 음소에 비해 좋지 않고, 모델의 수가 음소에 비해 매우 많으므로 음절 경계에서의 문맥 종속 모델링이 어렵다는 단점을 갖고 있다. 본 논문에서는 한국어에서의 음절의 학습성을 향상시키기 위한 방법과 음절경계에서의 음소 문맥 종속 음절 모델링을 제안한다. 제안된 방법을 단어 인식 실험에 적용한 결과, 기존의 음절 모델과 비교하여 평균 46.23%의 에러 감소율을 보였다 우측 음소 종속 음절 모델 (right phone dependent syllable model)의 경우 트라이폰(triphone) 모델에 비해 16.7%의 에러 감소율을 볼 수 있었다.

Social Media Neologisms: A Borrowed Affix as a Case of Pseudo-Anglicisms

  • Yoon, Junghyoe
    • International Journal of Advanced Culture Technology
    • /
    • 제9권4호
    • /
    • pp.86-93
    • /
    • 2021
  • This paper aims to investigate a novel affix prevalently and productively used in social media, which is assumed to be borrowed from English into Korean loanblens. The novel affix is composed of a prefix-like and a suffix-like elements, but it seems to be distinguished from other regular combinations of a prefix and a suffix. In analyzing the affix, we attempt to highlight its peculiarities of the affix with empirical data. First, the seemingly borrowed affix does not behave like affixes found in the donor language (English) or the recipient language (Korean) from a linguistic point of view. Both languages have circumfixation rarely available in productive word-formation processes. Second, no regular assimilation rules of Korean apply to the affix boundary, which would otherwise be mandatory to such syllable contact contexts. Last but not least, the affix form has no correspondence to the donor language, and therefore it is claimed to be derived through secretion and taken as a case of pseudo-anglicisms.

웨이브렛 변환을 이용한 음성신호의 끝점검출 (Endpoint Detection of Speech Signal Using Wavelet Transform)

  • 석종원;배건성
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.57-64
    • /
    • 1999
  • 본 논문에서는 잡음이 포함된 음성의 시작점과 끝점을 효율적으로 검출할 수 있는 알고리듬에 대하여 연구하였다. 이를 위해, 웨이브렛 영역에서의 에너지 분포를 고려함으로써 잡음환경하에서도 음성을 검출할 수 있는 새로운 검출 파라미터를 제안하였다. 제안된 끝점검출 파라미터는 웨이브렛 영역에서 세 번째 coarsed 스케일의 표준편차와 가중치를 곱한 첫 번째 detailed 스케일의 표준편차의 합으로 정의하였다. 제안된 끝점검출기의 성능평가를 위해서 다양한 SNR에서 기존방식과 비교하여 시작점과 끝점의 정확도 실험을 수행하였고 HMM 음성인식시스템을 이용하여 인식실험도 수행하였다.

  • PDF

어린이 글 읽기에서 나타나는 안구 운동의 특징 (The characteristics of eye-movement during children read Korean texts)

  • 고성룡;윤소정;민철홍;최경순;고선희;황민아
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.481-503
    • /
    • 2010
  • 이 연구는 초등학교 3학년 아동들이 나이에 알맞은 동화와 설명글을 읽을 때 보이는 안구 운동의 전반 특징과 낱말/어절 수준에 따른 특징을 우리글에서 처음으로 알아보았다. 아동들은 동화를 읽을 때 어절을 대략 213ms 동안 보다가 글 방향으로 3.6자 눈을 움직였고, 설명문을 읽을 때는 214ms 동안 보다가 글 방향으로 3.3자 정도 눈을 움직였다. 동화와 설명글 모두에서 앞으로 가서 다시 읽는 눈 움직임은 전체의 약 31%정도를 차지했다. 이런 전반 양상과 더불어, 어절 수준에서 어절 길이, 낱말빈도, 착지점 효과를 살펴보았는데, 아이들은 동화와 설명 글 모두에서 긴 어절을 짧은 어절보다 오래 주시하였고, 성인 독자와 마찬가지로 눈을 어절 가운데 근처에 착지하려는 경향성을 보였다. 또한 반복되지 않은 어절들을 분석했을 때 설명글에서 빈도가 낮은 어절들은 길이에 따른 주시시간이 차이를 크게 보였고 빈도가 높은 어절들은 길이에 따른 차이를 거의 보이지 않았다.

  • PDF

경계선 기울기 방법을 이용한 다양한 인쇄체 한글의 인식 (Recognition of Various Printed Hangul Images by using the Boundary Tracing Technique)

  • 백승복;강순대;손영선
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-5
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 입력되는 인쇄체 한글 이미지의 문자를 인식하여 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다 문자 인식에 있어서 잡음에 강한 경계선 기울기 방법을 이용함으로써 문자의 구조적 특성에 근거한 윤곽선 정보를 추출할 수 있었다. 이를 이용하여 각 문자 이미지의 수평 및 수직 모음을 인지하고 6가지 유형으로 분류한 후, 자소 단위로 분리하고 최대 길이 투영을 사용하여 모음을 인식하였다. 분리된 자음은 경계선이 변화되는 위상의 형태를 미리 저장된 표준 패턴과 비교하여 인식하였다. 인식된 문자는 KS 한글 완성형 코드로 문서 편집기에 출력되어 사용자에게 제공되는 시스템을 구현하였다.

Wavelet 특징 파라미터를 이용한 한국어 고립 단어 음성 검출 및 인식에 관한 연구 (A Study on Korean Isolated Word Speech Detection and Recognition using Wavelet Feature Parameter)

  • 이준환;이상범
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2238-2245
    • /
    • 2000
  • In this papr, eatue parameters, extracted using Wavelet transform for Korean isolated worked speech, are sued for speech detection and recognition feature. As a result of the speech detection, it is shown that it produces more exact detection result than eh method of using energy and zero-crossing rate on speech boundary. Also, as a result of the method with which the feature parameter of MFCC, which is applied to he recognition, it is shown that the result is equal to the result of the feature parameter of MFCC using FFT in speech recognition. So, it has been verified the usefulness of feature parameters using Wavelet transform for speech analysis and recognition.

  • PDF