• 제목/요약/키워드: Seoul corpus

검색결과 98건 처리시간 0.026초

Using Corpora for the Study of Word-Formation: A Case Study in English Negative Prefixation

  • Kwon, Heok-Seung
    • 한국영어학회지:영어학
    • /
    • 제1권3호
    • /
    • pp.369-386
    • /
    • 2001
  • This paper will show that traditional approaches to the derivation of different negative words have been of an essentially hypothetical nature, based on either linguists' intuitions or rather scant evidence, and that native-speaker dictionary entries show meaning potentials (rather than meanings) which are in fact linguistic and cognitive prototypes. The purpose of this paper is to demonstrate that using a large corpus of natural language can provide better answers to questions about word-formation (i.e., with particular reference to negative prefixation) than any other source of information.

  • PDF

조음 기관의 시각화를 이용한 음성 동기화 애니메이션 (Speech Animation by Visualizing the Organs of Articulation)

  • 이성진;김익재;고형석
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.843-851
    • /
    • 2006
  • 본 논문에서는 음성에 따른 얼굴 애니메이션을 사실적으로 표현하기 위한 조음기관(혀, 성대 등)의 움직임을 시각화하는 방법을 제시한다. 이를 위해서, 음성에 따른 얼굴 애니메이션을 위한 말뭉치(Corpus)를 생성하고, 생성된 말뭉치에 대해서 음소 단위의 분석(Phoneme alignment) 처리를 한 후, 각 음소에 따른 조음기관의 움직임을 생성한다. 본 논문에서는 조음기관의 움직임 생성을 위해서 얼굴 애니메이션 처리에서 널리 사용되고 있는 기저 모델 기반 형태 혼합 보간 기법(Blend shape Interpolation)을 사용하였다. 그리고 이를 통하여 프레임/키프레임 기반 움직임 생성 사용자 인터페이스를 구축하였다. 구축된 인터페이스를 통해 언어치료사가 직접 각 음소 별 조음기관의 정확한 모션 데이터를 생성토록 한다. 획득된 모션 데이터를 기반으로 각 음소 별 조음기관의 3차원 기본 기저를 모델링하고, 새롭게 입력된 음소 시퀀스(phoneme sequence)에 대해서 동기화된 3차원 조음기관의 움직임을 생성한다. 이를 통해 자연스러운 3차원 얼굴 애니메이션에 적용하여 얼굴과 동기화된 조음 기관의 움직임을 만들어 낼 수 있다.

  • PDF

Atypical Metronidazole-Induced Encephalopathy in Anaerobic Brain Abscess

  • Jang, Han Jin;Sim, Sook Young;Lee, Jong Yun;Bang, Ji Hwan
    • Journal of Korean Neurosurgical Society
    • /
    • 제52권3호
    • /
    • pp.273-276
    • /
    • 2012
  • Metronidazole-induced encephalopathy is a very rare complication of the long standing use of metronidazole. The encephalopathy is bilateral and symmetric in nature. We report on the magnetic resonance imaging (MRI) and clinical course of metronidazole-induced encephalopathy in a 60-year-old female with a persistent anaerobic brain abscess after draining of the abscess. After 3 months of metronidazole administration, the patient complained of dysarthria, tingling sense of all extremities, and left hemiparesis. MRI revealed symmetric hyperintensity lesions in medulla, pons, dentate nuclei of cerebellum, and splenium of corpus callosum, all of which represent typical findings of metronidazole-induced encephalopathy. In addition, asymmetric lesions in midbrain, thalamus, putamen and cerebral subcortical white matter were noted. The patient recovered after discontinuation of metronidazole and the remaining abscess was successfully treated with meropenem and levofloxacine.

Patterns of consonant deletion in the word-internal onset position: Evidence from spontaneous Seoul Korean speech

  • Kim, Jungsun;Yun, Weonhee;Kang, Ducksoo
    • 말소리와 음성과학
    • /
    • 제8권1호
    • /
    • pp.45-51
    • /
    • 2016
  • This study examined the deletion of onset consonant in the word-internal structure in spontaneous Seoul Korean speech. It used the dataset of speakers in their 20s extracted from the Korean Corpus of Spontaneous Speech (Yun et al., 2015). The proportion of deletion of word-internal onset consonants was analyzed using the linear mixed-effects regression model. The factors that promoted the deletion of onsets were primarily the types of consonants and their phonetic contexts. The results showed that onset deletion was more likely to occur for a lenis velar stop [k] than the other consonants, and in the phonetic contexts, when the preceding vowel was a low central vowel [a]. Moreover, some speakers tended to more frequently delete onset consonants (e.g., [k] and [n]) than other speakers, which reflected individual differences. This study implies that word-internal onsets undergo a process of gradient reduction within individuals' articulatory strategies.

How Korean Learner's English Proficiency Level Affects English Speech Production Variations

  • Hong, Hye-Jin;Kim, Sun-Hee;Chung, Min-Hwa
    • 말소리와 음성과학
    • /
    • 제3권3호
    • /
    • pp.115-121
    • /
    • 2011
  • This paper examines how L2 speech production varies according to learner's L2 proficiency level. L2 speech production variations are analyzed by quantitative measures at word and phone levels using Korean learners' English corpus. Word-level variations are analyzed using correctness to explain how speech realizations are different from the canonical forms, while accuracy is used for analysis at phone level to reflect phone insertions and deletions together with substitutions. The results show that speech production of learners with different L2 proficiency levels are considerably different in terms of performance and individual realizations at word and phone levels. These results confirm that speech production of non-native speakers varies according to their L2 proficiency levels, even though they share the same L1 background. Furthermore, they will contribute to improve non-native speech recognition performance of ASR-based English language educational system for Korean learners of English.

  • PDF

담화 성분을 활용한 지시 발화의 키프레이즈 추출: 한국어 병렬 코퍼스 구축 및 데이터 증강 방법론 (Keyphrase Extraction of Directive Utterances via Discourse Component: Construction and Data Augmentation of Korean Parallel Corpus)

  • 조원익;문영기;김종인;김남수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.241-245
    • /
    • 2019
  • 문서 요약, 키프레이즈 추출과 패러프레이징은 인간이, 혹은 기계가 문서를 보다 원활히 이해하는 데에 도움을 주는 방법론들이다. 우리는 본 연구에서 질문/요구 등의 지시성 발화를 대상으로, 핵심 내용을 추출하는 간단한 방법론을 통해 한국어 병렬 코퍼스를 구축한다. 또한, 우리는 인적 자원을 활용한 효율적인 데이터 증강 전략을 통해 부족하거나 필수적인 유형의 발화의 양을 보강하고, 약 5만 쌍 크기의 코퍼스를 제작하여 이를 공개한다.

  • PDF

Intonational Pattern Frequency of Seoul Korean and Its Implication to Word Segmentation

  • Kim, Sa-Hyang
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.21-30
    • /
    • 2008
  • The current study investigated distributional properties of the Korean Accentual Phrase and their implication to word segmentation. The properties examined were the frequency of various AP tonal patterns, the types of tonal patterns that are imposed upon content words, and the average number and temporal location of content words within the AP. A total of 414 sentences from the Read speech corpus and the Radio corpus were used for the data analysis. The results showed that the 84% of the APs contained one content word, and that almost 90% of the content words are located in AP-initial position. When the AP-initial onset was not an aspirated or tense consonant, the most common AP patterns were LH, LHH, and LHLH (78%), and 88% of the multisyllabic content words start with a rising tone in AP-initial position. When the AP-initial onset was an aspirated or tense consonant, the most common AP patterns were HH, HHLH, and HHL (72%), and 74% of the multisyllabic content words start with a level H tone in AP-initial position. The data further showed that 84.1% of APs end with the final H tone. The findings provide valuable information about the prosodic pattern and structure of Korean APs, and account for the results of a previous study which showed that Korean listeners are sensitive to AP-initial rising and AP-final high tones (Kim, 2007). This is in line with other cross-linguistic research which has revealed the correlation between prosodic probability and speech processing strategy.

  • PDF

Gonepteryx속(인시목: 흰나비과) 교미낭의 미세구조에 관한 비교분석 (A Microscopic Study of the Bursa Copulatrix of Gonepteryx (Lepidoptera: Pieridae))

  • 정선우;이창언;김훈수
    • Animal Systematics, Evolution and Diversity
    • /
    • nspc3호
    • /
    • pp.121-128
    • /
    • 1992
  • 흰나비과중 Gonepteryx속의 6아종에 대한 교미낭을 해부 및 주사전자현미경으로 관찰하여 종간의 형태를 비교분석 하였다. 흰나비과의 다른 속에서처럼 이속의 교미낭도 ductus bursa, corpus bursa 그리고 appendix bursa의 세 부분으로 뚜렷이 구분되었으며, corpus bursa의 형태는 종에 따라 그 차이가 비교적 뚜렷하였으나 signum은 모두 ribbon모양으로 속내에서 매우 안정된 형태를 보였다. Signum주위 내벽에는 동심원상으로 많은 주름이 발달해 있었으며 그곳에는 내벽돌기가 없었고 맞은편에 광범하게 분포하였다. 내벽돌기는 대부분 방추형이었으며 교미낭의 형태와 내벽돌기의 상태로 고려했을때 G. aspasia와 G.taiwana가 속내에서 가장 유사한 종들로 인식되었다.

  • PDF

CASI 초분광 영상을 이용한 RapidEye 위성영상의 대리복사보정 (Vicarious Radiometric Calibration of RapidEye Satellite Image Using CASI Hyperspectral Data)

  • 장안진;최재완;송아람;김예지;정진하
    • 대한공간정보학회지
    • /
    • 제23권3호
    • /
    • pp.3-10
    • /
    • 2015
  • 지상의 모든 물체는 고유의 분광 반사율을 갖고 있으며, 이러한 특성을 이용하여 지상 물체의 분류와 목표물 탐지 등이 가능하다. 정확한 분석을 위해서는 취득된 원격탐사 자료를 분광 반사율로 변환해야 한다. 이를 위한 절대복사보정 기법으로는 자료 제공 기관에서 명시한 변환 수식을 이용하는 방법, 지상에서 측정한 분광 반사율만으로 단순 경험적 회귀 분석을 이용하는 방법, ATCOR/FLAASH 같은 수학적 모델을 이용하는 방법 등이 있다. 본 연구에서는 CASI 초분광 영상의 분광 반사율 자료를 이용하여 RapidEye 위성영상의 대리복사보정을 수행하고, 그 결과를 다른 복사보정 기법 결과 및 지상 자료와 비교하였다. 실험 결과 제안 기법이 ATCOR 및 New Kurucz 2005 기법보다 높은 유사성을 보였으며, 일반적으로 활용되는 ELM 기법과 유사한 결과를 도출하였다.

한국어 TimeML-텍스트의 사건 및 시간 정보 연구 (The Korean TimeML: A Study of Event and Temporal Information in Korean Text)

  • 유현조;장하연;조유미;김윤신;남승호;신효필
    • 한국언어정보학회지:언어와정보
    • /
    • 제15권1호
    • /
    • pp.31-62
    • /
    • 2011
  • TimeML is a markup language for events and temporal expressions in natural language, proposed in Pustejovsky et al. (2003) and latter standardized as ISO-TimeML (ISO 24617-1:2009). In this paper, we propose the further specification of ISO-TimeML for the Korean language with the concrete and thorough examination of real world texts. Since Korean differs significantly from English, which is the first and almost only extensively tested language with TimeML, one continuously run into theoretical and practical difficulties in the application of TimeML to Korean. We focus on the discussion for the consistent and efficient application of TimeML: how to consistently apply TimeML in accordance with Korean specificity and what to be annotated and what not to be, i.e. which information is meaningful in the temporal interpretation of Korean text, for efficient application of TimeML.

  • PDF