Extension and Management of Verb Phrase Patterns based on Lexicon Reconstruction and Target Word Information (사전 재구성과 대역어 정보를 통한 동사구 패턴의 확장 및 관리)

  • Hong, Mun-Pyo;Kim, Young-Kil;Ryu, Chul;Choi, Sung-Kwon;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.103-107
    • /
    • 2002
  • 데이터 기반 기계번역의 성공여부는 대량의 데이터를 단기간에 구축하는 방법과, 또 구축된 데이터에 대한 효과적인 관리 방법이 좌우한다고 할 수 있다. 대표적인 데이터 기반 기계번역 방법론인 예제 기반 기계번역 방식이나 패턴 기반 기계번역 방식에서는 최소한의 학습 내지는 학습과정 없이 데이터를 구축하는 데에 연구가 중점적으로 이루어져왔으나, 데이터의 관리 문제에 대해서는 많은 연구가 이루어지지 못하였다. 그러나 데이터의 확장 못지않게 데이터의 효율적인 관리도 데이터 기반 기계번역 시스템의 개발에서 매우 중요하다. 이 논문에서는 사/피동 링크 등을 이용하여 사전을 재구성하는 것이 데이터의 일관성과 관리성을 향상시키고, 이론적인 면에서는 정보 기술상의 잉여성을 줄인다는 점을 보인다. 또한 이러한 정보에 기반하여 기구축된 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 패턴을 만들어내는 방법론도 제시한다.

  • PDF

English Auxiliary Verb Generation for Korean-to-English Machine Translation (한영 자동 번역을 위한 보조 용언 생성)

  • Shin, Jong-Hun;Yang, Seong-Il;Seo, Young-Ae;Kim, Chang-Hyun;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.143-147
    • /
    • 2011
  • 본 논문에서는 한국어로 입력된 문장을 분석한 결과로부터 그에 해당하는 영어 대역문을 생성하는 과정에서, 어떻게 한국어의 보조용언을 영어 대역문에 반영 할 것인가를 다룬다. 특히 대화체 분야를 다루는 한영 자동번역 시스템에서는 한국어의 보조용언 생성이 대역문의 품질을 향상시키는데 중요한 위치를 차지하기 때문에, 한영 자동 번역에서의 자연스러운 영어 보조용언 생성을 위한 방법론을 제안한다. 첫째, 기존 패턴 기반 한영 자동 번역 엔진과 한국어 말뭉치를 형태소 분석한 결과를 살펴보고, 자연스러운 보조 용언 대역어 생성의 어려움을 살펴본다. 둘째, 자연스러운 보조용언 생성에 필요한 양상을 규칙화 한 지식을 기반으로 자연스러운 단일 보조용언 생성을 위한 방법을 제시한다. 셋째, 두 개 이상의 보조용언이 연속해서 나타나는 다중 보조용언의 생성 방법을 제시한다. 마지막으로, 실험과 결론을 통하여 본 논문이 제안하는 방법론을 사용했을 때, 자동 번역 엔진의 성능 평가 지표 중 하나인 BLEU와 NIST점수의 변화를 나타내봄으로 그 성능을 보인다.

  • PDF

Microstructure and Dielectric Properties of (Sr·Ca)TiO3-based Ceramics Exhibiting Nonlinear Characteristics (비선형 특성을 갖는 (Sr·Ca)TiO3계 세라믹의 미세구조 및 유전 특성)

  • 최운식;강재훈;박철하;김진사;조춘남;송민종
    • Journal of the Korean Institute of Electrical and Electronic Material Engineers
    • /
    • v.15 no.1
    • /
    • pp.24-29
    • /
    • 2002
  • In this paper, the microstructure and the dielectric properties of Sr$\_$1-x/CaxTiO$_3$(0$\leq$x$\leq$0.2)-based grain boundary layer ceramics were investigated. The sintering temperature and time were 1420∼152 0$\^{C}$ and 4 hours in N$_2$ gas, respectively. The average grain size and the lattice constant were decreased with increasing content of Ca, but the average grain size was increased with increase of sintering temperature. The second phase foamed by the thermal diffusion of CuO from the surface leads to verb high apparent dielectric constant, $\xi$$\_$r/>50000 and low dielectric loss, tan$\delta$<0.05. X-ray diffraction patterns of Sr$\_$1-x/CaxTiO$_3$ exhibited cubic structure, and the peaks shifted upward and the peak intensity were decreased with x. This is due to the lattice contraction as Sr is replaced by Ca with a smaller ionic radius. The specimens treated thermal diffusion for 2hrs in 1150$\^{C}$ exhibited nonlinear current-voltage characteristic, and its nonlinear coefficient(a) was overt 7.

Automatic Text Summarization using Noun-Verb Cooccurrence Pattern (명사-동사 공기패턴을 이용한 문서 자동 요약)

  • Nam, Ki-Jong;Lee, Chang-Beom;Kang, Dae-Wook;Park, Hyuk-Ro
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.611-614
    • /
    • 2002
  • 문서 자동 요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문의 목적은 어휘 연관성 정보를 이용하여 한국어 문서를 자동으로 요약하는 효율적이며 효과적인 모형을 개발하는 것이다. 제안한 방법에서는 신문기사와 같은 특정 부류에 국한되는 단어간의 어휘연관성을 이용하여 명사-명사 공기패턴과 명사-동사 공기패턴을 구축하여 문서요약에 이용한다. 크게 불용어 처리 단계, 공기패턴 구축 단계, 문장 중요도 계산 단계, 요약 생성단계의 네 단계로 나누어 요약을 생성한다. 30% 중요문장 추출된 신문기사를 대상으로 평가한 결과 명사-명사 공기패턴과 빈도만을 이용한 방법보다 명사-동사 공기패턴을 이용한 방법이 좋은 결과를 가져 왔다.

  • PDF

Extension of Verb Patterns Using Passive Affixes (피동 접사를 이용한 동사패턴의 확장)

  • Kim, Chang-Hyun;Yang, Sung-Il;Choi, Sung-Kwon
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.619-622
    • /
    • 2002
  • 동사패턴은 원시 언어 분석을 위해 동사와 동사의 격성분 및 의미제약을 기술하고, 목적언어 생성을 위해 동사의 대역어 및 격성분들의 생성 위치정보를 기술한다. 이러한 동사패턴의 구축은 시간적, 경제적 부담이 큰 작업이며, 동사패턴 구축의 자동화 혹은 반자동화에 대한 요구는 크다. 본 논문에서는 서술성 명사와 결합하여 동사를 생성하는 접사들인 '-하-, -되-, -받-, -당하-, -드리-'에 대해, 이들 간의 상호 변환 규칙을 이용하여 수동으로 구축된 동사패턴으로부터 새로운 동사패턴을 자동으로 생성한다. 변환 규칙에서는 명사 어휘별 접사 분포 정보와 함께, 접사와 결합된 파생동사의 구문정보가 요구된다. 그러나, 기존의 사전에는 서술성 명사들의 '-하다, -되다' 분포 및 구문정보만이 기술되어 있고, '-받다, -당하다, -드리다'에 대해서는 기술되어 있지 않다. 본 논문에서는 서술성 명사들의 접사 분포 정보 및 구문정보를 파악하고, 이들 간의 상호 변환 규칙을 도출하여 새로운 동사패턴을 생성화는 2단계 작업을 수행한다.

  • PDF

Single-Stage High Power Factor Converter for 90-260Vrms Input (90-260Vrms 입력 범위를 갖는 단일 전력단 고역률 컨버터)

  • 김학원;문건우;조관열;윤명중
    • The Transactions of the Korean Institute of Power Electronics
    • /
    • v.7 no.1
    • /
    • pp.18-29
    • /
    • 2002
  • Generally, the single-stage power factor corrected converter has a problem of high dc link voltage. In the case of high line voltage, especially, the dc link voltage is verb high under the light load condition. To solve this problem, a new single stage power factor corrected AC/DC converter has been proposed. The proposed converter has huck topology as a power factor corrector. To prove feasibility of the proposed converter, the design example of the proposed converter has been presented. The design considerations and experimental results for the proposed converter have been shown. The experimental results show that the line input current harmonics can meet IEC1000-3-2 Class D requirements for the range of line input voltage from 90Vrms to 260Vrms.

Processing Scrambled Wh-Constructions in Head-Final Languages: Dependency Resolution and Feature Checking

  • Hahn, Hye-ryeong;Hong, Seungjin
    • Language and Information
    • /
    • v.18 no.2
    • /
    • pp.59-79
    • /
    • 2014
  • This paper aims at exploring the processing mechanism of filler-gap dependency resolution and feature checking in Korean wh-constructions. Based on their findings on Japanese sentence processing, Aoshima et al. (2004) have argued that the parser posits a gap in the embedded clause in head-final languages, unlike in head-initial languages, where the parser posits a gap in the matrix clause. In order to verify their findings in the Korean context, and to further explore the mechanisms involved in processing Korean wh-constructions, the present study replicated the study done by Aoshima et al., with some modifications of problematic areas in their original design. Sixty-four Korean native speakers were presented Korean sentences containing a wh-phrase in four conditions, with word order and complementizer type as the two main factors. The participants read sentences segment-by-segment, and the reading times at each segment were measured. The reading time analysis showed that there was no such slowdown at the embedded verb in the scrambled conditions as observed in Aoshima et al. Instead, there was a clear indication of the wh-feature checking process in terms of a major slowdown at the relevant region.

  • PDF

Extraction of ObjectProperty-UsageMethod Relation from Web Documents

  • Pechsiri, Chaveevan;Phainoun, Sumran;Piriyakul, Rapeepun
    • Journal of Information Processing Systems
    • /
    • v.13 no.5
    • /
    • pp.1103-1125
    • /
    • 2017
  • This paper aims to extract an ObjectProperty-UsageMethod relation, in particular the HerbalMedicinalProperty-UsageMethod relation of the herb-plant object, as a semantic relation between two related sets, a herbal-medicinal-property concept set and a usage-method concept set from several web documents. This HerbalMedicinalProperty-UsageMethod relation benefits people by providing an alternative treatment/solution knowledge to health problems. The research includes three main problems: how to determine EDU (where EDU is an elementary discourse unit or a simple sentence/clause) with a medicinal-property/usage-method concept; how to determine the usage-method boundary; and how to determine the HerbalMedicinalProperty-UsageMethod relation between the two related sets. We propose using N-Word-Co on the verb phrase with the medicinal-property/usage-method concept to solve the first and second problems where the N-Word-Co size is determined by the learning of maximum entropy, support vector machine, and naïve Bayes. We also apply naïve Bayes to solve the third problem of determining the HerbalMedicinalProperty-UsageMethod relation with N-Word-Co elements as features. The research results can provide high precision in the HerbalMedicinalProperty-UsageMethod relation extraction.

A Study on the Korean Language Acquisition of Children from Chinese Families in Korea: Focusing on Pronunciation and Vocabulary (재한중국인 가정 아동의 한국어 습득에 관한 연구 -발음과 어휘를 중심으로-)

  • Li, Yin
    • Journal of Korean language education
    • /
    • v.29 no.3
    • /
    • pp.165-196
    • /
    • 2018
  • This study examined the language acquisition of children from Chinese families in Korea under the bilingual background of Korean and Chinese, focusing on pronunciation and vocabulary. First, in the analysis of pronunciation acquisition, children correctly realized the lenition, aspirated sound, glottalization, palatalization, nasalization, and liquidization while the realization of pronunciation rules for unfamiliar words was low. There were also errors caused when the application principles of pronunciation were not accurately understood or they were not partially acquired. Second, in the analysis of vocabulary acquisition, the acquisition of receptive vocabulary was in the order of verb, noun, and adjective while they clearly understood vocabulary used in the actual relationships with school, family, and peers. In the acquisition of productive vocabulary, they showed the 'meaning-centered principle' of learning the meaning of vocabulary first and then learning its form afterwards. The amount of study and exposure to Korean language had effects on the improvement of vocabulary. Even though this study focused on the errors and characteristics in the acquisition process of Korean pronunciation and vocabulary for children from Chinese families in Korea, it could not clearly find out which one would have greater effects on the acquisition of Korean language. However, lots of exchanges and experiences with surrounding environment and peer group had great effects on the language acquisition and language acquisition transfer of children.

Copula Contraction and Deletion among African American Vernacular English (AAVE) Speakers

  • Willie, Willie U.
    • Cross-Cultural Studies
    • /
    • v.36
    • /
    • pp.211-240
    • /
    • 2014
  • This is a cross-sectional study designed to analyze the correlation between the structural and social variables and the pattern of contraction and deletion of the copula verb in the speech of African American Vernacular English (AAVE) speakers in Athens in Georgia, USA using a questionnaire. The results show that the frequency of copula contraction is higher than that of deletion in all factor groups including the age of the speakers where this study found that younger speakers tend to have higher frequency of contraction and deletion of the copula than older speakers. This study analyzes this as a function of the fact that younger speakers of AAVE are conscious of the linguistic and social differences between AAVE speakers and speakers of Standard American English (SAE) and they consciously make choices regarding which norm to use at which contexts to satisfy their communicative and socio-cultural needs. This sort of conscious social behavior is not likely to disappear with age rather it might increase as a correlate of the perceived physical, socio-cultural and psychological distance between AAVE speakers and speakers of other varieties. This study shows that such perceived linguistic, socio-cultural and psychological distance has negative effects on pedagogy and I proffer the remedy.