• 제목/요약/키워드: prepositional phrase

검색결과 6건 처리시간 0.017초

최대 엔트로피 부스팅 모델을 이용한 영어 전치사구 접속과 품사 결정 모호성 해소 ((Resolving Prepositional Phrase Attachment and POS Tagging Ambiguities using a Maximum Entropy Boosting Model))

  • 박성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.570-578
    • /
    • 2003
  • 최대 엔트로피 모델은 자연언어를 모델링하기 위한 좋은 방법이다. 하지만, 최대 엔트로피 모델을 전치사구 접속과 같은 실제 언어 문제에 적용할 때, 자질 선택과 계산 복잡도의 두 가지 문제가 발생한다. 본 논문에서는, 이런 문제와 자연언어 자원에 존재하는 불균형 데이터 문제를 해결하기 위한 최대 엔트로피 부스팅 모델(maximum entropy boosting model)을 제시하고, 이를 영어의 전치사구 접속과 품사 결정 모호성 해소에 적용한다. Wall Street Journal 말뭉치에 대한 실험 결과, 문제의 모델링에 아주 작은 노력을 들였음에도 불구하고, 전치사구 접속 문제에 대해 84.3%의 정확도와 품사 결정 문제에 대해 96.78%의 정확도를 보여 지금까지 알려진 최고의 성능과 비슷한 결과를 보였다.

최대 엔트로피 부스팅 모델을 이용한 전치사 접속 모호성 해소 (Resolving Prepositional Phrase Attachment Using a Maximum Entropy Boosting Model)

  • 박성배;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.670-672
    • /
    • 2002
  • Park과 Zhang은 최대 엔트로피 모델(maximum entropy model)을 실제 자연언어 처리에 적용함에 있어서 나타날 수 있는 여러가지 문제를 해결하기 위한 최대 엔트로피 모델(maximum entropy boosting model)을 제시하여 문서 단위화(text chunking)에 성공적으로 적용하였다. 최대 엔트로피 부스팅 모델은 쉬운 모델링과 높은 성능을 보이는 장점을 가지고 있다. 본 논문에서는 최대 엔트로피 부스팅 모델을 영어 전치사 접속 모호성 해소에 적용한다. Wall Street Journal 말뭉치에 대한 실험 결과, 아주 작은 노력을 들였음에도 84.3%의 성능을 보여 지금까지 알려진 최고의 성능과 비슷한 결과를 보였다.

  • PDF

통계 정보를 이용한 전치사 최적 번역어 결정 모델 (A Statistical Model for Choosing the Best Translation of Prepositions.)

  • 심광섭
    • 한국언어정보학회지:언어와정보
    • /
    • 제8권1호
    • /
    • pp.101-116
    • /
    • 2004
  • This paper proposes a statistical model for the translation of prepositions in English-Korean machine translation. In the proposed model, statistical information acquired from unlabeled Korean corpora is used to choose the best translation from several possible translations. Such information includes functional word-verb co-occurrence information, functional word-verb distance information, and noun-postposition co-occurrence information. The model was evaluated with 443 sentences, each of which has a prepositional phrase, and we attained 71.3% accuracy.

  • PDF

'Let alone'표현의 통사적 행동 연구: 용례중심 (A Study on the Use of 'Let Alone' expression: A Usage-Based Approach. X, xx-xx.)

  • 김미자
    • 비교문화연구
    • /
    • 제27권
    • /
    • pp.387-414
    • /
    • 2012
  • This paper is intended to describe the idiosyncratic aspects of the 'let alone' construction in English, clarifying the productivity property of this construction and to show that this construction displays the properties of prepositional phrase that denote the meaning of 'the comparison of degree', against the claim that this construction should be regarded as a coordinating conjunction. In the process of doing that, this paper classifies this 'let alone' construction into two types of construction, by investigating the external and internal syntactic distributions of 'let alone' constructions as well as the relationship between 'let alone' phrases and the main clause.

Korean Learners' Interpretation of English Locative PPs with Manner of Motion Verbs

  • Kim, Jung-Tae
    • 영어어문교육
    • /
    • 제16권1호
    • /
    • pp.41-59
    • /
    • 2009
  • The present study investigated Korean learners' knowledge on the range of possible interpretations of English locative PPs with manner of motion verbs, and considers whether learners can arrive at a superset L2 grammar on the basis of positive L2 input. Unlike Korean, some English locative PPs occurring with manner of motion verbs (such as in John jumped on the bed) are ambiguous as they can be interpreted as either directional or locational. Thirty Korean learners of English in three distinct groups (Advanced EFL-only group; Intermediate-EFL-only group; and ESL-experienced group) participated in an experimental study, along with a control group of nine native speakers of English. The results of the study showed that I) Korean learners, overall, tended to interpret English locative PPs as only locational, failing to recognize the ambiguity between the directional and locational readings in the target structure; 2) For the learners who experienced only the EFL context, even highly proficient learners, as well as intermediate level learners, failed to acknowledge the ambiguity; 3) The learners who experienced the ESL context for an extended period of time could identify the target reading to some extent, although they still could not reach the native-like competence. From these results, it is argued that robustness of positive evidence, not simply its availability, is critical in the acquisition of the superset L2 targets like the present one.

  • PDF

남북한 고등학교 영어교과서 4-gram 연어 비교 분석 (Comparative Analysis of 4-gram Word Clusters in South vs. North Korean High School English Textbooks)

  • 김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.274-281
    • /
    • 2020
  • 본 연구는 4-gram 연어분석으로 남북한 고등학교 영어교과서를 비교분석하고자 하는 것이 목적이다. N-gram 분석은 그동안 우리가 알고 있는 관습적인 관용어와는 달리 코퍼스를 구성하여 기계적인 방법으로 물리적으로 함께 공기하는 빈도가 높은 낱말군을 객관적인 방법으로 추출하여 분석하는 것이다. 본 연구의 목적은 AntConc의 N-gram 분석 도구로 4-gram 연어를 남북한 영어교과서 코퍼스에서 찾아서 비교 분석해 보는 것이다. 분석의 대상은 북한의 2013 교육개혁에 따른 북한 고등중학교 영어교과서와 남한의 2015교육과정에 따른 고등학교 영어교과서로 구성된 코퍼스에서 구어와 문어의 token과 type을 구분하여 분석 비교한다. 이를 분석대상으로 하여 코퍼스의 4-gram 연어를 문법범주와 기능범주로 나눈 준거를 통해서 분석하였다. 문법범주는 크게 명사구, 동사구, 전치사구, 부분절 그리고 기타로 나누어 범주화하고 기능범주는 지칭, 텍스트의 조직, 입장과 기타로 나누었다. 분석한 결과 4-gram 연어에 나타난 구어와 문어 모두 남한의 영어교과서가 북한의 영어교과서 보다 token과 type의 수가 상대적으로 많았다. 그리고 문법범주에는 남북한 모두 영어교과서에 동사구와 부분절 형태의 4-gram 연어가 가장 많았으며 기능범주에는 남북한 모두 영어교과서에 입장 기능과 관련된 4-gram 연어가 가장 많았다.