• Title/Summary/Keyword: 구문패턴

Search Result 112, Processing Time 0.023 seconds

A Conceptual Framework for Korean-English Machine Translation using Expression Patterns (표현 패턴에 의한 한국어-영어 기계 번역을 위한 개념 구성)

  • Lee, Ho-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.236-241
    • /
    • 2008
  • This paper discusses a Korean-English machine translation method using expression patterns. The expression patterns are defined for the purpose of aligning Korean expressions with appropriate English expressions in semantic and expressive senses. This paper also argues to develop a new Korean syntax analysis method using agglutinative characteristics of Korean language, expression pattern concept, sentence partition concept, and incorporation of semantic structures as well in the parsing process. We defined a simple Korean grammar to show the possibility of new Korean syntax analysis method.

  • PDF

Performance Enhancement of Tree Kernel-based Protein-Protein Interaction Extraction by Parse Tree Pruning and Decay Factor Adjustment (구문 트리 가지치기 및 소멸 인자 조정을 통한 트리 커널 기반 단백질 간 상호작용 추출 성능 향상)

  • Choi, Sung-Pil;Choi, Yun-Soo;Jeong, Chang-Hoo;Myaeng, Sung-Hyon
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.2
    • /
    • pp.85-94
    • /
    • 2010
  • This paper introduces a novel way to leverage convolution parse tree kernel to extract the interaction information between two proteins in a sentence without multiple features, clues and complicated kernels. Our approach needs only the parse tree alone of a candidate sentence including pairs of protein names which is potential to have interaction information. The main contribution of this paper is two folds. First, we show that for the PPI, it is imperative to execute parse tree pruning removing unnecessary context information in deciding whether the current sentence imposes interaction information between proteins by comparing with the latest existing approaches' performance. Secondly, this paper presents that tree kernel decay factor can play an pivotal role in improving the extraction performance with the identical learning conditions. Consequently, we could witness that it is not always the case that multiple kernels with multiple parsers perform better than each kernels alone for PPI extraction, which has been argued in the previous research by presenting our out-performed experimental results compared to the two existing methods by 19.8% and 14% respectively.

Development of Information Search Module by Integrating Regular Expression and Correlation Analysis Method (정규식 구문과 상관분석 기법을 통합한 정보 검색 모듈 개발)

  • Kim, Bong-Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.3
    • /
    • pp.634-640
    • /
    • 2013
  • Existing patterns and database search, string search unit search results for a lot of false positives, a simple search technique unreliable. In addition, the same conditions in addition to other search methods implemented due to wasted of resources and enforcement have been causing a waste of time. Therefore, regular expression and correlation analysis method by applying an integrated linkage information search module is to develop in this paper. From this, existing string search technique that has been noted as a problem by reducing the economic impact false positive and reliability to develop method that will information search secure.

Sentiment Classification considering Korean Features (한국어 특성을 고려한 감성 분류)

  • Kim, Jung-Ho;Kim, Myung-Kyu;Cha, Myung-Hoon;In, Joo-Ho;Chae, Soo-Hoan
    • Science of Emotion and Sensibility
    • /
    • v.13 no.3
    • /
    • pp.449-458
    • /
    • 2010
  • As occasion demands to obtain efficient information from many documents and reviews on the Internet in many kinds of fields, automatic classification of opinion or thought is required. These automatic classification is called sentiment classification, which can be divided into three steps, such as subjective expression classification to extract subjective sentences from documents, sentiment classification to classify whether the polarity of documents is positive or negative, and strength classification to classify whether the documents have weak polarity or strong polarity. The latest studies in Opinion Mining have used N-gram words, lexical phrase pattern, and syntactic phrase pattern, etc. They have not used single word as feature for classification. Especially, patterns have been used frequently as feature because they are more flexible than N-gram words and are also more deterministic than single word. Theses studies are mainly concerned with English, other studies using patterns for Korean are still at an early stage. Although Korean has a slight difference in the meaning between predicates by the change of endings, which is 'Eomi' in Korean, of declinable words, the earlier studies about Korean opinion classification removed endings from predicates only to extract stems. Finally, this study introduces the earlier studies and methods using pattern for English, uses extracted sentimental patterns from Korean documents, and classifies polarities of these documents. In this paper, it also analyses the influence of the change of endings on performances of opinion classification.

  • PDF

Design of Information Search Integration Module Using Regular Expression and Correlation Analysis (정규식 구문과 상관 분석을 이용한 정보 검색 통합 모듈 설계)

  • Kong, Young-Jin;Park, Young-Gil;Kim, Bong-Hyun
    • Proceedings of the KAIS Fall Conference
    • /
    • 2012.05b
    • /
    • pp.708-711
    • /
    • 2012
  • 기존 패턴 및 데이터베이스 검색, 페이지 단위 문자열 검색기법은 단순 검색으로 오탐율이 많아 검색 결과에 대한 신뢰성이 떨어지고, 동일 조건을 다른 검색기법에 추가로 시행함으로 인해 자원 낭비 및 시간 낭비를 초래하고 있다. 따라서 본 논문에서는 정규식 구문 기법과 상관 분석 기법을 연동시킨 통합형 정보 검색을 설계하여 경제적인 효과와 신뢰성을 확보하는 보안형 정보 검색 시스템의 기반기술을 제안하고자 한다.

  • PDF

An Analysis of the street structure and the Morphological Change using Space Syntax in Kangnam, Seoul (공간구문론을 활용한 가로체계와 공간변화 분석 - 서울 강남구를 사례로)

  • Kim, Hye-Young;Joo, Yong-Jin;Jun, Chul-Min
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.06a
    • /
    • pp.69-70
    • /
    • 2010
  • 우리나라의 경우 시계열적인 토지 이용의 변화특성에 대한 경향 및 유형의 분석과 예측에 관련한 연구는 그 중요성에도 불구하고 미흡한 실정이다. 따라서 본 연구는 서울시 강남구의 구축한 시계열 데이터를 바탕으로 가로체계와 토지이용 자료를 사용하여 강남구 공간구조의 시계열 공간구조변화의 패턴분석을 목적으로 한다. 또한 토지이용 변화과정을 함께 비교분석한다. 강남구는 70년대 초부터 개발로 인해 많이 변화해온 지역이다. 이를 고려하여 60,70,80,90년의 시계열별 공간구문론을 도입하여 축선도(Axial map)를 통해 정량적 분석을 한다. 향후 도로의 접근성 측면에서의 토지이용변화 예측모델 방법론과 연계가 이루어진다면 공간변화를 효과적으로 추정할 수 있을 것이라 기대한다.

  • PDF

The Method of Chinese Ellipsis Component Restoration for Chinese Dialog Machine Translation (중한 대화체 자동번역을 위한 중국어 긴축문 처리)

  • Jin, Yun;Wu, Yingshun;Kwon, Oh-Woog
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.300-302
    • /
    • 2012
  • 긴축문은 형식 상 복문이지만 문장의 일부를 생략하여 단일문처럼 표현하기 때문에 의미상 논리적인 관계를 가지고 있는 비구문적인 복문으로서, 중국어 대화체 비정형 데이터의 대표적인 유형이다. 이는 비구문적인 문장에 취약한 대화체 자동번역 성능 향상의 걸림돌이 되고 있다. 이를 위해 본 논문에서는 패턴기반의 긴축문 추정과 긴축문 복원이라는 두 단계 처리 방법을 제안하며, 긴축문 처리의 필요성과 유효성을 자동번역 성능 향상 여부 실험을 통해 검증하였다. 실험 결과, 긴축문 추정은 95.5% 정확률을 보였으며, 전체 번역문의 번역성능은 2.21% 향상되는 결과를 보였다.

Study on Sentence Rewriting in English-Korean Machine Translation (영한 기계번역에서 문장 다시 쓰기에 관한 연구)

  • Kim, Sung-Dong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.257-261
    • /
    • 2008
  • 규칙 기반의 영한 기계번역에서는 영어의 문법 규칙을 구축하고 이를 이용하여 영어의 구문 분석을 수행한다. 그러나 쉼표를 포함한 문장이나 특수한 형식의 문장들은 문법에 의해 분석하기 어렵다. 이를 문법에 의해 분석하기 위해서는 문법이 복잡해지고 문법의 수가 많아지게 되어 분석의 복잡도를 증가시키게 된다. 이러한 문제를 해결하기 위해 이미 존재하는 규칙에 의해 분석할 수 있는 형태로 문장을 바꾸는 문장 다시 쓰기를 제안한다. 문장 다시 쓰기를 위해 쉼표를 포함한 문장에 대해서 다시 쓰기가 필요한 패턴을 구축하였으며 이에 대해 문장 다시 쓰기를 실험하였다. 문장 다시 쓰기를 통해 입력 문장을 변형함으로써 규칙의 추가 없이 구문 분석이 가능하며 제안한 방법은 특수한 형식을 가진 문장 및 쉼표에 의해 연결되는 문장들에 대해 보다 정확한 분석과 번역을 위한 새로운 방법으로서 의의가 있다.

  • PDF

Machine Translation of Korean-to-English spoken language Based on Semantic Patterns (의미패턴에 기반한 대화체 한영 기계 번역)

  • Jung, Cheon-Young;Seo, Young-Hoon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.9
    • /
    • pp.2361-2368
    • /
    • 1998
  • This paper analyzes Korean spoken language and describes the machine translation o[ Korean to-English spoken language based on semantic patterns, In Korean-to-English machine translation. ambiguity of Korean sentence analysis using syntactic information can be resolved by semantic patterns, Therefore, for machine translation of spoken language, we estabilish the system based on semantic patterns extracted from Korean scheduling domain, This system obtains the robustness by skip ability of syllables in analysis of Korean sentence and we add options to semantic patterns in order to reduce pattern numbers, The data used [or the experiment are scheduling domain and performance of Korean-to-English translation is 88%.

  • PDF

A Extraction of Definitional Answer Sentence for a Definitional Question-Answering System (정의형 질의응답시스템을 위한 정의형 정답 문장 추출)

  • Ko, Byeong Il;Kang, Yu Hwan;Shin, Seung Eun;S, Young Hoon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2004.11a
    • /
    • pp.470-475
    • /
    • 2004
  • In this paper, we propose a method to extract a definitional answer sentence for a Definitional Question-Answering System. definitional answer sentence patterns are manually constructed with restriction rules to patterns, and a ranking information of the pattern using its frequency from the corpus. answer sentence pattern consists of the syntactic structure of a definitional answer sentence, and clue words. this system show 83% accuracy for untrained corpus.

  • PDF