• 제목/요약/키워드: as구문

검색결과 425건 처리시간 0.024초

추상구문트리를 이용한 구문지향 XML 문서 편집기 (A Syntax-Directed XML Document Editor using Abstract Syntax Tree)

  • 김영철;유두규
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.117-126
    • /
    • 2005
  • 기존의 XML 문서 편집기는 일반 텍스트 위주의 편집을 하고 내부적으로 구문적 검사를 하지 않는다. 따라서 작성된 XML 문서가 잘 설계(well-formed) 되었는지 유효(valid) 문서인지를 검사하지 못한다. 본 논문에서는 XML 문서를 편집하는데 있어서 구문에 맞도록 설계할 수 있는 구문지향 편집기를 설계하고 구현한다. 또한 트리 기반의 편집기로 구현되어 있기 때문에 향후에 XML 문서 확장이 용이하며, 다른 시스템과는 달리 실시간으로 유효성을 검증할 수 있도록 설계되었다. 본 시스템은 향후에 XML 관련 어플리케이션 개발에 많은 영향을 줄 것으로 기대된다.

  • PDF

구문트리 비고를 통한 프로그램 유형 복제 검사 (A Program-Plagiarism Checker using Abstract Syntax Tree)

  • 김영철;김성근;염세훈;최종명;유재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.792-802
    • /
    • 2003
  • 기존의 프로그램 유형 복제 검사 시스템들은 단순한 텍스트 기반의 프로그램 복제 검사나, 속성 및 토큰 스트링을 이용하여 복제 검사를 수행한다. 이 시스템들은 들여쓰기, 여백, 설명문과 같은 프로그램의 구문과 상관없는 프로그램 스타일에 어려움을 갖고 있다. 본 연구에서는 서로 다른 두 프로그램의 구문트리를 이용하여 복제 검사를 수행하는 모델을 제시한다. 구문트리를 이용한 프로그램 유형 복제 검사는 프로그램 스타일에 취약한 기존의 복제 검사 시스템의 단점을 극복할 수 있으며, 구문분석과 의미분석을 통해 프로그램의 구조적인 검사까지 수행할 수 있다는 장점을 가지고 있다. 또한 본 시스템은 인터넷이나 사이버 교육 체제에서 대량의 C/C+. 언어의 프로그램 복제 검사를 수행하기 위하여 AST 생성, 역파서 및 유사도 검사 알고리즘을 제시하며, 프로그램 복제 유형에 대해서 평가한다.

구조적 중의성 해결을 위한 명사 수식 부사 연구 (An Analysis of Noun-modifying Adverbs for Structural Disambiguation)

  • 황선영;이공주
    • 인지과학
    • /
    • 제13권4호
    • /
    • pp.43-53
    • /
    • 2002
  • 명사 수식 부사는 서술어를 수식하는 다른 부사들과 달리, 명사를 수식하는 기능을 수행하는 부사이다. 이들 부사들은 부사의 전형적인 기능과 다른 기능을 보이기 때문에 구문 분석시 많은 오류를 일으킨다. 이 연구에서는 명사 수식 부사를 포함한 구문이 보이는 분석의 오류를 해결하기 위하여 명사 수식 부사를 분류하고 명사 수식 부사들의 사용 양태를 살펴서 구문 분석시의 처리 방안을 수립하였다. 또한 이러한 작업이 실제로 분석의 정확도를 높이는 데 기여할 수 있음을 증명하기 위해 명사 수식 부사 처리기를 구현하여 구문 분석기의 성능 향상을 실험하였다. 제안된 방법에 의해서 구문 분석의 정확도는 81.9%에서 83.6% 정도로 향상되었다.

  • PDF

지배가능 경로 문맥을 이용한 의존 구문 분석의 수식 거리 모델 (Modification Distance Model using Headible Path Contexts for Korean Dependency Parsing)

  • 우연문;송영인;박소영;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.140-149
    • /
    • 2007
  • 본 논문에서는 한국어 의존 구문 분석을 위한 새로운 확률 모델을 제안한다. 한국어가 자유 어순 언어라 할지라도 지역적 어순은 존재하기 때문에 의존관계를 결정하기 위해 의존하는 두 어절인 의존소와 지배소 사이의 수식 거리가 유용하다는 것은 이미 많은 연구를 통해 밝혀졌다. 본 연구에서는 수식거리의 정확한 수식 거리의 추정을 위해 지배가능 경로 문맥을 이용한 수식 거리 확률 모델을 제안한다. 수식 거리를 위해 지배가능 경로를 고려함으로써, 긴 표층 문맥을 압축하는 효과를 가져다 준다. 이를 통해 구문 분석 정확률 향상과 원거리 의존 관계 향상을 보임을 설명한다. 실험 및 평가를 통해 제안하는 모델의 구문 분석 성능은 86.9%이며, 기존에 제안된 구문 분석 모델과 비교하여 높은 구문 분석 결과를 보이며, 특히 원거리 의존관계에 대하여 더욱 향상된 성능을 보인다.

내포문의 단문 분할을 이용한 한국어 구문 분석 (Korean Syntactic Analysis by Using Clausal Segmentation of Embedded Clause)

  • 이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.50-58
    • /
    • 2008
  • 한국어 문장은 대부분 주절과 내포문을 가지는 복문으로 구성되어 있다. 따라서 복문에 나타나는 하나 이상의 용언으로 인해 구문 분석 과정에서 다양한 구문 애매성이 발생한다. 이들 중 대부분은 내포문의 수식 범위로부터 발생되는 구 부착의 문제 때문이다. 이런 구문 애매성은 내포문의 범위를 정해서 하나의 구문 범주의 기능을 가지도록 하면 해결할 수가 있다. 본 논문에서는 내포문의 범위를 정하기 위해서 문형과 한국어의 구문 특성을 이용한다. 먼저, 내포문에 있는 용언의 문형 정보가 가질 수 있는 필수격을 최대로 부착하여 내포문의 범위를 정하고 이를 이용해서 복문을 내포문과 주절로 분할한다. 그리고 한국어의 구문 특성을 이용해서 분할된 내포문의 기능을 하나의 구문 범주인 체언구나 부사구로 변환한다. 이렇게 함으로써 복합문의 구성 형태가 단문 구조로 변환되기 때문에 내포문의 범위에 의한 구 부착의 문제가 쉽게 해결된다. 이것을 본 논문에서는 내포문의 단문 분할이라고 한다. 본 논문에서 제안한 방법으로 1000 문장을 실험한 결과 문형과 단문 분할을 이용하지 않은 방법보다 구문 애매성이 88.32% 감소되었다.

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색 (Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion)

  • 윤성희;장혜진
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.235-248
    • /
    • 2004
  • 웹 문서 정색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

Stacked Bidirectional LSTM-CRFs를 이용한 한국어 의미역 결정 (Korean Semantic Role Labeling using Stacked Bidirectional LSTM-CRFs)

  • 배장성;이창기
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.36-43
    • /
    • 2017
  • 의미역 결정 연구에 있어 구문 분석 정보는 술어-논항 사이의 의존 관계를 포함하고 있기 때문에 의미역 결정 성능 향상에 큰 도움이 된다. 그러나 의미역 결정 이전에 구문 분석을 수행해야 하는 비용(overhead)이 발생하게 되고, 구문 분석 단계에서 발생하는 오류를 그대로 답습하는 단점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 구문 분석 정보를 제외한 형태소 분석 정보만을 사용하는 End-to-end SRL 방식의 한국어 의미역 결정 시스템을 제안하고, 순차 데이터 모델링에 적합한 LSTM RNN을 확장한 Stacked Bidirectional LSTM-CRFs 모델을 적용해 구문 분석 정보 없이 기존 연구보다 더 높은 성능을 얻을 수 있음을 보인다.

구조적 중의성 해결을 위한 명사 수식 부사 연구 (An Analysis of Noun-modifying Adverbs for Structural Disambiguation)

  • 황선영;이공주
    • 인지과학
    • /
    • 제13권4호
    • /
    • pp.42-42
    • /
    • 2002
  • 명사 수식 부사는 서술어를 수식하는 다른 부사들과 달리, 명사를 수식하는 기능을 수행하는 부사이다. 이들 부사들은 부사의 전형적인 기능과 다른 기능을 보이기 때문에 구문 분석시 많은 오류를 일으킨다. 이 연구에서는 명사 수식 부사를 포함한 구문이 보이는 분석의 오류를 해결하기 위하여 명사 수식 부사를 분류하고 명사 수식 부사들의 사용 양태를 살펴서 구문 분석시의 처리 방안을 수립하였다. 또한 이러한 작업이 실제로 분석의 정확도를 높이는 데 기여할 수 있음을 증명하기 위해 명사 수식 부사 처리기를 구현하여 구문 분석기의 성능 향상을 실험하였다. 제안된 방법에 의해서 구문 분석의 정확도는 81.9%에서 83.6% 정도로 향상되었다.

프로그램 유사도 평가 알고리즘 (A Program Similarity Evaluation Algorithm)

  • 김영철;황석찬;최재영
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.51-64
    • /
    • 2005
  • 본 논문에서는 서로 다른 두 개의 C 프로그램의 구문트리를 이용하여 유사도를 평가하는 시스템을 제시한다. 구문 트리를 이용하는 방법은 기존의 유사도 평가 방법과는 달리 들여쓰기, 여백, 설명문 등 프로그램과 무관한 프로그램 스타일의 변화에 민감하지 않으며, 문장, 코드 블록, 함수 등의 순서 바꾸기 같은 제어 구조의 변경에 민감하지 않은 특징을 가지고 있다. 그리고 프로그램을 파싱함으로써 구문 오류도 함께 검사찬 수 있는 장점을 제공한다. 논문에서는 유사도를 평가하기 위한 알고리즘과 함께 프로그램의 비교횟수를 줄이기 위한 그룹 짓기 알고리즘도 같이 제공한다. 실험부분에서는 구문트리 비교방법을 이용한 프로그램의 유사도 평가 결과와, 그룹 짓기를 수행한 후에 많은 비교 횟수를 줄일 수 있다는 것을 보여준다.

  • PDF

'For/From V-ing' 사역구문의 전치사 for/from 교체현상 연구 (For/from Alternations in Causative 'FOR/FROM V-ing' Constructions)

  • 김미자
    • 비교문화연구
    • /
    • 제49권
    • /
    • pp.1-32
    • /
    • 2017
  • 본 논문은 보어로 사용된 사격 구문의 구조 및 의미적 특징을 논의하고, 비정형 V-ing 보어절 구문에 사용된 전치사 for와 from의 교체현상에서 드러난 문법적 특징을 고찰한다. 본 논문에서는 경험적 자료에 근거해 이 구문에서 사용되는 주절 동사를 기준으로 세 가지 유형의 통사적 패턴이 있다는 것을 제시하고, 이와 동시에 이 세 가지 통사 유형이 의미와 긴밀하게 연결되어 있다는 사실을 제시한다. 이런 유형분류는 수동태와 동사적 상에서 그 근거를 제시한다. 또한 비정형 V-ing절을 이끄는 전치사 for와 from의 기능을 고려해 본다면, 전치사로 취급하는 것이 타당하다는 견해를 제시한다.