• 제목/요약/키워드: 구문 분석

검색결과 831건 처리시간 0.027초

주관식 문제 채점에서의 구문의미트리 비교 시스템에 대한 연구 (Research on Comparing System with Syntactic-Semantic Tree in Subjective-type Grading)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제20권5호
    • /
    • pp.79-88
    • /
    • 2017
  • 질높은 주관식 문제 채점을 위해서는 답변 속에 들어있는 단어간의 구문의미적 관계를 분석하는 구문 의미 분석이 필요하다. 그러나 구문의미 분석의 결과인 구문의미트리는 단어간의 구조적 의미 관계를 내포하고 있어 단어의 나열인 일차원적인 벡터의 유사도 계산을 적용할 수가 없다. 본 연구는 단어의 지식과 함께 단어와 단어간의 구조적 의미 관계를 내포하는 구문의미트리를 비교하는 비교 시스템에 대한 연구를 한다. 본 연구에서는 구문의미트리 비교를 위해 유사성 계산 원칙을 제안하고 실험을 통해 검증하였다. 본 구문의미트리 비교 시스템은 구문의미분석의 결과를 비교할 수 있게 하여 주관식 문제 채점에 도움을 줄 것이고 문서 유사도 영역에도 활용할 수 있을 것이다.

한국어의 주격 중출 구문 (The Construction of Multiful Nominatives in Korean)

  • 이운영;이정민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.319-324
    • /
    • 1995
  • 한국어에는 주격 표지를 가진 명사가 두 번 이상 나타나는 구문이 자주 나타난다. 이러한 구문을 주격 중출 구문이라고 한다. 주격 중출 구문은 크게 부분-전체 구문, 양화사 유동 구문, 그리고 심리 술어 구문으로 나누어진다. 본고에서는 부분-전체 구문과 양화사 유동 구문은 함수-논항 관계를 이용하여 분석하고, 심리 술어 구문은 의미역할과 자리 이동으로 설명한다. 이러한 것은 의미적 측면과 통사적 측면을 함께 고려한 것으로 좀 더 일관성 있는 설명을 위한 접근이라 하겠다.

  • PDF

문장성분의 다양한 자질을 이용한 한국어 구문분석 모델 (Korean Parsing Model using Various Features of a Syntactic Object)

  • 박소영;김수홍;임해창
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.743-748
    • /
    • 2004
  • 본 논문에서는 효과적인 구문 중의성 해결을 위해 문장성분의 구문자질, 기능자질, 내용자질, 크기자질을 활용하는 확률적 한국어 구문분석 모델을 제안한다. 그리고, 제안하는 구문분석 모델은 한국어의 부분자유어순과 생략현상을 잘 처리할 수 있도록 문법규칙을 이진형식으로 제한한다. 실험을 통해 제안하는 구문분석 모델의 성능을 각 자질조합별로 분석한다. 분석결과는 서로 다른 특징을 갖는 자질의 조합이 서로 유사한 특징을 갖는 자질의 조합보다 구문중의성 해결에 더 유용하다는 것을 보여준다. 또한, 단일자질인 기능자질이 내용자질과 크기자질의 조합보다 성능이 더 우수함을 알 수 있다.

다단계 구단위화를 이용한 고속 한국어 의존구조 분석 (High Speed Korean Dependency Analysis Using Cascaded Chunking)

  • 오진영;차정원
    • 한국시뮬레이션학회논문지
    • /
    • 제19권1호
    • /
    • pp.103-111
    • /
    • 2010
  • 한국어 처리에서 구문분석기에 대한 요구는 많은 반면 성능의 한계와 강건함의 부족으로 인해 채택되지 못하는 것이 현실이다. 본 연구는 구문분석을 레이블링 문제로 전환하여 성능, 속도, 강건함을 모두 실현한 시스템에 대해서 설명한다. 우리는 다단계 구 단위화(Cascaded Chunking)를 통해 한국어 구문분석을 시도한다. 각 단계에서는 어절별 품사 태그와 어절 구문표지를 자질로 사용하고 CRFs(Conditional Random Fields)를 이용하여 최적의 결과를 얻는다. 58,175문장 세종 구문 코퍼스로 10-fold Cross Validation(평균 10.97어절)으로 실험한 결과 평균 86.01%의 구문 정확도를 보였다. 이 결과는 기존에 제안되었던 구문분석기와 대등하거나 우수한 성능이며 기존 구문분석기가 처리하지 못하는 장문도 처리 가능하다.

구문 그래프를 이용한 구문적 애매성 분석 (Analysis of Structural Ambiguities Using Syntactic Graph)

  • 김재훈;서정연;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.159-167
    • /
    • 1992
  • 한국어는 그 자체의 특성 때문에 영어와는 또 다른 형태의 구문적인 애매성을 포함하고 있다. 이와 같은 구문의 애매성을 해결하기 위해서는 여러 가지의 정보가 필요할 것이다. 예를 들면, 품사정보의 세분류, 명사들의 의미 속성정보들이 그것이다. 본 논문은 한국어 문장의 구문적인 애매성을 해결하기에 앞서 먼저 한국어 문장에 어떤 형태의 애매성이 포함되어 있는 지를 조사.분석한 것이다. 본 논문에서는 구문적인 애매성을 효율적으로 분석하기 위한 수단으로 구문 그래프를 이용하였다. 한국어 문장에는 다품사에 의한 애매성, 조사구 부착에 관한 애매성, 복합 체언구에 관한 애매성, 부사구 부착에 관한 애매성, 관형어의 수식 범위에 관한 애매성이 있다. 이들 중에서 복합 체언구에 의한 애매성이 가장 많은 애매성을 가지고 있었다. 즉, 실험 대상문장에서 발생가능한 전체의 애매성의 62%가 복합체언구에 관한 것이다. 따라서 한국어에서는 복합체언구에 관한 구문 구조적인 애매성 해소가 가장 우선적으로 해결해야 할 과제이다.

  • PDF

파싱을 위한 선택 : 구문 형태소의 이용 (Another Choice for Parsing : Using Syntactic Morpheme)

  • 황이규;송연정;이현영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.249-254
    • /
    • 1999
  • 자연어 분석에서 발생하는 가장 큰 문제점은 분석의 각 단계에서 필요 이상의 모호성이 발생하는 것이다. 이러한 모호성은 각각의 분석 단계에서는 반드시 필요한 결과일 수 있지만 다음 단계의 관점에서는 불필요하게 과생성된 자료로 볼 수 있다. 특히 한국어 형태소 분석 단계는 주어진 문장에 대해 최소의 의미를 가지는 형태소로 분석하기 때문에 과생성된 결과를 많이 만들어 내는데, 이들 대부분이 보조용언이나 의존 명사를 포함하는 형태소열에서 발생한다. 품사 태깅된 코퍼스에서 높은 빈도를 나타내는 형태소들을 분석해 보면 주위의 형태소와 강한 결합 관계를 가지는 것을 발견할 수 있다. 이러한 형태소는 대부분 자립성이 없는 기능형태소로서, 개개의 형태소가 가지는 의미의 합으로 표현되기보다는 문장내에서 하나의 구문 단위로 표현될 수 있다. 본 논문에서는 이 형태소 열을 구문 형태소로 정의하고, 필요한 경우 일반 형태소 해석의 결과를 구문 형태소 단위로 결합하고 이를 바탕으로 구문 해석을 하는 방법을 제안한다. 구문 형태소 단위를 이용하여 구문해석을 수행함으로써, 형태소 해석 결과의 축소를 통해 불필요한 구문 해석 곁과를 배제할 수 있다.

  • PDF

대등접속구문과 미지격 명사구의 문법기능 결정 (Grammatical Role Determination of Unknown Cases in Korean Coordinate Structures)

  • 이용훈;김미영;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.543-545
    • /
    • 2003
  • 한국어의 정확한 구문분석물 위해서는, 격조사가 존재하지 않고, 보조사와 함께 쓰이거나 영사만으로 구성된 미지격 명사구들의 정확한 문법기능을 파악하는 것이 중요하다. 또한 긴 문장의 효과적인 구문분석을 위해 대등접속구문을 파악하는 것 또한 중요한 과제이다. 본 논문에서는 위의 두 과제를 동시에 해결하는 방법을 제안하고자 한다. 즉, 한국어의 긴 문장의 대등접속구문을 파악하는 과정에서 미지격 명사구의 문법기능을 결정하고 이 문법기능정보를 이용하여 동시에 대등접속구문의 구간도 결정할 수 있는 방법을 제안한다.

  • PDF

구문 분석을 위한 한국어 말덩이 정의 (Defining Chunks for Parsing in Korean)

  • 남궁영;김창현;천민아;박호민;윤호;최민석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.409-412
    • /
    • 2018
  • 한국어는 문장 구성 요소들 간의 이동 및 생략이 자유롭다는 언어적 특성 때문에 구문 분석을 할 때 중의성이 증가한다. 뿐만 아니라 형태소 분석 단계에서 고도로 세분화된 분석 결과로 인해 한국어 구문 분석에 어려움을 더하고 있다. 이러한 문제점을 완화하기 위한 한 방안으로 형태소 분석과 구문 분석의 중간 단계에서 같은 역할을 수행하는 형태소들을 묶어 하나의 의미를 가진 부분적인 구문 요소(말덩이)를 형성하는 방법이 있다. 본 논문에서는 이러한 말덩이들에 대해 구체적인 정의를 내리고 그 단위 및 표지를 제시하여 향후 부분 구문 분석의 연구 및 수행에 활용될 수 있는 기준을 제시한다.

  • PDF

최대신장트리를 이용한 한국어 의존구문분석 (Korean Depenency Parsing using a Maximum Spanning Tree)

  • 박영민;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.68-72
    • /
    • 2010
  • 본 논문에서는 그래프 기반의 최대신장트리(Maximum Spanning Tree)를 이용한 한국어 의존구문분석 방법을 제안한다. 우리는 최대신장트리 알고리즘을 한국어의 특성인 지배성분 후위의 원칙과 투사성의 원칙을 적용하여 한국어 의존구문분석에 적합한 알고리즘을 만들었다. 제안한 알고리즘은 기존의 한국어 의존구문분석의 방법들보다 낮은 시간복잡도를 가지며 대용량 말뭉치를 학습하기 위해 증분학습이 가능하고 비교적 학습속도가 빠른 Averaged Perceptron 알고리즘을 사용하였다. 실험결과 제안한 방법은 비교적 열악한 환경인 복문이 포함된 장문의 문장에서도 뛰어난 성능을 보여주었다,

  • PDF

최장일치를 이용한 구문 분석용 형태소 분석기 (Morphological Analyzer using Longest Match Method for Syntactic Analysis)

  • 송연정;이근용;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.157-166
    • /
    • 1999
  • 형태소 분석 단계는 자연어 처리 과정의 첫 번째 단계로써 주어진 입력 어절들에 대한 형태소들의 조합을 추출하는 일을 한다. 형태소 분석 시스템의 기본적인 기능은 매우 중요하여 적용되는 형태소 분석 알고리즘에 따라 형태소 분석 시스템의 성능에 영향을 미친다. 그러나 형태소 분석 시스템, 구문 분석 시스템 및 의미 분석 시스템이 연계되어 하나의 자연어 처리 시스템이 구축되는 관점에서는 구문분석 시스템의 부담을 줄여 전체 시스템의 효율을 향상시키기 위하여 구문 분석 시스템의 입력에 적합한 형태소 분석 결과를 생성해주는 일 또한 형태소 분석 시스템의 중요한 역할이라 할 수 있다. 본 시스템은 최장일치법을 이용한 형태소 분석 방법으로 입력 어절에 대한 형태소 분석을 수행하는 동안 분석 후보의 개수를 줄이고 사전 탐색 시간을 줄여준다. 또한 구문분석 시스템의 입력에 적절한 형태소 분석 결과를 생성하여 전체 응용 시스템의 효율성을 향상시킨다.

  • PDF