• 제목/요약/키워드: 구문적 단서

검색결과 7건 처리시간 0.02초

구문관계에 기반한 단서의 결정 리스트를 이용한 지도학습 어의 애매성 해결 방법 (A Method of Supervised Word Sense Disambiguation Using Decision Lists Based on Syntactic Clues)

  • 김권양
    • 한국지능시스템학회논문지
    • /
    • 제13권2호
    • /
    • pp.125-130
    • /
    • 2003
  • 본 논문은 구문관계에 기반한 단서의 결정 리스트를 이용한 지도학습 어의 애매성 해결 방법을 제시한다. 이 방법은 주어진 단어의 어의 애매성을 해결하기 위해 애매한 의미를 가지는 단어와 문맥 내 주변 단어들 사이의. 구문적 관계에 비중을 두며, 모든 단서들을 통합하는 대신에 주어진 문맥 내에서 애매성 해결에 최상이 되는 단일 증거를 규명하고 이용함으로써 올바른 의미를 결정한다. 10개의 한국어 동사에 대한 실험 결과 주변 문맥 단어 외에 구문적인 단서를 추가한 방법이 정확도 성능에 있어서 기준 정확도보다 33% 향상됨을 보였으며, 결정 리스트를 사용한 방법이 모든 애매성 해결에 대한 단서들을 통합하는 방법보다 3%의 정확도 성능 개선을 보였다.

구문해석을 이용한 색인어 자동 주출 시스템

  • 한성현;박혁로;최기선;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.16-23
    • /
    • 1990
  • 본 논문에서는 자동 색인 시스템 구현에 있어서 형태소 해석뿐만 아니라 구문해석을 응용하면 통계적 방법이나, 간단한 단서에 의한 색인어 추출보다 훨씬 나은 색인어 추출이 가능하다는 것을 보이고 한국어 필수적이 색인어로써 충분한 자질이 있다는 제안을 한다. 또 시스템의 전체적인 흐름과 필수격 처리 과정, 예외적인 자유격의 처리 등에 대한 부분을 설명하고, 결론에서는 사람이 추출한 색인어와 본 시스템의 결과를 비교, 분석한다.

  • PDF

구문 트리 가지치기 및 소멸 인자 조정을 통한 트리 커널 기반 단백질 간 상호작용 추출 성능 향상 (Performance Enhancement of Tree Kernel-based Protein-Protein Interaction Extraction by Parse Tree Pruning and Decay Factor Adjustment)

  • 최성필;최윤수;정창후;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.85-94
    • /
    • 2010
  • 본 논문에서는 기존의 연구에서 시도되었던 것과는 달리, 복잡하고 추출하기가 어려운 다양한 형태의 자질 및 단서 정보가 필요 없는 합성곱 구문 트리 커널 기반의 단백질 간 상호작용 추출 기법을 소개한다. 이 기법의 특징은 단백질 이름 쌍을 포함한 상호작용 포함 후보 문장에 대한 구문 트리만을 이용하여 추출을 시도한다는 것이며 부가적인 자질이나 커널 함수가 불필요하다는 장점이 있다. 이를 기반으로 본 논문의 연구 성과는 다음과 같다. 첫째, 단백질 간 상호작용 추출에 있어서 구문 트리 커널을 적용할 경우 불필요한 문맥 정보를 효과적으로 제거하는 구문 트리 가지치기 작업이 필수적임을 기존 연구 결과와의 성능 비교로써 증명한다. 둘째, 동일한 학습 조건에서 구문 트리 커널의 소멸 인자(decay factor)는 평활 인자(smoothing factor)로서 중요한 역할을 하며, 성능 변화의 핵심 요소임을 보인다. 특히 학습 집합의 규모에 따라서 소멸인자가 성능에 미치는 영향력이 상이한 패턴으로 나타남을 제시하였다. 결론적으로 기존의 최신 연구결과로서 주장한 "단일 커널보다 혼합 커널의 성능이 더 뛰어나다"라는 가설이 항상 성립하는 것은 아니라는 것을 합성곱 구문 트리 커널 단독으로 적용하여 높은 성능을 나타냄으로써 보여주었다. 동일한 조건으로 수행한 실험에서 기존의 두 연구 결과에 비해 19.8%, 14%의 성능 개선을 나타내었다.

인과관계 문맥정보를 사용한 용어 군집화 연구 (Term Clustering based on Causal Context Information)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

술어기반 문형정보를 이용한 자동요약시스템에 관한 연구 (A Study on an Automatic Summarization System Using Verb-Based Sentence Patterns)

  • 최인숙;정영미
    • 정보관리학회지
    • /
    • 제18권4호
    • /
    • pp.37-55
    • /
    • 2001
  • 본 연구에서는 특정 주제분야의 텍스트를 대표할 수 있는 단어술어를 추출하고 기본문형을 형성 한 후 각 단서술어의 기본문형을 실례화하여 연결함으로써 요약문을 작성하는 자동요약시스템의 모형을 설계하고 구현하였다. 시스템은 학습과정과 요약과정을 구분되며, 학습과정에서는 술어와 격조사를 출현빈도를 이용하여 주제분야 텍스트집단을 대표하는 단어술어와 필수격 조사를 추출한 뒤 단어술어가 이루는 문장의 기본문형을 형성한다. 요약과정에서 실례화 규직을 요약 대상 문장의 구문 분석 결과에 적용하여 기본문형의 격조사와 결합될 논항을 찾아 단문을 생성하고 연결하여 요약문을 완성한다. ‘화재’및‘강도’와 관련된 신문기사를 대상으로 실험을 수행하였으며, 작성된 요약문은 단어술어가 포함된 주요 문장에서 추출한 필수 정보항목과 술어를 중심으로 생성된 문장들로서 문장간의 연결이 자연스러울 뿐 아니라 텍스트의 전체적인 의미를 표현할 수 있었다. 또한, 통계적 기법을 이용한 학습을 통해 주제영역의 확장이 가능하였다.

  • PDF

센터링 이론과 대화체에서의 논항 생략 현상 (Centering Theory and Argument Deletion in Spoken Korean)

  • 홍민표
    • 인지과학
    • /
    • 제11권1호
    • /
    • pp.9-24
    • /
    • 2000
  • 본고는 한국어 대화체에서 자주 관찰되는 논항 명사구의 생략현상에 대한 분석을 제시한다. 약 한 시간 분량의 라디오 대담 프로그램을 녹취, 전사하여 획득한 자료를 중심으로, 한국어 대화체에서 논항 명사구의 생략 빈도 및 그 생략 논항의 선행사를 지시대상의 유형을 분류한 통계를 제시한다. 나아가 센터링 이론을 적용하여 이들 생략 논항의 선행사를 결정하는 노력에 있어 청/화자와 일반인을 지칭하는 영형 대명사를 센터링 이론의 적용대상에서 제외시킬 것을 제안하고, 이렇게 제외된 청/화자 지칭 영형 대명사가 보이는 언어적 단서를 추적하여 제시한다. 또한 센터의 순위 및 전이 유형을 결정하는 과정에서 반드시 고려해야할 한국어의 특성에 대해 주제와 주어의 차이. 구문분석의 영향, 그리고 세상지식과의 충돌 등을 중심으로 지적한다.

  • PDF

맹사성 <강호사시가>의 짜임새 (A Study on the )

  • 양희찬
    • 한국시조학회지:시조학논총
    • /
    • 제21집
    • /
    • pp.143-164
    • /
    • 2004
  • 이 논문은 <강호사시가>가 한 주제를 형상화하는 데 네 계절의 특징을 담고 있는 서로 다른 글감들을 사용하였지만, 내용의 일관된 통일성을 유지한 연시조이며, 이 통일성 유지는 하나의 일정한 틀을 사용한 데 근거하였음을 해명하려고 한 것이다. 그 일정한 틀은 겉틀과 속틀로 나누었다. 겉틀은 네 작품에 공통된 표현 부분이다. 그 내용은 '화자의 거처(강호)'-'화자(이 몸)'$\cdot$'화자와 임금의 관계(군은)' 및 '강호의 상태(강호에 (가)이 드니)', '화자의 상태(이 몸이 (라)히옴)'를 제시한 것이다. 그리고 초장의 '강호에 (가)이 드니'를 구문의 생성 조건의 측면에서 분석하여 표현의 압축과 간결함을 지적하고, 종장의 '역군은이샷다'를 구문의 생성 의도의 측면에서 분석하여 화자 개인 차원의 삶에 대한 만족을 표출한 것임을 설명하고, 이 삶의 만족을 사회적 차원의 태평성대로 확장할 수 있는지에 대하여 문제제기를 하였다. 속틀은 작품 내용의 세부 짜임이다. 이에 대해서는 네 작품을 초$\cdot$$\cdot$종장 각각으로 묶어 분석한 다음, 네 작품의 공유된 짜임을 설명하고, 각각의 내용 분석을 통하여 곁틀에서 다룬 <강호사시가>의 내용이 갖는 특성을 해명하였다. 네 작품의 초$\cdot$$\cdot$종장을 각각 하나로 묶어 종합 분석하기 위하여 지표기능과 제시기능을 설정하여 그 내용의 짜임을 설명하였다. 초장은 공통으로 네 계절의 흥취를 표현한 것이며, 중장은 지표기능 어휘인 '화자'가 생략되어 제시기능 구절만으로 이루어졌으며, 초장의 흥취를 행위나 상태로 구체적으로 제시하였다. 종장은 중장과 연결하여 함축적 표현이며,사적인 삶과 공적인 가치관(군신유의)의 관계에서 공적인 가치관으로 사적인 삶을 보장받으려는 의도를 내포한 것이다. 이를 종합하면, <강호사시가>의 속틀의 짜임은 '계절의 제시'$\to$'계절에 대한 발흥'$\to$'계절의 즐김 행위'$\to$'(심적$\cdot$신체적) 평안'으로 전개된다. 문맥의 흐름에서 초장은 중장의 단서가 되며, 중장은 초장에 대한 반응이며, 종장은 중장의 응축으로서 평가라는 성격을 가지고 있다. 그리고 속틀의 짜임에 '감군은'이 포함되면 곁틀의 짜임을 확인할 수 있다. 끝으로, 작자가 작품의 본지를 개인의 평안에 둔 것처럼 꾸몄으나, 본래의 발상은 임금의 치적(태평성대)을 송축하려는 것이라고 결론하였다.

  • PDF