• 제목/요약/키워드: 구문구조

검색결과 476건 처리시간 0.024초

집중조명 / 디지털콘텐츠 식별자[DOI]

  • 이재진
    • 디지털콘텐츠
    • /
    • 12호통권91호
    • /
    • pp.26-36
    • /
    • 2000
  • 인터넷이 확산되고 이를 통해 이용가능한 정보자원이 급증함에 따라 접근 및 검색을 용이하게 할 식별체계의 중요성이 강조되고 있다. 디지털콘텐츠식별자(Digital Object Identifier, DOI)는 새로운 식별체계로서 기존의 식별체계가 안고 있는 단점을 극복해 줄 것으로 기대된다. 본 연구는 기존 정보자원 식별체계의 구문구조를 대략적으로 살펴보고 현재 미국 ANSI/NISO 표준 (z39.84-2000)으로 제정된 DOI의 구문구조 표준을 토대로 국내 표준을 제안하기 위한 것이다.

  • PDF

스택-포인터 네트워크와 어절 정보를 이용한 한국어 의존 구문 파서 (Korean Dependency Parser using Stack-Pointer Network and Information of Word Units)

  • 최용석;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.13-18
    • /
    • 2018
  • 구문 분석은 문장의 구조를 이해하며 의미의 중의성을 해결하는 것이다. 일반적으로 한국어는 어순 배열의 자유도가 높고 문장 성분의 생략이 빈번한 특성이 있기 때문에 의존 구문 분석이 주된 연구 대상이 되어 왔다. 스택-포인터 네트워크 모델은 의존 구문 파서에 맞게 포인터 네트워크 모델을 확장한 것이다. 스택-포인터 네트워크는 각 단어에서 의존소를 찾는 하향식 방식의 모델로 기존 모델의 장점을 유지하면서 각 단계에서 파생된 트리 정보도 사용한다. 본 연구에서는 스택-포인터 네트워크 모델을 한국어에 적용해보고 이와 함께 어절 정보를 반영하는 방법을 제안한다. 모델의 실험 결과는 세종 구문 구조를 중심어 후위(head-final)를 엄격히 준수하여 의존 구문 구조로 변환한 것을 기준으로 UAS 92.65%의 정확도를 얻었다.

  • PDF

규칙에 기반한 한국어 부분 구문분석기의 구현 (Implementing Korean Partial Parser based on Rules)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.389-396
    • /
    • 2003
  • 본 논문에서는 문법검사기나 기계번역과 같은 실제 응용 시스템을 위한 한국어 부분 구문분석의 처리 대상을 정의하고, 규칙에 기반한 한국어 부분 구문분석기의 구현에 대해서 논의한다. 부분 구문분석기는 기본적으로 여러 개의 형태소나 단어가 구문적으로 하나의 구조에 속한 경우 이를 하나의 덩어리로 묶어주는 역할을 수행하며, 동시에 부가적인 작업을 수행할 수 있다. 또한 부분 구문분석기는 다양한 형태로 표현된 부분 구조를 표준 형태소 구조로 바꾸어 줌으로써, 상위 모듈의 처리에서 그 결과를 용이하게 사용할 수 있도록 한다. 본 논문에서는 한국어 부분 구문분석을 위해서 수동으로 작성된 140여 개의 규칙을 이용하였으며, 각 규칙은 일반적인 규칙과 마찬가지로 조건부와 행위부로 구성되었다. 부분 구문분석의 효율성을 관찰하기 위해서 일반적인 구문분석과 부분 구문분석을 포함한 구문분석을 비교하였다. 실험을 통해서 전자가 후자에 비해 약 두 배의 레코드 수가 요구됨을 알 수 있었다.

격조사 복원: 구문분석 전처리 (Case Particle Restoration as Preprocessing for Syntactic Analysis)

  • 서형원;권홍석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2012
  • 본 논문은 구문분석의 전처리로서 생략된 한국어 격조사의 복원 방법을 제안한다. 격조사 생략은 체언과 용언 사이의 관계가 아주 밀접하여 생략하여도 의사 전달에 문제가 없을 경우에 자주 발생한다. 이렇게 생략된 조사는 구문분석의 복잡도를 크게 높일 뿐 아니라 구문 분석의 오류의 원인이 되기도 한다. 본 논문에서는 구문구조 부착 말뭉치를 분석하여 생략된 조사는 그 체언과 용언 사이의 거리가 매우 가깝다는 사실을 발견하였고 이 성질을 이용해서 기계학습 방법을 이용해서 생략된 조사를 복원하는 방법을 제안한다. 본 논문에서는 ETRI 구문구조 부착 말뭉치를 이용해서 실험한 결과, 생략된 조사의 81%를 정확하게 복원할 수 있었다.

  • PDF

CRFs를 이용한 의존구조 구문 레이블링 (Labeling Dependency Structures using CRFs)

  • 정석원;최맹식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.137-138
    • /
    • 2013
  • 본 논문에서는 의존구조 분석 결과로부터 구문 레이블을 생성하는 방법을 제안한다. 제안 시스템은 의존 구조 분석 결과의 의존소-지배소 쌍에 대해 자질을 생성하고, 문장 단위로 CRFs를 이용하여 구문 레이블을 부착한다. 실험을 통해 90.8%의 정확도를 보였고, 구문 레이블이 없는 의존구조 시스템의 후처리로 사용 가능하다.

  • PDF

구간분할 기반 한국어 대등접속 구문분석 기법 (A Korean Conjunctive Structure Analysis based on Sentence Segmentation)

  • 장재철;박의규;나동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-146
    • /
    • 2002
  • 본 논문에서는 한국어의 대등접속의 구문분석 문제를 다룬다. 이를 전체 문장의 구문분석 기법에 기반하도록 하여, 문장 전체에 대한 분석 결과를 가장 좋게 하는 대등접속 구조가 선정되도록 하였다. 본 기법의 특징으로는 구간 분할 기법에 기반하여 대등접속 구조 후보의 수의 감소가 가능하게 되기 때문에 구문분석의 안정화를 얻게 되었다. 또한 전체 구문분석기에서 한 부품으로 동작함으로써 전체 문장 구조가 올바른 대등구조를 선택할 수 있게 되어, 보다 전역적인 정보의 이용에 의한 분석이 되었다. 선접속부와 후접속부 간의 구조 및 어휘적 유사성, 평행연결의 이용 등은 본 기법의 또 다른 특징으로 볼 수 있다. 실험결과 정상적인 문장의 대등접속에 대한 분석에서 매우 효과적으로 동작함을 관찰하였다.

  • PDF

XML 문서 편집을 위한 추상문법 (An Abstract Grammar for XML Document Editing)

  • 신경희;최종명;유재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.268-277
    • /
    • 2003
  • 문서내의 태그를 정의하는 문서타입정의(DTD)는 구문구조를 정의하는 XML 문서문법으로 이문법에 따라 작성되는 XML 문서는 파싱처리로 적합성을 확인해야 한다. XML 문서의 적합성을 확인하기 위한 파싱 방법으로서 프로그래밍 언어의 결정적 파싱은 표준에서 언급한 모든 엘리먼트선언에 대한 결정적 내용 모델에 대한 정의를 만족할 수 없다. 이에 본 논문에서는 적합한 XML 문서 처리를 위하여 구문 편집환경에 초점을 맞추고 구문편집에 기본이 되는 DTD의 내부표현과 그에 따른 알고리즘에 대하여 기술한다. 문자열로 표현되는 DTD의 엘리먼트선언과 어트리뷰트선언의 문서 논리구조는 본 논문에서 제시하는 알고리즘에 의해 그래프구조와 데이블구조로 변환되고, 특히 테이블구조의 구문정보는 속성값을 갖는 문맥자유문법형태로 구문지향적 편집기에 이용되는 문법이 된다. 이 문법을 XML 추상문법이라고 하고 문법생성결과 및 구문편집 예를 보인다.

중심어 간의 공기정보를 이용한 한국어 확률 구문분석 모델 (Korean Probabilistic Syntactic Model using Head Co-occurrence)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.809-816
    • /
    • 2002
  • 구문 분석에서 가장 큰 문제점 중 하나는 구문 구조의 중의성을 어떻게 해결하느냐에 달려있다. 확률 구문 규칙은 구문 구조의 중의성 해결에 한 방법이 될 수 있다. 본 논문에서는 중심어 간의 공기정보를 이용하여 한국어 구문 구조의 중의성을 해결하는 확률 모델을 제안하고자 한다. 중심어는 어휘를 이용하기 때문에 자료 부족 문제를 야기시킬 수 있다. 이 때문에 자료부족 문제를 어떻게 해결하느냐에 따라 어휘 정보 사용의 성공이 결정될 수 있다. 본 논문에서는 구문규칙을 단순화하고 Back-off 방법을 이용해서 이 문제를 완화한다. 제안된 모델은 실험 데이터에 대해 약 84%의 정확도를 보였다.

부사 정보를 이용한 한국어 구조 중의성 해소 (Korean Structural Disambiguation using Adverb Information)

  • 신승은;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.110-115
    • /
    • 2000
  • 자연 언어 처리의 구문 분석에서는 중의성 있는 결과가 많이 생성된다. 이러한 중의성을 해소하는데 어휘정보가 유용하다는 것은 잘 알려져 있으며, 이러한 어휘정보와 이를 이용한 중의성 해소에 관한 연구가 많이 이루어지고 있다. 본 논문은 한국어의 구문 구조 분석 시 부사에 의해 발생되는 중의성을 해소하기 위해 수식어 사전을 이용하여 구문 분석에서의 구조 중의성을 해소하였다. 수식어 사전의 어휘정보와 대상 말뭉치를 통해 각각의 부사에 대한 문법을 구성하고, 이를 이용하여 한국어 구문구조 분석에서 부사에 의해 발생되는 중의성을 줄일 수 있다.

  • PDF

입력 문장 특성을 이용한 의존 구조 분석기 통합 (Integrating two dependency parsers : picking the better one)

  • 이지민;정상근;이청재;이진식;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.202-206
    • /
    • 2009
  • 의존 구조 분석의 중요성이 커지면서 의존 구문 분석에 대한 연구가 활발해 지고 있다. 이와 함께 기존의 의존 구조 분석기를 통합하려는 연구도 다양하게 시도되고 있다. 본 논문에서는 여러 개의 구문 분석 결과들로부터 새로운 구문 분석 결과를 만들어 내는 기존 연구들과는 다르게, 입력문장의 특성을 사용해서 사용할 의존 구조 분석기를 미리 선택하는 새로운 의존 구조 분석기 통합 방법을 제안한다. 본 논문에서는 기계학습과 규칙을 함께 사용하는 하이브리드 형태로 의존 구조 분석기를 선택하는 방법을 설명하고, 이 방법을 두 쌍의 의존 구조 분석기 통합에 적용하고 성능 향상이 있었음을 보인다.

  • PDF