• 제목/요약/키워드: 명사화

검색결과 113건 처리시간 0.022초

문형 정보를 이용한 규칙 기반 한국어 의존구문분석 (Rules-based Korean Dependency Parsing using Sentence Pattern Informations.)

  • 김성태;김민호;김현아;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-143
    • /
    • 2019
  • 본 논문에서 제안하는 구문분석기는 품사 태거를 사용하지 않고 문장에서 나오는 모든 형태소 분석 후보에 의존관계를 부여하는 광범위 의존구문분석기이다. 중의성이 발생할 수 있는 문장에 대해 나오는 모든 후보 구문분석 트리를 출력하며 규칙을 통해 순위화를 진행한다. 또한 문형 정보 말뭉치의 적절한 사용을 위해 이전 연구의 한계점을 극복한 규칙과 알고리즘을 구현하고 문형 정보를 통해 후보 구문분석 트리의 순위화를 강화하였다. 뿐만 아니라 순위화가 어려운 [명사-관형사구] 자질에 대해 문형 정보를 사용하여 순위화를 강화하였다. 그 결과, 1순위의 구문 분석 트리에 대한 UAS(Unlabeled Attachment Score)가 0.52% 향상되었고, 후보트리에 대한 평균 정답 순위는 12.2%의 성능향상을 보였다.

  • PDF

학술적 글쓰기에서의 객관화 전략 사용 양상 연구 - 한국어 학습자와 한국어 모어 화자 간의 비교를 중심으로 - (Study on the Use of Objectification Strategy in Academic Writing)

  • 김한샘;배미연
    • 비교문화연구
    • /
    • 제49권
    • /
    • pp.95-126
    • /
    • 2017
  • 이 논문은 학습자의 학술적 텍스트와 모어 화자의 학술 텍스트를 비교해 구체적으로 학습자들의 객관화 전략의 사용 양상을 살펴보는 것을 목적으로 한다. 객관화 전략은 학문적 탐구의 결과를 보편성과 타당성을 갖추어 과학적으로 기술하기 위해 적용하는 담화 기제로서의 객관성을 갖추기 위해 필자가 사용하는 전략이다. 이 연구에서는 객관화 전략의 언어적 표지를 관련된 의도성, 정확성, 완화 등과 비교하여 분석하였다. 그 결과 객관화 표지가 관련 기제들을 나타내는 표지와 일부 겹치기는 하지만 개념은 변별될 수 있음을 알 수 있었다. 객관화 표지는 크게 연구 결과의 상태성을 강조하는 것과 연구 주체를 연구 결과와 분리하는 것, 연구 내용을 일반화하는 것으로 나누어 볼 수 있다. 지속 표현과 명사화 구문은 상태성을 강조하는 역할을 하고, 비인칭 표현, 피동 표현, 자기인용 등은 주장하는 바와 필자의 거리를 유지하게 하며, 1인칭 대명사와 접미사 등을 통한 복수화는 연구 내용을 일반화 하는 데에 기여한다. 모어 화자 말뭉치와 비교하여 학습자 말뭉치를 분석한 결과 연구 결과의 상태성을 강조하기 위해서 학습자들이 모어 화자에 비해 '-고 있다'는 더 많이 사용하는 반면, '-(으) ㄴ/는 것이다' 등의 문법적 연어는 적게 사용하는 것으로 나타났다. 연구 주체의 분리를 위한 비인칭 표현의 사용이 학습자 말뭉치에서는 '본 연구'와 '본고'에만 집중된 반면 모어 화자는 '본고, 본 연구, 본 논문, 본장 등'과 '이 연구, 이 논문, 이 장 등'이 고른 분포로 나타났다. 복수화를 통한 연구 내용의 일반화는 모어 화자 말뭉치에서 활발하게 구현되었다. 이 연구는 객관성 구현의 관점에서 한국어 학술 텍스트의 특성을 파악하고 학문 목적 학습자의 담화 표현 교육을 위한 기초 자료를 마련하였다는 데에 의의가 있다.

한국어 특수구문 처리를 위한 파서의 구현 (An implementation of parser for special syntax processing in Korea)

  • 김재문;이상국;이상조
    • 전자공학회논문지B
    • /
    • 제31B권11호
    • /
    • pp.124-135
    • /
    • 1994
  • 본 논문에서는 한국어 특수구문의 처리를 위한 국어 구문 분석 시스템을 제안한다. 문법의 기술은 동사와 의미를 통합적으로 처리하는 HPSG를 채택하고, 파싱 기법으로는 한국어에 유리한 단방향 활성 차트 파싱을 사용한다. 본 논문의 파서는 포괄적인 문장 구조(보어-중심어 구조, 수식어-중심어 구조, 중심어-중심어 구조)의 처리뿐만 아니라, 실용적인 문장에서 많이 나타나는 보조용언 구몬, 사동문, 피동문, 명사화 어미, 존칭, 화계와 같은 특수구문에 대해서도 파싱을 할 수 있도록 구현되었다.

  • PDF

왜 수동구문이 학술적 전문어에서 특히 선호되고 있는가? (Warum werden die Passivkonstruktionen in den wissenschaftlichen Fachsprachen besonders bevorzugt?)

  • 강국진
    • 한국독어학회지:독어학
    • /
    • 제1집
    • /
    • pp.119-139
    • /
    • 1999
  • 일상어는 한 사회의 모든 구성원이 쉽게 이해할 수 있고 사회생활에서 아무런 어려움이 없이 상호간에 의사소통을 할 수 있는 언어의 표현 수단이다. 이에 반하여 학술어는 각각의 전문분야에서 사용되고 있는 언어의 한 형태이다. 학술적 텍스트에서 나타나는 일반적인 특징은 글이 객관적이면서도 명확하게 기술된다는 점이다. 일반독자는 자주 사용되는 전문어휘를 통하여 학술적 텍스트를 가장 쉽게 인식할 수 있으며, 또한 텍스트의 구성에 있어서도 학술적 텍스트가 일반 텍스트와 다르다는 사실을 알 수 있다. 이 외에도 독일어에서는 일정한 문법적 현상들이 학술적 전문어의 요소로서 사용되고 있다. 예를 들면 삼인칭 단수, 부사구, 명사화 경향, 기능동사구의 선호, 수동구문 등등이 있다. 일반적으로 학술적 전문어에 자주 사용되고 있는 문법적 요소 중의 하나가 수동구문이다. 학술어의 요소로서 수동구문이 갖는 언어적 기능은 다음과 같다: 1. 수동구문에서는 일반적으로 행위자가 언급되지 않음으로써 사실이 객관적으로 표현되며, 동시에 행위자의 억제는 언어의 경제성에 기여한다. 2. 경우에 따라서 행위자가 표현될 때, 직접적인 행위의 주체를 나타내는 von-전치사구 혹은 매개체나 원인을 표현하는 durch-전치사구를 통하여 사건을 정확하게 기술할 수 있다. 3. 테마-레마 구조와 관련하여 살펴보면 문장구성 혹은 문장연결을 위한 표현수단으로도 수동구문은 활용된다. 4. 수동구문을 사용함으로써 문체상의 단조롭고 획일적인 점을 회피할 수도 있다. 본 논문은 이와 같이 수동구문이 지니고 있는 언어적 기능을 살펴봄으로써 학술적 전문어의 특징과 전문어를 이해하는데 기여한다.

  • PDF

FCA 기반 계층적 구조 표현을 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure Representation based on the Formal Concept Analysis)

  • 김태환;박제현;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.388-392
    • /
    • 2006
  • 가공해서 사용하는 정보량이 많아질수록 원하는 정보를 찾는 데 더 많은 노력이 필요하게 마련이다. 따라서 사람들은 대대로 정보를 구조화하는 방법들을 고안해왔으며, 여러 가지 계층적 구조화 방법들을 사용했었다. 이렇게 구현된 정보의 계층 구조는 키워드 검색을 바탕으로 수평적 계층 구조만을 가지는 구조였다. 자료가 전문화되고 정보를 검색하는 사용자 또한 검색된 정보와 관련된 정보를 더 원하는 현 시점에서 정보의 수평적 계층 구조만으로 사용자의 만족도를 충족할 수 없다. 이러한 문제점을 해결하기 위해 이 논문에서는 특정 도메인의 문서를 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 체크하여 그 단락의 계층적 트리를 구성하고, 단락별 트리를 이용하여 문서의 내용을 트리로 재구성할 수 있게 된다. 이렇게 만들어진 문서의 트리들은 트리의 구조를 보고 특정 문서에 더 구체적인지 아니면 더 일반적인지 측정하여 문서와 문서간의 관계 또한 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색해 주는 자동화 문서 계층 구조를 제안한다.

  • PDF

Answer set 자동 구축을 위한 문서 필터링 (Document filtering for automatic construct ion of Answer Set)

  • 정용교;신승은;오효정;장명길;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-258
    • /
    • 2002
  • 본 논문은 의미기반 정보검색 소프트웨어 기술에서 정답 문서 자동 구축을 위한 문서 필터링기법을 제안한다. 문서 필터링은 1차 질의어와 문서간의 유사도와 2차 질의어와 문서간의 유사도를 이용하여 이루어지며, 1차 질의어와 문서간의 유사도를 구하기 위하여 개념 망과 백과사전 정보를 이용한 1차 질의어 확장 과정을 수행하고, 화장된 질의어와 문서와의 유사도를 계산한다. 1차 확장 질의어를 이용해 얻어진 결과 중 유사도가 상위 10%에 속하는 문서를 이용하여 2차 질의어 확장을 한다. 2차 질의어 확장은 상위 10% 문서에 출현하는 명사중 문서 출현 빈도가 임계치 이상인 명사를 선택하여 이루어지고, 그것을 이용하여 문서의 유사도를 계산한다. 이렇게 얻어진 두 가지의 유사도를 결합하여 문서들을 순위화하고 Accept Point를 이용하여 문서를 필터링한다.

  • PDF

Continual learning을 이용한 한국어 상호참조해결의 도메인 적응 (Domain adaptation of Korean coreference resolution using continual learning)

  • 최요한;조경빈;이창기;류지희;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.320-323
    • /
    • 2022
  • 상호참조해결은 문서에서 명사, 대명사, 명사구 등의 멘션 후보를 식별하고 동일한 개체를 의미하는 멘션들을 찾아 그룹화하는 태스크이다. 딥러닝 기반의 한국어 상호참조해결 연구들에서는 BERT를 이용하여 단어의 문맥 표현을 얻은 후 멘션 탐지와 상호참조해결을 동시에 수행하는 End-to-End 모델이 주로 연구가 되었으며, 최근에는 스팬 표현을 사용하지 않고 시작과 끝 표현식을 통해 상호참조해결을 빠르게 수행하는 Start-to-End 방식의 한국어 상호참조해결 모델이 연구되었다. 최근에 한국어 상호참조해결을 위해 구축된 ETRI 데이터셋은 WIKI, QA, CONVERSATION 등 다양한 도메인으로 이루어져 있으며, 신규 도메인의 데이터가 추가될 경우 신규 데이터가 추가된 전체 학습데이터로 모델을 다시 학습해야 하며, 이때 많은 시간이 걸리는 문제가 있다. 본 논문에서는 이러한 상호참조해결 모델의 도메인 적응에 Continual learning을 적용해 각기 다른 도메인의 데이터로 모델을 학습 시킬 때 이전에 학습했던 정보를 망각하는 Catastrophic forgetting 현상을 억제할 수 있음을 보인다. 또한, Continual learning의 성능 향상을 위해 2가지 Transfer Techniques을 함께 적용한 실험을 진행한다. 실험 결과, 본 논문에서 제안한 모델이 베이스라인 모델보다 개발 셋에서 3.6%p, 테스트 셋에서 2.1%p의 성능 향상을 보였다.

  • PDF

순위 휴리스틱을 이용한 단음절 질의어의 검색 성능 향상에 관한 실험적 연구 (An Experimental study on enhancing retrieval performance for monosyllabic queries using ranking heuristics)

  • 박양하;문성빈
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.23-30
    • /
    • 2004
  • 온라인 대용량 데이터베이스 검색에서 널리 사용되는 불리언 검색의 가장 큰 단점은 검색된 문헌을 적합한 정도에 따라 순위화하기 어렵다는 것이었다. 본 연구에서는 부적합문헌이 다른 질의어에 비해 많이 검색되는 단음절 명사 질의어를 사용하여 이용자의 노력은 최소화 하면서 검색 성능은 향상 시킬 수 있는 순위 휴리스틱 적용에 대해 연구하였다.

  • PDF

평균점에 대한 불일치의 합을 이용한 자동 단어 군집화 (Automatic word clustering using total divergence to the average)

  • 이호;서희철;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.419-424
    • /
    • 1998
  • 본 논문에서는 단어들의 분포적 특성을 이용하여 자동으로 단어를 군집화(clustering) 하는 기법을 제시한다. 제안된 군집화 기법에서는 단어들 사이의 거리(distance)를 가상 공간상에 있는 두 단어의 평균점에 대한 불일치의 합(total divergence to the average)으로 측정하며 군집화 알고리즘으로는 최소 신장 트리(minimal spanning tree)를 이용한다. 본 논문에서는 이 기법에 대해 두 가지 실험을 수행한다. 첫 번째 실험은 코퍼스에서 상위 출현 빈도를 가지는 약 1,200 개의 명사들을 의미에 따라 군집화 하는 것이며 두 번째 실험은 이 논문에서 제시한 자동 군집화 방법의 성능을 객관적으로 평가하기 위한 것으로 가상 단어(pseudo word)에 대한 군집화이다. 실험 결과 이 방법은 가상 단어에 대해 약 91%의 군집화 정확도와(clustering precision)와 약 81%의 군집 순수도(cluster purity)를 나타내었다. 한편 두 번째 실험에서는 평균점에 대한 불일치의 합을 이용한 거리 측정에서 나타나는 문제점을 보완한 거리 측정 방법을 제시하였으며 이를 이용하여 가상 단어 군집화를 수행한 결과 군집화 정확도와 군집 순수도가 각각 약 96% 및 95%로 향상되었다.

  • PDF

구조적 정렬: 개념적 시사점과 한계 (Structural Alignment: Conceptual Implications and Limitations)

  • 이태연
    • 인지과학
    • /
    • 제17권1호
    • /
    • pp.53-74
    • /
    • 2006
  • 유사성은 인지구조와 그 처리과정을 설명하는 중요한 개념으로 알려져 있으며 유사성 비교과정을 설명하기 위해 제안된 대표적인 초기모형으로는 다차원 척도모형(Shepard, 1964; Nosofsky, 1991)과 대비모형(Tversky, 1977)이 있다. 그러나 초기 모형에 의해 설명되기 어려운 경험적 연구결과들이 발표되면서 유사성의 개념적 타당성에 대한 의문이 제기되었다. Goldstone(1994)은 유사성이 속성차원간의 정렬과정에서 정의된다고 가정하고, 구조적 정렬 개념을 유사성을 둘러싼 개념적 논쟁들을 해결할 수 있는 유망한 대안으로 제안하였다. 본 연구에서는 우선 초기 유사성모형들의 기본 가정과 알고리즘을 개관한 후 속성차원에 대한 선택적 주의의 임의성이나 속성차원들 사이에 존재하는 상관적 구조와 같이 초기 유사성 모형들에 의해 설명되기 어려운 개념적 문제들을 살펴보았다. 그리고 SIAM(Goldston,, 1994)의 개념적 특징과 알고리즘을 알아본 후 구조적 정렬 개념이 범주화, 명사결합, 유추 추리 등의 인지심리학 분야들에 어떻게 적용되었는지를 개관하였다. 끝으로 자료 주도적 처리와 대안적 처리과정의 가능성과 관련된 SIAM의 한계점을 검토하고 가능한 발전방향에 대해 논의하였다.

  • PDF