• 제목/요약/키워드: 표제어복원

검색결과 5건 처리시간 0.022초

백과사전 질의응답을 위한 생략된 표제어 복원에 관한 연구 (Restoring an Elided title for Encyclopedia QA System)

  • 임수종;이창기;장명길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.541-543
    • /
    • 2005
  • 백과사전에서 정답을 찾기 위해 문장의 구조를 분석하는데 한국어 백과사전은 표제어에 대한 정보를 문장에서 생략한다. 그러나 표제어는 문장에서 주어나 목적어 역할을 하기 때문에 생략된 정보를 복원하지 못 하면 질의에 대한 정답을 제시할 수 없다. 생략된 표제어에 대한 정보를 복원하기 위해서 본 연구에서는 표제어의 의미범주 정보, 격틀, Maximum Entropy 모델을 이용하여 표제어 주어, 표제어 목적어 복원, 미복원 3가지로 인식한다. 표제어 의미범주는 의미 범주에 대해 일정 수준의 복원 성향을 보일 경우 Maximum Entropy 정보를 창조하였고 격틀을 이용하여 복원 여부를 결정한다. 만약 표제어의 의미범주 정보, 격틀을 이용하여도 복원 여부를 결정하지 못할 경우에는 Maximum Entropy 모델에 기반한 통계 기법을 적용하여 복원 여부를 결정한다. 그리고 각각 방법의 단점을 보완하기 위해서 규칙에 해당하는 표제어 의미범주 정보와 격틀 정보에는 통계 모델인 ME 모델을 보완하여 사용한다.

  • PDF

무형대용어 해결 기술을 이용한 백과사전 표제어 복원 (Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique)

  • 황민국;김영태;나동열;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2014
  • 한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

  • PDF

한국어 사전의 압축 구현 (Implementation of Compressing a Korean Lexicon)

  • 임한규;박상호
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 추계학술대회 발표논문집:21세기를 향한 정보통신 기술의 전망
    • /
    • pp.395-403
    • /
    • 1997
  • 한국어 처리의 기본이 되는 형태소 분석을 위한 사전의 효율적인 구성을 위해 각 표제어의 반복 음절수에 의한 방식으로 이를 압축하고 복원하는 알고리즘을 보였다. 사전의 크기에 있어서 25% 줄일 수 있었으며 표제어를 검색할 때 횟수를 36 % 줄일 수 있었다. 아울러 빠른 검색을 위한 이진 사전을 오프셋에 의해 구성하였다.

  • PDF

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

강진 안운마을 백운동원림의 승경과 수공간의 조영 특성 (Formative Characteristics of Water Space and Scenic Spot of Baegun-dong Wonlim in Gangjin Aaun Village)

  • 박율진;김홍균;노재현;김화옥;고여빈
    • 한국전통조경학회지
    • /
    • 제29권2호
    • /
    • pp.99-107
    • /
    • 2011
  • 본 연구는 여러 시문과 옛 그림 속에 나타난 백운동8영과 12승경 등 백운동원림의 내경과 외경의 고찰을 통해 조망경관과 식재경관 등 백운동원림의 전통 조경적 특질을 검토함으로써 복원의 진정성 제고할 수 있는 자료를 도출하고자 하였다. 1. 백운동원림의 장소성은 백운사지(白雲寺址) 및 양(梁)나라 도홍경(陶弘景)이 화양(華陽) 은거고사 그리고 원림입구의 백운동(白雲洞) 각자에서 근원하고 있음이 확인되었다. 2. 백운동8영은 백운동유서기(白雲洞幽棲記)의 표제어를 그대로 차운하고 있으며, 백운동8영의 요소인 소나무 매화 대나무 난 연꽃 국화 그리고 영산홍은 관상학적 측면은 물론 의미경관요소로 지속적으로 원림의 내경을 구성하였던 조경 식물로 보인다. 3. 백운동12승경으로 볼 때, 약 1.6km 권역의 원경인 옥판봉을 외경으로, 산다경, 백매오, 홍옥폭, 풍단 등은 전이공간으로 설정한 것으로 파악된다. 한편, 초당과 정자를 비롯하여 국화, 모란, 영산홍, 왕대, 소나무 그리고 연못 등을 내경의 경관요소로 구성함으로써 백운동원림은 별서를 중심으로 구심적이며 다층적 경관구조를 갖추고 있었던 것으로 보인다. 4. 두 개의 방지(方池)가 곡수거로 연결되는데 상지는 크기 $3.5m{\times}4.5m$ 크기이고, 하지 또한 장방형에 크기 $3.6m{\times}5.7m$ 로 실측되고 있으며, 서측을 흐르는 계곡수를 끌어 원내로 유도한 유로(流路)는 $90^{\circ}$의 직각 형태를 보이고, 원내에서 총 5번의 굴절(屈折)을 이루는 곡수로 구성되어 있다. 5. 현재 유구가 남아있는 국내 대부분의 곡수거(曲水渠) 형태는 유선형인데 반하여 백운동의 곡수거는 반듯한 직선으로, 내원(內園)을 거의 장악하다시피 형태와 규모를 갖는 이채로운 발상과 디자인으로 주목된다. 백운동원림의 진정한 복원을 추진하기 위해서는 옥판봉을 비롯한 12승경 중 외경의 경물요소에 대한 점진적인 경관연출을 도모하기 위한 조망 관리적 배려가 수반되어야 할 것이다.