• 제목/요약/키워드: lexical information

검색결과 324건 처리시간 0.028초

구문 분석에서의 중의성 해소를 위한 일반화된 어휘정보의 자동 구축 및 적용 (Automatic Construction of Generalized Lexical Information for Syntactic Ambiguity Resolution)

  • 정후중;황영숙;곽용재;박소영;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.269-275
    • /
    • 1998
  • 구문 분석에서의 중의성을 해결하는 데 어휘정보가 유용하다는 것은 잘 알려져 있다. 그러나 기존의 어휘정보 구축 방법들은 많은 수작업을 요구하거나, 자동으로 구축하는 경우에는 어휘 자체를 그대로 사용함에 따라 심각한 자료 회귀성 문제가 발생했다. 본 논문에서는 구문 분석에서의 중의성 해소를 위해 원시 코퍼스와 시소러스를 이용하여 개념 수준(conceptual-level)의 일반화된 술어-인자 어휘정보를 자동으로 구축하고, 이를 파서에 적용하는 방법을 제안하고자 한다. 제안한 방법으로 구축한 일반화된 어휘정보를 파서를 이용하여 명사구의 지배소 결정 실험에 적용하여 본 결과, 정확도가 85.9%에서 91.5%로 향상되었다. 또, 미지격 결정 실험에 대해서는 86.32 %의 격 결정 성공률을 보여주었다.

  • PDF

개념기반 복합키워드 추출방법 (Concept-based Compound Keyword Extraction)

  • 이상곤;이태헌
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.23-31
    • /
    • 2003
  • 인간은 문서를 읽고 그 내용을 머릿속에서 개념적으로 정리하여 적은 수의 복합단어를 이용하여 문서를 대표하는 적당한 키워드로 정리한다. 본 논문은 이러한 점에 착안하여 문서를 대표하는 키워드를 추출하는 방법을 제안한다. 학술논문을 실험 예로 사용하여 저자가 자신의 문서에 부여한 키워드가 문서의 본문 중에 출현하지 않는 경우에도 동작하도록 출현단어의 개념정보를 기초로 복합어 생성규칙을 구축한다. 문서의미와 상관없는 키워드의 추출을 억제하기 위해 중요도 결정법을 새로 제안한다. 추출된 키워드의 타당성 여부는 자연언어와 음성언어에 관한 논문의 제목과 요약을 수집하여 실험하였다. 또한 저자가 부여한 키워드와 본 시스템이 출력한 키워드를 비교 한 결과, 상위 한 개의 정확율이 96%가 되어 제안방법의 유용성을 확인하였다.

  • PDF

조선시대 일기류의 기상일지(氣象日誌)적 재구성과 고종일기의 기상기록 분석 (Reconstitution of Meteorological Daily Logs in Choseon Dynasty and Analyzing Weather Records of the Annals of King Gojong)

  • 김일권
    • 대기
    • /
    • 제25권3호
    • /
    • pp.407-433
    • /
    • 2015
  • First half of my article focused on analyzing the current state of historical materials regarding weather and climate, and established a list of weather-related historical literature collection of Korea with which to make a lexical approach to the situations of all kinds of weather literature. It also put emphasis on gathering information and data of weather logs from journal-type historical records which were contained in 48 weather-related journals of Choseon period. The results of this research are expected to be useful for the activation of study in historical meteorology. The latter half of my research focused on analyzing various meteorological states of sunny, cloudy, rainy, snowy and frosty weather which were recorded in the official Annals of King Kojong (1864~1907). And it re-verified historical rainfall data of preceding researches of Wada Yuji (1917), Jung-Lim (1994), Jhun-Moon (1997). In result, different records were found between data of theirs and mine. It means that we have to analyze and reconstruct newly the meteorological data of the Annals of King Gojong and the Daily Records of Royal Sungjungwon (1623~1910) during the late Choseon period.

영한 기계번역의 자연어 생성 연구 (A Study on the Natural Language Generation by Machine Translation)

  • 홍성룡
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권1호
    • /
    • pp.89-94
    • /
    • 2005
  • 기계번역에서 자연어 생성의 목적은 입력언어의 어구 분석을 이용하여 그 문장의 의미를 변환해주는 목적 언어를 생성하는 것이다. 그것은 언어적 구조 낱말 전사. 대화체 언어, 어휘적 정보 등을 포함해야 한다. 본 연구에서는 대화체 자동 기계번역 시스템 구현계획의 일부인 음성, 음운 분야에서 담당하게 될 음성인식과 음성합성 알고리듬을 확립하기 위한 한국어 특질에 대한 기초조사를 하고자 한다. 또한 기계번역의 단계를 분석하여 형태소 분석 단계와 구문 분석 단계, 의미 분석 단계로 구분한다. 형태소 분석은 입력 문장을 받아 분리된 형태소를 사전 내에서 검색하여·품사 정보를 얻고 이웃하는 단어와의 접속 관계가 문법적으로 올바르게 되었는지를 점검한다. 본 연구의 결과가 대화체 기계번역 시스템 구현계획의 종합적 입장에서는 단순한 기초조사일 수 있지만, 한국어의 교육 및 기계번역 이해의 측면에서는 그 자체로 가치를 지닌다고 할 수 있겠다. 따라서 교육적 측면에서의 직접적 활용을 여러 측면에서 고려할 수 있을 것이다.

  • PDF

지지벡터기계(Support Vector Machines)를 이용한 한국어 화행분석 (An analysis of Speech Acts for Korean Using Support Vector Machines)

  • 은종민;이성욱;서정연
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.365-368
    • /
    • 2005
  • 본 연구에서는 지지 벡터 기계(Support Vector Machines)를 이용하여 한국어 대화의 화행을 분석하는 방법을 제안한다. 우리는 발화의 어휘 및 품사와 이진 품사 쌍을 문장 자질로 사용하고 이전 발화의 문맥을 문맥 발화로 사용한다. 카이 제곱 통계량을 이용해 적절한 자질을 선택하고 선택된 자질로 지지 벡터 기계를 학습하였다. 학습된 지지 벡터 기계 분류기를 이용하여 각 발화의 화행을 분석하였다. 호텔 예약 영역의 말뭉치에 대해 제안된 시스템을 이용하여 실험한 결과 약 $90.54\%$의 정확률을 얻었다.

A Muti-Resolution Approach to Restaurant Named Entity Recognition in Korean Web

  • Kang, Bo-Yeong;Kim, Dae-Won
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권4호
    • /
    • pp.277-284
    • /
    • 2012
  • Named entity recognition (NER) technique can play a crucial role in extracting information from the web. While NER systems with relatively high performances have been developed based on careful manipulation of terms with a statistical model, term mismatches often degrade the performance of such systems because the strings of all the candidate entities are not known a priori. Despite the importance of lexical-level term mismatches for NER systems, however, most NER approaches developed to date utilize only the term string itself and simple term-level features, and do not exploit the semantic features of terms which can handle the variations of terms effectively. As a solution to this problem, here we propose to match the semantic concepts of term units in restaurant named entities (NEs), where these units are automatically generated from multiple resolutions of a semantic tree. As a test experiment, we applied our restaurant NER scheme to 49,153 nouns in Korean restaurant web pages. Our scheme achieved an average accuracy of 87.89% when applied to test data, which was considerably better than the 78.70% accuracy obtained using the baseline system.

다음절 단어재인에 있어서 음운적 활성화 (Phonological Activation in Multi-syllabic Word Recognition)

  • 이창환;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.225-228
    • /
    • 2004
  • 영어단어 중에는 글자 열에 소리가 나지 않는 묵음자를 가진 단어들이 있다(예 : $\underline{k}nowledge$). 이러한 단어들은 같은 위치의 글자 열에 소리가 나는 글자를 가진 단어들(예 :available)과 수행을 비교하여 다음절 단어 재인에 있어서 음운 정보의 역할을 검증할 수 있는 기회를 제공한다. 파일럿 연구의 성격을 가진 본 연구의 결과, 어휘판단 과제에서 묵음자가 삭제된 단어 (예 : _nowledge)의 수행이 소리음이 삭제된 단어 (예 :_vailable)의 수행보다 빨랐다. 어휘접근을 반영하는 어휘판단과제에서의 이러한 결과는 다음절 단어재인에 있어서 음운 재부호화가 일어날 수 있는 개연성을 보여주는 것이다.

  • PDF

Interworking technology of neural network and data among deep learning frameworks

  • Park, Jaebok;Yoo, Seungmok;Yoon, Seokjin;Lee, Kyunghee;Cho, Changsik
    • ETRI Journal
    • /
    • 제41권6호
    • /
    • pp.760-770
    • /
    • 2019
  • Based on the growing demand for neural network technologies, various neural network inference engines are being developed. However, each inference engine has its own neural network storage format. There is a growing demand for standardization to solve this problem. This study presents interworking techniques for ensuring the compatibility of neural networks and data among the various deep learning frameworks. The proposed technique standardizes the graphic expression grammar and learning data storage format using the Neural Network Exchange Format (NNEF) of Khronos. The proposed converter includes a lexical, syntax, and parser. This NNEF parser converts neural network information into a parsing tree and quantizes data. To validate the proposed system, we verified that MNIST is immediately executed by importing AlexNet's neural network and learned data. Therefore, this study contributes an efficient design technique for a converter that can execute a neural network and learned data in various frameworks regardless of the storage format of each framework.

XML 문서의 빠른 변환을 위한 XSLT 스크립트 (XSLT Scripts for Fast XML Document Transformation)

  • 신동훈;이경호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권6호
    • /
    • pp.538-549
    • /
    • 2005
  • 본 논문에서는 스키마를 구성하는 단말 노드 간의 일대일 매칭으로부터 XML 문서의 빠른 변환을 지원하는 XSLT 스크립트를 생성하는 방법을 제안한다. 제안된 방법은 XML 스키마를 구성하는 빈도 지시자 간의 대응관계 생성과 XSLT 스크립트 생성의 두 단계로 이루어진다. 어휘 및 구조 유사도를 이용하여 빈도 지시자 간의 대응관계를 생성하며 이를 바탕으로 적은 수의 템플릿을 포함하는 XSLT 스크립트를 생성한다. 성능을 평가하기 위하여 다양한 크기의 문서와 다수의 XSLT 처리기에 대해 실험한 결과, 제안된 방법은 기존 연구보다 XML 문서를 보다 빠르게 변환하는 XSLT 스크립트를 생성하였다.

XML 스키마 메타모델에서 OCL 생성 (Generate of OCL on XML Sechma Meta Model)

  • 이돈양;최한용
    • 한국콘텐츠학회논문지
    • /
    • 제6권6호
    • /
    • pp.42-49
    • /
    • 2006
  • XML이 인터넷에서 정보전송을 위한 메타언어의 표현방법으로 급속하게 이용되고 있다. 아울러 XML 스키마는 XML 데이터의 다양한 유형을 표현하는데 사용하는 빈도수가 늘고 있다. 본 논문에서는 UML을 이용한 XML 스키마의 simpleType형 메타모델에 대한 설계를 하였다. 그러나 XML 스키마의 구조가 복잡하고 다양한 데이터의 유형을 지원하기 때문에 UML에서 나타내고 있는 모델의 속성에 대한 사용자의 이해와 적용에 어려운 부분이 많이 발생하는 것을 알 수 있다. 이를 해결하는 방법으로 본 연구에서는 OCL의 기능을 적용하여 XML 스키마 메타모델에서 구조적인 표현을 명확하게 명시할 수 있도록 하였으며, 아울러 이를 바탕으로 컴파일단계에서 어휘분석과 구문분석을 위한 파스트리와 토큰생성에 대한 구체적인 설계방법을 제시하였다.

  • PDF