• Title/Summary/Keyword: 지식 확장

Search Result 841, Processing Time 0.024 seconds

Construction of Korean Knowledge Base Based on Machine Learning from Wikipedia (위키백과로부터 기계학습 기반 한국어 지식베이스 구축)

  • Jeong, Seok-won;Choi, Maengsik;Kim, Harksoo
    • Journal of KIISE
    • /
    • v.42 no.8
    • /
    • pp.1065-1070
    • /
    • 2015
  • The performance of many natural language processing applications depends on the knowledge base as a major resource. WordNet, YAGO, Cyc, and BabelNet have been extensively used as knowledge bases in English. In this paper, we propose a method to construct a YAGO-style knowledge base automatically for Korean (hereafter, K-YAGO) from Wikipedia and YAGO. The proposed system constructs an initial K-YAGO simply by matching YAGO to info-boxes in Wikipedia. Then, the initial K-YAGO is expanded through the use of a machine learning technique. Experiments with the initial K-YAGO shows that the proposed system has a precision of 0.9642. In the experiments with the expanded part of K-YAGO, an accuracy of 0.9468 was achieved with an average macro F1-measure of 0.7596.

Ontology-based Knowledge Evaluation Method using Scenario Testing (시나리오 테스트를 통한 온톨로지 기반 지식 평가 기법)

  • Lee, Keon-Soo;Kim, Min-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.376-379
    • /
    • 2007
  • 오늘날 컴퓨팅 기능의 급격한 발달은, 시스템의 효율뿐만 아니라 지능화에 대한 요구를 증대시키고 있다. 지능화된 서비스를 성공적으로 제공하기 위해서는, 제공하려는 도메인에 대한 지식 처리 기능이 필수적이다. 시스템의 지능적인 행동은 그 시스템이 보유하고 있는 지식의 질(質)에 영향을 받기 때문에, 사용되는 지식의 질적 우수성을 보장하려는 시도가 이루어지고 있지만, 문제는 지식의 질이 높아질수록, 지식 관리의 비용이 증가한다는 점이다. 따라서 품질과 비용 사이의 균형점을 맞추기 위한 노력이 필요하다. 이에 본 논문에서는 사용하려는 지식의 품질과 시스템에서 요구하는 지식의 품질을 비교함으로써, 이 균형점을 맞추는 방법을 제안한다. 이를 위해, 시스템이 제공하려는 서비스 시나리오를 대상 지식으로 표현 및 처리한다. 시스템 관리자는 이 결과를 바탕으로 채택하려는 지식과 자신의 시스템 사이의 괴리를 손쉽게 판단 할 수 있고, 그 차이를 없애기 위해 지식의 확장 및 축소의 부분을 결정하고, 수정할 수 있다.

  • PDF

A Rule Generation Technique Utilizing a Parallel Expansion Method (병렬확장을 활용한 규칙생성 기법)

  • Lee, Kee-Cheol;Kim, Jin-Bong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.4
    • /
    • pp.942-950
    • /
    • 1998
  • Extraction of knowledge, especially in the form of rules, from raw data is very important in data mining, the aim of which is to help users who feel the lack of knowledge in spite of the abundance of data. Logic minimization tools are ones which derive optimized knowledge given ON set and DC set. First, the parallel expansion scheme of logic minimization is extracted and used to obtain intial knowledge to get final rules, which are successfully applicable to real world data. The prototype system based on this new approach has been experimented with real world data to show that it is as practical as conventional long studied decision tree methods like C4.5 system.

  • PDF

A Study on Utilization of Wikipedia Contents for Automatic Construction of Linguistic Resources (언어자원 자동 구축을 위한 위키피디아 콘텐츠 활용 방안 연구)

  • Yoo, Cheol-Jung;Kim, Yong;Yun, Bo-Hyun
    • Journal of Digital Convergence
    • /
    • v.13 no.5
    • /
    • pp.187-194
    • /
    • 2015
  • Various linguistic knowledge resources are required in order that machine can understand diverse variation in natural languages. This paper aims to devise an automatic construction method of linguistic resources by reflecting characteristics of online contents toward continuous expansion. Especially we focused to build NE(Named-Entity) dictionary because the applicability of NEs is very high in linguistic analysis processes. Based on the investigation on Korean Wikipedia, we suggested an efficient construction method of NE dictionary using the syntactic patterns and structural features such as metadatas.

다사용자용 전문가시스템 구축을 위한 persistent rule object management system

  • 김일곤
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1993.04a
    • /
    • pp.255-264
    • /
    • 1993
  • 요즈음 구축되는 지식기반시스템은 다목적, 다사용자에 의한 활용 필요성 때문에 지식베이스가 점점 커지고, 축적된 전문지식을 공유할 필요성이 점점 커진다. 따라서, 이렇게 형성된 여러개의 다양한 지식베이스를 지속적으로 관리할 수 있는 메카니즘이 필요하다. 이런 메카니즘의 구축에 객체 지향 데이타베이스 관리시스템의 기술과 지식 기반시스템의 기술이 통합 활용되어야 하기 때문에, 지식베이스의 확장과 응용 영역확대에 따른 데이타, 규칙, 그리고 지식의 공유 및 지속성을 유지하는 한편, 이에 필요한 추론방법의 변화를 분석하여 지식베이스가 분산되어 있더라도 이를 효율적으로 활용할 수 있는 추론엔진을 설계하고, 여러 사용자가 필요한 지식기반시스템을 사용할 수 있도록 지식베이스의 공유를 위한 지속적 관리시스템의 설계를 그 목적으로 한다.

  • PDF

The Extension of Artificial Science Laboratory (ASL-EE II) : DC & AC Circuit Experiments (인공과학실험실의 확장(ASL-EE II) : 직.교류회로 실험)

  • 오석일;변영태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.119-121
    • /
    • 1999
  • 화학관련 지식계층구조를 기반으로 기 구축된 인공화학실험실의 시스템 구조를 바탕으로 한, 전기실험 관련 인공과학실험실은 초.중.고 수준의 교과과정에 한정해서 기초 직류(直流)회로실험, 자기력(磁氣力)에 관련한 자기장(磁氣場)의 실험, 화학지식을 이용한 화학전지실험을 모의할 수 있는 시스템으로 개선 발전되어 왔다. 본 논문에서는 기존의 추론 모델을 개선/변경하여, 회로에 대한 해석 주체를 구성하고 있는 각 소자(素子)들 중심으로 좀 더 현실세계에 부합되는 시스템으로 확장함으로 해서 관련 지식 추가와 함께 직류 실험에 추가적으로 교류(交流)회로실험이 가능하도록 그 실험 범위를 확대한다.

  • PDF

Neural Network Model for Named Entitiy Linking using Wikipedia Link Data (위키피디아 링크 데이터를 이용한 Neural Network Model 기반 한국어 개체명 연결)

  • Lee, Young-Hoon;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.163-166
    • /
    • 2018
  • 개체명 연결이란 주어진 문장에 출현한 단어를 위키피디아와 같은 지식 기반 상의 하나의 개체와 연결하여 특정 개체가 무엇인지 식별하여 모호성을 해결하는 작업이다. 본 연구에서는 위키피디아의 링크를 이용하여 개체 표현(Entity mention)과 학습 데이터, 지식 기반을 구축한다. 또한, Mention/Context 쌍의 표현과 Entity 표현의 코사인 유사도를 이용하여 Score를 구하고, 이를 통해 개체명 연결 문제를 랭킹 문제로 변환한다. 개체의 이름과 분류뿐만 아니라 개체의 설명, 개체 임베딩 등의 자질을 이용하여 모델을 확장하고 결과를 비교한다. 확장된 모델의 개체 링킹 성능은 89.63%의 정확도를 보였다.

  • PDF

Automatic Classification of Web Documents Using Concept-Based Keyword Information (개념 기반 키워드 정보를 이용한 웹 문서의 자동 분류)

  • 박사준;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.151-153
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해서 분류하고자 하는 영역(category)에 대한 개념 지식을 이용한다. 먼저, 영역별 개념 지식을 기구축된 웹 문서의 집합으로부터 제목과 하이퍼링크에 기반한 앵커 텍스트를 이용하여 개념을 보유한 키워드를 추출한다. 추출된 키워드를 형태소 분석을 통해 색인어로 추출한다. 추출된 색인어에 대해 TFIDF를 확장한 영역 적용 색인 가중치 TFIDFc를 적용하여 영역별 개념 기반 색인어와 색인를 구축한다. 색인은 TFIDF를 영역별로 확장하여 구축한다. 구축된 영역별 개념 기반 색인을 이용하여 새로운 웹 문서에 대해서 어떤 영역에 해당하는 가를 결정하는 자동 분류 알고리즘을 수행한다. 자동 분류 알고리즘에 의해 수행된 문서는 영역별로 정리되며, 또한, 분류된 웹 문서의 색인어는 새로운 개념 기반 키워드로 추출되어 개념 기반 영역 지식을 구축한다.

  • PDF

Gutenberg Galaxy and Music (구텐베르크 은하계와 음악)

  • KIM, Hyokyung
    • Trans-
    • /
    • v.5
    • /
    • pp.49-64
    • /
    • 2018
  • Marshall Mcluhan, a media scholar, created the word Gutenberg Gaaxy meaning the new environment formulated by printing technic and he insisted that it changed human life entirely. In the history of human, the media evolved into printing technic through oral and transcription. This evolution of media and the environment created by the media are the most important point of Mcluhan's theory. He sees the world as the result of media evolution. In mcluhan's sight, Gutenberg Galaxy is the first environment composed by the media. Based on the mcluhan's theory, this study focused on the environment created by the media and applied it into the western music history. The link of the Gutenberg Galaxy and the western music, especially in romantic era, will be the main subject of the study. The Book is the most representative media of the printing technic. In the era of oral and transcription, the communication was limited by the spatial restriction. However, the book was free to spatial condition and this character of the book made the knowledge free. The knowledges delivered by the oral and transcription were mostly the matter of mundane world because they are so close to the human life, even though they are narrating about the God's world. The book, free to expanding the knowledge beyond the world, made the knowledge transcendent and expanded the sight of the humans into the transcendent world. The modern western world is the product of the expanded knowledge by the book and so does the music. In the time of printing technic, the music begun to gain the population by the printed sheet music. As delivering the music through the printed sheet, the music received transcendence and mystery as meeting the spirit of the times. This link formed by the time of Gutenberg Galaxy will be the main focus of the study and it will prove the link between the media and the western music.

  • PDF

Study of Representation Methodology by Comparative Analysis between Information Visualization and Knowledge Visualization (정보시각화와 지식시각화의 비교분석을 통한 표현방법 연구)

  • Jang, Seok-Hyun;Lee, Joo-Youp;Lee, Kyung-Won
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02b
    • /
    • pp.392-398
    • /
    • 2008
  • 이 연구는 정보의 효과적인 전달을 목적으로 하는 정보디자인에 있어서 지식의 활용에 대해 고찰하며, 정보시각화와 지식시각화의 특성에 대한 비교분석을 목적으로 한다. 지식은 일종의 고부가 가치의 정보로서 주어진 데이터에 관한 인간의 인지활동을 내포하고 있다. 지식은 정보에 관한 사용자의 해석, 인지, 이해 등을 거친 것으로서 정보 이상의 가치를 지닌 것으로 사용자의 심상과 인지를 확장시켜 새로운 정보와 지식의 생성 및 의사 결정에 사용될 수 있다. 지식의 표현은 현재 정보의 양적 팽창으로 인해 정보디자인에서 나타나는 정보과중, 해석오류와 오역, 사용자 태도 등의 문제를 해결하는 대안이 될 수 있다. 지식시각화는 지식의 전달과 장조를 위한 방법론으로써 사람들이 알고 있는 것을 좀 더 풍부한 의미로 전달한다. 또한 개인 또는 그룹 사이의 지식의 장작을 촉진하고 전달을 개선하며 습득을 용이하게 할 수 있다. 이 연구는 지식시각화란 정보디자인의 새로운 연구 분야로써 이론적 부분을 정립하고 표현방법 및 효과적인 프로세스 모델 설계를 연구하였다. 정보시각화와 지식시각화의 이론적 특성과 표현 방법 요소의 비교분석을 통해 지식시각화의 성격과 특정을 파악하였다. 또한 지식시각화의 대표적 표현방법을 도출하고, 지식의 표현에 적함한 시각화 방법 에 관해 고찰하였다. 더불어 지식의 실질적 표현에 기초가 되는 지식 구조화에 적합한 시각화 프로세스 모델을 제안하였다. 일반적인 시각화에서는 다양한 관점 제시나 지원구분을 하고 있지 않기 때문에 이 연구를 통해 도출되는 시각화 요소를 이용한 합리적인 시각화 프로세스 모델은 지식의 표현에 있어 효과적일 것이라 생각한다.

  • PDF