• 제목/요약/키워드: Knowledge extraction

검색결과 381건 처리시간 0.032초

정보추출결과의 시각화 표현방법에 관한 이용성 평가 연구 (A Usability Evaluation on the Visualization of Information Extraction Output)

  • 이지연
    • 한국문헌정보학회지
    • /
    • 제39권2호
    • /
    • pp.287-304
    • /
    • 2005
  • 이 연구의 목적은 자동적으로 추출된 정보를 시각화 브라우저를 통해 표현하고 접근하는 방법에 대해 이용성평가를 수행하는 것이다. 특정 주제 분야에 국한되지 않는 정보추출시스템을 사용하여 신문기사에서 의미정보를 자동 추출하였고, 그 결과로 시각적으로 브라우저 할 수 있는 지식베이스를 구축하였다. 이 연구에 이용된 정보추출시스템은 신문기사의 텍스트정보로부터 다양한 자연언어처리 기술을 적용하여 개념-관계-개념의 형태로 표현되는 정보를 자동적으로 추출하였다. 지식베이스에 저장된 정보를 시각적으로 표현하는 시각화 브라우저를 구현하였는데, 이때 인터페이스 부분은 쌍곡면형 정보시각화 시스템의 하나인 PersonalBrain을 이용하여 개발하였다. PersonalBrain을 이용하면 표현하고자 하는 정보를 논리관계의 네트워크 형태로 연결할 수 있다. 지식베이스 정보의 시각화 접근방법에 대하여 15명의 이용자를 대상으로 질적 평가를 수행하였다. IS명의 연구대상자로 하여금 시각화 브라우저를 이용하도록 하고 관찰과 인터뷰를 통하여 이용성평가 데이터를 수집하였다. 내용분석결과, 이용자들은 정보추출결과의 시각화 브라우저 이용가능성에 대해 긍정적인 반응을 보인 동시에 몇 가지 이용성 관련 문제점을 지적하였다.

도메인지식의 계층화를 통한 온톨로지 인스턴스의 속성정보 추출 (An Extraction of Property of Ontology Instance Using Stratification of Domain Knowledge)

  • 장문수;강선미
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.291-296
    • /
    • 2007
  • 최근에 여러 분야에서 구축되고 있는 온톨로지는 기계가 이해할 수 있는 지식을 축적하는 것을 목표로 하고 있다. 기계가 온톨로지를 이용하여 정보의 관리 및 해석을 스스로 하는 것이 가능할 것으로 본다. 본 논문에서는 온톨로지의 인스턴스를 구성하는 속성을 기존 웹 문서의 구조정보로부터 추출하는 알고리즘을 제안하였다. 특히, 속성 정보로 구성하는 도메인 지식을 계층화함으로써 속성 추출 알고리즘을 개선하고, 추출 결과의 품질을 향상시킨다. 2만 문서를 대상으로 제안된 알고리즘을 적용한 결과 약 83%의 신뢰도의 속성 정보를 추출할 수 있었다.

정보 추출을 위한 이벤트 문장 추출 (Event Sentence Extraction for Information Extraction)

  • 김태현;임수종;윤보현;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.325-331
    • /
    • 2002
  • 정보추출 시스템의 목적은 관심의 대상이 되는 특정 정보를 선택적으로 찾아내 제시하는데 있다. 따라서 도메인 정보에 의존적인 방법으로 정보추출이 이루어질 수밖에 없고, 이에 따른 도메인 정보 구축의 부담이 컸다. 이러한 부담을 줄이기 위해 본 연구에서는 특정 주제영역과 관련한 문서로부터 자동으로 이벤트 문장을 추출하는 시스템을 제안한다. 이벤트 문장이란, 특정도메인에서 다루어지는 이벤트의 구체적인 내용을 포함하고 있는 문장이다. 이러한 문장을 추출함으로써 기본적인 수준의 정보추출 요구를 만족시킬 수 있을 뿐만 아니라, 주출된 이벤트 문장을 도메인 정보 구축에 활용할 수 있을 것이다. 본 연구에서는 동사, 명사, 명사구, 및 3W 자질을 이용하여 문장추출의 성능을 최대화하기 위한 방안을 제안하고, 세 개의 평가 도메인을 대상으로 실험을 수행하였다. 실험 결과, when 및 where 자질과 동사, 명사. 명사구의 가중치를 이용하여 문장 가중치를 계산함으로써 최적의 이벤트 문장추출 성능을 얻을 수 있음을 알 수 있었다.

  • PDF

An intelligent system for automatic data extraction in E-Commerce Applications

  • Cardenosa, Jesus;Iraola, Luis;Tovar, Edmundo
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.202-208
    • /
    • 2001
  • One of the most frequent uses of Internet is data gathering. Data can be about many themes but perhaps one of the most demanded fields is the tourist information. Normally, databases that support these systems are maintained manually. However, there is other approach, that is, to extract data automatically, for instance, from textual public information existing in the Web. This approach consists of extracting data from textual sources(public or not) and to serve them totally or partially to the user in the form that he/she wants. The obtained data can maintain automatically databases that support different systems as WAP mobile telephones, or commercial systems accessed by Natural Language Interfaces and others. This process has three main actors. The first is the information itself that is present in a particular context. The second is the information supplier (extracting data from the existing information) and the third is the user or information searcher. This added value chain reuse and give value to existing data even in the case that these data were not tough for the last use by the use of the described technology. The main advantage of this approach is that it makes independent the information source from the information user. This means that the original information belongs to a particular context, not necessarily the context of the user. This paper will describe the application based on this approach developed by the authors in the FLEX EXPRIT IV n$^{\circ}$EP29158 in the Work-package "Knowledge Extraction & Data mining"where the information captured from digital newspapers is extracted and reused in tourist information context.

  • PDF

Discovery of CPA`s Tacit Decision Knowledge Using Fuzzy Modeling

  • Li, Sheng-Tun;Shue, Li-Yen
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.278-282
    • /
    • 2001
  • The discovery of tacit knowledge from domain experts is one of the most exciting challenges in today\`s knowledge management. The nature of decision knowledge in determining the quality a firm\`s short-term liquidity is full of abstraction, ambiguity, and incompleteness, and presents a typical tacit knowledge extraction problem. In dealing with knowledge discovery of this nature, we propose a scheme that integrates both knowledge elicitation and knowledge discovery in the knowledge engineering processes. The knowledge elicitation component applies the Verbal Protocol Analysis to establish industrial cases as the basic knowledge data set. The knowledge discovery component then applies fuzzy clustering to the data set to build a fuzzy knowledge based system, which consists of a set of fuzzy rules representing the decision knowledge, and membership functions of each decision factor for verifying linguistic expression in the rules. The experimental results confirm that the proposed scheme can effectively discover the expert\`s tacit knowledge, and works as a feedback mechanism for human experts to fine-tune the conversion processes of converting tacit knowledge into implicit knowledge.

  • PDF

BERT 모델과 지식 그래프를 활용한 지능형 챗봇 (An Intelligent Chatbot Utilizing BERT Model and Knowledge Graph)

  • 유소엽;정옥란
    • 한국전자거래학회지
    • /
    • 제24권3호
    • /
    • pp.87-98
    • /
    • 2019
  • 인공지능이 활발하게 연구되면서 이미지, 영상, 자연어 처리와 같은 다양한 분야에 적용되고 있다. 특히 자연어 처리 분야는 사람이 말하고 쓰는 언어들을 컴퓨터가 이해할 수 있도록 하기 위한 연구들이 진행되고 있고 인공지능 기술에서 매우 중요한 영역 중 하나로 여겨진다. 자연어 처리에서 컴퓨터에게 사람의 상식을 이해할 수 있도록 학습시키고 사람의 상식을 기반으로 결과를 생성하도록 하는 것은 복잡하지만 중요한 기술이다. 단어들의 관계를 이용해 연결한 지식 그래프는 컴퓨터에게 쉽게 상식을 학습시킬 수 있다는 장점이 있다. 하지만 기존에 고안된 지식 그래프들은 특정 언어나 분야에만 집중해 구성되어 있거나 신조어 등에는 대응하지 못하는 한계점을 갖고 있다. 본 논문에서는 실시간으로 데이터를 수집 및 분석하여 자동으로 확장 가능한 지식 그래프를 구축하고, 이를 기반 데이터로 활용하는 챗봇 시스템을 제안하고자 한다. 특히 자동 확장 그래프에 BERT 기반의 관계 추출 모델을 적용시켜 성능을 향상시키고자 한다. 자동 확장 지식 그래프를 이용해 상식이 학습되어 있는 챗봇을 구축하여 지식 그래프의 활용 가능성과 성능을 검증한다.

Development of Expert Systems using Automatic Knowledge Acquisition and Composite Knowledge Expression Mechanism

  • Kim, Jin-Sung
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.447-450
    • /
    • 2003
  • In this research, we propose an automatic knowledge acquisition and composite knowledge expression mechanism based on machine learning and relational database. Most of traditional approaches to develop a knowledge base and inference engine of expert systems were based on IF-THEN rules, AND-OR graph, Semantic networks, and Frame separately. However, there are some limitations such as automatic knowledge acquisition, complicate knowledge expression, expansibility of knowledge base, speed of inference, and hierarchies among rules. To overcome these limitations, many of researchers tried to develop an automatic knowledge acquisition, composite knowledge expression, and fast inference method. As a result, the adaptability of the expert systems was improved rapidly. Nonetheless, they didn't suggest a hybrid and generalized solution to support the entire process of development of expert systems. Our proposed mechanism has five advantages empirically. First, it could extract the specific domain knowledge from incomplete database based on machine learning algorithm. Second, this mechanism could reduce the number of rules efficiently according to the rule extraction mechanism used in machine learning. Third, our proposed mechanism could expand the knowledge base unlimitedly by using relational database. Fourth, the backward inference engine developed in this study, could manipulate the knowledge base stored in relational database rapidly. Therefore, the speed of inference is faster than traditional text -oriented inference mechanism. Fifth, our composite knowledge expression mechanism could reflect the traditional knowledge expression method such as IF-THEN rules, AND-OR graph, and Relationship matrix simultaneously. To validate the inference ability of our system, a real data set was adopted from a clinical diagnosis classifying the dermatology disease.

  • PDF

BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템 (Korean Contextual Information Extraction System using BERT and Knowledge Graph)

  • 유소엽;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.123-131
    • /
    • 2020
  • 인공지능 기술의 비약적 발전과 함께 사람의 언어를 다루는 자연어 처리 분야 역시 활발하게 연구가 진행되고 있다. 특히 최근에는 구글에서 공개한 언어 모델인 BERT는 대량의 코퍼스를 활용해 미리 학습시킨 모델을 제공함으로써 자연어 처리의 여러 분야에서 좋은 성능을 보이고 있다. BERT에서 다국어 모델을 지원하고 있지만 한국어에 바로 적용했을 때는 한계점이 존재하기 때문에 대량의 한국어 코퍼스를 이용해 학습시킨 모델을 사용해야 한다. 또한 텍스트는 어휘, 문법적인 의미만 담고 있는 것이 아니라 전후 관계, 상황과 같은 문맥적인 의미도 담고 있다. 기존의 자연어 처리 분야에서는 어휘나 문법적인 의미를 중심으로 연구가 주로 이루어졌다. 텍스트에 내재되어 있는 문맥 정보의 정확한 파악은 맥락을 이해하는 데에 있어 중요한 역할을 한다. 단어들의 관계를 이용해 연결한 지식그래프는 컴퓨터에게 쉽게 문맥을 학습시킬 수 있는 장점이 있다. 본 논문에서는 한국어 코퍼스를 이용해 사전 학습된 BERT 모델과 지식 그래프를 이용해 한국어 문맥 정보를 추출하는 시스템을 제안하고자 한다. 텍스트에서 중요한 요소가 되는 인물, 관계, 감정, 공간, 시간 정보를 추출할 수 있는 모델을 구축하고 제안한 시스템을 실험을 통해 검증한다.

상황과 정보 집적도를 고려한 유사도 기반의 맞춤형 지식 생성프레임워크 (Customized Knowledge Creation Framework using Context- and intensity-based Similarity)

  • 손미애;이현정
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.113-125
    • /
    • 2011
  • 정보의 출처와 형식이 다양해지고 정보의 양 또한 많아짐에 따라 소셜 웹에서의 맞춤형 지식 생성은 더욱 어려워지고 있다. RSS(Really Simple Syndication)가 정보 수집 방법의 개선에 일조했으나, 웹에 산재된 정보를 찾아 필요한 정보들만으로 구성된 맞춤형 지식을 생성하는 것은 여전히 사용자들의 몫으로 남아 있다. 본 논문에서는 맞춤형 지식 생성의 용이성을 제고하기 위해 상황 기반 유사도를 이용한 맞춤형 지식생성 프레임워크를 제안하였다. 본 프레임워크는 기본적으로 사례 기반추론의 절차를 따르지만, 기존 사례 기반의 유사도 계산 방식이 문법적 추론에 기반했던 것과 달리, 온톨로지를 활용한 의미적 유사도를 이용한 사례 기반 추론을 활용한다. 또한 사용자 요구를 만족하는 유사사례의 보정을 위해 온톨로지를 활용한 정보 집적도 기반의 유사도 방법론을 제안하였다. 본 프레임워크에서는 첫째 비구조적인 웹 정보를 사례 형태의 구조적 정보로 변환하고, 둘째 사용자의 요구에 적합한 의미론적 유사사례를 찾은 후 셋째, 선택된 유사사례의 정보 집적도를 고려한 보정을 통해 맞춤형 지식을 생성하는 과정을 거친다. 본 논문에서는 유사도 계산에 일반적으로 활용되는 여러 방법론들과 비교를 통하여 제안한 온톨로지 기반 의미적 유사도 계산 방법론의 타당성을 입증하였다.

Knowledge Extraction of Highway Retaining Structure Selection: Characteristics of Knowledge Database

  • Song, Chang Young;Ryoo, Boong Yeol;Lee, Soo Gon
    • Architectural research
    • /
    • 제4권1호
    • /
    • pp.45-52
    • /
    • 2002
  • Selection procedures of earth retention systems are increasingly complex and directly related to the serviceability of the retaining structure selection systems since significant changes in earth retention technology motivates the review of design, and selection processes of earth retaining structures. Collection and classification of retaining structure selection knowledge are key issues because two expert groups, geotechnical and structural engineers, are mainly involved in the retaining structure selection. The course of natural tendency of expert knowledge are investigated considering the decision factors. The decision factors for selecting retaining structures are divided into four categories: application of the structure, and spatial, behavior, and economic constraints.