• 제목/요약/키워드: 연관지식

검색결과 607건 처리시간 0.032초

웹 도큐먼트 기반 연관 지식 추출 기법 : 생명정보분야에의 적용 (Web Document-based Associate Knowledge Extraction Method : Applying to Bioinformatics)

  • 문현정;김교정
    • 인터넷정보학회논문지
    • /
    • 제2권5호
    • /
    • pp.9-19
    • /
    • 2001
  • 본 논문에서는 웹 도큐먼트로부터 사용자의 관심과 선호도를 반영하는 지식을 자동으로 확장 탐색하고 추출하기 위한 연관지식 추출 기법을 제시한다. 사용자의 학습의도를 내포한 중심어와 연관된 정보를 예제 도큐먼트로부터 탐색 추출하기 위하여 연관 규칙 탐색 데이터 마이닝 기법을 웹 도큐먼트상의 연관 객체 추출에 적용한다. 또한 추출된 연관 정보들의 가중치 부여를 위하여 연관 태그 블록 기반 가중치 기법을 제시한다. 본 논문에서 제시된 연관 지식 추출 기법을 생명정보학 분야에 적용하여 의미적으로 연관성 있는 지식 추출 실험을 수행한 결과 매우 높은 정확성을 보이는 것으로 나타났다.

  • PDF

지식 간 내용적 연관성 파악 기법의 지식 서비스 관리 접목을 위한 정량적/정성적 고려사항 검토 (Quantitative and Qualitative Considerations to Apply Methods for Identifying Content Relevance between Knowledge Into Managing Knowledge Service)

  • 유기동
    • 한국전자거래학회지
    • /
    • 제26권3호
    • /
    • pp.119-132
    • /
    • 2021
  • 내용적 연관성에 기반한 연관지식의 파악은 핵심 지식에 대한 서비스와 보안의 기본적인 기능이다. 본 연구는 내용적 연관성을 기준으로 연관지식을 파악하는 기존의 방식, 즉 키워드 기반 방식과 워드임베딩 방식의 연관문서 네트워크 구성 성능을 비교하여 어떤 방식이 정량적/정성적 측면에서 우월한 성능을 나타내는가를 검토한다. 검토 결과 키워드 기반 방식은 핵심 문서 파악 능력과 시맨틱 정보 표현 능력 면에서 우월한 성능을, 워드임베딩 방식은 F1-Score와 Accuracy, 연관성 강도 표현 능력, 대량 문서 처리 능력 면에서 우월한 성능을 나타냈다. 본 연구의 결과는 기업과 사용자의 요구를 반영하여 보다 현실적인 연관지식 서비스 관리에 활용될 수 있다.

계층형 및 네트워크형 지식지도의 사용자 관점 성능 비교 (User-oriented Performance Comparison between Hierarchical and Networked Knowledge)

  • 장기태;유기동
    • 지식경영연구
    • /
    • 제22권3호
    • /
    • pp.75-89
    • /
    • 2021
  • 지식지도는 상호참조적 네비게이션 방식의 지식 탐색, 즉 내용적 연관성을 갖는 연관지식에 대한 교차적이고 순차적인 검색 및 조회를 지원할 수 있어야 한다. 본 연구는 계층형 및 네트워크형 지식지도 중 어떤 유형의 지식지도가 문제 풀이에 필요한 지식 탐색을 지원하는 데에 우월한 성능을 나타내는가를 사용자 관점에서 규명하는 테스트를 수행한다. 테스트 결과, 정답률을 이용하여 파악한 효과성과 문제 풀이 완료시간 및 참고 문서 수를 이용하여 파악한 효율성 모두 네트워크형 지식지도가 우월한 성능을 보임이 확인되었다. 본 연구에서 규명한 네트워크형 지식지도를 이용한 지식 검색 및 조회 방식의 우월성은 보다 사용자 친화적이고 합리적인 지식서비스 개발에 응용될 수 있다.

지식 간 내용적 연관성을 표현하는 키워드 기반 네트워크형 지식지도 개발 (Keyword-based networked knowledge map expressing content relevance between knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.119-134
    • /
    • 2018
  • 저장 및 관리하는 지식의 분류체계로서의 의미를 갖는 지식지도는, 문제해결을 위하여 지식을 조회 및 선택하는 사용자의 활동을 지원하고 보완할 수 있는 구조를 갖추어야 한다. 계층형 구조를 갖는 기존의 지식지도는, 관리하는 지식을 체계적으로 정리하는 데에는 이점이 있으나, 지식 사용자가 갖는 인지 및 활용의 논리를 반영하지 못할 뿐만 아니라 지식을 조회 및 추출하는 사용자의 활동을 지원하지 못한다. 본 연구는, 내용적 관련성을 갖는 연관지식을 연쇄적으로 조회 및 추출하는 사용자의 지식활용 패턴을 반영하는, 키워드 기반 네트워크형 지식지도를 구축하는 방법론을 제시한다. 즉, 지식 간 내용적 연관성을 파악하기 위하여 키워드를 추출하고 공통된 키워드를 갖는 지식 간 링크를 해당 키워드를 이용하여 정의한다. 키워드는 해당 지식의 내용을 대변하므로, 키워드를 기반으로 정의된 링크는 내용적으로 관련성이 있는 지식 간에 형성되며, 이를 종합하면 내용적 연관성을 지식 간의 네트워크, 즉 네트워크형 지식지도가 완성된다. 제시된 방법론의 적용 타당성을 검토하기 위해 50개의 연구논문을 이용하여 이들 간의 내용적 연관성을 표현하는 네트워크형 지식지도를 구현하였으며, 검토 결과 만족할만한 수준의 정밀도와 재현율을 보였다.

Apriori-Genetic 알고리즘을 이용한 베이지안 자동 문서 분류 (Bayesian Automatic Document Categorization Using Apriori-Genetic Algorithm)

  • 고수정;이정현
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.251-260
    • /
    • 2001
  • 기존의 베이지안 문서 분류는 문서의 특징 표현에 있어서 단어간의 의미를 정확하게 반영하지 못하는 문제점이 있다. 이러한 문제점을 해결하기 위해, 본 논문에서는 Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류 방법을 제안한다. Apriori 알고리즘은 단어간의 의미를 반영한 연관 단어의 형태로 문서의 특징을 추출하며 추출된 연관 단어로 연관 단어 지식베이스를 구축한다. Aprrori 알고리즘만으로 연관 단어 지식베이스를 구축할 경우, 지식베이스 안에 부적당한 연관 단어가 포함된다. 따라서 문서 분류의 정확도가 낮아지는 단점이 있다. 이러한 단점을 보완하기 위해, Genetic 알고리즘을 이용하여 연관 단어 지식베이스를 최적화하는 방법을 사용한다. 베이지안 확률을 이용하는 분류자는 최적화된 연관 단어 지식베이스를 기반으로 문서를 클래스별로 분류한다. Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류의 성능을 평가하기 위해, Apriori 알고리즘을 이용한 베이지안 문서 분류 방법, 역문헌빈도를 사용한 베이지안 문서 분류 방법, 기존의 단순 베이지안 분류 방법과 비교하였다.

  • PDF

연역적 유전자 알고리즘을 이용한 연관 단어 지식베이스의 최적화 (Optimization of Associative Word Knowledge Base using Apriori-Genetic Algorithm)

  • 고수정;최준혁;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권8호
    • /
    • pp.560-569
    • /
    • 2001
  • 지식 기반 정보검색 시스템에서의 질의 확장은 단어간의 의미 관계를 고려한 지식베이스를 필요로 한다. 기존의 단순 마이닝 기법은 사용자의 선호도를 고려하지 않은 채 연관 단어를 추출하므로 재현율은 향상되나 정확도는 저하된다. 본 논문에서는 단어간의 의미 관게를 고려한 연관 단어 중에서 사용자가 선호하는 연관 단어만을 포함하는 정확도가 향상된 최적화된 연관 단어 지식베이스 구축을 위한 방법을 제안한다. 이를 위해 컴퓨터 분야의 웹문서를 8개의 클래스로 분류하고, 각 클래스별 웹문서에서 명사를 추출한다. 추출된 명사를 대상으로 Apriori 알고리즘을 이용하여 연관 단어를 추출하고, 유전자 알고리즘을 이용하여 사용자가 선호하지 않은 연관 단어를 지식베이스의 구축 대상에서 제외시킨다. 본 논문에서 제안된 Apriori 알고리즘과 유전자 알고리즘의 성능을 평가하기 위하여 Apriori 알고리즘은 상호 정보량과 Rocchio 알고리즘과 비교하며, 유전자 알고리즘은 TF.IDF를 이용한 단어 정제 방법과 비교한다.

  • PDF

데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

데이터 웨어하우스 환경에서의 설명기반 데이터 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터 마이닝 기법들이 연구되어왔다. 특히 데이터 웨어하우스의 등장은 이러한 데이터 마이닝에 있어 필요한 데이터 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성 없는(trivial, spurious and irrelevant)내용만 무수히 쏟아낼 수 있다. 그러므로 데이터 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라도 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문에서는 데이터 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이터 웨어하우스로부터 연관규칙을 검증하는 일련의 아텍쳐(architecture)를 제시하고다 한다. 먼저 데이터 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이터 웨어하우스와 데이터 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이터 웨어하우스으 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기위한 지식표현 방법으로 Relational Predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이터 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 도메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이터 마이닝 접근을 제시하였다는데 있다.

  • PDF

연관지식의 효율적인 표현 및 추론이 가능한 지식그래프 기반 지식지도 (Knowledge graph-based knowledge map for efficient expression and inference of associated knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.49-71
    • /
    • 2021
  • 문제해결을 위해 지식을 활용하는 사용자는 내용 면에서 관련된 또 다른 지식, 즉 연관지식에 대한 교차적이고 순차적인 탐색을 진행한다. 지식지도는 관리하는 지식의 현황을 보여주는 도식이자 지식저장소의 분류체계로서, 지식 간 연관성에 기반한 사용자의 지식 탐색을 지원하는 도구이다. 따라서 지식지도는 지식 간 연관성에 의한 네트워크 형식으로 표현되며, 이를 정의 및 추론하는 데에 최적화된 기술을 접목하여 구현되어야 한다. 이를 위해 본 연구는 관리하는 개체와 개체 간 관계를 표현 및 추론하는 데에 최적화된 기능성을 발휘하는 것으로 알려진 그래프DB를 이용하여 지식그래프 기반 지식지도를 개발하는 방법론을 제시한다. 제시된 방법론의 유효성을 확인하기 위하여, 선행 연구의 온톨로지 기반 지식지도 구축 사례 데이터를 그래프DB에 적용하여 지식그래프 기반 지식지도를 구현하고, 구현된 지식 네트워크의 유효성과 Class 자동 구성 능력을 선행 연구의 결과와 비교하는 성능 테스트를 진행한다. 성능 테스트 결과, 본 연구의 지식그래프 기반 지식지도는 선행 연구의 온톨로지 기반 지식지도와 동일한 수준의 성능을 나타냈으며, 지식 및 지식 간 관계 정의 및 추론을 더욱 효율적으로 진행할 수 있음을 확인하였다. 본 연구의 결과는 연관지식에 대한 사용자의 인지과정을 반영한 지식 탐색 기능의 구현에 활용될 수 있으며, 추론에 의한 새로운 연관지식의 발견을 통해 자율적으로 확장되는 지능적 지식베이스의 개발에 응용될 수 있다.

데이터웨어하우스 환경에서의 설명기반 데이터마이닝 (Explanation-Based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 지능정보연구
    • /
    • 제5권2호
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF