• 제목/요약/키워드: 기존지식 베이스

검색결과 205건 처리시간 0.029초

Apriori알고리즘에 의한 연관 단어 지식 베이스에 기반한 가중치가 부여된 베이지만 자동 문서 분류 (Weighted Bayesian Automatic Document Categorization Based on Association Word Knowledge Base by Apriori Algorithm)

  • 고수정;이정현
    • 한국멀티미디어학회논문지
    • /
    • 제4권2호
    • /
    • pp.171-181
    • /
    • 2001
  • 기존의 베이지만 문서 분류를 위한 단어 군집 방법은 많은 시간과 노력을 요구하며, 단어 간의 의미 관계를 정확하게 반영하지 못하는 문제점이 있다. 본 논문에서는 마이닝 기법으로 구축된 연관 단어 지식 베이스를 기반으로 하는 베이지안 문서 분류 방법을 제안한다. 제안된 베이지안 문서 분류 방법은 문서를 분류하기 전에 훈련 문서를 사용하여 가중치가 부여된 연관 단어 지 식 베이스를 구축한다. 그 다음으로, 베이지안 확률을 이용하는 분류자는 구축된 연관 단어 지식 베이스를 기반으로 문서를 클래스별로 분류한다. 제안된 방법의 성능을 평가하기 위해, 상호 정보 계산에 의한 단어 사전을 이유한 가중치가 부여된 베이지안 문서 분류 방법, 가중치가 부여된 베이지안 분류 방법, 기존의 단순 베이지안 분류 방법과 비교하였다. 그 결과, 연관 단어 지식 베이스에 기반한 가중치가 부여된 베이지안 분류 방법이 상호 정보에 의한 단어 사진을 이용하는 가중치가 부여된 베이지안 분류 방법보다는 0.87%, 가중치가 부여된 베이지안 분류 방법보다는 2.77%, 단순 베이지안 방법보다는 5.97% 높은 성능 차이를 보였다.

  • PDF

특정 영역 정보 에이전트의 지식베이스 확장을 위한 웹 정보추출 (Web Information Extraction for Expanding Knowledge Base of a Specific Domain Information Agent)

  • 조은휘;변영태
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.336-341
    • /
    • 2002
  • 현재 연구개발 중인 웹 정보 에이전트는 Agent Manager와 KB Manager. Web Manager로 구성되어 있다. 이 시스템은 동물영역에 관련된 정보를 영어로 서비스하고 있어 국내 접근보다는 외국에서의 접근이 더 많았다. 그러므로 국내 사용을 높이기 위해 애완용 동물을 위주로 한 정보추출(IE)을 수행하여 지식베이스(KB)의 확장을 시도하고 있다. 이를 위하여 태그(tag) 및 심볼(symbol)의 패턴(pattern) 유사성 정보를 찾아내고, 기존 KB와 연계하여 KB의 확장 및 수정에 이용하기 위한 유효 정보 패턴 결정에 활용함으로써 정보 추출의 새로운 방법을 고찰하고 그 가능성을 제시하고자 한다.

  • PDF

딥러닝과 정보검색을 결합한 질의응답 시스템 (Question Answering System that Combines Deep Learning and Information Retrieval)

  • 이현구;김학수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.134-138
    • /
    • 2016
  • 정보의 양이 빠르게 증가함으로 인해 필요한 정보만을 효율적으로 얻기 위한 질의응답 시스템의 중요도가 늘어나고 있다. 그 중에서도 질의 문장에서 주어와 관계를 추출하여 정답을 찾는 지식베이스 기반 질의응답 시스템이 활발히 연구되고 있다. 그러나 기존 지식베이스 기반 질의응답 시스템은 하나의 질의 문장만을 사용하므로 정보가 부족한 단점이 있다. 본 논문에서는 이러한 단점을 해결하고자 정보검색을 통해 질의와 유사한 문장을 찾고 Recurrent Neural Encoder-Decoder에 검색된 문장과 질의를 함께 활용하여 주어와 관계를 찾는 모델을 제안한다. bAbI SimpleQuestions v2 데이터를 이용한 실험에서 제안 모델은 질의만 사용하여 주어와 관계를 찾는 모델보다 좋은 성능(정확도 주어:33.2%, 관계:56.4%)을 보였다.

  • PDF

유사어 사전을 이용한 자동범주화 모델 개발 (Automatic Text Categorization Model by Synonym Dictionary)

  • 김규환;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.167-172
    • /
    • 2004
  • 기존의 문서분류는 학습문서에 출현하는 자질에 대해 가중치를 계산하여 그 순위에 따라 상위 자질로 구성된 지식베이스를 사용하였다. 그리고 새로운 문서가 들어왔을 때 자질 지식베이스를 근거로 새 문서를 색인하였다. 결국 자질 지식베이스와 정확히 일치하지 않는 키워드는 색인대상에서 제외되는 문제가 있었다. 본 고에서는 이 문제를 해결하기 위하여 분류될 문서의 특징을 나타내는 범주별 자질과 유사한의미를 가지나 형태가 변형되어 기술된 단어에 대하여 유사어 사전을 구축하였으며 이를 통해 새로운 문서가 범주에 할당될 가능성을 높여 자동 문서 범주화 시스템의 성능을 향상시키고자 한다.

  • PDF

협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘 (Effective User Clustering Algorithm for Collaborative Filtering System)

  • 고수정;임기욱;이정현
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.144-154
    • /
    • 2001
  • 협력적 여과 시스템은 사용자가 검색하고 읽었던 웹문서를 기반으로 사용자 군집을 생성하여 웹문서의 정확한 추천을 가능하게 한다. 이러한 목적으로 설계된 다양한 알고리즘이 있으나 속도가 느리거나 정확도가 낮다는 등의 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘인 CUG알고리즘은 사용자 군집을 생성하기 위해 Apriori 알고리즘, Native Bayes 알고리즘을 이용한다. Apriori 알고리즘은 연관 단어 지식 베이스를 구축하고, Native Bayes 알고리즘은 구축된 연관 단어 지식 베이스에 가중치를 추가하며, 사용자가 검색하여 읽은 웹문서를 클래스별로 분류한다. CUG 알고리즘은 분류된 웹문서를 기반으로 하여 사용자 군집을 만든다. 이러한 방법으로 설계된 CUG 알고리즘은 사용자들이 사용할 문서를 미리 검색하여 저장함에 의해 정보검색의 효율성을 향상시키는데 사용될 수 있다. 본 논문에서 설계한 CUG 알고리즘의 선능을 평가하기 위하여 기존의 K-means 방법과 Gibbs샘플링 방법에 의한 군집과 비교한다.

  • PDF

딥러닝과 정보검색을 결합한 질의응답 시스템 (Question Answering System that Combines Deep Learning and Information Retrieval)

  • 이현구;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.134-138
    • /
    • 2016
  • 정보의 양이 빠르게 증가함으로 인해 필요한 정보만을 효율적으로 얻기 위한 질의응답 시스템의 중요도가 늘어나고 있다. 그 중에서도 질의 문장에서 주어와 관계를 추출하여 정답을 찾는 지식베이스 기반 질의응답 시스템이 활발히 연구되고 있다. 그러나 기존 지식베이스 기반 질의응답 시스템은 하나의 질의 문장만을 사용하므로 정보가 부족한 단점이 있다. 본 논문에서는 이러한 단점을 해결하고자 정보검색을 통해 질의와 유사한 문장을 찾고 Recurrent Neural Encoder-Decoder에 검색된 문장과 질의를 함께 활용하여 주어와 관계를 찾는 모델을 제안한다. bAbI SimpleQuestions v2 데이터를 이용한 실험에서 제안 모델은 질의만 사용하여 주어와 관계를 찾는 모델보다 좋은 성능(정확도 주어:33.2%, 관계:56.4%)을 보였다.

  • PDF

전자상거래 머천트 시스템에서의 원투원 마케팅을 위한 데이터마이닝 시스템의 설계 및 구현 (Design and Implementation of A Data Mining System for One-to-One Marketing in EC Merchant Systems)

  • 김종달;홍정희;김성민;남도원;이동하;김성훈;이전영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.117-119
    • /
    • 1999
  • 전자상거래에서 판매 실적을 높이기 위한 효과적인 방법의 하나는 사용자에 따라 개별화된 정보의 제공, 즉 원투원 마케팅의 개념을 도입하는 것이다. 이를 위해서는 사용자의 구매 성향이나 사용자의 특성에 대한 지식베이스가 있어야 한다. 이러한 지식베이스로 데이터마이닝 기법중의 하나인 연관규칙을 도입하였다. 본 논문에서는 연관규칙을 기본 연산으로 하는 데이터마이닝 시스템의 설계와 구현을 기술하였다. 사용자와 제품간의 연관규칙을 추출하여 동적으로 제공되는 웹 문서를 생성하는데 필요한 지식베이스를 구축하였다. 또한 구축된 데이터마이닝 시스템은 연관규칙 탐사 엔진과 개념 계층 관리기로 구성되어 있으며, 대용량의 데이터를 다루기 위해 기존의 방법과는 다른 파일을 기반으로 한 빈번항목집합 인덱싱 기법을 제시하였다.

  • PDF

지식 Life-Cycle을 기반으로 한 지식 관리 시스템 구조 연구 (The Study of Knowledge management system architecture based on a life-cycle of knowledge)

  • 이종국;송희경;한관희
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.75-84
    • /
    • 1999
  • 본 논문에서는 지식에 대한 개념을 정의하기 보다 지식의 life-cycle을 통한 지식의 생성과 소멸을 모델화함으로 지식을 설명하려 한다. 본 논문은 노나카의 지식 창조 모델을 기반으로 하고 기존의 KMS들을 분석하여 일반적인 지식 life-cycle 모델을 도출하였으며, 기존 모델의 문제점을 보완하여 새로운 지식 life-cycle 모델을 만들었다. 이 모델과 앞으로의 지식관리 시스템 발전 방향을 고려하여 지식 관리 시스템 아키텍쳐를 제시하였다. 본 논문에서는 이 아키텍쳐를 근거로 지식 관리 시스템을 구현하기 위한 6개의 컴포넌트를 도출하였다 6개의 컴포넌트는 지식 생성, 지식 분배, 지식 측정, 지식연결, 지식 검색, 지식 저장이다. 이 컴포넌트들로 지식 관리 시스템의 prototype을 구현해 본 결과 지식life-cycle을 단계적, 부분적으로 지원하지만 부족한 부분이 있는 것을 발견하였다. 향후에는 지식 생성과 지식 연결 컴포넌트를 강화하여 전체적인 지식 life-cycle을 지원할 예정이다.

  • PDF

냉방기 설계를 위한 전문가시스템 (An Expert System for Air-conditioner Design)

  • 김상호;명세현;한순홍
    • 지능정보연구
    • /
    • 제3권1호
    • /
    • pp.83-99
    • /
    • 1997
  • 냉방기인 에어컨디셔너에 대해 기존의 설계방법과 지식, 그리고 경험을 체계화하고, 설계 제한 조건에 따른 최적설계 기법을 도입한 전문가시스템을 구현한다면, 적은 데이터 입력으로 주어진 설계 조건에서의 최적 해를 시간 낭비 없이 얻을수 있고, 설계자 간의 설게 능력 차이에 의한 상이한 결과도 해소할 수 있으므로 경제적인 설계가 중심에서 전문가시스템 중심으로 축적되는 것이 가능해져, 설계자의 이동에 따른 설계 지식의 누수를 방지할 수 있고, 설계 지식이 별도의 지식베이스에 구축되어 있으므로 보수 관리도 용이하게 되어 설계 지식의 지속적인 발전과 집적을 도모할 수 있다. 현장에서 사용중인 에어컨 설계용 소프트웨어를 기초로 실제 실무에서 접할 수 있는 설계 제약 조건에 대해서, 최적설계 기법의 적용과 지식베이스 구축을 통해 경제적인 설계가 가능한 설계 전문가시스템을 개발하였다.

  • PDF

규칙기반의 전문가 시스템 개발 도구에 관한 연구 (Focused on the Adminstration of Student Affairs)

  • 곽훈성;황병하
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.329-347
    • /
    • 1992
  • 본 논문은 교육 분야인 대학교 학사 업무를 중심으로 지식베이스 구축을 위한 개발 도구를 개인용 컴퓨터상에 구현한 결과에 관한 것이다.자문 전문가 시스템 구성은 추론엔진,지식베이스,사용자 인터페이스등으로 구성되는 기존의 전형적인 규칙기반 전문가 시스템에 근간을 두어 객체지향 추론을 가능케하는 추론 관리 시스템,다양한 인터페이스를 제공하는 사용자 인터페이스 관리 시스템, 지식의 효율적인 관리 및 지식을 취득할 수 있는 지식관리 시스템으로 독립구성하고 이들 시스템들의 효율적인 관리를 위한 객체 관리 시스템을 구성한다. 이 시스템의 설계는 사용자 입장들이 다양한 관점에서 전문가의 자문을 받을수 있고,사용자의 접근이 용이한 개인용 컴퓨터상에서 운용될 수 있도록 자문 전문가 시스템인 C-I(Consultant-One)을 개발하였다. 기존의 지식을 충분히 황룡할 수있고,효율적인 추론과 사용자에게 편리한 인터페이슬 제공하도록 하는 C-I에 대학교 학사관리 업무중 시간표 관리,교과과정 및 학점이수,성격진단의 세가지 영역에 해당하는 지식베이스를 구축한 '학사관리 업무를 위한 규칙 기반의 자문 전문적 시스템(Student affair Administration Consultation Expert System:SACES')을 구현하였다.