• 제목/요약/키워드: 지식기반 데이터마이닝

검색결과 47건 처리시간 0.026초

클러스터링 분석에 의한 공간데이터마이닝 방법 (A Spatial Data Mining Method by Clustering Analysis)

  • 손은정;강인수;김태완;이기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.161-163
    • /
    • 1998
  • 지리정보시스템과 같이 방대한 양의 공간데이터를 다루는 응용시스템에서 공간데이터베이스로부터 규칙적인 특성이나, 혹은 관심 있는 지식을 추출해내는 공간데이터마이닝의 역할은 매우 중요하다. 이를 위해 지금까지 이루어진 방법들에는 여러 가지가 있지만 그 중에서 대표적인 방법이 클러스터링으로 이는 단지 기하학적인 거리에 기반을 둔 공간적인 집중성과 분포도를 찾는 데에만 한정되어 있다. 그러나, 공간데이터마이닝을 위해서는 공간클러스터가 형성된 원인을 분석하는 것 또한 필요하다. 따라서 본 연구에서는 공간 클러스터링에서 얻어진 결과를 다른 공간적인 객체와의 연관성을 분석하여 공간적 집중성과 분포도를 유발하는 원인을 찾는 방법을 다룬다. 우선 몇 가지의 거리를 정의하는 것에 의해 클러스터와 공간객체사이의 연관성을 분석하는 방법을 제시하고, 생성된 공간 클러스터가 다수의 공간객체에 영향을 받을 경우, 그 공간 클러스터를 각각 단위클러스터로 분리하는 방법을 제시한다.

인텔리전트마이너를 이용한 텍스트마이닝 시스템의 설계 및 구현 (Design and Implementation of a Text Mining System using Intelligent Miner)

  • 최윤정;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.316-318
    • /
    • 2000
  • 데이터마이닝 기능은 문서의 구조화되지 않은 텍스트보다는 테이블과 일반적인 DB에 있는 구조화된 자료에 초점이 맞춰져 있다. 정보화의 과정속에서 많은 기업이나 조직들은 과거의 시스템을 DB로 구축하여 어느 정도 형태를 갖추게 되었지만, E-business, E-commerce가 활발해지면서 보유하고 있는 DB기반이 아닌 무작위의 새로운 데이터가 사용자들에 의해 생성되기도 한다. 본 논문에서는 이러한 텍스트 문서에 숨어있는 정보들을 발견하기 위한 텍스트마이닝 과정을 시나리오로 설정하고, 문서와 문서집합에 대해 분석도구를 적용하는 어플리케이션을 구현해 보았다. 대규모의 문서집합에 분석도구를 이용함으로써 빠른 문서처리가 가능하고 이는 사용자가 많은 양의 문서들을 다룰 때의 시간비용을 최소화시킬 수 있는 방법이 될 수 있다. 또한 마이닝과정을 통해 발견한 지식과 특징들을 기반으로 반구조화된 파일로 변환하여, 규칙발견, 데이터마이닝기법을 적용하여 의미있는 새로운 결론을 얻을 수 있을 것이다.

  • PDF

Knowledge Extraction from Academic Journals Using Data Mining Techniques

  • 남수현;김홍기
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2005년도 춘계학술대회
    • /
    • pp.531-544
    • /
    • 2005
  • 최근 우리는 인접학문 간 그리고 학계와 산업계 간의 연구협조가 점차 증가하고 있음을 보아오고 있다. 이러한 현상은 특히 학술저널 간 지식의존성을 촉진하는 계기를 제공하고 있다고 할 수 있다. 본 논문의 목적은 관련저널 간 지식상호 의존성을 규명하고 저널지식의 구조화를 위하여 association, 군집화, 링크분석 등 데이터마이닝 기법을 적용하는 방법론을 제시하는 것이다. 제시된 방법을 통하여 기대되는 점들은 1) 논문의 기본속성인 키워드, 저자, 그리고 인용데이터를 통합하는 규칙 집합을 통하여 논문지식검색기능의 향상, 2) 키워드를 기반으로 관련 저널 간 그리고 저널내부의 군집분석으로 지식동향 파악, 3) Kleinberg (1999)의 권위와 허브 개념을 인용데이터 분석에 활용하여 기존의 양적 평가 기준인 영향력 지수 (impact factor)의 문제점을 보완하며, 4) 특정 논문이나 저널의 지식파급과 관련한 영향력을 산출하는 잠재적 지식파급 지수를 제안하는 것이다.

  • PDF

Knowledge Extraction from Academic Journals Using Data Mining Techniques

  • 남수현;김홍기
    • 디지털융복합연구
    • /
    • 제3권1호
    • /
    • pp.75-88
    • /
    • 2005
  • 최근 우리는 인접학문 간 그리고 학계와 산업계간의 연구협조가 점차 증가하고 있음을 보아오고 있다. 이러한 현상은 특히 학술저널 간 지식의존성을 촉진하는 계기를 제공하고 있다고 할 수 있다. 본 논문의 목적은 관련저널 간 지식상호 의존성을 규명하고 저널지식의 구조화를 위하여 연관성 (association), 군집화, 링크분석 등 데이터마이닝 기법을 적용하는 방법론을 제시하는 것이다. 제시된 방법을 통하여 기대되는 점들은 1) 논문의 기본 속성인 키워드, 저자, 그리고 인용데이터를 통합하는 규칙 집합을 통하여 논문지식검색기능의 향상, 2) 키워드를 기반으로 관련 저널 간 그리고 저널내부의 군집분석으로 지식동향 파악, 3) Kleinberg (1999)의 권위와 허브 개념을 인용데이터 분석에 활용하여 기존의 양적 평가 기준인 영향력지수 (impact factor)의 문제점을 보완하며, 4) 특정 논문이나 저널의 지식파급과 관련한 영향력을 산출하는 잠재적 지식파급 지수를 제안하는 것이다.

  • PDF

다중 에이전트 기반 지식 탐사 및 문제 해결 프레임워크 (Multi-Agent Knowledge Discovery and Problem Solving Framework)

  • 강성희;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.101-103
    • /
    • 1999
  • Decentralized 정보는 여러 도메인에 대한 heterogeneous한 독립적인 정보가 자율적으로 존재하며 이들 정보간의 관계성의 고려한 전체에 대한 global view가 존재하지 않기 때문에 inter-domain에 대한 마이닝을 수행하는데 어려움이 있다. 본 연구에서는 intra-domain knowledge discovery, intra 및 inter-domain problem solving method라는 접근방법으로, decentralized 데이터 환경에서 문제 해결에 필요한 정보 추출을 위한 데이터 tailoring과 분산 데이터에 대한 목표-지향 데이터마이닝(goal-oriented data-mining)을 통해 문제 해결을 위해 필요한 지식을 생성하고 이들 간의 관련 정보를 탐색하여 문제를 해결하는 프레임워크를 제안한다. 특히, 생성된 지식간의 협동 문제 처리를 멀티 에이전트 패러다임을 이용하기로 한다. 제안 프레임워크는 산재되어 있는 데이터들로부터 문제 해결에 유용한 지식 차원의 정보를 추출해내고 생성된 지식을 바탕으로 각 도메인 정보에 대한 개별적인 사용뿐 만 아니라 서로 cooperation을 통한 문제 해결을 지원함으로써, 개방된 분산 환경하에 decentralized 되어 있는 여러 도메인 정보를 보다 효율적으로 활용할 수 있는 새로운 형태의 문제 해결 방법이라고 할 수 있다.

  • PDF

다각도 정보융합 방법을 이용한 지능형 에이전트 시스템 (An Intelligent Agent System using Multi-View Information Fusion)

  • 이현숙
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.11-19
    • /
    • 2014
  • 본 논문에서는 데이터마이닝모듈과 정보융합모듈을 핵심구성요소로 가지는 지능형에이전트 시스템을 설계하고 다각도 정보를 융합하여 진단전문가시스템으로 활용할 수 있는 가능성을 제시한다. 데이터마이닝모듈에서는 퍼지신경망 OFUN-NET에 의하여 다각도의 데이터를 분석하고 퍼지 클러스터 정보를 지식베이스로 구축한다. 정보융합모듈과 응용모듈에서는 가능성정도로 제공되는 진단결과와 불확실 결정상태나 비대칭의 발견과 같은 전문가의 진단에 유용한 정보를 제공해 주고 있다. 또한 DDSM 벤치마크 데이터베이스로부터 획득한 디지털 유방 x선 영상의 BI-RADS 기반 특징데이터를 가지고 실험한 결과는 기존의 방법보다 높은 분류 정확도를 보여주면서 컴퓨터보조진단시스템으로서의 가능성을 보여주고 있다.

제조업분야의 고객 성향 및 추이 분석 (Analysis of Customer Behavior and Trend of Manufacture)

  • 이병엽;임승빈;박용훈;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제9권6호
    • /
    • pp.336-343
    • /
    • 2009
  • 최근 기업은 업무의 효율적 수행을 위해 데이터베이스를 사용하고, 저장된 데이터베이스의 데이터로부터 분석을 통해 행동 패턴을 추출해내어 그 결과를 마케팅과 생산의 효율성 증대를 위해 데이터마이닝을 많이 사용한다. 데이터마이닝을 통해 얻어진 지식의 활용은 기업 활동을 정비하고 활동방향을 제시하며 의사결정의 순간에 기반 자료로 활용될 수 있는 부가적 경쟁력이라 할 수 있다. 본 논문에서는 제조업체의 실제 데이터를 가지고 데이터마이닝 방법론을 이용하여 기존고객의 등급 및 소비행위 파악을 위한 예측모델을 설계한다. 이를 통해 고객의 등급 및 소비행위를 파악하여 이를 마케팅까지 연결, 수익을 창출하고, 기업의 브랜드 가치를 향상시키는데 목적이 있다.

시간 속성을 갖는 이벤트의 의미있는 희소 관계에 기반한 연관 규칙 탐사 (Finding Association Rules based on the Significant Rare Relation of Events with Time Attribute)

  • 한대영;김대인;김재인;송명진;황부현
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.691-700
    • /
    • 2009
  • 이벤트는 환자의 증상과 같이 시간 속성을 갖는 하나의 흐름을 의미하며 인터벌 이벤트는 시작과 종료 시점에 대한 시간 간격을 갖는다. 그리고 시간 데이터마이닝에 대한 많은 연구가 있었지만 환자 이력, 구매자 이력, 로그 이력과 같은 인터벌 이벤트에 대한 지식 탐사 방법에 대한 연구는 미흡하다. 이 논문에서는 이벤트들의 인과 관계에 대한 연관 규칙을 탐사하고 이 규칙에 기반하여 결과 이벤트 발생을 예측하는 시간 데이터마이닝 방법을 제안한다. 제안 방법은 이벤트 시간 속성을 사용하여 인터벌 이벤트로 요약하고 이벤트들의 인과 관계를 탐사하여 이벤트 발생을 예측한다. 성능평가를 통하여 제안 방법은 다양한 지지도를 적용하여 발생 빈도에 상관없이 이벤트 발생에 높은 영향을 주는 의미있는 희소 관계를 발견함으로써 기존의 데이터마이닝 기법에 비하여 보다 우수한 정보를 탐사할 수 있다.

PHR 기반 개인 맞춤형 건강정보 탐사 알고리즘 설계 (Design of knowledge search algorithm for PHR based personalized health information system)

  • 신문선
    • 디지털융복합연구
    • /
    • 제15권4호
    • /
    • pp.191-198
    • /
    • 2017
  • PHR(Personal Health Record)기반 헬스케어 서비스 플랫폼 지능화를 위해서는 사용자 맞춤형 건강정보 제공서비스가 필요하다. 본 논문에서는 개인 맞춤형 건강정보 추천을 위해서 온톨로지 기반 건강 정보 모델을 제안하였다. 또한 기계학습과 데이터마이닝 기법을 적용한 유사 건강정보 탐사 알고리즘을 설계하였다. 기존의 데이터마이닝 기법중 연관규칙 알고리즘을 확장하여 속성을 기반으로 연관규칙 탐사를 수행하여 지식탐사의 연관성을 높이고 효율적인 탐사시간을 제공할 수 있도록 하였다. 머신러닝의 한 기법인 K근접이웃 알고리즘을 적용하여 사용자 프로파일별 그룹화를 수행하고 유사패턴의 사용자 프로파일을 검색할 수 있도록 하였다. 이는 사용자의 질환과 건강상태에 따른 맞춤형 건강정보 탐사 수행의 효율성을 높인다. 제안된 알고리즘은 개인 맞춤형 헬스케어 서비스 플랫폼에서 추론과정에 적용되어 사용자에게 개인맞춤형건강정보를 추천하는 것을 가능하게 한다. 이는 고령화사회에서 스마트한 자가 건강관리에 활용될 수 있다.

DEA 와 SVM 을 통합한 IT 벤처기업의 효율성 평가

  • 홍태호;박지영
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.800-806
    • /
    • 2007
  • IT 벤처기업은 자본 대비 높은 수익성을 가지므로 지식기반 산업환경에서 많은 투자자들의 집중적인 관심을 받고 있다. 이러한 IT 벤처기업의 효율성을 평가하기 위한 방안으로, DEA 와 데이터마이닝 기법을 통합하는 방안을 제시하였다. 국내 코스닥 상장 기업 가운데 IT 에 주력하고 있는 벤처기업들을 대상으로 본 연구에서 제시한 효율성 평가방법을 적용 하였다. 대표적인 비모수적 분석기법인 Data Envelopment Analysis(DEA)를 이용하여 연구대상 기업들을 효율기업 및 비효율기업으로 구분한 후, DEA 의 효율성을 설명하는 모형을 logit 을 이용하여 구축하였다. DEA 는 기업의 상대적인 효율성을 측정하는 데에서 우수하지만, 효율성 정도를 설명하는 모형의 구축에는 한계가 있다. 이를 보완한 DEA 의 결과를 logit 과 통합한 효율성 모형에 대해서 데이터 마이닝 기법인 logit, 판별분석, Support Vector Machine(SVM) 등을 적용하여 IT 벤처기업의 효율성을 사전에 예측하여 평가 및 투자에 활용할 수 있는 방안을 제시하였다.

  • PDF