• 제목/요약/키워드: Knowledge Mining

검색결과 580건 처리시간 0.023초

Data Mining Techniques for Medical Informatics: Application to SNP Analysis

  • 천세학;김진;박윤주;함기백;천세철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.258-263
    • /
    • 2005
  • Haplotype-based analysis using high-density SNP markers have gained a great attention in evaluating genes in gene analysis and various clinical situations. However, there has been no research on disease diagnostic modeling based on SNPs analysis to our knowledge. The purpose of this study is to explore how knowledge discovery techniques are applied in medical informatics area and proposes a Case Based Reasoning (CBR) technique for diagnosis of gastric caner using Single Nucleotide Polymorphism(SNP).

  • PDF

Data Mining 기법을 활용한 디자인 지식경영 시스템 구축 (The Development of Design Knowledge Management System Using Data Mining)

  • 양종열;오민권;최경은
    • 디자인학연구
    • /
    • 제16권2호
    • /
    • pp.281-290
    • /
    • 2003
  • 오늘날과 같은 지식정보화 시대에는 자료 및 정보에서 창출된 지식을 어떻게 경영하고 관리하느냐에 의해 개인, 기업, 국가의 경쟁력이 평가된다고 해도 과언이 아닐 것이다. 지식경영 의 중요성 및 필요성이 부각되면서 디자인분야에서도 디자인 관련 지식을 창출하고 적용한 후 그 효용가치를 평가하려는 연구가 이루어져 왔다. 이들 선행연구들은 지식창출을 위해 이용되는 기초자료가 무엇이냐에 따라 CRM분야와 온라인 통계 조사분야 그리고 eCRM 분야로 구분할 수 있다. 그러나 이들 연구에서는 개별분야에서의 지식을 창출할 수 있다는 측면에서는 의미가 있지만 디자이너가 실무에 직접적으로 적용 할 수 있는 디자인 지식을 창출할 수 있다고 하기에는 다소 무리가 따른다. 왜냐하면 디자인관련 고객은 CRM분야의 기존 오프라인에서의 고객의 선호행위, 통계조사부분의 각종 디자인 요소에 대한 통계적 설문조사 결과 그리고 eCRM분야의 시공을 초월한 불특정 다수의 소비행태 및 선호패턴에 이르기까지 통합적인 형태의 지식이 요구되기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위해 CRM, 통계조사, eCRM부분을 통합적으로 적용한 웹기반의 디자인 지식관리 솔루션을 제안하였다. 솔루션에서 제공되는 다양한 정보는 디자인관련 기업과 연구소 등의 실무 디자이너에게 고객위주 디자인을 생성하는데 필요한 잠재적 지식을 창출하는데 많은 도움을 줄 것으로 기대된다.

  • PDF

인간 지식을 이용한 경험적 의사결정트리의 설계 (Design of Heuristic Decision Tree (HDT) Using Human Knowledge)

  • 윤태복;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.525-531
    • /
    • 2009
  • 데이터 마이닝(Data Mining)은 수집된 데이터로 부터 감춰진 패턴을 찾는 작업이다. 여기에서 수집된 데이터는 예측 및 추천을 위한 기반 정보로 중요한 역할을 하며, 분석 결과의 성능을 향상시키기 위해 잘못된(Missing value) 데이터를 선별하는 과정을 필요로 한다. 수집한 데이터에서 의도하지 못한 데이터를 선별하기 위한 기존의 방법은 주로 통계적이거나 단순 거리(Distance)에 기반을 둔 방법을 이용하였다. 하지만 환경 및 데이터의 특성을 고려하지 못하여, 의미 있는 데이터도 함께 분석에서 제외 될 수 있는 문제점을 가지고 있다. 본 논문은 인간의 경험적 지식을 수집된 데이터와 비교하여 가중치로 변환하고, 의사결정트리(Decision Tree)의 생성에 이용한다. 생성된 트리는 인간의 지식이 반영되어 기존의 분석 방법보다 신뢰성이 높다고 할 수 있으며, 실험을 통하여 제안하는 방법의 유효성을 확인하였다.

공간 데이타 마이닝을 위한 개방형 객체 관리 시스템의 설계 및 구현 (Design and Implementation of an Open Object Management System for Spatial Data Mining)

  • 윤재관;오병우;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제1권1호
    • /
    • pp.5-18
    • /
    • 1999
  • 최근 들어 공간 데이타베이스 시스템에 저장되어 있는 공간 데이타로부터 새로운 지식을 자동으로 추출해야 할 필요성이 증가함에 따라 공간 데이타베이스 시스템에 명시적으로 저장되어 있지 않은 암시적인 지식이나 공간 데이타간의 연관 관계, 그리고 다른 새로운 지식을 추출해 내는 학문인 공간 데이타 마이닝에 대한 연구가 증가하고 있다. 이러한 유용한 지식을 공간 데이타로부터 추출하기 위해서는 공간 데이타를 효율적으로 저장하고, 빠른 인덱스와 검색 기능을 제공하고, 또한 분산환경을 지원할 수 있는 객체 관리 시스템이 필요하다. 본 논문에서는 공간 데이타 마이닝 시스템에서 사용되는 공간, 비공간, 지식 데이타를 효율적으로 관리할 수 있는 개방형 객체 관리 시스템을 설계 및 구현하였다. 개방형 객체 관리 시스템을 개발하기 위하여 본 논문에서는 현재 많은 분야에서 사용되고 있는 Open OODB에 공간 데이타 타입의 지원, 동적인 클래스의 생성 객체-지향 개념의 상속성 지원, 공간 인덱스의 지윈, 공간 연산 함수 제공 등의 기능을 추가하여 확장하였다. 또한, 본 논문에서는 다른 공간 데이타베이스 시스템이나 공간 데이타 마이닝 시스템과의 상호운영성을 증가시키기 위하여 데이타 모델링을 위해 ODMG 2.0, 데이타 모델링과 공간 데이타의 교환을 위해 SDTS(Spatial Data Transfer Standard), 그리고 클라이언트와 서버간의 효율적 연동을 위해 OpenGIS Simple Features Specification for CORBA를 수용하였다.

  • PDF

데이터 마이닝을 이용한 지능형 전공지도시스템 연구 (A Date Mining Approach to Intelligent College Road Map Advice Service)

  • 최덕원;조경필;신진규
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.266-273
    • /
    • 2005
  • 대학의 학사관리 시스템은 학생이 입학하여 졸업하기까지 수행하는 여러 가지 학사활동 및 과외활동으로부터 발생하는 방대한 데이터를 보유하고 있다. 그러나 이들을 학생들의 전공지도나 진로지도에 효과적으로 활용하지 못하고 있다. 본 논문에서는 학사관리 시스템에 축적된 정보를 대상으로 데이터 마이닝 기법을 적용하여 학생들의 전공선택 및 진로지도에 도움을 줄 수 있는 새로운 정보와 지식을 생성하는 방법을 개발, 제시하였다. 이 연구를 위하여 요인분석, 계층분석 (AHP), 인공신경망, CART 기법 등을 동원하여 데이터 마이닝을 수행함으로써 유용한 지식과 규칙을 생성하였다. 방법론의 개발에 사용된 기본 자료들은 학생들의 Holland 적성검사, TOEIC 점수, 이수과목, 평점 등이다. 연구의 결과로서 기존의 학생지도 담당자가 수작업으로는 알아낼 수 없었던 학생지도에 관한 유용한 규칙을 도출할 수 있었다.

  • PDF

A New Approach to Web Data Mining Based on Cloud Computing

  • Zhu, Wenzheng;Lee, Changhoon
    • Journal of Computing Science and Engineering
    • /
    • 제8권4호
    • /
    • pp.181-186
    • /
    • 2014
  • Web data mining aims at discovering useful knowledge from various Web resources. There is a growing trend among companies, organizations, and individuals alike of gathering information through Web data mining to utilize that information in their best interest. In science, cloud computing is a synonym for distributed computing over a network; cloud computing relies on the sharing of resources to achieve coherence and economies of scale, similar to a utility over a network, and means the ability to run a program or application on many connected computers at the same time. In this paper, we propose a new system framework based on the Hadoop platform to realize the collection of useful information of Web resources. The system framework is based on the Map/Reduce programming model of cloud computing. We propose a new data mining algorithm to be used in this system framework. Finally, we prove the feasibility of this approach by simulation experiment.

An Efficient Algorithm for Mining Frequent Sequences In Spatiotemporal Data

  • ;지정희;류근호
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.61-66
    • /
    • 2005
  • Spatiotemporal data mining represents the confluence of several fields including spatiotemporal databases, machine loaming, statistics, geographic visualization, and information theory. Exploration of spatial data mining and temporal data mining has received much attention independently in knowledge discovery in databases and data mining research community. In this paper, we introduce an algorithm Max_MOP for discovering moving sequences in mobile environment. Max_MOP mines only maximal frequent moving patterns. We exploit the characteristic of the problem domain, which is the spatiotemporal proximity between activities, to partition the spatiotemporal space. The task of finding moving sequences is to consider all temporally ordered combination of associations, which requires an intensive computation. However, exploiting the spatiotemporal proximity characteristic makes this task more cornputationally feasible. Our proposed technique is applicable to location-based services such as traffic service, tourist service, and location-aware advertising service.

  • PDF

Industrial Waste Database Analysis Using Data Mining Techniques

  • Cho, Kwang-Hyun;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.455-465
    • /
    • 2006
  • Data mining is the method to find useful information for large amounts of data in database. It is used to find hidden knowledge by massive data, unexpectedly pattern, and relation to new rule. The methods of data mining are decision tree, association rules, clustering, neural network and so on. We analyze industrial waste database using data mining technique. We use k-means algorithm for clustering and C5.0 algorithm for decision tree and Apriori algorithm for association rule. We can use these outputs for environmental preservation and environmental improvement.

  • PDF

Automated Classification of PubMed Texts for Disambiguated Annotation Using Text and Data Mining

  • Choi, Yun-Jeong;Park, Seung-Soo
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.101-106
    • /
    • 2005
  • Recently, as the size of genetic knowledge grows faster, automated analysis and systemization into high-throughput database has become hot issue. One essential task is to recognize and identify genomic entities and discover their relations. However, ambiguity of name entities is a serious problem because of their multiplicity of meanings and types. So far, many effective techniques have been proposed to analyze documents. Yet, accuracy is high when the data fits the model well. The purpose of this paper is to design and implement a document classification system for identifying entity problems using text/data mining combination, supplemented by rich data mining algorithms to enhance its performance. we propose RTP ost system of different style from any traditional method, which takes fault tolerant system approach and data mining strategy. This feedback cycle can enhance the performance of the text mining in terms of accuracy. We experimented our system for classifying RB-related documents on PubMed abstracts to verify the feasibility.

  • PDF

Industrial Waste Database Analysis Using Data Mining

  • 조광현;박희창
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.241-251
    • /
    • 2006
  • Data mining is the method to find useful information for large amounts of data in database It is used to find hidden knowledge by massive data, unexpectedly pattern, relation to new rule. The methods of data mining are decision tree, association rules, clustering, neural network and so on. We analyze industrial waste database using data mining technique. We use k-means algorithm for clustering and C5.0 algorithm for decision tree and Apriori algorithm for association rule. We can use these analysis outputs for environmental preservation and environmental improvement.

  • PDF