• Title/Summary/Keyword: 지식기반 데이터마이닝

Search Result 47, Processing Time 0.034 seconds

Empirical Evaluation of Ensemble Approach for Diagnostic Knowledge Management (진단지식관리를 위한 앙상블 기법의 실증적 평가)

  • Ha, Sung-Ho;Zhang, Zhen-Yu
    • The Journal of Information Systems
    • /
    • v.20 no.3
    • /
    • pp.237-255
    • /
    • 2011
  • 지난 수십 년 간 연구자들은 효과적인 진료지원시스템을 개발하기 위해 다양한 도구와 방법론들을 제안하였고 지금도 새로운 방법론과 도구들을 계속적으로 개발하고 있다. 그 중에서 흉통으로 응급실에 내원한 노인환자에 대한 정확한 진단은 중요한 이슈 중의 하나였다. 따라서 많은 연구자들이 의사의 진단 능력을 향상시키기 위한 지능적인 의료의사결정과 시스템 개발에 투신하고 있지만 전통적인 의료시스템에 따른 대부분의 진료의사결정이 단일 분류기(classifier)에 기반하고 있어 만족스런 성능을 보여주지 못하고 있는 것이 현실이다. 따라서 이 논문은 앙상블 전략을 활용하여 의사들이 노인환자들의 흉통을 더 정확하고 빠르게 진단하는데 있어 도움을 줄 수 있게 하였다. 의사결정나무, 인공신경망, SVM 모델을 결합한 앙상블 기법을 실제 응급실에서 수집한 응급실 자료에 적용하였고, 그 결과 단일 분류기를 사용하는 것에 비해 월등히 향상된 진단 성과를 보이는 것을 관찰 할 수 있었다.

Performance Prediction System For Axial Fan using Data Mining (데이터마이닝을 이용한 축류팬 성능예측 시스템)

  • Kim, Myung-il;Lee, Seung-min;Kim, Yeon-ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.1047-1050
    • /
    • 2010
  • 축류팬(axial fan)은 냉장고, 에어컨 등 가전제품 뿐 아니라, 자동차, 중장비 등에 가장 널리 사용되는 팬의 형태로 제품의 성능과 소음에 많은 영향을 미치는 요소이다. 그러나 설계, 목업(mock-up)개발, 풍동실험 등의 시간과 비용적인 면에서 비효율적인 방법을 통해 개발이 이루어지고 있다. 따라서 범용으로 사용가능한 팬 설계 프로그램과 설계 인자의 입력만으로도 성능을 예측하여 개발에 소요되는 시간과 비용을 줄일 수 있는 시스템의 개발이 필요하다. 본 연구에서는 슈퍼컴퓨터를 활용하여 축류팬 형상변수의 변화에 대한 성능과 소음을 미리 해석한 후 그 결과를 지식형 데이터베이스로 저장하고, 팬 자동설계 시스템과 결합한다. 즉, 축류팬 설계 변수를 입력하면 팬의 형상을 CAD 파일로 자동 생성할 뿐 아니라, 지식형 데이터베이스을 기반으로 하는 데이터 마이닝 기법을 이용하여 해당 모델의 성능과 소음을 예측한다.

A Study of Recommending Service Using Mining Sequential Pattern based on Weight (가중치 기반의 순차패턴 탐사를 이용한 추천서비스에 관한 연구)

  • Cho, Young-Sung;Moon, Song-Chul;Ahn, Yeon S.
    • Journal of Digital Contents Society
    • /
    • v.15 no.6
    • /
    • pp.711-719
    • /
    • 2014
  • Along with the advent of ubiquitous computing environment, it is becoming a part of our common life style that the demands for enjoying the wireless internet using intelligent portable device such as smart phone and iPad, are increasing anytime or anyplace without any restriction of time and place. The recommending service becomes a very important technology which can find exact information to present users, then is easy for customers to reduce their searching effort to find out the items with high purchasability in e-commerce. Traditional mining association rule ignores the difference among the transactions. In order to do that, it is considered the importance of type of merchandise or service and then, we suggest a new recommending service using mining sequential pattern based on weight to reflect frequently changing trends of purchase pattern as time goes by and as often as customers need different merchandises on e-commerce being extremely diverse. To verify improved better performance of proposing system than the previous systems, we carry out the experiments in the same dataset collected in a cosmetic internet shopping mall.

Anomaly Detection Model Using THRE-KBANN (THRE-KBANN을 이용한 이상현상탐지모델)

  • Shim, Dong-Hee
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.38 no.5
    • /
    • pp.37-43
    • /
    • 2001
  • Since Internet has been used anywhere, illegal intrusion to a certain host or network become the ciritical factor in security. Although many anomaly detection models have been proposed using the statistical analysis, data mining, genetic algorithm/programming to detect illegal intrusions, these models has defects to detect new types of intrusions. THRE-KBANN (theory-refinement knowledge-based artificial neural network) which can learn continuously based on KBANN, is proposed for the anomaly detection model in this paper. The performance of this model is compared with that of the model based on data mining using the experimental data. The ability of continual learning for the detection of new types of intrusions is also evaluated.

  • PDF

Multi-Dimensional Association Rule Mining in Multimedia Data (멀티미디어 데이터의 다차원 연관규칙 마이닝)

  • Kim, Jin-Ok;Hwang, Dae-Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.233-236
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 특성국지화를 이용한 내용기반의 정보검색 기술과 다차원 데이터큐브 구축기술을 통해 멀티미디어 데이터에서 연관규칙을 찾아내는 멀티미디어 데이터마이닝 시스템 프로토타입을 제안한다. 특히 멀티미디어 데이터의 칼라, 질감 등 거시적인 이미지 성분 대신 이미지의 영역성과 유사성을 이용한 특성국지화방법을 이용하여 이미지를 분할함으로써 방대한 데이타에서 효과적인 내용기반의 정의 검색을 시행하고 검색한 벡터를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이터베이스에서 데이터간 연관규칙을 찾아내어 지식을 마이닝하는데 효과적인 다차원 데이터큐브를 구축하고 여기에 연관규칙 검색 알고리즘을 적용한다.

  • PDF

Temporal Associative Classification based on Calendar Patterns (캘린더 패턴 기반의 시간 연관적 분류 기법)

  • Lee Heon Gyu;Noh Gi Young;Seo Sungbo;Ryu Keun Ho
    • Journal of KIISE:Databases
    • /
    • v.32 no.6
    • /
    • pp.567-584
    • /
    • 2005
  • Temporal data mining, the incorporation of temporal semantics to existing data mining techniques, refers to a set of techniques for discovering implicit and useful temporal knowledge from temporal data. Association rules and classification are applied to various applications which are the typical data mining problems. However, these approaches do not consider temporal attribute and have been pursued for discovering knowledge from static data although a large proportion of data contains temporal dimension. Also, data mining researches from temporal data treat problems for discovering knowledge from data stamped with time point and adding time constraint. Therefore, these do not consider temporal semantics and temporal relationships containing data. This paper suggests that temporal associative classification technique based on temporal class association rules. This temporal classification applies rules discovered by temporal class association rules which extends existing associative classification by containing temporal dimension for generating temporal classification rules. Therefore, this technique can discover more useful knowledge in compared with typical classification techniques.

Classification and Analysis of Data Mining Algorithms (데이터마이닝 알고리즘의 분류 및 분석)

  • Lee, Jung-Won;Kim, Ho-Sook;Choi, Ji-Young;Kim, Hyon-Hee;Yong, Hwan-Seung;Lee, Sang-Ho;Park, Seung-Soo
    • Journal of KIISE:Databases
    • /
    • v.28 no.3
    • /
    • pp.279-300
    • /
    • 2001
  • Data mining plays an important role in knowledge discovery process and usually various existing algorithms are selected for the specific purpose of the mining. Currently, data mining techniques are actively to the statistics, business, electronic commerce, biology, and medical area and currently numerous algorithms are being researched and developed for these applications. However, in a long run, only a few algorithms, which are well-suited to specific applications with excellent performance in large database, will survive. So it is reasonable to focus our effort on those selected algorithms in the future. This paper classifies about 30 existing algorithms into 7 categories - association rule, clustering, neural network, decision tree, genetic algorithm, memory-based reasoning, and bayesian network. First of all, this work analyzes systematic hierarchy and characteristics of algorithms and we present 14 criteria for classifying the algorithms and the results based on this criteria. Finally, we propose the best algorithms among some comparable algorithms with different features and performances. The result of this paper can be used as a guideline for data mining researches as well as field applications of data mining.

  • PDF

A Study on the Design and Implementation of Small Basic Library for Educational AI Programming (스몰베이직 언어 기반 교육용 인공지능 프로그램 작성을 지원하는 라이브러리 설계 및 구현에 관한 연구)

  • Kim, Ji-Yong;Jeong, Seung-Wan;Jo, Sung-Mo;Choi, Kwang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.694-696
    • /
    • 2017
  • 텍스트 기반 언어 스몰베이직은 기존 프로그래밍 언어와는 달리 배우기 쉽고 이후에 C/C++/Java로 빠르게 전환할 수 있기 때문에 청소년 프로그래밍 교육용 언어로 적합하다. 프로그래밍 교육에 흥미를 높이기 위해 풍부한 라이브러리가 필요하다. 풍부한 라이브러리를 바탕으로 마이크로소프트에서 개발한 스몰베이직 환경에서는 쉽게 프로그램을 작성 할 수 있지만, 최근 화두가 되고 있는 인공지능 프로그램을 쉽게 작성할 수 있는 라이브러리는 지원하지 않는다. 이 논문에서 오픈소스 소프트웨어 스몰베이직 환경하에 동작하는 데이터마이닝 라이브러리를 설계 및 구현하였고, 이 라이브러리를 기반으로 틱택토 게임을 개발하여 인공지능 스몰베이직 프로그램을 쉽게 작성할 수 있음을 확인하였다. 널리 보급된 언어인 C/C++/Java로 인공지능 프로그램을 작성하기 위해서는 광대한 범위의 지식과 코딩 실력이 바탕이 되어야 한다. 그러나 스몰베이직은 프로그램을 쉽게 작성 할 수 있고, 그림 기반의 교육용 언어인 스크래치와는 달리 텍스트 기반의 언어이기 때문에 이후에 C/C++/Java로 전환하기 용이하다.

러프집합과 계층적 분류구조를 이용한 데이터마이닝에서 분류지식발견

  • Lee, Chul-Heui;Seo, Seon-Hak
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.12 no.3
    • /
    • pp.202-209
    • /
    • 2002
  • This paper deals with simplification of classification rules for data mining and rule bases for control systems. Datamining that extracts useful information from such a large amount of data is one of important issues. There are various ways in classification methodologies for data mining such as the decision trees and neural networks, but the result should be explicit and understandable and the classification rules be short and clear. The rough sets theory is an effective technique in extracting knowledge from incomplete and inconsistent data and provides a good solution for classification and approximation by using various attributes effectively This paper investigates granularity of knowledge for reasoning of uncertain concopts by using rough set approximations and uses a hierarchical classification structure that is more effective technique for classification by applying core to upper level. The proposed classification methodology makes analysis of an information system eary and generates minimal classification rules.

창업연구 실증연구 분석방법론

  • Lee, Il-Han
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2017.04a
    • /
    • pp.17-17
    • /
    • 2017
  • 구조방정식모델(Structural Equation Modeling: SEM)은 변수들 간의 인관관계 및 상관관계를 검증하기 위한 통계기법으로 사회학 및 심리학 분야에서 개발되었지만 현재는 경영학, 광고학, 교육학, 생물학, 체육학, 의학, 정치학 등 여러 학문분야에서 광범위하게 사용되고 있다. Amos는 기본적으로 그래픽(Amos graphics)과 베이직(Amos basic)을 제공하기 때문에 정확한 프로그램의 작성이나 행렬에 대한 지식이 없는 초보자들도 아이콘을 이용하여 복잡한 연구모델이나 다중집단분석모델을 분석할 수 있다. PLS(Partial Least Square)는 모형 추정과정에서 발생하는 잔차 또는 예측오차를 최소화하여 예측력을 극대화하기 위한 프로그램이며, 즉, PLS-SEM는 표본 수가 적고 자료가 정규분포를 보이지 않거나 조형지표 모델이거나 복잡한 연구모델 분석에 유용하다. 최근 빅데이터의 열풍으로 자료들을 분석을 위한 도구로 R이 실무 현장에서 인기를 끌고 있다. R은 통계 프로그래밍 언어이자 오픈 소프트웨어 환경으로 통계, 그래픽, 데이터마이닝 등의 다양하고 방대한 양의 패키지들을 지원한다. R에서 제공되는 패키지들이 오픈 소스이고 선형 및 비선형 모델링, 고전적인 통계분석, 시 계열 분석, 분류 및 군집분석 등의 다양한 통계 패키지들을 제공한다는 측면에서 R은 실무는 물론 학문적인 측면에서도, 특히 통계를 기반으로 실증분석을 수행하는 사회과학연구들에서 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF