• 제목/요약/키워드: 마이닝시스템

검색결과 932건 처리시간 0.028초

텍스트 마이닝의 개념과 응용

  • 조태호
    • 지식정보인프라
    • /
    • 통권5호
    • /
    • pp.76-85
    • /
    • 2001
  • 정보검색시스템은 물론 텍스트 데이터를 대상으로하는 지식관리 시스템, 문서관리시스템, 그리고 전자도서관등에서 텍스트 마이닝에 대한 기술에 대한 수요가 증가하고 있는 추세이다. 이 글에서는 텍스트 마이닝의 개념을 소개하고, 텍스트 마이닝의 주요기능, 그리고, 응용사례등을 기술할것이다. 텍스트 마이닝은 텍스트 데이터를 대상으로 하여 그들간의 암묵적인 정보를 추출하는 과정으로 정의할 수 있다. 데이터마이닝과 텍스트 마이닝의 차이는 대상이 텍스트 데이터와 수치 데이터하는 점에서 구분되고 텍스트 마이닝은 데이터 마이닝과 달리 이를 구조화시키는 과정이 필요하다. 텍스트마이닝에 있어서 구조화하는 과정에서 가장 보편적으로 사용되는것은 문서색인이다.

  • PDF

비연계 DB 테이블상에서의 데이터 추출을 위한 규칙 기반의 데이터 마이닝 기법 (A Rule-Based Data Mining Method among the Unrelated DataBase Table)

  • 김찬일;조대호
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.220-224
    • /
    • 2000
  • 데이터 마이닝란 대량의 실제 데이터에서 묵시적이고 잠재적으로 유용한 정보를 추출하는 작업이다. 본 논문에서 서로 관계가 정의되지 않은 데이터베이스의 각 테이블간에서 필요한 정보를 추출 또는 가공하기 위해 데이터 마이닝 기법을 사용한다. 마이닝 기법인 연관 규칙은 어떤 사건이 일어나면 다른 사건이 일어나는 관련성을 의미하는 것이고, 제시된 규칙 기반의 데이터 마이닝 기법은 연관 규칙의 한 분야로서 데이터를 규칙 맞게 분류하는 기법이다. 이런 마이닝 기법을 구현하기 위해 인공지능 분야의 규칙 기반의 전문가 시스템을 사용하였고, 실 시스템인 GDS(Grating automatic Drawing System)에 적용하였다.

  • PDF

LCD 산업에서의 품질마이닝 시스템 (A Quality Data-Mining System in LCD Industry)

  • 이현우;남호수;최병욱
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.381-386
    • /
    • 2005
  • 본 논문에서는 LCD 공정의 효율적인 관리를 위한 방법으로서 품질마이닝 시스템의 설계/개발 그리고 운영방법론을 논하고자 한다. 주요내용으로는 주요공정의 탐색, 설비유의차분석, 공정최적화 및 recipe 최적화, 수율 및 주요특성의 추정/예측 등을 들 수 있다. 이를 위하여 다양한 데이터마이닝 도구와 통계적 모형의 적절한 활용 방법을 논하고자 한다. 또한, 실제현장 중심의 개발사례를 통하여 품질마이닝 시스템의 유용성을 기술하였다.

  • PDF

데이터 마이닝 기술을 이용한 웹 분석 시스템의 개발 (Development of a Web Analyzing System based on Data Mining Techniques)

  • 전재범;양성모;윤석호;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.67-70
    • /
    • 2006
  • 최근 웹 분석 시스템은 단순히 통계 정보를 이용한 분석을 넘어서서 웹 마이닝 기술을 이용한 웹 분석 시스템의 형태로 변화하고 있다. 이는 기존의 단순 통계 분석으로는 점차 거대하고 복잡해져가는 현재의 웹 사이트를 분석하는 데 한계가 있기 때문이다. 따라서 앞으로 웹 분석 시스템은 웹 마이닝 기술을 활용한 다양한 측면의 연구와 구현이 이루어 질 것으로 보인다. 본 연구에서는 기존의 웹 마이닝 기술을 이용한 웹 마이닝 분석 시스템을 구현하여 웹 마이닝 기술에 대한 분석과 응용을 고찰한다. 또한, 실제로 한양대학교 웹사이트를 대상으로 웹 분석 시스템을 설계 구현함으로써 웹 마이닝 기술을 이용한 웹 분석 시스템의 가능성을 타진한다.

  • PDF

유비쿼터스 데이터 마이닝, 도전과 과제 (Ubiquitous Data Mining, Challenge and Task)

  • 전성해
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.57-60
    • /
    • 2005
  • 21세기에 들어서면서 인터넷은 새로운 패러다임인 유비쿼터스 컴퓨팅 환경으로 빠르게 바뀌고 있다. 특히 2005년에 접어들면서 유비쿼터스는 정보기술 분야에서 건설, 의료, 교통, 안전, 교육 등 사회 각 분야에서 유비쿼터스 컴퓨팅의 도입을 추진하고 있다 동시에 유비쿼터스 컴퓨팅이 각 분야에서 적용이 될 때에는 지능형 시스템에 의한 서비스가 이루어 져야 한다는 것에 대하여 모두가 공감하고 있다. 지능형 유비쿼터스 서비스가 이루어지기 위한 하나의 방법으로서 현재 인터넷의 지능형 서비스에서 활발하게 이루어지고 있는 데이터 마이닝 전략이 있다. 즉 유비쿼터스 컴퓨팅 환경에서 발생하는 엄청난 양의 데이터를 분석하여 지능형 유비쿼터스 서비스를 하기 위한 데이터 마이닝 분야가 바로 유비쿼터스 데이터 마이닝이다. 유비쿼터스 데이터 마이닝은 오프라인 데이터 마이닝, 웹 마이닝 등에 비해 여러 가지 다른 점들이 있다. 본 논문에서는 유비쿼터스 데이터 마이닝에 대한 소개와 기존의 데이터 마이닝 프로세스와의 차이점을 알아본다. 아울러 유비쿼터스 컴퓨팅 환경에서 이루어져야 할 데이터 마이닝 전략의 과제와 도전에 대한 이슈들을 살펴보고 몇 가지 모의실험을 통하여 이것들에 대한 확인을 하였다.

  • PDF

데이터 마이닝에 기반한 침입탐지시스템의 탐지 정확도 향상에 관한 연구 (A Study on Accuracy Improvement of Intrusion Detection System Based on Data Mining)

  • 송중석;고창홍희;강부수남;권용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.208-210
    • /
    • 2005
  • 공격 방법의 다양화와 지능화에 대응하기 위해 침입탐지시스템(IDS)의 성능도 향상되고 있다. 특히, 데이터 마이닝 기반의 침입탐지시스템은 기존 침입탐지시스템의 많은 문제점을 개선시켰다. 그러나 데이터 마이닝에 기반한 침입탐지시스템의 탐지 정확도가 트레이닝 데이터(training data)에 포함된 속성(features)과 선택된 axis 및 reference 속성에 의해 결정됨에도 불구하고 현재의 데이터 마이닝 기반의 침입탐지시스템은 트레이닝 데이터에 포함된 고유의 속성만을 고려하기 때문에 탐지 정확도를 향상시키는 데는 한계가 있다. 따라서 본 논문에서는 데이터 마이닝에 기반한 침입탐지시스템의 탐지 정확도를 향상시키기 위하여 기존 데이터 마이닝 기반의 침입탐지시스템이 고려했던 고유의 속성 외에 침입과 밀접하게 관련되고 axis및 reference속성으로도 사용될 수 있는 새로운 속성을 제안한다.

  • PDF

공간 데이터 마이닝에서의 질의 처리 최적화 전략 (Query Optimization Infrastructure in Spatial Data Mining)

  • 김충석;이현창;김경창
    • 한국통신학회논문지
    • /
    • 제26권7A호
    • /
    • pp.1200-1211
    • /
    • 2001
  • 최근 각광을 받고 있는 데이터 마이닝 분야에서 데이터 마이닝 툴과 시스템의 등장으로 상호적이고 사용하기 쉬운 GUI 환경의 강력한 데이터 마이닝 질의 언어가 필요하게 되었다. 공간 데이터 마이닝은 공간 데이터에서 유용한 지식을 발견하기 위한 데이터 마이닝의 한 부문이며 공간 데이터는 점, 선, 사각형, 다각형 등으로 이루어져 있다. 공간 데이터 마이닝은 지리정보시스템(GIS)과 더불어 최근에 많은 관심과 연구가 활발히 진행되고 있다. 한편, 공간 데이터 마이닝을 위한 질의 언어와 그 언어에 기반한 공간 데이터 마이닝 질의 처리 및 최적화에 대한 연구가 중요하게 대두되고 있다. 공간 데이터에 대한 마이닝은 일반 관계형 데이터베이스에서의 질의 언어로는 표현이 불가능하다. 본 연구에서는 먼저 공간 데이터 마이닝 질의언어를 정의, 설계하고 질의 언어에 결과 표현 방식과 결과 데이터 집합의 저장을 명시하여 질의 표현의 효율을 높이는 방식을 제시하였다. 또한 공간 데이터 마이닝을 위한 질의 처리 및 최적화 과정을 질의에 기반한 공간 실체화 뷰의 생성과 유지, 인덱스 활용을 통한 질의 재사용, sampling 마이닝 질의 option 등의 방법론을 이용하여 제시하였다.

  • PDF

산업재해 관리 시스템 구축을 위한 데이터 웨어하우스 마이닝 기법의 활용

  • 한정훈;유훈;이원근;심종칠;김창은
    • 한국산업안전학회:학술대회논문집
    • /
    • 한국안전학회 1998년도 추계 학술논문발표회 논문집
    • /
    • pp.225-230
    • /
    • 1998
  • 데이터 마이닝은 대용량 데이터베이스의 데이터 사이에 묻혀 있는 '패턴'을 발견하여 규칙을 추론함으로 여러 가지 유용한 지식을 캐내는 기법이다. 본 논문에서는 효과적인 재해관리 시스템을 구축하기 위해서 재해를 분석하고 대책을 마련할 수 있는 데이터 마이닝을 적용한 '데이터베이스 웨어하우스 마이닝 재해관리 데이터베이스 시스템'을 제시하고자 한다. 데이터 웨어하우스 마이닝은 다차원 데이터베이스로 구축되며 재해데이터간의 상호관련성, 특성요인별 패턴을 찾고 재해발생 가능성을 예측함으로써 재해예방의 의사결정을 지원할 수 있다.

  • PDF

다차원 데이터큐브를 이용한 멀티미디어 데이터 마이닝 연구 (A Study on the MultiMedia Data Mining using Multi-dimensional DataCube)

  • 김진옥;황대준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.151-153
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 내용기반의 정보검색 기술과 다차원 다중 데이터큐브 구축기술을 통해 멀터미디어데이타의 마이닝을 구현하는 시스템에 대해 제안한다. 제안 시스템은 멀티미디어 데이터에 내용기반의 정보추출 시스템을 적용하여 성분백터를 추출하고 이를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이타베이스로부터 지식을 마이닝할 수 있도록 다차원 데이터큐브를 구축하여 빠른 데이터검색과 마이닝결과을 이용자에게 보여주는 모듈로 구성된다. 다차원 데이터큐브는 다중 어레이 구조로써 다차원 데이터를 저장하고, 저장된 여러 데이터 레벨 정보에서 가장 중요한 주제를 통합 생성하여 효율적으로 처리하므로 멀티미디어 데이터를 마이닝하는데 효과적인 방법이다. 또만 다차원데이타큐브를 다중으로 생성하는 방법은 데이터 마이닝 속도를 높이는데 효율적이다.

  • PDF

공개 소스시스템을 이용한 효과적인 마이닝 전략 (An Effective Mining Strategy Using Open Source System)

  • 전성해;이승주;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.405-408
    • /
    • 2007
  • CRM, Biouformatics 등 데이터 마이닝이 적용되는 분야에서 데이터분석에 주로 사용되는 도구는 고가의 마이닝 패키지들이다. SAS사의 Enterprise Miner, SPSS사의 Clementine 등이 대표적이다. 그러나 이 패키지들은 방대한 분석시스템으로 이루어져 있기 때문에 배우기가 어렵고 또한 고급의 컴퓨터 리소스들을 요구한다. 따라서 중소규모의 업체나 연구조직에서는 이와 같은 고성능의 마이닝 패키지를 사용하는데 상당한 어려움이 있다. 본 논문에서는 공개 소스시스템에서 제공되는 패키지를 이용하여 중소규모의 마이닝 프로젝트를 위한 효과적인 전략을 제안한다. 본 논문의 제안전략에 의해 비용 절감과 동시에 수준 높은 마이닝 결과를 제공받을 수 있게 된다.

  • PDF