• 제목/요약/키워드: 연관마이닝

검색결과 488건 처리시간 0.023초

메타 규칙 생성에 의한 RFID 데이터 마이닝 기법 (A Method Mining RFID Data Using Generation Meta-Rules)

  • 김영희;이창열;강은영;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.145-148
    • /
    • 2006
  • RFID 데이터에 대한 연관 규칙을 효율적으로 생성하기 위해서는 단일 개념 레벨에서 연관 규칙을 찾는 방법과는 달리 다단계 개념 레벨에서 의미 있는 정보를 발견할 수 있다. 이로부터 연관 규칙을 생성하게 되면 최상위 레벨의 정보를 통해 하위 레벨의 객체 이동 정보나 위치 정보, 상태 정보를 빠르게 획득 가능하다. 또한, 다차원 레벨을 갖는 연관 규칙 마이닝을 수행할 때 메타 규칙의 생성은 제한적이고 유용한 규칙만을 효율적으로 생성 가능하도록 할 수 있다. 따라서, 생성된 메타 규칙을 이용하여 많은 양의 데이터에서 질의를 효과적으로 수행 할 수 있을 뿐만 아니라, 데이터베이스의 저장 효율을 높이고, 객체간의 숨겨진 연관 관계를 발견하는데 있어 효율적인 방법이다.

  • PDF

연관규칙기반 Pattern Miner의 설계 및 구현

  • 김지현;성유진;박종수;지원철
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1998년도 추계학술대회 논문집
    • /
    • pp.381-384
    • /
    • 1998
  • 방대한 양의 데이터들 속에 존재하는 일관된 흐름이나 경향을 파악해 내는 데이터 마이닝에 대한 관심이 확산되고 있다. 특히 항목들 상호간의 연관성을 나타내는 연관 규칙과 시간 개념이 포함되어 항목들 사이의 순서를 찾아내는 순차 패턴의 탐사는 데이터 마이닝에서 중요한 역할을 하고 있다. 본 논문에서는 트랜잭션 데이터베이스에서 연관 규칙과 순차 패턴을 탐사하는 시스템의 설계 및 구현에 관하여 기술한다. 연관 규칙을 위해 Aproiri, DHP를, 순차패턴을 위해 AprioriAll등 기존에 연구된 대표적인 알고리즘들을 사용하였고, Windows NT상에서 Visual C++과 JAVA언어로 구현하였다. 편리한 사용자 환경 구축을 위해, 데이터의 입력 형식으로 텍스트 타입과 MDB(Microsoft Access)형태를 모두 처리할 수 있게 하였고, 출력형식은 스프레드시트이다. 입력 데이터로 실험 데이터와 통계청의 DB 이용 로그 데이터에 대하여 본 시스템 을 수행하였다.

  • PDF

효율적인 문서 자동 분류를 위한 대표 색인어 추출 기법 (A Feature Selection Technique for an Efficient Document Automatic Classification)

  • 김지숙;문현정;김영지;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.295-302
    • /
    • 2001
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 기존의 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 비감독학습 기법에 의해 대량의 문서를 효율적으로 분류하기 위한 대표 색인어 추출 기법을 제안하였다. 컴퓨터 분야의 논문을 대상으로 각 분야별 대표 색인어를 추출하여 유사한 문서끼리 분류하는 실험을 통해 제안된 방법의 효율성을 보였다.

  • PDF

데이터 마이닝을 위한 연관규칙의 다중 값 속성 처리방법 (Processing Multi-Valued Attributes in Association Rules for Data Mining)

  • 김산성;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.340-342
    • /
    • 2002
  • 다중 값이란 속성 값이 집합인 것을 말한다. 즉, 관계형 데이터베이스에서 자료 유형이 집합인 속성을 의미한다. 이러한 다중 값 속성 처리는 기존 데이터마이닝 기술 자체로는 처리한 수 없으며 후처리나 선처리 과정을 이용하여 처리하고 있다. 전처리나 후처리 과정을 통해 처리할 경우 수행과장에 있어 많은 시간이 소요되고 혹은 타당하지 않은 규칙이 생성되는 문제점을 가지고 있다. 특히 연관화 기법 특성상 분석하고자 할 항목이 증가할수록 연관성의 수가 지수(exponential)단위이기 때문에 이를 해결하는데는 상당한 어려움이 따르게 된다. 본 논문에서는 관계형 데이터베이스 테이블 구조에서 데이터 마이닝의 수행을 위한 전처리나 후처리의 과정을 고려하지 않음으로 위에서 언급된 문제점들을 해결하고자 한다. 특히 데이터 변환 작업 없이 정량적(Quantitative)연관 규칙과 연관 규칙(Market Basket Analysis)의 혼합 형태의 규칙을 생성할 수 있게끔 알고리즘을 확장하여 보다 효율적인 규칙이 생성될 수 있도록 한다. 마지막으로 Each Movie 데이터를 사용하여 확장한 알고리즘의 다중 값 속성 처리 방법의 효율성과 타탕성을 검증한다.

  • PDF

NFP-Algorithm 알고리즘을 기반한 텍스트 연관 패턴 추출 (Text Assocation Pattern Extraction using NFP-tree Algorithm)

  • 유수경;김교정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.97-100
    • /
    • 2004
  • 인터넷상에서 존재하는 많은 데이터베이스들 중 현실적으로 유용한 정보를 가지고 있는 것은 텍스트 데이타베이스이다. 텍스트 마이닝 기법에서 비구조적인 특징을 가진 텍스트 데이타로부터 유용한 정보를 분석하고 추출하여 연관된 패턴을 탐색하는 과정은 중요한 연구과제이다. 이에 본 논문은 인터넷에서 저장된 텍스트 데이터를 가지고 기존 텍스트 마이닝 기법 중 연관탐색 기법을 적용하여 사용자 중심의 연관된 패턴을 찾아서 의미있는 정보를 얻고자 한다. 탐색하기 위해 먼저 전처리 작업으로 용어의 객체를 추출하고. 추출된 각 객체들은 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관탐색 기법인 NFP-Algorithm(N-most interesting k-itemsets Using FP-tree and FP-Growth)을 적용시켜서 의미있는 정보를 추출했다. 또한 Apriori계 Algorithm, FP-Algorithm, NFP-Algorithm을 비교하여 NFP-Algorithm이 시간적면에서 효율적임을 보여주었다.

  • PDF

빅데이터 추천시스템을 위한 과립기반 연관규칙 마이닝 (Granule-based Association Rule Mining for Big Data Recommendation System)

  • 박인규
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.67-72
    • /
    • 2021
  • 연관규칙 마이닝은 여러 테이블에 숨겨진 패턴들의 관계를 나타내주는 방법이다. 요즈음에는 연관규칙 마이닝에 보다 세부적인 의미를 추가하기 위하여 과립화 논리를 이용하고 있다. 또한 기존의 데이터를 이용하여 추천하는 기존의 시스템과는 달리 과립화 연관규칙에서는 신규 가입자나 신규상품에 대한 추천의 경우도 가능하다. 따라서 연관규칙의 과립화의 정성적인 크기를 결정하는 것이 추천 시스템의 성능을 좌우한다. 본 논문에서는 관람자가 평가한 영화에 대한 관계를 파악하기 위하여 퍼지논리와 샤논 엔트로피 개념을 이용하여 관람자와 영화데이터에 대한 과립화 방법을 제안한다. 연구는 관람자와 영화간의 연관규칙의 함의에 결정적인 역할을 하는 데이터의 과립화의 크기를 결정하는 부분과 이러한 과립화를 이용하여 관람자와 영화간의 연관규칙을 추출하는 두 번째 부분으로 구성되어 있으며 넷플릭스의 MovieLens데이터를 이용하여 분석하였다. 최종적으로 도출된 연관규칙의 의미와 추천의 정확도 및 고려해야하는 함의를 제시하였다.

다차원 연관 분석을 이용한 인터넷 이용자의 특징 분석 (Analysis of Internet User Features using Multi-dimensional Association Analysis)

  • 이수은;정용규
    • 서비스연구
    • /
    • 제1권1호
    • /
    • pp.61-69
    • /
    • 2011
  • 데이터 마이닝은 대용량의 데이터베이스로부터 기존에 알려지지 않은, 즉 단순한 질의어로 추출할 수 없는 형태의 '유용한' 정보를 찾아내고 이를 바탕으로 데이터에 대한 통찰(insight)을 얻는 것으로 정의할 수 있다. 본 논문에서는 웹에서 발생하거나 웹 사이트에 저장한 데이터를 대상으로 유용한 패턴을 찾아내기 위하여 인터넷을 이용하는 이용자의 특징을 분석하기 위해 시도되었다. 즉 인터넷 사용자에 대한 일반적인 통계 정보 데이터에 연관성 분석을 적용하여 인터넷 사용 시간에 영향을 미치는 인터넷 이용자의 특징을 분석하였다. 실험을 통하여 데이터로부터의 연관 규칙을 추출 해내었으며, 최적의 결과를 도출하기위한 데이터 전처리 및 알고리즘을 적용하여 웹 마이닝을 위한 인터넷 사용자의 특징을 분석한 결과 그 유용성을 확인할 수 있었다.

  • PDF

시간 속성을 갖는 이벤트 집합에서 인터벌 연관 규칙 마이닝 기법 (A Method for Mining Interval Event Association Rules from a Set of Events Having Time Property)

  • 한대영;김대인;김재인;나철수;황부현
    • 정보처리학회논문지D
    • /
    • 제16D권2호
    • /
    • pp.185-190
    • /
    • 2009
  • 시간 속성을 갖는 이벤트 집합에서 동일한 이벤트 타입에 대한 이벤트 시퀀스는 하나의 이벤트로 요약될 수 있다. 그러나 정의된 시간 간격이 경과된 후 발생된 이벤트 타입은 하나 이상의 독립된 서브 이벤트 시퀀스로 요약하는 것이 바람직하다. 본 논문은 Allen의 시간 관계 대수에 기반하여 인터벌 이벤트를 요약하고, 요약된 인터벌 이벤트들로부터 인터벌 연관 규칙을 찾아내는 새로운 시간 데이터 마이닝 기법을 제안한다. 제안하는 기법은 독립적인 서브 시퀀스 개념을 도입하고 인터벌 이벤트 사이의 연관 규칙을 탐사함으로써 질적으로 우수한 정보를 제공한다.

민원 분석을 위한 텍스트 마이닝 기법 연구: 계층적 연관성 분석 (A Study on Text Mining Methods to Analyze Civil Complaints: Structured Association Analysis)

  • 김현종;이태헌;유승의;김나랑
    • 한국산업정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.13-24
    • /
    • 2018
  • 정부 및 공공기관에 있어 시민의 직접적인 요구사항이 담겨 있는 민원은 정책 개발을 위한 중요한 데이터로 활용이 가능하다. 그러나 민원 데이터는 비정형 텍스트로 작성되어 있는 특성으로 인해 일반적인 텍스트 마이닝 기법으로는 시민의 요구사항을 정확히 도출하기 어려웠다. 이에 본 연구에서는 민원 데이터 분석을 위한 텍스트 마이닝 기법을 개선하여, 시민의 요구사항을 도출할 수 있는 방법을 제시하고자 하였다. 새로운 텍스트 마이닝 기법은 공기어구조맵의 원리에 착안하여 연관성 분석을 2단계로 실시하여 핵심주제어를 기반으로 1차 연관 단어 와 2차 연관 단어로 구조화하였다. 분석을 위해 2016년 1년간 부산시 민원게시판에 올라온 3004건을 활용하였다. 분석 결과는 빈도수와 핵심주제어를 가지고 연관성 분석만으로는 찾을 수 없었던 민원 상의 문제를 본연구에서 제시한 계층적 연관성 분석을 이용하여 시민의 요구사항을 더욱 정확하게 파악할 수 있었다. 본 연구는 민원 데이터에서 시민의 요구사항을 도출하기 용이한 방법을 제안하였다는 학문적 기여점이 있으며, 행정기관에서 민원 데이터를 통해 정책 개발에 활용할 수 있다는 실무적 기여점이 있다.

온톨로지 기반에서 연관 마이닝 방법을 이용한 지식 추론 알고리즘 연구 (A Study of a Knowledge Inference Algorithm using an Association Mining Method based on Ontologies)

  • 황현숙;이준연
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1566-1574
    • /
    • 2008
  • 정보 검색에 대한 연구는 방대한 데이터에서 원하는 검색 정보를 제공할 뿐 만 아니라 개인의 취향에 따른 맞춤 검색 및 추론된 지식을 제공하는 데 초점을 두고 있다. 본 논문의 목적은 데이터를 개념화하여 분류 및 정의할 수 있는 온톨로지 구조를 기반으로 숨어있는 지식을 발견하여 개인 맞춤 검색을 제공하는 추론 알고리즘에 대해 연구하는 것이다. 현재의 검색에서는 방대한 데이터에서 너무 많은 검색 결과를 제공 하거나 검색 결과를 제공하지 못하는 경우도 발생하고 여다. 이러한 정보 검색의 단점을 보완하기 위해 OWL 온톨로지 제약조건과 연관 마이닝 방법으로 추론된 연관 지식을 SWRL 추론 언어로 표현하여 Jess 엔진을 통한 새로운 지식을 발견하여 효율적인 검색을 지원하는 알고리즘을 제안한다. 식당, 주유소, 제과점 등의 도메인에 따른 개인별 선호 온톨로지를 구축하고, 주유소 개인 선호 데이터를 예제로 하여 연관 및 온톨리지 기반에서 정보를 검색할 때, 연관 및 추론 정보를 제공함을 보여준다.

  • PDF