• 제목/요약/키워드: 데이타마이닝

검색결과 106건 처리시간 0.033초

물 공급량 예측을 위한 데이터 마이닝 기법 (Data Mining for Water Supply Forecasting)

  • 신강욱;김연권
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.233-235
    • /
    • 2021
  • 본 논문에서는 물 공급량 예측을 위한 다양한 알고리즘 적용에 있어서 데이터 마이닝의 효용성을 검토하고자 하였다. 물 공급분야에 있어서, 물 이용 지역의 특성에 따라 공급량과 이용 시간이 매우 상이한 특성을 나타낸다. 물 이용 지역은 주택지역, 상업지역, 산업단지지역 등 다양한 형태로 분류할 수 있고, 이에 따라 물 이용 시간의 상이함에 따른 물 공급패턴이 일정하지 않게 된다. 특히, 주택지역과 상업지역이 복합적으로 이루어진 경우, 물 이용 단위인 블록 단위에서의 물 특성이 불규칙적인 패턴을 나타낸다. 따라서, 각 블록 단위 특성에 적합한 물 이용량을 예측하여 효율적 물 공급 방안을 마련할 필요가 있다. 또한, 물 이용량 데이터 중 이상 데이타 감지와 이상 데이터 보정을 통하여 물 이용량 예측의 정확도가 향상된다. 따라서, 블록 단위의 물 이용량에 대한 원시데이타의 효율적인 데이터 마이닝 방안이 요구된다. 본 연구에서는 물 공급지역의 특성에 따른 물 공급 패턴을 분석하고, 이에 적합한 데이터 마이닝 기법을 제시하고 비교 분석하였다. 제안된 데이터 마이닝 기법은 딥러닝 예측모델을 적용하여 적합성을 검증하고, 이를 물 공급량 예측알고리즘에 폭넓게 활용될 수 있음을 확인하였다.

  • PDF

통신이력 데이타에 기반한 교우관계 분석 (Peer Relationship Analysis Based on Communication History Records)

  • 문양세;최훈영;김진호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.730-740
    • /
    • 2006
  • 최근 청소년의 교우관계에 있어서 집단 따돌림과 불량 그룹이 사회적으로 큰 문제가 되고 있다. 본 논문에서는 학생들의 교우관계를 보다 객관적으로 분석하는 방법을 제안한다. 분석을 위한 객관적인 데이타로는 교우관계 정보를 묵시적으로 내포하고 있는 통신이력 데이타를 사용하며, 체계적 분석을 위하여 데이타 마이닝 기법을 활용한다. 제안하는 분석 방법은 다음과 같다. 첫째, 교우간 친밀도 (degree of familiarity) 개념을 정형적으로 정의하고, 여러 통신도구에서 발생한 통신이력 데이타를 기반으로 교우 간 친밀도를 수학적으로 계산하는 방법을 제안한다. 제안하는 방법은 학생 x가 y로 통신을 많이 시도할수록, 학생 x 의 y 에 대한 교우간 친밀도가 높다는 직관을 사용한다. 둘째, 계산한 교우간 친밀도를 사용하여 집단 따돌림의 가능성이 높은 학생을 파악한다. 이는 집단 따돌림 가능성이 높은 학생은 다른 학생으로부터의 통신 시도가 적을 것이라는 직관에 기반한다. 셋째, 교우간 친밀도를 데이타 마이닝 기법 중 하나인 클러스터링으로 분석하여 의미 있는 교우집단을 파악한다. 클러스터링 기법을 사용하기 위하여, 본 논문에서는 교우간 친밀도를 기반으로 교우간 유사도 (similarity) 개념을 정형적으로 정의하고, 이를 사용하여 클러스터링을 수행한다. 마지막으로, 제안한 방법의 실용성을 입증하기 위하여, 실제 구현 및 분석 실험을 수행하고, 그 의미를 해석한다. 이 같은 결과를 볼 때, 본 연구는 학생들의 교우관계를 보다 객관적으로 파악할 수 있는 효과적인 방법론이라 사료된다.

퍼지 데이타에 대한 퍼지 결정트리 기반 분류규칙 마이닝 (Classification Rue Mining from Fuzzy Data based on Fuzzy Decision Tree)

  • 이건명
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권1호
    • /
    • pp.64-72
    • /
    • 2001
  • 결정트리 생성은 일련의 특징값으로 기술된 사례들로부터 분류 지식을 추출하는 학습 방법중의 하나이다. 현장에서 수집되는 사례들은 관측 오류, 주관적인 판단, 불확실성 등으로 인해서 애매하게 주어지는 경우가 많다. 퍼지숫자나 구간값을 사용함으로써 이러한 애매한 데이타의 수치 속성은 쉽게 표현될 수 있다. 이 논문에서는 수치 속성은 보통값 뿐마아니라 퍼지숫자나 구간값을 갖을 수 있고, 비수치 속서은 보통값을 가지며, 데이터의 클래스는 확신도를 기자는 학습 데이터들로 부터, 분류 규칙을 마이닝하기 위한 퍼지 결정트리 생성 방법을 제안한다. 또한 제안한 방법에 의해 생성된 퍼지 결정트리를 사용하여, 새로운 데이터에 대한 클래스를 결정하는 추론 방법을 소개한다. 한편, 제안된 방법의 유용성을 보이기 위해 수행한 실험의 결과를 보인다.

  • PDF

NFP-Algorithm 알고리즘을 기반한 텍스트 연관 패턴 추출 (Text Assocation Pattern Extraction using NFP-tree Algorithm)

  • 유수경;김교정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.97-100
    • /
    • 2004
  • 인터넷상에서 존재하는 많은 데이터베이스들 중 현실적으로 유용한 정보를 가지고 있는 것은 텍스트 데이타베이스이다. 텍스트 마이닝 기법에서 비구조적인 특징을 가진 텍스트 데이타로부터 유용한 정보를 분석하고 추출하여 연관된 패턴을 탐색하는 과정은 중요한 연구과제이다. 이에 본 논문은 인터넷에서 저장된 텍스트 데이터를 가지고 기존 텍스트 마이닝 기법 중 연관탐색 기법을 적용하여 사용자 중심의 연관된 패턴을 찾아서 의미있는 정보를 얻고자 한다. 탐색하기 위해 먼저 전처리 작업으로 용어의 객체를 추출하고. 추출된 각 객체들은 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관탐색 기법인 NFP-Algorithm(N-most interesting k-itemsets Using FP-tree and FP-Growth)을 적용시켜서 의미있는 정보를 추출했다. 또한 Apriori계 Algorithm, FP-Algorithm, NFP-Algorithm을 비교하여 NFP-Algorithm이 시간적면에서 효율적임을 보여주었다.

  • PDF

SOM을 적용한 선택적 샘플링에 관한 연구 (A Study on Selective Sampling using SOM)

  • 김만선;양형정;김정식;김선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.38-41
    • /
    • 2007
  • 데이타 마이닝을 위하여 수집된 대용량의 데이타를 여과 없이 기계학습에 적용하는 것은 많은 시간과 비용이 요구될 뿐만 아니라 저장 공간면에서도 비효율적이다. 선별적 샘플링은 이러한 상황에서 매우 효율적으로 적용할 수 있도록 원본 데이타의 특성을 가능한 반영하여 새로운 훈련 데이타를 생성하는 방법이다. 본 연구에서는 신경망의 하나인 SOM을 적용한 선별적 샘플링을 수행하는데 있어서 여러 가지 선택 문제를 효과적으로 해결하기 위한 실험을 수행한다. 실험 결과로는 두 가지 결과를 얻었다. 1) 충분한 맵 사이즈를 선택해야 학습 데이타의 함축적인 특성을 잘 반영한다, 2) 선택적 샘플링을 위한 유닛선택 방법에서는 의미없는 유닛을 제거함으로서 분류 성능향상을 얻을 수 있다.

  • PDF

혼합형 이미지 메타데이타를 이용한 지능적 이미지 검색 시스템 설계 및 구현 (A Design and Implementation of Intelligent Image Retrieval System using Hybrid Image Metadata)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.209-223
    • /
    • 2000
  • 멀티미디어 데이타의 중요성과 활용도가 증가됨에 따라 데이타베이스에서 멀티미디어 데이타를 표현하고 관리하기 위한 연구가 필요하게 되었다. 따라서, 본 논문은 혼합형 이미지 메타데이타를 이용하여 이미지 데이타베이스에서 이미지 데이타에 대한 검색 기법을 지능화하고 시스템을 효율적으로 관리할 수 있는 시스템을 제시한다. 개념 계층을 기반으로 이미지 정보를 지능적인 형태로 저장, 검색하고, 이미지 마이닝을 하기위해 사용자의 정보와 사용자가 이용한 질의 정보 그리고 이 미지정보를 통합하여 검색한다. 즉, 사용자 메타데이타와 이미지 메타데이타를 추출하고 통합하여 사용자에게 좀더 많은 부가 정보를 제공할 수 있는 지능적 이미지검색 시스템을 제공한다.

  • PDF

웹 사용 마이닝의 정확도 향상을 위한 인기도 기반 전진 참조 기법 (Popularity-weighted Forward Reference Scheme for High Accuracy in Web Usage Mining)

  • 조현웅;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.133-135
    • /
    • 2001
  • 웹 사용 마이닝의 단계중 패턴 발전을 위해 초기 데이타를 정제하는 전처리 과정은 매우 중요한 작업이다. 전처리 과정의 결과가 높은 정확도를 가지고 있다면 마이닝의 결과 역시 보다 정확한 결과를 생성한다는 것은 여러 연구를 통해 널리 알려진 사실이다. 본 논문에서는 전처리 과정중 내용 페이지를 구분하기 위해 자주 이용되는 기법중 하나인 최대 전진 참조(M.F.R : Maximal Forward Reference) 기법을 개선한 인기도 기반 전진 참조(P.F.R : Popularity-weighted Forward Reference) 기법을 제안하고 예제를 통해 두 기법의 결과를 비교하였다. 그 결과 최대 전진 참조 기법에서 발생할 수 있는 오류를 극복한 인기도 기반 기법이 좀더 정확한 내용 페이지 구분이 가능하여 웹 사용 마이닝 단계에서 유용하게 활용 할 수 있음을 보였다.

  • PDF

데이타마이닝 기법을 적용한 지능형 인터넷 쇼핑몰 설계 및 구현 (A Design and Implementation of Intelligent Internet Shopping Mall using Datamining Technology)

  • 김진철;황보윤;황성희;곽난희;문현정;우용태
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 1999년도 종합학술대회발표논문집
    • /
    • pp.757-760
    • /
    • 1999
  • 본 논문에서는 오라클사의 전자상거래용 패키지인 ICS를 기반으로 지능형 인터넷 쇼핑몰을 설계 하고 구현하였다. 본 쇼핑몰은 고객들의 접속 기록과 상품 구매 기록을 데이터마이닝 기법에 의해 통계적으로 분석하여 상품에 대한 인기도에 따라 상품 진열을 자동적으로 구성할 수 있는 지능형 쇼핑몰이다. 본 시스템을 동하여 쇼핑몰 관리자의 주관적인 판단에 의해 수 작업으로 이루어지는 기존 쇼핑몰 관리 업무를 자동화할 수 있다. 또한 최근에 급격하게 증가하고 있는 전자상거래 시장에서 경쟁력을 강화할 수 있는 새로운 형태의 마케팅 기법을 제시하였다.

  • PDF

감성공학기술을 이용한 사례기반추론의 판매지원 에이전트에 관한 연구 (A Study on Sales Agent using Case-Based Reasoning And Aesthetic Engineering Technique)

  • 윤종찬;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.3-6
    • /
    • 2004
  • 전자상거래의 지원 시스템에서 판매지원 에이전트는 고객의 취향을 파악하여 구매자에게 가장 적절한 상품을 탐색하여 사용자의 만족도를 극대화할 수 있어야 한다. 이에 데이타마이닝의 기법 중의 하나인 사례기반추론기법을 이용한 판매지원 에이전트와 감성공학을 이용한 신제품 개발지원과 기존 제품의 리모델링을 제시하는 에이전트를 결합한 다중 에이전트 시스템을 제안하고자 한다.

  • PDF

복수 데이터베이스에서 링크를 이용한 연관 규칙 탐사 (Mining Association Rules in Multiple Databases using Links)

  • 배진욱;신효섭;이석호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권8호
    • /
    • pp.939-954
    • /
    • 1999
  • 데이타마이닝 분야에서는 대용량의 트랜잭션 데이타베이스와 같은 하나의 데이타베이스로부터 연관 규칙을 찾는 연구가 많이 수행되어왔다. 그러나, 창고형 할인매장이나 백화점 같이 고객 카드를 이용하는 판매점의 등장으로, 단지 트랜잭션에 대한 분석 뿐만이 아니라, 트랜잭션과 고객과의 관계에 대한 분석 또한 요구되고 있다. 즉, 두 개의 데이타베이스로부터 연관 규칙을 찾는 연구가 필요하다. 이 논문에서는 두 데이타베이스 사이에 링크를 생성하여 연관 항목집합을 찾는 알고리즘을 제안한다. 실험 결과, 링크를 이용한 알고리즘은 고객 데이타베이스가 메모리에 거주가능한 크기라면 시간에 따른 분석에 유용함을 보여주었다.Abstract There have been a lot of researches of mining association rules from one database such as transaction database until now. But as the large discount store using customer card emerges, the analysis is not only required about transactions, but also about the relation between transactions and customer data. That is, it is required to search association rules from two databases. This paper proposes an efficient algorithm constructing links from one database to the other. Our experiments show the algorithm using link is useful for temporal analysis of memory-resident customer database.