• Title/Summary/Keyword: 발견적 알고리즘

Search Result 462, Processing Time 0.028 seconds

빈발 패턴 네트워크에서 연관 규칙 발견을 위한 아이템 클러스터링

  • O, Gyeong-Jin;Jeong, Jin-Guk;Jo, Geun-Sik
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2007.05a
    • /
    • pp.321-328
    • /
    • 2007
  • 데이터마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 제안되어 왔다. 본 논문에서는 정점으로 아이템을 표현하고, 간선으로 두 아이템집합을 표현하는 빈발 패턴 네트워크(FPN)이라 불리는 새 자료 구조를 제안한다. 빈발 패턴 네트워크에서 아이템 사이의 연관 관계를 발견하기 위해 이 구조를 어떻게 효율적으로 사용 하느냐에 초점을 두고 있다. 구조의 효율적인 사용을 위하여 한 아이템이 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 네트워크의 정점을 클러스터링하는 방법을 사용한다. 실험은 신뢰도, 상관관계 그리고 간선 가중치 유사도를 이용하여 네트워크에서 아이템 클러스터링의 정확도를 보여준다. 본 논문의 실험 결과를 통해 신뢰도 유사도가 네트워크의 정점을 클러스터링할 때 클러스터의 정확성에 가장 많은 영향을 미친다는 것을 알 수 있었다.

  • PDF

A Proxy Caching Algorithm based on the Analysis of Multimedia Contents Request Patterns in Mobile Environments (모바일 환경에서 멀티미디어 컨텐츠의 요청패턴 분석에 기반한 프록시 캐싱 알고리즘)

  • Lee, Sang-Min;Kim, Bub-Jung;Nang, Jong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.649-651
    • /
    • 2005
  • 본 논문에서는 실제 모바일 환경에서의 멀티미디어 컨텐츠의 요청 패턴을 분석하고 그 결과를 반영한 캐싱 알고리즘을 제안한다. 로그 데이터를 분석한 결과 컨텐츠의 연속적인 요청이 매우 짧은 시간 동안 이루어지는 시간적인 특성을 발견했으며, 컨텐츠의 다른 버전 사이의 요청 시간이 짧음을 통해서 버전별 컨텐츠의 요청이 응집되어 나타남을 확인했다. 제안된 알고리즘에서는 시간적인 특성과 컨텐츠의 인기도 특성을 반영하기 위해 측정 시간 윈도우 내에서 컨텐츠의 요청 횟수를 측정하고, 요청 횟수의 임계값 이상의 컨텐츠에 대해서 유지 시간 단위만큼의 컨텐츠 만료 시간을 정한다. 또한 공간적인 특성을 이용하여 컨텐츠가 캐시에서 제거될 때, 만료시간이 지난 컨텐츠의 다른 버전을 동시에 캐시에서 제거하는 방법을 사용한다 실험 결과 캐시의 크기가 작은 경우 제안된 알고리즘이 기존 알고리즘에 비해 $1-5\%$ 정도 성능향상을 보였다.

  • PDF

Genetics-Based Machine Learning for Generating Classification Rule in Data Mining (데이터 마이닝의 분류 규칙 발견을 위한 유전자알고리즘 학습방법)

  • 김대희;박상호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.429-434
    • /
    • 2001
  • 데이터(data)치 홍수와 정보의 빈곤이라는 환경에 처한 지금, 정보기술을 이용하여 데이터를 여과하고, 분석하며, 결과를 해석하는 자동화 된 데이터 분석 방안에 높은 관심을 가지게 되었으며, 데이터 마이닝(Data Mining))은 이러한 요구를 충족시키는 정보기술의 활용방법이다. 특히 데이터 마이닝(Data Mining)의 분류(Classification) 방법은 중요한 분야가 되고 있다. 분류 작업의 핵심은 어떻게 적당한 결정규칙(decision rule)을 정의하느냐에 달려 있는데 이를 위해 학습능력을 가지고 있는 알고리즘이 필요하다. 본 논문에서는 유전자 알고리즘(Genetic Algorithm)을 기반으로 하는 강건한 학습방법을 제시했으며, 이러한 학습을 통해 데이터 마이닝(Data Mining)의 분류시스템을 제안하였다.

  • PDF

Efficient Update Algorithm of Sequential Pattern (효율적인 순차 패턴 갱신 알고리즘)

  • 김학자;김형근;황환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.178-180
    • /
    • 2003
  • 본 논문은 순차 패턴을 갱신하는 알고리즘을 제안한다. 갱신된 데이터베이스에서 새로운 순차 패턴을 찾는 비용을 줄이기 위해 갱신 전 데이터베이스에서 발견한 순차 패턴에 대한 정보와 추가되는 데이터베이스의 정보만으로 새로운 순차 패턴의 후보를 줄이는 방법으로, 갱신된 전체 데이터베이스를 대상으로 순차 패턴 마이닝 알고리즘을 재실행하는 방법에 비해 후보 셋이 줄어들고 이로 인해 연산 비용을 줄일 수 있는 장점이 있다.

  • PDF

An Effective Scheme for Managing Overlay Networks based on Propagation of Network Address Change of Node in a Mobile P2P Environment (모바일 P2P 환경에서 이동 노드 주소 변경 전파를 통한 효율적 Overlay 망 유지 기법)

  • Kim, Dong-Wook;Lee, Eo-Hyung;Hong, Chung-Pyo;Kim, Shin-Dug
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.750-753
    • /
    • 2009
  • 최근 유비쿼터스 및 모바일 환경에서 Peer-to-Peer(P2P)시스템에 대한 연구들이 활발히 진행되고 있다. 모바일 환경에서는 모바일 환경의 제약사항과 함께 이동성이라는 특징이 중요하게 고려된다. 노드의 이동에 의해서 네트워크의 주소가 변경되어 P2P 네트워크 망에서 유효하지 않은 접속 정보들이 생기고 이러한 정보들이 검색 및 P2P 시스템의 전체적인 성능을 떨어뜨리게 된다. 이 논문은 이러한 접속 정보들의 불일치를 해결하여 접속 정보를 유지하기 위한 효과적인 방법론인 이동전파 알고리즘을 제안한다. 이 알고리즘은 접속 정보의 불일치를 해결하기 위해 정보를 빠르게 처리해서 P2P 시스템의 성능을 향상하는 것을 목표로 한다. DHT 기반 P2P 시스템을 기반으로 하여 제안하는 알고리즘을 적용하여 실험을 하였으며, 그 결과로 처음 신규 발견된 정보를 재 발견하는 경우에 성능이 기존의 DHT 기반의 P2P 시스템보다 80% 향상되었음을 알 수 있다.

Finding the longest match in data compression using suffix trees (접미사 트리를 이용한 압축 기법에서 가장 긴 매치 찾기)

  • 나중채;박근수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.658-660
    • /
    • 1999
  • Ziv-Lempel 코딩 방식은 문자열이 반복해서 나올 때 뒤에 나오는 문자열을 앞에 나온 문자열에 대한 포인터로 대칭시킴으로써 압축을 한다. 따라서 이 방식을 위해서는 앞서 나온 문자열을 유지하는 사전과 문자열 매칭이 필수적이다. 그래서 이 두 가지에 효율적인 자료구조인 접미사 트리를 Ziv-Lempel 코딩 방식에 적용시키려고, 그 이후에 Fiala, Greene와 Larsson은 각각 McCreight와 Ukkonen의 접미사 트리 생성 알고리즘을 LZ77 코딩에 이용하였다. 접미사 트리를 이용한 Zv-Lempel 코딩에는 만들어진 사전, 즉 접미사 트리와 앞으로 압축될 문자열과의 가장 긴 매치는 찾는 과정이 있다. 이는 단순히 접미사 트리의 루트부터 차례로 검색해 나가도 되지만 이렇게 했을 때 걸리는 시간은 노드에서 자식을 찾는데 걸리는 분기 결정 시간에 의해 좌우된다. 즉 분기에 성형 시간 이상이 걸리면 가장 긴 매치를 찾는데도 역시 선형 시간 이상이 걸린다. 게다가 이 방법은 자기 중복(self-overlapping)의 이점을 살릴 수가 없다. Rodeh, Pratt와 Even은 McCreight의 생성 알고리즘을 이용할 때 가장 긴 매치를 바로 찾을 수 있다는 것을 발견했다. 그러나 Ukkonend의 알고리즘에 대해서는 아직 이러한 방법이 알려지지 않았다. 본 논문에서는 Ukkonen의 알고리즘에 몇가지 작업을 추가하여 전체적으로 선형시간안에 가장 긴 매치를 찾는 방법을 소개한다.

  • PDF

Numerical Analysis of Flow Characteristics in the Impeller Channel of a Double Suction Pump (양흡입 펌프 회전차 채널 내부 유동 특성 고찰)

  • 김세진;김윤제
    • Journal of Energy Engineering
    • /
    • v.9 no.2
    • /
    • pp.89-94
    • /
    • 2000
  • 양흡입 펌프 회전차 내부 유동특성을 수치적으로 고찰하였다. 수치계산은 설계점과 2개의 탈설계점에서 이루어졌으며, Patankar에 의해 제시된 SIMPLE 알고리즘을 이용하였다. 설계점에서는 양 회전차 채널 내부에서 대칭 형상을 갖는 이차유동 특성을 발견하였지만, 탈설계점에서는 비대칭 유동특성을 발견하였다. 수치해석 결과로는 유량감소에 따라 양흡입 펌프 회전차 채널내부의 이차유동 특성이 달라진다는 사실을 고찰하였다. 또한 양흡입 펌프 회전차 단면에는 모퉁이 와류가 존재함을 알 수 있었다.

  • PDF

Mining Sequential Patterns Using Multi-level Linear Location Tree (단계 선형 배치 트리를 이용한 순차 패턴 추출)

  • 최현화;이동하;이전영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.70-72
    • /
    • 2003
  • 대용량 데이터베이스로부터 순차 패턴을 발견하는 문제는 지식 발견 또는 데이터 마이닝(Data Mining) 분야에서 주요한 패턴 추출 문제이다. 순차 패턴은 추출 기법에 있어 연관 규칙의 Apriori 알고리즘과 비슷한 방식을 사용하며 그 과정에서 시퀀스는 해쉬 트리 구조를 통해 다루어 진다. 이러한 해쉬 트리 구조는 항목들의 정렬과 데이터 시퀀스의 지역성을 무시한 저장 구조로 단순 검색을 통한 다수의 복잡한 포인터 연산수행을 기반으로 한다. 본 논문에서는 이러한 해쉬 트리 구조의 단정을 보완한 다단게 선형 배치 트리(MLLT, Multi-level Linear Location Tree)를 제안하고, 다단계 선형 배치 트리를 이용한 효율적인 마이닝 메소드(MLLT-Join)를 소개한다.

  • PDF

Detecting Changes in Structured Documents using Message Digest (메시지 다이제스트를 이용한 구조화된 문서의 변화 탐지)

  • 김동아;이석균
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.151-153
    • /
    • 2002
  • XML/HTML 문서와 같이 트리 구조로 표현되는 데이터의 변화 탐지는 NP-hard의 문제로 이에 대한 효율적인 구현은 매우 중요하다. 본 논문에서는 효율적인 변화 탐지를 위해 트리 구조의 데이터를 X-tree로 표현하고 이에 기초한 휴리스틱 알고리즘을 제안한다. X-tree에서는 모든 서브트리의 루트 노드에 서브트리의 구조와 소속 노드들의 데이터들을 128비트의 해시값으로 표현하여 저장함으로 신ㆍ구 버전의 X-tree들에 속한 서브트리들의 비교가 매우 효율적이다. 제시한 변화 탐지 알고리즘에서는 구 버전의 X-tree의 모든 서브트리들에 대해 신 버전의 X-tree에서 동등한 서브트리들을 찾고, 이들에 기초하여 이동 연산이 발생한 서브트리들과 갱신 연산이 발생한 서브트리들을 순차적으로 찾는다. 이때 이동 연산과 갱신 연산으로 대응되는 서브트리는 동등 서브트리로부터 루트 노드로 대응 관계를 확장하는 가운데 발견된다. 이후 깊이 우선으로 검색하면서 나머지 노드들을 대응시킨다. X-tree의 구조적 특징에 기인하여 노드들 간의 비교를 통해 대응 여부를 검사하는 대부분의 기존 연구와는 달리 서브트리의 비교를 통해 대부분의 대응 관계를 결정하므로 효율적인 변화 탐지가 가능하다. 본 알고리즘은 최악의 경우에서도 N을 신ㆍ구 버전 문서의 전체 노드 수라 할 때 O(N)의 시간 복잡도를 갖는다.

  • PDF

Improvement Approach on the Plant Layout Based on Tabu Search (Tabu 탐색 기법을 활용한 개선적 공장 설비배치)

  • Kim, Chae-Bogk
    • Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology
    • /
    • v.6 no.6
    • /
    • pp.469-477
    • /
    • 2016
  • This study develops an approach to assign numbers of facilities (rectangular shape) in a given plant and compares the test results by proposed approach with those by approaches in the literature. An improvement approach is proposed to minimize material handling cost given initial layout. Like popular heuristic approaches, the developed heuristic approach employs interchange routine to improve material handling cost in current layout. Horizontal interchange and vertical interchange procedures are applied to obtain better solution. Also, it is possible to rotate facility layout when the sizes of both facilities are same. However, the proposed approach generates good solutions without shape distortion. That means the shape of facilities remains rectangle in the final solution. In addition, the improve approach can find global optimal solution from local optimal solution by applying Tabu search technique. Based on 25 test problems in the literature, we obtained better solutions than other facility layout approaches in the literature when there are many facilities.