• 제목/요약/키워드: 순차 패턴

검색결과 309건 처리시간 0.029초

비즈니스 서비스 식별을 위한 변형 순차패턴 마이닝 알고리즘 (Adapted Sequential Pattern Mining Algorithms for Business Service Identification)

  • 이정원
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.87-99
    • /
    • 2009
  • SOA를 도입하는 하향식 (top-down) 방법은 온톨로지를 기반으로 서비스를 분석하고 설계하는 서비스 모델링 단계를 핵심으로 봄으로써 SOA의 장점을 가장 잘 반영할 수 있는 방법으로 권장되고 있다. 그러나 대부분의 기업들은 하향식 방법이 최상이라는 것을 알면서도 기업 이윤 창출에 단기적인 효과가 드러나지 않고 도입 초기에 개발시간과 비용이 증대되므로 이를 꺼리게 된다. 특히 잘 정의된 컴포넌트 시스템을 이미 사용하고 있는 경우에 더욱 그러하다. 따라서 본 논문에서는 기존의 잘 정의된 컴포넌트시스템을 최대한 이용할 수 있는 상향식 (bottom-up) 서비스식별 방법을 제안한다. GUI는 직접 사용자의 입력을 받아 들여 이벤트를 발생시킨다는 점에 착안하여 이벤트의 경로를 연결하면 비즈니스 프로세스에 근사시킬 수 있다. 따라서 컴포넌트와 상호작용하는 GUI의 이벤트 수를 기준으로 핵심 GUI를 선정하고 핵심 GUI로부터 연결되는 이벤트 경로를 대상으로 기존의 순차패턴 마이닝 알고리즘을 변형하여 사용자의 서비스 사용 패턴을 추출한다. 실험결과 추출된 이벤트 패턴에 응집도를 적용하여 다양한 크기의 비즈니스 서비스를 식별할 수 있음을 보였다.

웹 로그 마이닝을 이용한 웹 문서 예측 시스템 (Web Document Prediction System by using Web Log Mining)

  • 이범석;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.97-99
    • /
    • 2005
  • 웹 문서 수의 급격한 증가는 사용자로 하여금 방대한 양의 웹 문서들로부터 필요한 정보를 선별하기 위한 시간과 비용을 낭비하게 만들었다. 따라서 이러한 문제를 해결하기 위한 연구의 필요성이 점차 증가하였는데, 그 중 웹 서버 로그 데이터에 마이닝 기법을 적용하여 사용자들의 사이트 내 문서의 접근 패턴을 분석하고, 그 데이터를 이용하여 동적으로 변화하는 적응형 웹 사이트를 제공하려는 것이 대표적인 연구 사례이다. 본 논문에서는 웹 서버 로그 마이닝을 이용하여 사용자가 필요로 하거나, 관심을 가지고 있는 페이지를 예측하여 추천해 주는 시스템에 대해 소개한다. 이러한 시스템을 구현하기 위해 순차 패턴 마이닝이나 빈발 에피소드 발견 기법 등의 알고리즘을 사용할 수 있다. 제안하는 시스템에서는 사용자 접근 패턴을 분석할 때 순차 패턴 마이닝 기법을 사용하고, 사용자의 이동 패턴을 근거로 웹 문서를 예측하여 추천해줄 때에는 에피소드 발견 기법에서의 window 개념을 이용한다. 본 논문에서 제안한 시스템은 웹 문서를 사용자가 머물었던 시간에 따라 관심 있는 문서와 지나간 문서로 구분하여 관심 있는 문서에 대해서안 마이닝을 수행한다. 또한 일정한 크기를 갖는 History window에 의해 다음 문서를 추천해주기 때문에 사용자의 모든 로그를 저장하지 않으므로 보다 효율적이다.

  • PDF

생물학적 서열들에서 빈발한 연속 서열 패턴 마이닝 (Mining Frequent Contiguous Sequence Patterns in Biological Sequences)

  • 강태호;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.27-31
    • /
    • 2007
  • 생물학적 서열 데이터는 크게 DNA 염기 서열과 단백질 아미노산 서열이 있다. 이들 서열은 일반적으로 많은 수의 항목들을 가지고 있어 그 길이가 매우 길다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 부분 연속 서열들이 존재하는데 이들 서열들을 찾아내는 것은 다양한 서열 분석에서 유용하게 사용될 수 있다. 이를 위해 초기에는 Apriori 알고리즘을 기반으로 하는 순차패턴 마이닝 알고리즘들을 활용하는 방법들이 많이 제시되었다. 그중 PrefixSpan 알고리즘은 Apriori기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로부터 서열 패턴을 확장해나가는 방식으로 길이가 긴 연속 서열을 포함하는 생물학적 데이터 서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 원본 데이터베이스보다 크기가 큰 별도의 프로젝션 데이터베이스를 사용함으로서 많은 비용부담이 발생하고 특히 길이가 긴 서열에 대해서는 더욱 효율적이지 못하다. 이에 본 논문에서 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색 성능이 우수함을 증명한다.

  • PDF

순차 패턴 마이닝 기법을 이용한 개인 맞춤형 TV 프로그램 스케줄러 (A Personalized Automatic TV Program Scheduler using Sequential Pattern Mining)

  • 표신지;김은희;김문철
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.625-637
    • /
    • 2009
  • 방송 프로그램 콘텐츠들의 증가와 콘텐츠 접근 방법의 다양화로 따라 사용자는 기존의 단순한 방송 시청 환경에서 보다 복합적인 환경에서 다양한 콘텐츠를 접할 수 있게 되었다. 따라서 사용자는 익숙지 않은 다양한 콘텐츠들 중에서 자신이 시청하기 원하는 콘텐츠를 찾고 그것들을 원하는 시간에 시청하기 위해 전보다 많은 노력을 기울이게 되었다. 또한 사용자는 대체로 자신만의 일관성 있는 시청 패턴으로 프로그램을 시청한다. 본 논문에서는 사용자의 개인적인 시청 특성을 발견하여 사용자의 수고를 줄이고 프로그램 시청의 편의성을 제공하기 위해 순차 패턴 마이닝 기법을 이용하여, 개인 맞춤형 TV 프로그램 스케줄러를 제안한다. 이를 위해 개인 맞춤형 TV 프로그램 스케줄 추천 시스템을 제안하였으며, 사용자들의 TV 프로그램 시청 기록을 바탕으로 TV시청 환경에 적합한 순차 패턴 마이닝 기법을 제안하였다. 또한 개인 사용자의 암시적인 선호도를 추출하여 TV 프로그램 추천에 적용, 개인 맞춤형 TV 프로그램 스케줄을 구성하여 추천할 수 있도록 하였다. 이러한 TV 프로그램 스케줄 추천 시스템은 향후 IPTV의 VoD 특성을 고려한 프로그램 스케줄 추천 시스템으로 확장 가능하다.

하이브리드 플래시-디스크 저장장치용 Flash Translation Layer의 성능 개선을 위한 순차패턴 마이닝 기반 2단계 프리패칭 기법 (Improving Flash Translation Layer for Hybrid Flash-Disk Storage through Sequential Pattern Mining based 2-Level Prefetching Technique)

  • 장재영;윤언근;김한준
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.101-121
    • /
    • 2010
  • 본 논문은 플래시 메모리와 하드디스크로 구성되는 하이브리드 저장장치의 성능을 높이기 위한 프리패칭 기법을 제안한다. 하이브리드 저장장치에 포함된 플래시 메모리는 하드디스크에 비해 쓰기/읽기 연산 속도가 상대적으로 빠르기 때문에 이를 캐시 공간처럼 활용하여 성능을 높일 수 있다. 프리패칭을 위한 기본 전략은 순차패턴 마이닝을 이용하는 것이며, 이를 이용하면 시간적 흐름을 가지는 과거 객체 참조열로부터 반복되는 객체 접근 패턴을 추출할 수 있다. 프리패칭 기법을 사용하여 하이브리드 저장장치의 성능을 최대화하기 위하여 본 논문은 두 가지 방법을 사용하였다. 첫 번째는 플래시 메모리 매핑을 위하여 기존의 FAST 알고리즘을 개선하였고, 두 번째는 제한된 플래시 메모리의 공간을 효율적으로 사용하기 위하여 프리패칭 단위로 파일 수준과 블록 수준을 동시에 고려하였다. 제안 기법의 효용성을 평가하기 위해 참조 지역성을 가지는 합성 데이터와 UCC 데이터를 활용하여 실험을 실시하여 제안된 방법의 우수성을 증명하였다.

웹 로그 분석을 이용한 추천 에이전트의 개발 (Development of Recommendation Agents through Web Log Analysis)

  • 김성학;이창훈
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.621-630
    • /
    • 2003
  • 웹 로그는 사용자가 웹 사이트의 데이터를 액세스할 때 웹 서버에 의해 기록되는 정보로써 최근 인터넷 이용의 급속한 증가로 인해 웹 로그의 활용가치가 더욱 중요하게 되었으며, 웹 로그의 분석 결과는 쇱 사용자들의 행위를 나타내는 패턴을 분석하거나 웹 사이트의 구조를 재배치 하는데 이용될 수 있다. 이를 실현하기 위한 많은 연구들은 주로 연관규칙과 순차패턴을 이용하고 있는데, 대다수는 Apriori 알고리즘을 기본으로 하고 있어서 대용량의 데이터베이스에 적용하기에는 컴퓨팅 시간적 측면에서 비효율적이다. 따라서 본 논문에서는 웹 환경에서 흥미있는 패턴을 탐사하는 새로운 알고리즘을 개발하여 보다 빠르게 패턴탐사를 수행하고, 많은 사용자들이 관심있게 순차적으로 접근하고 있는 정보를 시스템 관리자에게 제공할 수 있는 추천에이전트를 개발한다.

  • PDF

낸드 플래시 메모리 상에서 쓰기 패턴 변환을 통한 효율적인 B-트리 관리 (Efficiently Managing the B-tree using Write Pattern Conversion on NAND Flash Memory)

  • 박동주;최해기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권6호
    • /
    • pp.521-531
    • /
    • 2009
  • 플래시 메모리는 하드디스크와 다른 물리적 특성을 가진다. 대표적으로 읽기연산과 쓰기연산의 비용이 다르고, 덮어쓰기(overwrite)가 불가능하여 소거연산(erase)이 선행되어야 한다. 이러한 물리적 제약을 소프트웨어적으로 보완해주기 위해서, 플래시 메모리를 사용하는 시스템은 대부분 플래시 변환 계층(Flash Translation Layer)을 사용한다. 현재까지 효율적인 FTL 기법들이 제안되었으며, 이들은 임의쓰기(random writes) 패턴보다 순차쓰기(sequential writes) 패턴에 훨씬 더 효율적으로 동작한단. 본 논문에서는 플래시 메모리 상에서 B-트리 인덱스를 효율적으로 생성, 유지하기 위한 새로운 기법을 제안한다. B-트리에 키의 삽입, 삭제, 수정 등치 연산을 수행하면 FTL에 비효율적인 임의쓰기 패턴을 많이 발생시키며, 결국 B-트리 인덱스 유지 비용이 커지게 된다. 제안하는 기법에서는 B-트리에서 발생되는 임의쓰기 패턴을 먼저 플래시 메모리의 쓰기 버퍼에 추가쓰기(append writes) 패턴으로 변환하여 저장하고, 추후 이를 FTL에 효율적인 순차쓰기 패턴으로 FTL에 전달한다. 다양한 실험을 통해 제안하는 기법이 기존의 기법보다 플래시 메모리 I/O 비용 측면에서 우수하다는 것을 보인다.

파동분할 기반의 꼭지점 계보를 이용한 순차적 삼차원 메쉬 부호화 (Sequential 3D Mesh Coding using Vertex Pedigree based on Wave Partitioning)

  • 김태완;안정환;양창모;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.213-218
    • /
    • 2001
  • 본 논문에서는 파동분할(Wavepartitioning) 방식을 기반으로 꼭지점들간의 특징적인 관계(Vertex Pedigree)를 이용한 순차적(Sequential) 메쉬 부호화 방식을 제안한다. 파동분할 방식은 호수에 물방울이 퍼져 나가는 자연 원리를 이용하여 초기 삼각형의 주위에 삼각형을 덧붙여 가면서 하나의 SPB(Small Processing Block)을 만들어내는 방식이다. 이 방식을 이용하여 하나의 모델을 서로 독립적인 SPB로 분할하고, 각각의 SPB내에서 초기 삼각형을 중심으로 그것에 덧붙여진 삼각형에 의해 만들어진 원 또는 반원을 찾는다. 또한, 그 원주를 따라 순차적으로 꼭지점을 구하면 각각의 꼭지점들은 서로의 관계에 따라 일정한 패턴으로 늘어서게 되고, 이것을 이용하여 연결성 정보 없이 부가 정보만으로 모델을 순차적으로 무손실 부호화한다.

  • PDF

안드로이드 웹 브라우저의 EXT4에 대한 파일시스템의 접근 특성 분석 (Characterization of EXT4 Filesystem Accesses for Android Web Browser)

  • 이준우;김강희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.89-91
    • /
    • 2012
  • 플래시 저장장치는 순차 쓰기패턴에 높은 성능을 보이고, 랜덤 쓰기패턴에 낮은 성능을 보인다고 알려져 있다. 그러나 실제 응용 프로그램은 동작 방식에 따라 복합적인 패턴을 보일 수 있다. 본 논문은 대표적인 모바일 응용으로서 웹 브라우저 응용의 파일시스템 접근 특성을 정량적으로 분석하고자 한다. 최근에 안드로이드 스마트 폰에 채택된 Ext4 파일시스템을 기준으로 웹 브라우저 응용의 파일시스템 요청들을 성능개선점을 지적하고자 한다.

전자상거래에서 연관규칙과 순차패턴을 이용한 온라인 마이닝 (On-Line Mining using Association Rules and Sequential Patterns in Electronic Commerce)

  • 김성학
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권7호
    • /
    • pp.945-952
    • /
    • 2001
  • 인터넷 사용 인구의 증가로 전자상거래는 새로운 상거래 형태로 빠르게 발전하고 있으며, 대다수 인터넷 쇼핑몰들은 사용자에게 더 많은 정보와 편리한 사용자 인터페이스를 제공함으로써 보다 많은 고객을 확보하려고 노력하고 있다. 편리한 인터페이스 중의 하나는 상품을 추천해주는 서비스이며, 이를 위해서는 쇼핑몰에서의 구매정보, 행동 그리고 장바구니 등 사용자로부터 특정 행동패턴을 추출하고 분석하는 방법이 필요하다. 이러한 방법 중에서 상품간의 연관성 추출을 위하여 주로 연관규칙과 순차패턴이 이용되고 있는데, 대부분의 온라인 전자상거래에서는 사용자의 정보 또는 구매이력을 가지고 카테고리를 중심으로 수행하고 있다. 그러나 이는 단일한 구매패턴에 의한 연관성만을 나타낼 뿐이며, 상품 각각에 대한 연관성을 찾아보기 힘들다. 또한 단일 구매패턴은 계산 비용이 작기는 하지만 사용자의 구매패턴을 정확하게 반영하기 어렵다. 따라서 본 논문에서는 이러한 문제를 해결하기 위하여 카테고리 독립적이고 단일 항목간의 구조화를 통하여 항목간의 연계성을 갖는, 다중 구매패턴을 고려하는 마이닝 방법을 제안한다.

  • PDF