• 제목/요약/키워드: 순차패턴분석

검색결과 118건 처리시간 0.033초

웹 로그 분석을 이용한 추천 에이전트의 개발 (Development of Recommendation Agents through Web Log Analysis)

  • 김성학;이창훈
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.621-630
    • /
    • 2003
  • 웹 로그는 사용자가 웹 사이트의 데이터를 액세스할 때 웹 서버에 의해 기록되는 정보로써 최근 인터넷 이용의 급속한 증가로 인해 웹 로그의 활용가치가 더욱 중요하게 되었으며, 웹 로그의 분석 결과는 쇱 사용자들의 행위를 나타내는 패턴을 분석하거나 웹 사이트의 구조를 재배치 하는데 이용될 수 있다. 이를 실현하기 위한 많은 연구들은 주로 연관규칙과 순차패턴을 이용하고 있는데, 대다수는 Apriori 알고리즘을 기본으로 하고 있어서 대용량의 데이터베이스에 적용하기에는 컴퓨팅 시간적 측면에서 비효율적이다. 따라서 본 논문에서는 웹 환경에서 흥미있는 패턴을 탐사하는 새로운 알고리즘을 개발하여 보다 빠르게 패턴탐사를 수행하고, 많은 사용자들이 관심있게 순차적으로 접근하고 있는 정보를 시스템 관리자에게 제공할 수 있는 추천에이전트를 개발한다.

  • PDF

연관분석과 순차분석을 통한 스마트홈 패턴 구성 방안 (A Study on the Composition of Smart Home Patterns through Association Analysis and Sequential Analysis)

  • 정승민;최한얼;곽경호;김민재;정해린
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.376-377
    • /
    • 2023
  • 스마트홈은 기술 시스템, 자동화 프로세스, 원격 제어 기기 등을 아파트나 주택에서 사용하는 것을 말한다. 주요 목적은 가정에서 삶의 질과 편의성을 높이는 것이다. 현재의 스마트홈은 사용자의 원격 제어 방식을 사용하고 있다. 이러한 방식은 고정된 시간에만 스마트홈이 작동하도록 한다는 문제가 있었다. 연관분석과 순차분석을 통해 AI가 상황과 사용자의 취향을 학습한다면, 스스로 최적화된 패턴을 제공할 수 있을 것이다.

안드로이드 웹 브라우저의 EXT4에 대한 파일시스템의 접근 특성 분석 (Characterization of EXT4 Filesystem Accesses for Android Web Browser)

  • 이준우;김강희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.89-91
    • /
    • 2012
  • 플래시 저장장치는 순차 쓰기패턴에 높은 성능을 보이고, 랜덤 쓰기패턴에 낮은 성능을 보인다고 알려져 있다. 그러나 실제 응용 프로그램은 동작 방식에 따라 복합적인 패턴을 보일 수 있다. 본 논문은 대표적인 모바일 응용으로서 웹 브라우저 응용의 파일시스템 접근 특성을 정량적으로 분석하고자 한다. 최근에 안드로이드 스마트 폰에 채택된 Ext4 파일시스템을 기준으로 웹 브라우저 응용의 파일시스템 요청들을 성능개선점을 지적하고자 한다.

순차 패턴 마이닝을 사용한 두 XML 문서간 최대 유사 경로 추출 (Extracting Maximal Similar Paths between Two XML Documents using Sequential Pattern Mining)

  • 이정원;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.553-566
    • /
    • 2004
  • 최근 XML 저장 기법, 질의 최적화, 인덱싱 등의 XML 관련 기술이 활발히 연구되고 있다. 이와 관련하여 하나의 DTD나 XML Schema로 정의된 고정 구조를 공유하는 문서 집합이 아니라 다양한 구조를 가진 문서 집합인 경우 다중 문서간의 구조적 유사성이나 차이점 등을 파악할 필요가 있다. 예를 들어 서로 다른 사이트나 문서 관리 시스템에서 도출된 문서들을 합병하거나 분류할 필요가 있을 때, 문서를 처리하기 위해 공유 구조를 발견하는 일은 매우 중요하다. 본 연구에서는 다양한 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘(1)을 변형하여 두 XML 문서간 최대 유사 경로를 추출한다. 몇 가지 실험을 통해 본 논문에서 제안한 변형된 순차패턴 마이닝 알고리즘이 두 문서간의 최대 유사 경로를 찾아내고 또한 두 문서간의 정확한 공유 경로 및 최대 유사 경로를 정확히 찾을 수 있음을 보인다. 또한 실험 결과 분석을 위해 최대 유사 경로를 기반으로 정의된 유사성 척도가 XML 문서를 정확하게 분류할 있음을 보인다.

보이스 피싱 행동 패턴 분석을 통한 상황 인지 및 사용자 의도 파악 시스템 (Situational Awareness and User Intention system with Behavior patterns Analysis of Voice Phishing)

  • 조단비;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.855-857
    • /
    • 2019
  • 개인 정보의 확산 및 유출의 문제점으로 인해 보이스 피싱의 피해 건수가 증가하고 있다. 이러한 보이스 피싱의 사회적 문제에 대하여 상황 인지 및 사용자 의도 파악 시스템을 적용하여 해결책으로 제안하고자 한다. 이 시스템은 음성 전화로 이루어지는 순차 정보를 텍스트 데이터에 기반하여 사기범의 문맥적 흐름에서 행위 동사를 추출한다. 추출된 행위 동사의 순차 정보를 통해 보이스 피싱의 상황임을 인지하고, 흐름의 행동 패턴을 분석하여 사기범의 의도를 파악한다. 이러한 상황 인지 및 사용자 의도 파악 시스템은 개인 정보의 문제뿐만 아니라 경제적 피해 규모를 축소시킬 것으로 예상된다.

T-Cache: 시계열 배관 데이타를 위한 고성능 캐시 관리자 (T-Cache: a Fast Cache Manager for Pipeline Time-Series Data)

  • 신제용;이진수;김원식;김선효;윤민아;한욱신;정순기;박세영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권5호
    • /
    • pp.293-299
    • /
    • 2007
  • 지능형 배관 검사체(PIG)는 가스나 기름 배관 안을 지나가며 검사체에 장착된 여러 센서로부터 신호(센서 데이타로 불림)들을 취합하는 장치이다. PIG로부터 취합된 센서데이타들을 분석함으로써, 배관의 구멍, 뒤틀림 또는 잠재적으로 가스 폭발의 위험을 가지고 있는 결함들을 발견할 수 있다. 배관의 센서 데이타를 분석가가 분석을 할 때에는 주로 두 가지 분석 패턴을 사용한다. 첫 번째는 센서 데이터를 순차적으로 분석하는 순차적 분석 패턴이고, 두 번째는 특정한 구간을 반복해서 분석하는 반복적 분석 패턴이다. 특히, 센서 데이타를 분석할 때 반복적 분석 패턴이 많이 사용된다. 기존의 PIG 소프트웨어들은 사용자의 요청이 있을 때 마다 서버로부터 센서 데이타들을 오므로, 매 요청마다 네트워크 전송비용과 디스크 액세스 비용이 든다. 이와 같은 방법은 순차적 분석 패턴에는 효율적이지만, 분석 패턴의 대부분을 차지하는 반복적 분석 패턴에는 비효율적이다. 이와 같은 문제는 서버/클라이언트 환경에서 다수의 분석가가 동시에 분석을 할 경우에는 매우 심각해진다. 이러한 문제점을 해결하기 위해 본 논문에서는 배관 센서 데이타들을 여러 개의 시계열 데이타로 생각하고, 효율적으로 시계열 데이타를 캐싱 하는 T-Cache라 부르는 주기억장치 고성능 캐시 관리자를 제안한다. 본 연구는 클라이언트 측에서 시계열 데이타를 캐싱하는 최초의 연구이다. 먼저, 고정된 거리의 시계열 데이타들의 집합을 캐싱 단위로 생각하는 신호 캐시 라인이라는 새로운 개념을 제안하였다. 다음으로, T-Cache에서 사용되는 스마트 커서와 여러 알고리즘을 포함하는 여러 가지 자료구조를 제안한다. 실험 결과, 반복적 분석 패턴의 경우 T-Cache를 사용하는 것이 디스크 I/O측면과 수행 시간 측면에서 월등한 성능 향상을 보였다. 순차적 분석 패턴의 경우에도 T-Cache를 사용하지 않은 경우와 거의 유사한 성능을 보였다. 즉, 캐시를 사용함으로써 발생하는 추가비용은 무시할 수 있음을 보였다.

생물학적 서열들에서 빈발한 연속 서열 패턴 마이닝 (Mining Frequent Contiguous Sequence Patterns in Biological Sequences)

  • 강태호;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.27-31
    • /
    • 2007
  • 생물학적 서열 데이터는 크게 DNA 염기 서열과 단백질 아미노산 서열이 있다. 이들 서열은 일반적으로 많은 수의 항목들을 가지고 있어 그 길이가 매우 길다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 부분 연속 서열들이 존재하는데 이들 서열들을 찾아내는 것은 다양한 서열 분석에서 유용하게 사용될 수 있다. 이를 위해 초기에는 Apriori 알고리즘을 기반으로 하는 순차패턴 마이닝 알고리즘들을 활용하는 방법들이 많이 제시되었다. 그중 PrefixSpan 알고리즘은 Apriori기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로부터 서열 패턴을 확장해나가는 방식으로 길이가 긴 연속 서열을 포함하는 생물학적 데이터 서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 원본 데이터베이스보다 크기가 큰 별도의 프로젝션 데이터베이스를 사용함으로서 많은 비용부담이 발생하고 특히 길이가 긴 서열에 대해서는 더욱 효율적이지 못하다. 이에 본 논문에서 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색 성능이 우수함을 증명한다.

  • PDF

시뮬레이션과 순차 패턴을 이용한 FMC 로봇의 효율적 작업 순서 설계 및 분석 (Design and Analysis of Efficient Operation Sequencing in FMC Robot Using Simulation and Sequential Patterns)

  • 김선길;김연진;이홍철
    • 한국산학기술학회논문지
    • /
    • 제11권6호
    • /
    • pp.2021-2029
    • /
    • 2010
  • 본 논문에서는 FMC 로봇의 생산성 향상을 위해 시뮬레이션과 순차 패턴 기법을 이용해 로봇의 패턴을 분석하고 최적의 로봇 작업 우선순위규칙(Dispatching Rule)을 설계하는 방법을 제시하였다. 이를 위해, 먼저 FMC를 시뮬레이션으로 설계하고 각 설비가 로봇에게 요청하는 신호를 추출 해 이를 로그(Log) 형태로 생성, 저장하였다. 그 후, 이 로그를 데이터 마이닝 기법 중 하나인 순차 패턴 분석을 이용해 설비의 신호와 로봇간의 연관된 순서를 분석 하여 로봇의 최적 이동 경로를 도출하는 방법을 제시하였다. 또한, 사례연구를 통하여 FMC의 적용성에 대한 효율성 을 입증하였다. 도출된 최적의 패턴을 국내 A사 생산라인에 적용한 결과 작업물 대기시간(Loss Time)의 감소와 로봇 이용률의 향상, 작업물의 총 처리량의 증가와 평균 처리시간 감소를 가져왔다. 또한, 이러한 신호의 패턴을 이용한 분석 방법은 신호와 동작간의 로그를 저장, 데이터베이스화하여 시스템 상에서 로봇의 작업 우선순위규칙을 도출할 수 있게 하므로, 작업자의 오랜 노하우(Know-How) 없이도 로봇 운영의 문제점을 파악하고 그 개선안을 제시할 수 있다. 이러한 방법을 통해 FMC 뿐만이 아닌 로봇을 사용하는 모든 분야에 설비의 신호와 로봇 동작간의 그 연관관계를 분석하고 최적의 운영법칙을 설계, 운영하여 생산성 향상에 크게 기여할 것으로 기대된다.

비즈니스 서비스 식별을 위한 변형 순차패턴 마이닝 알고리즘 (Adapted Sequential Pattern Mining Algorithms for Business Service Identification)

  • 이정원
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.87-99
    • /
    • 2009
  • SOA를 도입하는 하향식 (top-down) 방법은 온톨로지를 기반으로 서비스를 분석하고 설계하는 서비스 모델링 단계를 핵심으로 봄으로써 SOA의 장점을 가장 잘 반영할 수 있는 방법으로 권장되고 있다. 그러나 대부분의 기업들은 하향식 방법이 최상이라는 것을 알면서도 기업 이윤 창출에 단기적인 효과가 드러나지 않고 도입 초기에 개발시간과 비용이 증대되므로 이를 꺼리게 된다. 특히 잘 정의된 컴포넌트 시스템을 이미 사용하고 있는 경우에 더욱 그러하다. 따라서 본 논문에서는 기존의 잘 정의된 컴포넌트시스템을 최대한 이용할 수 있는 상향식 (bottom-up) 서비스식별 방법을 제안한다. GUI는 직접 사용자의 입력을 받아 들여 이벤트를 발생시킨다는 점에 착안하여 이벤트의 경로를 연결하면 비즈니스 프로세스에 근사시킬 수 있다. 따라서 컴포넌트와 상호작용하는 GUI의 이벤트 수를 기준으로 핵심 GUI를 선정하고 핵심 GUI로부터 연결되는 이벤트 경로를 대상으로 기존의 순차패턴 마이닝 알고리즘을 변형하여 사용자의 서비스 사용 패턴을 추출한다. 실험결과 추출된 이벤트 패턴에 응집도를 적용하여 다양한 크기의 비즈니스 서비스를 식별할 수 있음을 보였다.

연관규칙을 이용한 잠재성장모형의 개선방법론 (A Methodology for Improving fitness of the Latent Growth Modeling using Association Rule Mining)

  • 조영빈;전재훈;최병우
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.217-225
    • /
    • 2019
  • 대표적인 종단자료 분석방법인 잠재성장모형(Latent Growth Modeling)은 무조건적 모형과 조건적 모형으로 구분한다. 잠재성장모형의 무조건적 모형 성장궤적은 선형으로 가정하여 분석하는 경우가 많다. 본 연구는 선형 성장궤적으로 가정하여 모형 적합도가 미달하는 경우 연관규칙기법을 이용하여 모형 적합도를 제고하는 방법론을 제안한다. 방법론은 연관규칙 마이닝의 순차패턴(Sequential Pattern)을 사용한다. 이를 위하여 종단자료를 분위별로 나누고, 각 분위에 속한 종단자료의 기간 변화를 산출한 뒤 이를 순차 패턴 화하였다. SPSS AMOS를 이용하여 한국고용정보원의 2001년부터 6년간 조사한 청년 패널 자료로 효과성을 검증하였다. 기존 단순선형함수를 가정할 때와 비교하여 모형 적합도가 상승하는 것을 확인할 수 있었다.