• 제목/요약/키워드: 데이터스트림

검색결과 918건 처리시간 0.03초

적응적 IOLIN시스템을 사용한 Concept Drift가 있는 데이터 스트림의 분류 (Concept-Drifting Data Streams classification using Adapted IOLIN System)

  • 김재우;이주홍;홍준식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.485-488
    • /
    • 2007
  • 스트림 데이터를 분류하는 문제는 데이터 스트림 마이닝 분야에서 가장 넓게 연구되고 있는 항목이다. 실세계에서의 데이터 스트림을 분류하는데 있어서 본질적인 문제점들이 있다 : 1)많은 양의 데이터가 불규칙적으로 빠르게 입력되는 것과, 2)유동적 컨셉트로 알려진, 데이터의 분류가 시간에 따라서 유동적으로 변하는 문제이다. 본 논문에서는 위와 같은 문제를 해결하기 위해서 적응적 OLIN시스템을 제안한다. 제안된 시스템은 지역적인 유동적 컨셉트뿐만 아니라 전역적인 유동적 컨셉트 문제까지 고려하여, 기존의 시스템보다 향상된 성능을 보였다.

이동 단말기에서 멀티미디어 연출시 최초 재생 지연시간을 줄이기 위한 트랜스코드 스케줄링 기법 (A transcode scheduling technique to reduce early-stage delay time in playing multimedia in mobile terminals)

  • 홍마리아;윤준성;임영환
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.695-704
    • /
    • 2003
  • 본 논문은 멀티미디어 데이터 스트림들을 이동단말기에서 연출(play)하기 위해 스트림의 특성을 파악한 후 변환 시킬 스트림을 선정하여 트랜스코딩하는 스케줄링 기법을 제시하였다. 이것은 연출될 모든 스트림들을 트랜스코딩하는 것보다 선정정책에 의해 특정 스트림을 선택하여 트랜스코딩하는 것이 최초 재생 지연 시간을 줄일 수 있는 장점이 있다. 따라서 본 논문은 멀티미디어 데이터 스트림들의 요구 대역폭을 네트워크 대역폭 보다 낮추면서, 이동 단말기에서 멀티미디어 데이터 스트림들이 재생되기까지의 최초 재생 지연시간을 최소화시킬 수 있는 방법으로 EPOB(End Point of Over Bandwidth) 기반의 트랜스코딩 스트림 선정 정책을 제안하였다.

동기화된 데이터 방송 애플리케이션 제작을 위한 스트림 생성기 개발 (The Stream Generator for Syncronized Data Broadcasting Applications)

  • 김세훈;정문렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.267-270
    • /
    • 2003
  • 본 논문은 DVB-MHP 규약을 따르는 동기화 된 데이터 방송 애플리케이션을 제작하기 위한 스트림 생성기의 구현을 기술한다. 동기화 된 애플리케이션은 비디오와 공유된 시간기준을 가지며 특정시각에 발생한 이벤트(스케쥴드 스트림 이벤트)를 처리할 수 있는 애플리케이션이다. 동기화 된 애플리케이션을 위해서 스트림 생성기는 다음 작업을 수행한다. (1) NPT(Normal Play Time)를 수신기로 보내기 위해 NPT 참조서술자를 전송 스트림 내에 MPEG2 섹션으로 포장하여 넣는다. (2) 스케쥴드 스트림 이벤트들을 생성하여 전송 스트림내의 적당한 위치에 MPEG2 섹션으로 포장하여 넣는다. (3) 애플리케이션 프로그램과 스트림 이벤트에 대한 참조(reference)를 포함하는 객체 카로셀을 생성한다. DVB-J 애플리케이션은 DVB-MHP API중에 섹션필터 관련 API를 이용하여 전송된 NPT 참조 서술자를 읽어들이고 이로부터 NPT를 재구성하며, 스트림 이벤트 관련 API를 이용하여 스트림 이벤트를 처리하도록 구현한다 스트림 생성기가 생성한 MPEG2 전송 스트림으로 Interactive Game Show 애플리케이션을 제작하여 비디오와 애플리케이션이 사용하는 이미지 디스플레이간의 동기화를 테스트하였다.

  • PDF

데이터 스트림 환경에서 효율적인 빈발 항목 집합 탐사 기법 (A Method for Frequent Itemsets Mining from Data Stream)

  • 서복일;김재인;황부현
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.139-146
    • /
    • 2012
  • 데이터 마이닝은 다양한 분야에서 축적된 데이터로부터 필요한 지식을 탐사하기 위하여 널리 이용되고 있다. 연관규칙을 탐사하기 위하여 이벤트의 빈발 횟수에 기반을 둔 많은 방법들이 존재하지만, 이들은 이벤트가 연속적으로 발생하는 스트림 환경에는 적합하지 않다. 또한 실시간으로 연관규칙을 탐사해야 하는 스트림 환경에 적용하기에는 많은 비용이 든다. 이 논문에서는 스트림 환경에서 연관규칙을 탐사하기 위한 새로운 방법을 제안한다. 제안하는 방법은 데이터 스트림에서 목적 이벤트의 발생 간격에 따른 가변 윈도우로부터 이벤트의 존재 유무에 근거한 COBJ(Count object) 계산법을 이용하여 데이터 항목을 추출한다. 추출된 데이터는 FPMDSTN(Frequent Pattern Mining over Data Stream using Terminal Node) 알고리즘을 통해 실시간으로 연관규칙을 탐사한다. 실험 결과를 통해 제안하는 방법이 기존의 방법에 비해 스트림 환경에 효율적임을 보인다.

AVL 트리를 사용한 효율적인 스트림 큐브 계산 (Efficient Computation of Stream Cubes Using AVL Trees)

  • 김지현;김명
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.597-604
    • /
    • 2007
  • 스트림 데이터는 끊임없이 고속으로 생성되는 데이터로써 최근 이러한 데이터를 분석하여 부가가치를 얻고자 하는 노력이 활발히 진행 중 이다. 본 연구에서는 스트림 데이터의 다차원적 분석을 위해 큐브를 고속으로 계산하는 방법을 제안한다. 스트림 데이터는 비즈니스 데이터와는 달리 정렬되지 않은 채로 도착하며, 데이터의 끝에 도달하지 않은 상태에서는 집계 결과를 낼 수 없어서, 고속으로 집계하는 과정에서 저장 공간의 낭비를 심하게 초래한다. 또한 큐브에 속한 집계 테이블들을 모두 생성하는 것은 시간/공간 측면에서 비효율적이라는 점이 지적되고 있다. 이러한 문제를 해결하기 위해 본 연구에서는 기존 연구들과 마찬가지로 큐브에 포함시킬 집계 테이블들을 사용자가 미리 정하도록 하였고, 정렬되지 않은 스트림 데이터를 고속으로 집계하는 과정에서 배열과 AVL 트리들로 구성된 자료구조를 집계 테이블의 임시 저장소로 사용하였다. 제안한 알고리즘은 생성하려는 큐브가 메모리에 상주할 수 없을 정도로 큰 경우에도 집계 연산을 수행할 수 있다. 이론적 분석과 성능 평가를 통해 제안한 큐브 계산 알고리즘이 실용적임을 입증하였다.

스트림 데이터의 효율적인 연관규칙 업데이트 알고리즘 (HARD : Hybrid Association Rule with streaming Data)

  • 김형주;최재걸
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.40-42
    • /
    • 2006
  • 스트림 데이터에 내재된 정보들은 시간이 흐름에 따라 변화의 가능성이 매우 높기 때문에 이러한 변화를 신속하게 업데이트할 수 있다면 유용한 정보를 제공할 수 있을 것이다. 그러나 스트림 데이터의 모든 연관규칙을 업데이트하는 것은 수행하는데 많은 부담이 있으므로 이 논문에서는 지지도의 변화가 큰 흥미있는(interesting)데이터에 대해서 효율적으로 업데이트 하는 방법을 제시하고자 한다.

  • PDF

적응적 격자기반 다차원 데이터 스트림 클러스터링 방법 (An Adaptive Grid-based Clustering Algorithm over Multi-dimensional Data Streams)

  • 박남훈;이원석
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.733-742
    • /
    • 2007
  • 데이터 스트림이란, 빠른 속도로 지속적으로 생성되는 무한한 크기의 방대한 양의 데이터 집합으로 정의된다. 무한한 데이터 스트림에 비해 주어진 메모리 공간은 유한하게 한정되어 있어, 이러한 제약조건을 충족시키는 범위 내에서 일정 한도내의 정확도 오차를 허용하기도 한다. 또한, 변화하는 데이터 스트림 내의 최신 클러스터를 찾기 위해서는 데이터 객체의 저장없이 오래된 데이터 스트림 내의 정보들을 비중을 감소시킬 수 있어야 한다. 본 연구에서는 데이터 스트림 분석을 위한 데이터 스트림 격자 기반 클러스터링 기법을 제시한다. 주어진 초기 격자셀에 대해, 데이터 객체의 빈도가 높은 범위를 반복적으로 보다 작은 크기의 격자셀로 분할하여 최소 크기의 격자셀, 단위 격자셀을 생성한다. 격자 셀에서는 데이터 객체들의 분포에 대한 통계값만을 저장하여, 기존의 클러스터링 기법에 비해 데이터 객체에 대한 탐색없이 효율적으로 클러스터를 찾을 수 있다. 또한, 가용 메모리 공간에 따라 단위 격자셀의 크기를 조절하여 클러스터의 정확도를 최대화할 수 있어, 주어진 메모리 공간에 맞게 적응적으로 성능을 조절할 수 있다.

스트림 암호 기반 랜섬웨어에 대한 기술적 분석 동향

  • 이영주
    • 정보보호학회지
    • /
    • 제32권3호
    • /
    • pp.49-56
    • /
    • 2022
  • 최근까지 랜섬웨어 공격은 끊임없이 발생하고 있으며 공격자의 암호기술에 대한 이해가 향상되면서 다양한 암호 알고리즘을 사용하여 피해자의 중요한 데이터를 암호화하고 있다. 블록 암호만을 사용하던 초창기 랜섬웨어와 달리 최근 몇 년 전부터 스트림 암호를 사용하여 데이터를 암호화하는 랜섬웨어가 계속해서 발견되고 있다. 따라서, 본 논문에서는 스트림 암호 기반 랜섬웨어의 동작과정, 암호화 과정을 기술적으로 분석하여 어떠한 형태로 악성행위를 수행하는 지 알아보고자 한다

시계열 스트림 데이터 상에서 핸드헬드 디바이스를 위한 효율적인 스트림 시퀀스 매칭 알고리즘 (Efficient Stream Sequence Matching Algorithms for Handheld Devices over Time-Series Stream Data)

  • 문양세;노웅기
    • 한국통신학회논문지
    • /
    • 제31권8B호
    • /
    • pp.736-744
    • /
    • 2006
  • 핸드헬드 디바이스의 경우, 반복 작업에 대한 CPU 연산 최소화가 성능에 중요한 요소이다. 본 논문에서는 주식 데이터, 네트워크 트래픽, 센서 데이터 등의 시계열 스트림 데이터 상에서 유사 시퀀스를 효율적으로 찾아내는 핸드헬드 디바이스용 알고리즘을 제시한다. 이를 위하여, 우선 시계열 스트림 데이터 상에서 유사 시퀀스를 찾아내는 문제를 스트림 시퀀스 매칭(stream sequence matching)으로 정형적으로 정의한다. 다음으로, 기존의 서브시퀀스 매칭에서 사용했던 윈도우 구성법을 적용하여, 스트림 시퀀스 매칭을 효율적으로 처리하는 윈도우 기반 접근법을 제안한다. 그리고 이러한 윈도우 기반 접근법을 가능하게 하는 윈도우 MBR(window MBR) 개념을 제시하고, 이 개념을 사용하면 스트림 시퀀스 매칭을 정확하게 수행할 수 있음을 증명한다. 또한, 윈도우 기반 접근법에 기반한 두 가지 스트림 시퀀스 매칭 알고리즘을 제안한다. 마지막으로, 분석과 실험을 통해 제안한 알고리즘이 단순 접근법에 비해 CPU 연산을 크게 줄이고 성능을 향상시킴을 보인다. 이 같은 결과를 볼 때, 제안한 방법은 CPU 연산 능력이 부족한 핸드헬드 디바이스의 내장형 알고리즘으로 매우 적합하다고 사료된다.

데이터 스트림에서 다중 연속질의의 선택 조건에 대한 실행 순서 결정 (Run-time Evaluation of Selection Predicates in Multiple Continuous Queries over Data Streams)

  • 윤은원;이원석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.25-28
    • /
    • 2007
  • 무한히 연속적으로 발생하는 데이터 스트림에서의 연속 질의 처리는 빠른 처리 시간과 적은 메모리 사용량을 요구한다. 이런 제약 사항을 만족하기 위해 연속 질의의 선택 조건절에 사용된 같은 속성들로 그룹화하여 해당 속성들을 처리함으로써 빠르게 질의를 처리할 수 있다. 그리고 더 효율적으로 질의를 처리하기 위해 초기에 일정 기간 동안 데이터 스트림에 대한 통계 정보를 수집한다. 실행 시 통계 정보를 수집하는 이유는 데이터 스트림의 특성을 예측할 수 없기 때문에 데이터 특성에 대한 정보를 수집하고 수집된 정보를 가지고 가장 좋은 질의 처리 순서를 결정함으로 써 전체적인 질의 처리 성능을 향상 시킬 수 있고 실험을 통해 이를 검증한다.

  • PDF