• Title/Summary/Keyword: 데이터 확장 기법

검색결과 827건 처리시간 0.024초

대량 트래픽 전송자의 실시간 탐지를 위한 플로우 라벨링 방법 (Flow Labeling Method for Realtime Detection of Heavy Traffic Sources)

  • 이경희;양대헌
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권10호
    • /
    • pp.421-426
    • /
    • 2013
  • 인터넷을 통해 전송되는 트래픽의 양이 점점 더 많아지고 있고, 이에 따라 트래픽의 양을 알아내는 것이 중요해지고 있다. 트래픽을 측정하는 기법에 대한 많은 연구가 있었으며, 주로 적은 양의 메모리를 사용해서 측정의 정확도를 높이는 방향으로 연구가 진행되고 있다. 이 논문에서는 기존 기법들에서는 제공하지 않는 플로우 라벨링 기법을 제안한다. 이 기법을 통해서 관리자는 특정 값 이상의 트래픽을 생성한 플로우의 라벨을 실시간으로 알아낼 수 있으며, 기존의 기법이 가지는 카운팅의 상한선을 확장시킬 수 있다. 가장 최근에 발표된 CSM (Counter Sharing Method)에 이 기법을 적용하고, CAIDA 데이터셋을 이용해서 성능을 분석해 본다.

Plug-in 기법을 이용한 PGP 기반의 Web 보안 시스템 개발 (WWW Security Mechanism Using Plug-in and PGP)

  • 김태갑;조은경;박정수;류재철
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 1996년도 종합학술발표회논문집
    • /
    • pp.205-218
    • /
    • 1996
  • 인터넷 기반의 World Wide Web(WWW)은 여러 가지 측면에서 유용한 특성을 가지고 있다. 사용의 편리함, 멀티미디어 데이터 지원, Interactive한 사용자 인터페이스 등이 그 대표적인 예이다. 이러한 이유로 WWW은 급속한 성장을 이루었고 거의 모든 분야에 적용될 정도로 확산되어 있는 실정이다. 그러나 WWW은 위와 같은 장점들에도 불구하고 인터넷이 지니고 있는 보안상의 취약점을 그대로 포함하고 있다는 단점을 지니고 있다. 이는 WWW 상에서 전송되는 데이터가 불법적인 접근에 쉽게 노출될 수 있는 형태 그대로 전송되기 때문이다. 이러한 문제점을 근본적으로 해결 할 수 있는 방법은 전송되는 데이터의 암호화로써 불법적인 데이터 접근을 시도하려는 사용자로부터 데이터를 보호 할 수 있다. 본 논문에서는 공개 키 암호 방식에 기초하고 있는 PGP(Pretty Good Privacy) 툴을 이용하여 WWW 상으로 전송되는 데이터의 암호화 및 인증 메커니즘을 제공하고자 한다. PGP보안 툴의 삽입을 위해 Plug-in 이라는 Web 브라우저 확장 기법을 사용한다.

  • PDF

Peer-to-Peer 환경에서 중복된 데이터의 갱신 전파 기법 (Update Propagation of Replicated Data in a Peer-to-Peer Environment)

  • 최민영;조행래
    • 한국통신학회논문지
    • /
    • 제31권4B호
    • /
    • pp.311-322
    • /
    • 2006
  • P2P(Peer-to-Peer) 시스템은 대용량의 데이터를 공유하는데 유용하며, 네트워크 구조에 따라 중앙 집중형, 구조적 분산형, 그리고 비구조적 분산형으로 분류된다. 이 중 Gnutella와 같은 비구조적 분산형 P2P 시스템은 확장성과 신뢰성 측면에서 장점을 갖지만, 참여하는 노드의 수가 증가함에 따라 데이터를 액세스하는 비용도 증가한다는 문제를 가진다. 데이터 중복을 이용하여 이러한 문제를 해결할 경우 중복된 데이터들의 일관성을 유지하기 위한 기법이 필요하다 본 논문에서는 특정 노드가 데이터를 갱신할 때 중복된 사본을 저장하고 있는 다른 노드에 전파하기 위한 새로운 갱신 전파 알고리즘을 제안한다. 제안한 알고리즘은 타임스탬프와 push/pull 개념을 조합하여 메시지의 전송 오버헤드를 줄일 수 있다는 장점을 갖는다.

분산 파일 시스템 기반 NoSQL의 데이터 안정성을 위한 범용 트랜잭션 관리 기법 (General-purpose Transaction Management Technique for Data Stability of NoSQL on Distributed File System)

  • 권영현;윤도현;박호진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.299-306
    • /
    • 2015
  • 본 논문에서는, 분산 파일 시스템을 기반으로 하는 NoSQL의 데이터 안정성 확보를 연구하였다. 본 논문의 궁극적 목표인 분산 파일 시스템 기반의 NoSQL을 구현하는 과정에서 분산 파일 시스템의 제약 조건인 랜덤 쓰기 문제에 봉착했고, 이 문제의 해결을 위해 중간파일의 개념을 사용함으로써 어떠한 장애 상황에서도 데이터의 오염을 방지할 수 있었다. 또한 중간파일을 쓰는 과정에서 기존 파일 시스템에 비해 분산 파일 시스템이 가지는 성능적 열세를 인식하여, NoSQL을 위한 파일 블록 단위를 다시 정의하는 방법으로 성능적 손실을 크게 줄였다. 결과적으로, 본 논문에서는 보편적 분산 파일 시스템의 확장성을 가진 NoSQL을 개발함과 동시에 원자성, 일관성, 고립성, 성능 등의 조건을 만족하는 트랜잭션 관리 기법을 사용함으로써 데이터 안정성을 가지면서 실용적 사용에도 무리가 없는 NoSQL을 구현하였다.

클러스터 기반 퍼지 모델트리를 이용한 데이터 모델링 (Data Modeling using Cluster Based Fuzzy Model Tree)

  • 이대종;박진일;박상영;정남정;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.608-615
    • /
    • 2006
  • 본 논문에서는 퍼지 클러스터 기법을 이용하여 구간 분할된 퍼지 모델트리의 제안과 이를 이용한 데이터 모델링 기법을 다룬다. 제안된 방법은 먼저 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 노드의 확장은 부모노드(parent node)에서 만들어진 모델에서 계산된 오차값과 자식노드(child node)에서 계산된 오차값을 비교하여 이루어진다. 출력값 예측 단계에서는 입력된 데이터와 잎노드에서 계산된 클러스터 중심값과 비교하여 소속도가 높은 선형모델을 선택하여 데이터에 대한 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 데이터를 대상으로 실험한 결과, 기존의 모델트리방식 및 뉴럴 네트워크 기반의 신경회로망 보다 향상된 성능을 보임을 알 수 있었다.

대규모 웹 지리정보시스템을 위한 메모리 상주 공간 데이터베이스 클러스터 (Main Memory Spatial Database Clusters for Large Scale Web Geographic Information Systems)

  • 이재동
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.3-17
    • /
    • 2004
  • 웹을 통해 위치기반 서비스 등과 같은 다양한 지리정보 서비스를 사용하려는 사용자가 급격하게 증가하면서, 웹 지리정보시스템도 많은 다른 인터넷 정보시스템들과 같이 클러스터 기반 아키텍쳐로의 변화가 요구되고 있다. 즉, 사용자의 수에 상관없이 양질의 지리정보 서비스를 지속적이며 빠르게 제공하기 위해서는 비용대비 효율, 가용성과 확장성이 높은 클러스터 기반의 웹 지리정보시스템이 필요하다. 본 논문에서는 가용성과 확장성이 높은 클러스터 기반의 웹 지리정보시스템을 설계한다. 이를 위해 메모리 상주 공간 데이터베이스들을 클러스터의 각 노드로 구성하고 전체 데이터 영역 중 일부만을 복제 처리함으로써, 각 노드가 공간 질의에 대해 공간적 근접성을 이용한 캐시 역할을 수행하도록 한다. 또한, 제안된 시스템은 단순 영역 질의외에 연산 비용이 큰 공간 조인 연산을 효율적으로 처리한다. 본 논문에서는 성능평가를 통해 제안된 기법이 기존 기법에 비해 데이터 양이 많고, 클러스터의 노드 수가 증가할수록 각각 약 23%, 30%의 향상된 성능을 갖음을 보인다.

  • PDF

음원 데이터베이스의 효율적 확장을 지원하는 내용 기반 음원 검색 시스템 (A Content-based Audio Retrieval System Supporting Efficient Expansion of Audio Database)

  • 박지훈;강현철
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.811-820
    • /
    • 2017
  • 음원 서비스의 주요 기능 중 하나인 내용 기반 검색을 위해 음원의 지문을 채취하여 데이타베이스에 저장하고 색인하여 검색에 활용하는 기법이 널리 사용되고 있다. 그런데 지속적으로 추가되는 신규 음원의 지문이 기존의 데이타베이스에 계속 삽입되면 공간 효율 및 음원 검색 성능의 저하가 점차 초래되는 문제점이 있다. 따라서 시스템 운용 비용의 증가를 가져오는 주기적인 데이터 베이스 재구성 없이 효율적인 음원 데이타베이스의 확장을 지원하는 기법이 요구된다. 본 논문에서는 샤잠의 지문 채취 알고리즘을 기반으로 클러스터 컴퓨팅 환경에서 맵리듀스 및 NoSQL 데이타베이스를 사용하여 이러한 문제를 해결하는 내용 기반 음원 검색 시스템의 설계를 제시하고 실제 음원 데이터를 이용한 다양한 실험을 통해 그 성능을 평가한다.

BPM과 SOA기반의 비즈니스 프로세스 자동화와 분석기법 (Business Processes Automation and Analysis Techniques by Using BPM and SOA)

  • 이충헌;이종학;서정만;조완섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.171-178
    • /
    • 2009
  • 최근 대규모 비즈니스 시스템을 효율적으로 운영하고 자동화하기 위해 기법으로 BPM과 SOA의 융합이 제안되고 있으며 운영데이터로부터 매일 의미 있는 정보를 생성할 필요성이 증가하고 있다. 본 논문에서는 BPM-SOA 융합을 통해 비즈니스 프로세스 자동화 방법론을 제시하고 실제 프로젝트 관리 비즈니스 프로세스를 구현하여 검증한다. BPM-SOA 융합은 약 결합된 시스템 구조를 통해 향상된 확장성과 생산성을 제공하며 잦은 변경과 프로세스 재사용에도 장점이 있다. 그 다음, 기존 시스템에 새로운 비즈니스 프로세스가 추가될 때 시스템의 확장성을 분석한다. 마지막으로 의사결정을 지원하기 위한 SAP 비즈니스 인텔리젼스를 이용하여 BPM에서 생성된 데이터를 분석한다. 비즈니스 인텔리젼스는 의사결정에 유용한 정보를 제공할 뿐만 아니라 비즈니스 프로세스 최적화 기회를 제공한다.

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.155-162
    • /
    • 2008
  • DNA 염기 서열이나 단백질 아미노산 서열과 같은 생물학적 서열 데이터들은 일반적으로 많은 수의 항목들을 가지고 있다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 수 백개의 항목으로 이루어진 연속된 서열들이 존재한다. 이들 서열들에서 빈번하게 발생하는 연속 서열을 검색하는 것은 생물학적 서열 분석에서 중요한 부분을 차지하고 있다. 이전에는 순차 패턴을 효과적으로 발견하고자 하는 많은 연구들이 수행되었으며 대부분의 기존 순차패턴 마이닝 기법들은 Apriori 알고리즘을 기반으로 한다. PrefixSpan 알고리즘은 Apriori 기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로 부터 서열 패턴을 확장해나가는 방식이다. 따라서 길이가 긴 연속 서열을 포함하는 생물학적 데이터서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 길이가 긴 생물학적 데이터 서열들로부터 빈번하게 발생하는 연속 서열들을 검색하기에는 효율적이지 않다. 본 논문에서는 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색성능이 보다 우수함을 보인다.

의료영상 분할을 위한 3차원 능동 모양 모델 (Three-Dimensional Active Shape Models for Medical Image Segmentation)

  • 임성재;정용연;호요성
    • 전자공학회논문지SC
    • /
    • 제44권5호
    • /
    • pp.55-61
    • /
    • 2007
  • 본 논문은 관심 객체 분할을 위한 통계적 모양 모델에 기반한 3차원 능동 모양 모델링 기법을 제안한다. 3차원 모양 모델을 만들려면 포인트 분산 모델(PDM)의 생성이 필수적인데, 이를 위해서는 모든 학습(training) 데이터에 대응하는 특징점(landmark)을 잘 선택해야 한다. 현재까지도 3차원 데이터에서 대응하는 특징점을 선택하는 방법은 주로 수동적으로 선택하거나 2차원 기반 기법 또는 제한된 3차원 기법이 사용되고 있다. 본 논문에서는 최근에 제안된 "3차원 통계적 모양 모델의 자동생성 기법"의 거리 변환(distance transform)과 사면체(tetrahedron) 알고리듬을 사용하여 3차원 통계적 모양 모델을 생성하고 2차원 능동 모양 모델의 모양 모델 학습과 그레이레벨(gray-level) 모델 학습을 개선하여 확장하고, 스케일(scale)과 그레이레벨 모델을 결합한 3차원 능동 모양 모델 알고리듬으로 관심 객체를 분할한다. 본 논문에서는 제안한 방법을 영역 기반 윤곽선 기반 기법 및 2차원 능동모양모델 기법과 그 성능을 비교하여 평가했다.