• 제목/요약/키워드: 데이터 척도

검색결과 684건 처리시간 0.012초

통계적 척도 선택 방법에 따른 네트워크 침입 분류의 성능 비교

  • 문길종;김용민;노봉남
    • 정보보호학회지
    • /
    • 제19권2호
    • /
    • pp.16-25
    • /
    • 2009
  • 네트워크 기술의 발달에 따른 서비스의 증가는 네트워크 트래픽과 함께 취약점도 증대하여 이를 악용하는 행위도 늘어나고 있다. 따라서 네트워크 침입탐지 시스템은 증가하는 트래픽의 양을 처리할 수 있어야 하며, 악의적인 행동을 효과적으로 탐지 할 수 있어야 한다. 증가하는 트래픽을 효과적으로 처리하고 탐지의 정확성을 높이기 위해 처리 데이터를 감소시키는 기술이 요구된다. 이러한 방법들은 크게 데이터 필터링, 척도 선택, 데이터 클러스터링의 영역으로 구분되며, 본 논문에서는 척도 선택의 방법으로 데이터 처리의 감소 및 효과적 침입탐지를 수행할 수 있음을 보이고자 한다. 실험 데이터는 KDDCUP 99 데이터 셋을 이용하였으며, 통계적 척도선택의 방법으로 분류율, 오탐율, 거리값, 규칙, 선택된 척도 등을 제시함으로써 침입 탐지 시 데이터 처리량이 감소하였고, 분류율은 증가, 오탐율은 감소하여 침입 탐지 정확성이 높아짐을 알 수 있었다. 또한 본 논문에서 제시한 방법이 다른 관련연구에서 제시한 선택 척도보다 높은 정확성을 보임으로써 보다 유용함을 증명할 수 있었다.

의미 정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구 (A Study of Similarity Measures on Multidimensional Data Sequences Using Semantic Information)

  • 이석룡;이주홍;전석주
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.283-292
    • /
    • 2003
  • 연속된 일차원 실수로 이루어진 시계열 데이터는 데이터 마이닝이나 데이터 웨어하우징과 같은 다양한 데이터베이스 응용 분야에서 연구되어져 왔다. 그러나 최근의 복잡한 비즈니스 환경에서, 다차원 데이터 시퀀스(multidimensional data sequence : MDS)는 일차원 시계열 데이터와 더불어 그 중요성이 더해가고 있다. 다차원 데이터 시퀀스의 예로써, 비디오 스트림은 색상과 질감 등의 속성들로 이루어진 다차원 공간상에서 MDS로 나타낼 수 있다. 본 논문에서는 패턴 유사성 검색에서 사용되는 효과적인 유사성 척도를 제시한다. 하나의 MDS는 여러 개의 세그먼트(segment)로 나누어지며, 각 세그먼트는 다양한 의미적인 특징들로 표현된다. 유사성 척도는 이러한 세그먼트에 대해서 정의되는데 이 척도를 사용하여 어떤 주어진 질의 시퀀스에 대하여 무관한 세그먼트들은 검색 대상에서 일차적으로 제외된다. 데이터 시퀀스와 질의 시퀀스 모두 세그먼트 단위로 분할되며, 질의 처리는 전체 시퀀스의 모든 데이터를 검색하지 않고 데이터 세그먼트와 질의 세그먼트의 특징을 비교하는 것을 기초로 하여 수행된다.

협력필터링의 데이터 희소성 해결을 위한 자카드 지수 반영의 유사도 성능 분석 (Performance Analysis of Similarity Reflecting Jaccard Index for Solving Data Sparsity in Collaborative Filtering)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제19권4호
    • /
    • pp.59-66
    • /
    • 2016
  • 협력 필터링 시스템에서 데이터 희소성 문제의 해결을 위해 공통평가항목수를 반영하는 방법이 연구되었다. 이러한 방법으로 널리 알려진 자카드 지수는 기존의 유사도 척도와 결합되어 성능을 개선할 수 있었다. 그러나, 다양한 데이터 환경에서 여러 유사도 척도들과 각각 결합했을 때의 성능 개선 효과에 대한 분석 연구는 미미하므로, 본 연구는 이에 대한 분석을 목적으로 한다. 우선 자카드 지수 자체를 유사도 척도로 사용했을때 희소한 데이터셋 상에서 전통적인 척도들보다 월등한 예측 성능을 보였고 추천 성능도 매우 우수하였다. 자카드 지수를 결합함으로써 기존 유사도 척도는 데이터 특성에 상관없이 성능이 대개 향상되었고, 특히 코사인 유사도는 희소한 데이터셋에서 가장 큰 향상을 이루었으나, 평균차이 제곱(Mean Squared Difference)의 유사도는 밀집된 데이터셋에서 오히려 저하된 예측 성능을 보였다. 따라서, 자카드 지수를 결합하여 사용하기 위해 데이터 환경 특성과 유사도 척도를 고려할 필요가 있다.

객체지향 패러다임에서 저해요인에 기반한 응집도 척도 (Cohesion Measure by the Decreasing Factors for an Object-Oriented Paradigm)

  • 김성애;최완규;이성주
    • 한국정보처리학회논문지
    • /
    • 제7권11호
    • /
    • pp.3372-3383
    • /
    • 2000
  • 객체지향 패러다임에서 응집도가 높은 클래스들은 단 하나의 데이터 요소만이 정의되고 모든 메소드(또는 연산)들이 그 데이터 요소 상에서 수행되거나, 메소드와 데이터 요소간에 최대연결이 이루어진 클래스이다. 따라서 데이터 요소의 증가와 최대연결을 저해하는 연산들은 클래스의 응집을 저해하는 주 요인들이다. 본 연구에서는 이러한 저해요인들에 근거하여, 응집도에 관한 우리의 직관과 더욱 일치하는 측정을 할 수 있는 새로운 클래스 응집도 척도인 CM(Cohesion Metric)을 제안하였다. 본 연구에서는 응집도를 저해하는 요인의 식별을 위해 참조 그래프(reference graph)를 이용하고, 참조 그래프의 분석을 기초로 하여 클래스의 응집도를 측정하였다. 또한 제한된 CM 측정값이 응집도 척도가 만족해하는 특성들을 만족함을 보였고, 기존 응집도 척도들과의 비교평가를 통해서 CM이 기존의 척도들보다 향상된 측정을 제시함을 보였다.

  • PDF

데이터의존성과 벡터왜곡척도를 이용한 개선된 프랙탈 칼라영상 복호화 (An Improved Fractal Color Image Decoding Based on Data Dependence and Vector Distortion Measure)

  • 서호찬;정태일;문광석;안상호;권기룡
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.116-121
    • /
    • 1998
  • 본 논문에서는 데이터의존성과 벡터왜곡척도를 이용하여 개선된 칼라영상을 복호화하였다. 프랙탈 칼라영상의 복원방법은 Zhang과 Po의 벡터왜곡척도를 이용한 R, G, B 칼라 성분간의 상관관계를 고려하여 부호화한 압축파일을 사용하여 수렴될 복원영상을 독립적인 반복변환에 의해 수렴되는 영역과 데이터의존성을 갖는 영역으로 분류하여 데이터의존성 부분이 차지하는 만큼 복호화 과정에서 불필요한 계산량이 제거되었고, R 영역에서 검색한 데이터 의존영역을 G, B 영역에 그대로 사용하여 고속복호화가 가능하였다.

  • PDF

연구데이터 서비스의 유용성 평가 모형 연구 (A Study on Evaluation Model for Usability of Research Data Service)

  • 박진호;고영만;김현수
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.129-159
    • /
    • 2019
  • 본 연구의 목적은 연구데이터 서비스 자체의 유용성과 연구데이터에 대한 사용경험 기반의 유용성 측면에서 평가 모형을 개발하는 것이다. 다양한 사례에서 도출한 데이터 서비스의 유용성 평가 요소로부터 연구데이터에 내재된 평가척도인 검색성, 접근성, 상호운용성, 재활용성 4개와 각각의 측정지표 총 20개를 도출하였다. 그리고 Google Analytics, YouTube 광고료 책정 기준, 서울특별시, Altmetrics의 사례를 분석하여 연구데이터에 대한 이용자 경험 기반의 유용성 측정지표 12개를 도출하였다. 평가척도와 측정지표에 대한 타당성과 신뢰성 검정을 위해 연구데이터의 잠재적 이용자 164명을 대상으로 설문조사를 실시하였다. 평가척도의 타당성 검정을 위해 KMO Bartlett 분석을 하였으며, 측정지표의 성분분석을 위해 주성분 분석과 베리맥스 회전분석법을 사용하였다. 내재적 평가척도의 경우 4개 척도 모두 KMO Bartlett의 타당성 값을 충족시켰으며, 평가척도에 대한 측정지표의 성분분석 결과 모두 단일 성분으로 나타나 현재의 척도로 해당 지표에 대한 설명이 가능하였다. 그러나 이용자 경험 기반의 12개 측정지표의 성분분석 결과는 2개 성분으로 나누어지는 것으로 나타나 각각을 활용도와 참여도라는 개념의 2개 평가척도로 구분하였다. Cronbach's alpha 계수에 의한 신뢰도 측정 결과 6개의 평가척도 모두 0.6 이상의 측정치를 충족시키는 것으로 나타났다.

중첩성과 분리성을 이용한 퍼지 클러스터 평가척도 (A Fuzzy Cluster Validity based on Inter-cluster Overlapping and Separation)

  • 김대원;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.99-102
    • /
    • 2003
  • 본 논문에서는 퍼지 클러스터링 알고리즘에 의해 구해진 퍼지 클러스터들에 대한 평가척도를 제안한다. 제안된 척도는 퍼 지 클러스터들간의 중첩성(overlapping)과 분리성 (separation)을 이용한다. 중첩성은 클러스터간 인접도를 이용하여 계산하며, 분리성은 데이터에 대한 상관성 정도를 나타낸다. 따라서 중첩성이 낮고 분리성이 높을수록 좋은 클러스터 결과라고 할 수 있다. 표준 데이터 집합을 대상으로 기존의 척도들과 비교실험 함으로써 제안된 척도의 신뢰성을 알아보았다.

  • PDF

프라이버시 보존형 데이터 마이닝 방법 및 척도 분석 (Privacy Preserving Data Mining Methods and Metrics Analysis)

  • 홍은주;홍도원;서창호
    • 디지털융복합연구
    • /
    • 제16권10호
    • /
    • pp.445-452
    • /
    • 2018
  • 생활의 모든 것들이 데이터화 되어가고 있는 세상에서 데이터의 양은 기하급수적으로 증가하고 있다. 이러한 데이터는 수집 및 분석을 통하여 새로운 데이터로 가공되어진다. 새로운 데이터는 병원, 금융, 기업 등 여러 분야에서 다양한 용도로 사용되고 있다. 그러나 기존의 데이터에는 개인들의 민감한 정보가 포함되어 있기 때문에 수집 및 분석과정에서 개인의 프라이버시 노출 우려가 있다. 해결 방안으로 프라이버시 보존형 데이터 마이닝(PPDM)기술이 있다. PPDM은 프라이버시를 보존하면서 동시에 데이터로부터 유용한 정보를 추출하는 방법이다. 본 논문에서는 PPDM을 조사하고 데이터의 프라이버시와 유틸리티를 평가하기 위한 다양한 측정방법을 분석한다.

생물학적 데이터의 베이지안 네트워크 학습에서의 효과적인 스코어링 척도 비교 (Comparison of Efficient Scoring Metrics for Bayesian Network Learning in Biological Domain)

  • 황성철;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.357-360
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크 학습 방법을 이용한 비교적 적은 양의 샘플 데이터에서 현실적인 네트워크 모델 추론을 위한 효율적인 스코어링 척도를 찾는 것을 목표로 하였다. UPSM, CUPSM, DPSM, BDe(Bayesian Dirichlet) 등을 각각 적용시켜본 결과를 통해 어떤 방법이 가장 적은 샘플의 데이터, 특히 생물학적 데이터에적합한지 알아보았다.

  • PDF

색상 및 곡률기반 정점 재조정을 이용한 메쉬 간략화 (Mesh Simplification using Vertex Replacement based on Color and Curvature)

  • 최한균;강의철;김현수;이관행
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.1385-1388
    • /
    • 2005
  • 최근 3 차원 스캐닝(Scanning) 기술의 발달로 형상 및 색상 정보 데이터를 동시에 획득할 수 있게 되었다. 특히 한번의 측정으로 다량의 데이터를 확보할 수 있기 때문에 3 차원 데이터의 정합(Registration) 및 병합(Merging) 과정에서 계산량이 증가하게 된다. 또한 정합과 병합 후의 대용량 데이터 자체로는 3 차원 모델의 저장, 전송, 처리 및 렌더링(Rendering) 등의 과정에서 어려움이 있다. 따라서 모델의 기하 정보와 색상, 질감, 곡률 등의 속성 정보를 유지하면서 데이터의 양을 감소시키는 메쉬 간략화 기술이 필요하다. 현재 널리 쓰이는 이차 오차 척도(Quadric Error Metric) 방법으로 메쉬를 극심하게 감소하게 되면 오차가 누적되어 기하 정보 및 속성 정보가 소실된다. 본 연구에서는 이를 방지하기 위해 이차 오차 척도 감소화 과정에서 곡률과 색상 기반의 정점 재조정 방법을 제안한다.

  • PDF