• 제목/요약/키워드: Multivariate Stream Data

검색결과 21건 처리시간 0.031초

다변량 스트림 데이터 축소 기법 평가 (Evaluation of Multivariate Stream Data Reduction Techniques)

  • 정훈조;서성보;최경주;박정석;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.889-900
    • /
    • 2006
  • 센서 네트워크는 애플리케이션 분야에 따라 데이터 특성과 사용자의 요구사항이 다양함에도 불구하고, 현존하는 스트림 데이터 축소 연구는 데이터의 본질적인 특징보다 특정 축소 기법의 성능 향상 측면에 중점을 두고 있다. 이 논문은 계층/분산형 센서 네트워크 구조와 데이터 모델을 소개하고, 선택적으로 축소 기법을 적용하기 위해 데이터 특성과 사용자의 요구에 적합한 다변량 데이터 축소 기법을 비교 평가한다. 다변량 데이터 축소 기법의 성능을 비교 분석하기 위해, 우리는 웨이블릿, HCL(Hierarchical Clustering), SVD(Singular Value Decomposition), 샘플링과 같은 표준화 된 다변량 축소 기법을 이용한다. 실험 데이터는 다차원 시계열 데이터와 로봇 센서 데이터를 사용한다. 실험 결과 SVD와 샘플링 기법이 상대 에러 비율과 수행 성능 측면에서 웨이블릿과 HCL기법에 비해 우수하였다. 특히 각 데이터 축소 기법의 상대 에러 비율은 입력 데이터 특성에 따라 다르기 때문에 선택적으로 데이터 축소 기법을 적용하는 것이 좋은 성능을 보였다. 이 논문은 다차원 센서 데이터가 수집되는 센서 네트워크를 디자인하고 구축하는 응용 분야에 유용하게 활용될 것이다.

슬라이딩 윈도우 기반 다변량 스트림 데이타 분류 기법 (A Sliding Window-based Multivariate Stream Data Classification)

  • 서성보;강재우;남광우;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.163-174
    • /
    • 2006
  • 분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.

과포화(Overdefined) 연립방정식을 이용한 LILI-128 스트림 암호에 대한 분석 (Cryptanalysis of LILI-128 with Overdefined Systems of Equations)

  • 문덕재;홍석희;이상진;임종인;은희천
    • 정보보호학회논문지
    • /
    • 제13권1호
    • /
    • pp.139-146
    • /
    • 2003
  • 본 논문은 과포화 다변수 방정식을 이용하여 LILI-128 스트림 암호를 분석한다. LILI-128 암호$^{[8]}$ 는 128비트 키를 가진 선형귀환 쉬프트 레지스터 기반의 스트림 암호로 구조를 살펴보면 크게 “CLOCK CONTROL” 부분과 “DATA GENERATION” 부분으로 나뉘어진다. 분석 방법은 “DATA CENERATION” 부분에 사용되는 함수 \ulcorne $r^{d}$ 의 대수적 차수가 높지 못하다는 성질을 이용한다. 간략히 설명하면 차수(K)가 6차인 다변수 방정식을 많이 얻을 수 있고, 이를 7차 (D)의 다변수 방정식으로 확장하여 주어진 변수보다 많은 연립방정식을 얻어 그 해를 구하는 XL 알고리즘을 통해 전수조사보다 빠르게 키정보를 찾을 수 있다. 결과 중 가장 좋은 것은 출력 키수열 2$^{26.3}$비트를 가지고 2$^{110.7}$ CPU 시간을 통해 128비트 키정보를 얻는 것이다.다.

다변량기법을 활용한 용담호 수질측정지점 유사성 연구 (A Study on Measuring the Similarity Among Sampling Sites in Lake Yongdam with Water Quality Data Using Multivariate Techniques)

  • 이요상;권세혁
    • 환경영향평가
    • /
    • 제18권6호
    • /
    • pp.401-409
    • /
    • 2009
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data and understand the characteristics of classified clusters have been discussed for the optimal water quality monitering network. For empirical study, data of two years (2005, 2006) at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in Yongdam reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

다변량 통계기법을 이용한 미호천 본류 수질특성 평가 (Assessment of Water Quality in the Miho Stream Using Multivariate Statistics)

  • 윤혜영;김지현;채민희;조윤해;천세억
    • 환경영향평가
    • /
    • 제28권4호
    • /
    • pp.373-386
    • /
    • 2019
  • 본 연구는 금강 수계 주요 지류인 미호천수계를 대상으로 수계의 공간적 특성을 조사하고, 수질분석과 통계분석을 이용하여 수질에 영향을 주는 주요인을 파악하였다. 조사 대상은 미호천 수계의 본류에서 수질측정망을 운영 중인 7개 지점으로 선정하였고, 2012년부터 2017년까지 6년간 측정망 수온 등 16개 항목, 기상자료 등을 사용하여 다변량 통계분석을 실시하였다. 수질 분석 결과, 유기물질 지표인 BOD와 COD의 6년간 평균 농도는 환경부 수질 및 수생태계 생활환경기준(하천)과 비교하여 III등급(보통)으로 나타났다. 지점별 비교 결과 질소계열과 인계열의 농도는 상류 지점에서 가장 높게 나타났으며, 이후 감소하는 경향을 보이다 수리적, 지형적 영향으로 다시 증가하는 것으로 나타났다. 공간 및 수질 특성을 고려한 계층적 군집분석 결과, 총 3개의 군집으로 평가되었으며, 수계에 유입되는 오염원의 영향이 큰 것으로 나타났다. 각 군집과 본류 전체를 대상으로 실시한 주성분 및 요인분석 결과, 각각 3~4개의 주성분이 추출되었다. 요인분석 결과 제1요인은 본류와 Cluster1,3에서 질소계열 요인과 계절적 요인, Cluster2에서 질소계열 요인과 수온으로 나타나 미호천 수계의 수질에 가장 큰 영향을 미치는 인자는 질소계열의 농도인 것으로 나타났다.

Factor analysis of the trend of stream quality in Nakdong River

  • Kim, Kyong-Mu;Lee, In-Rak;Kim, Jong-Tae
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1201-1210
    • /
    • 2008
  • The goal of this paper is to investigate the trend of stream quality and the quality of water in Nakdong river by the method of factor analysis. It used the fourteen different monthly time series data such as pH, BOD, COD, SS, TN and etc. of the thirty four of Nakdong River measurement points from Jan. 1998 to Dec. 2006. The result of factor analysis is that the factor 1 results from organic water pollution is occupied 29.288% such as BOD, COD, TN and EC, and the factor 2 explained from sewage and a seasonal variation is occupied 16.467% such as SS.

  • PDF

다변량 Thomas-Fiering 모형과 Matalas 모형의 비교연구 (A Comparative Study on the Multivariate Thomas-Fiering and Matalas Model)

  • 이주헌;이은태
    • 물과 미래
    • /
    • 제24권4호
    • /
    • pp.59-66
    • /
    • 1991
  • 단기간의 실측자료를 이용하여 다변량 추계학적 모형에 의해 월유량 자료를 모의발생 시키는 목적은 수자원 시스템의 운영 조작 방침을 결정하기 위한 풍부한 입력자료를 제공하는데 있다. 본연구에서는 2종류의 다변량 모형(Thomas-Fiering 과 Matalas)을 서로 근접해 있는 두 지점에 적용하여 각각의 모형에 의한 모의 결과의 우수성과 적용가능성을 검토하여 보았으며, 이를 위해 모멘트법과 Fourier 분석에 의한 실측자료의 통계특성치를 구하였으며 비교의 기준으로는 실측치와 모의발생 자료의 통계특성을 이용하였다. 본 연구에 사용한 자료를 이용한 연구분석결과로는 다변량 Matalas 모형이 좀더 좋은 결과를 얻을 수 있었으며 변수추정도 수월함을 보였다.

  • PDF

다변량 통계 분석기법을 이용한 한강수계 지천의 수질 평가 (Evaluation of Water Quality for the Han River Tributaries Using Multivariate Analysis)

  • 김요용;이시진
    • 대한환경공학회지
    • /
    • 제33권7호
    • /
    • pp.501-510
    • /
    • 2011
  • 한강의 주요 14개 지류하천 유역의 수질오염원을 평가하고, 2007. 1~2009. 12의 하천 수질자료(14 data set)로 SPSS-17.0을 이용하여 하천별 수질 특성을 평가하였다. 시 공간변화에 대한 군집 분석을 실시한 결과 공간변화에 따라 4그룹으로 평가되었으며, 유역의 오염원 종류 및 밀도가 군집분류에 가장 큰 영향을 미치는 것으로 나타났다. 시간변화에 따라 여름에서 가을까지(7~10월)와 겨울에서 초여름까지(11~6월)의 2그룹으로 분류되어 강우와 기온 그리고 부영양화 현상이 군집화에 기여하는 것으로 평가되었다. 조사대상 하천의 수질오염 요인은 유기물질 영양염류 세균오염요인과 하천 내 물질대사요인으로(71~90%) 설명되었고, 계절에 따라 주요인(수질오염물질)은 변화하는 것으로 나타났다. 각 하천의 수질특성은 요인과 유역 오염원을 같이 평가하였을 때 유용한 결과를 얻을 수 있었다.

하천유량의 모의발생을 위한 추계학적 모형의 적용에 관한 연구 (A Study on the Stochastic Modeling for Stream Flow Generation)

  • 이주헌
    • 한국방재학회 논문집
    • /
    • 제1권2호
    • /
    • pp.115-121
    • /
    • 2001
  • 실측자료가 충분하지 못한 단기간의 유출량 자료로부터 추계학적 모형에 의해 장기간의 자료를 모의발생시키는 목적은 수공구조물의 설계에 필요한 설계홍수량의 산정 및 수자원 시스템의 운영조작 방침을 결정하기 위한 풍부한 입력자료를 제공하는데 있다. 특히 본 연구에서는 단일지점이 아닌 다지점에 대한 지점간 서로의 연관성을 고려한 하천유량의 추계학적인 모의 발생기법인 다변량 자기회귀 모형을 적용하고자 한다. 따라서 본 연구에서는 낙동강유역의 2개 지점에 대하여 다변량 모형을 적용하여 모의 발생된 월유량과 실측치를 통계적으로 비교, 분석하였다. 모의발생된 월유량과 실측치를 평균, 분산, 왜곡도, 상관관계 등에 의해 비교, 분석한 결과 모의발생된 월유량과 실측치는 통계적으로 매우 유사하게 나타났다.

  • PDF

저수지 수질조사 지점간 유사성 분석 (A Study on Measuring the Similarity Among Sampling Sites in Lake)

  • 이요상;고덕구;이현석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.957-961
    • /
    • 2010
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data. For empirical study, data of two years at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

  • PDF