• Title/Summary/Keyword: 상관 데이터

Search Result 2,830, Processing Time 0.03 seconds

Analysis of the Correlation between Fine Dust and Disease Using Big Data (빅데이터를 활용한 미세먼지와 질병 간의 상관관계 분석)

  • Nam, Kyeongyoon;Moon, Soyoung;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.368-370
    • /
    • 2022
  • WHO 산하의 국제암연구소는 2013 년부터 미세먼지를 1 급 발암 물질로 분류하고 있으며 미세먼지 노출에 대한 질병 발생의 심각성은 점점 수면 위로 드러나고 있는 추세다. 본 연구에서는 국민건강보험공단의 진료 내역 정보 데이터와 2015 년부터 2021 년까지의 미세먼지 및 초미세먼지 월 평균 농도 데이터를 이용하여 미세먼지 및 초미세먼지 농도와 순환기계와 호흡기계 질병 간의 상관 관계를 보이고, 연관성있는 질병을 찾아내었다. 이를 위해 시계열분석, 상관분석, 빈도분석을 시행하였으며 실험 결과 호흡기질환에서는 급성 부비동염, 코의 농양 등의 질병과 순환기질환에서는 상세불명의 원발성 고혈압, 폐색전증이 상관관계가 높은 질병으로 판명되었다.

A Study on Solving of Double-layer Pattern Problem in Daejeon Correlator (대전상관기에서 복층패턴 문제의 해결에 관한 연구)

  • Oh, Se-Jin;Roh, Duk-Gyoo;Yeom, Jae-Hwan;Chung, Dong-Kyu;Oh, Chung-Sik;Hwang, Ju-Yeon
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.16 no.4
    • /
    • pp.162-167
    • /
    • 2015
  • This paper describes the reason and the problem solving for the double-layer pattern of a Daejeon correlator operated in Korea-Japan Correlation Center. When the electric power of an input signal in the correlator is charged small enough to be buried in the noise, it is hard to see a signal with a specific pattern in the input signal, but when the electric power is large, a specific one is reported to be seen. By comparing data from observation with one from software correlator, it was confirmed from the analysis using the AIPS software that the amplitude gain of a source signal was affected about 3%. Therefore, in order to solve the problem of double-layer patterns, we found that a problem in the memory management module responsible for both the data input and the data serialization of the correlator is a cause for the double-layer pattern detected periodically. In other words, while data is serialized and read repeatedly in the memory area assigned to serialize the data from the serialization module, redundant last data is generated and an overlap for the memory allocation is occurred. Therefore, by modifying the program of the FPGA memory sections on serialization module to correct the problem, we confirmed that double-layer pattern is disappeared and correlation results are normally acquired.

A Measurement Allocation for Reliable Data Gathering in Spatially Corrected Sensor Networks (공간상관 센서네트워크에서 신뢰성 있는 데이터 수집을 위한 측정의 분배)

  • Byun, Sang-Seon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.05a
    • /
    • pp.434-437
    • /
    • 2016
  • In this paper, we consider a measurement allocation problem for gathering reliable data from a spatially correlated sensor field. We allocate the probability of each sensor's being measured considering its marginal contribution in entire data gathering; higher measurement probability is given to a sensor that gives higher reilable data. First we establish a correlation model considering limit in each sensor's transmission power, noise in the process of measurement and transmission, and attenutations in wireless channel. Then we evaluate the reliability of gathered data by estimating distortion error in sink node. We model the measurement allocation problem in spatially correlated sensor field into a cooperative game, and quantifiy each sensor's marginal contribution using Shapley Value. Then, the probability of each sensor's being measured is given in proportion to the Shapley Value.

  • PDF

The Stock Portfolio Recommendation System based on the Correlation between the Internet Stock Message Board and the Stock Market (인터넷 주식 토론방과 주식 시장의 상관관계 분석을 통한 투자 종목 선정 시스템)

  • Lee, Yun-Jung;Kim, Gunwoo;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.967-970
    • /
    • 2014
  • 인터넷 게시판이나 트위터 같은 온라인 매체는 쉬운 접근성과 실시간 특성으로 어떤 사건에 대한 사용자들의 반응이 즉각적으로 나타난다. 또한, 실시간으로 엄청난 양의 데이터가 생성되고 있어 이 데이터를 잘 분석한다면 실제 사회에서 나타나는 다양한 현상들에 대해 파악할 수 있다. 최근 주식 시장에서도 이러한 온라인 데이터들을 분석하여 주가 변동이나 주식 시장 상황을 이해하려는 연구가 시도되고 있다. 이 논문에서는 주식 토론방의 게시물과 주가 사이에 어떤 상관관계가 있는지를 분석하고, 이를 이용한 주식 투자 종목 추천 시스템을 제안하고자 한다. 먼저 주가와 주식 토론방 게시물들 사이의 상관관계를 분석하기 위해서 KOSPI200에 속한 회사 중 55개의 회사를 대상으로 주가와 주식 토론방 게시물을 분석하였다. 2008년부터 2013년까지 6년 동안 각 회사의 주가와 게시물의 상관관계를 분석한 결과 개별 주가와 게시물 수 사이에는 특별한 상관관계가 나타나지 않았다. 하지만 주가와 게시물 수의 상관관계가 높을수록 주식 수익률이 높은 경향을 보였다. 이 논문에서는 주가와 게시물 수의 상관관계 정보를 이용한 투자 종목 추천 알고리즘을 제안하였고, 모의투자 실험을 통해 제안 방법의 효율성을 보였다. 2008년 1월부터 2013년 12월까지의 주가와 주식 토론방 데이터를 이용한 모의투자 실험에서 제안 방법으로 구성한 포트폴리오의 1개월 평균 수익률은 약 1.82%로, 주식 네트워크 특성을 이용한 기존 방법보다 약 0.64% 높은 수익률을 보였다. 또한, 마코위츠의 효율적 포트폴리오와 KOSPI200 수익률보다 각각 약 0.85%와 1.48% 높게 나타났다.

Cancer Classification with Gene Expression Profiles using Forward Selection Method (전진 선택법을 이용한 유전자 발현정보 기반의 암 분류)

  • Yoo, Si-Ho;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.293-296
    • /
    • 2003
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 microarray상에서 측정한 것으로 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에, 유전발현 데이터를 통하여 암을 분류할 수 있다. 하지만 분류에 모든 유전자가 관여하지는 않으므로 관련성 있는 유전자만을 선별해내는 작업인 특징 선택방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선택하고 분류하는 방법을 제안한다. 실험데이터는 대장암 데이트를 사용하였고, 분류기는 KNN을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택 방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징 선택방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다.

  • PDF

Correlation Analysis of Feature Space Data in End-to-end Image Compression Network (종단간 인공신경망 기반 이미지 압축 기술의 피쳐 공간 상관관계 분석)

  • Lee, Jooyoung;Jeong, Se-Yoon;Choi, Jin Soo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.151-154
    • /
    • 2020
  • 뉴럴넷 기술이 발전과 힘께 다양한 분야에서 획기적인 성능 향상이 이루어지고 있다. 이미지 압축 분야에서도 기존의 전통적인 툴 제인 구조의 압축 방식에서 벗어나 종단간(end-to-end) 뉴렬넷 기반의 이미지 압축 기술에 대한 연구가 활발히 이루어지고 있다. 특히 최근 네트워크를 통해 변환된 피쳐 데이터의 엔트로피를 최소화하는 방식에 대한 연구가 활발히 이루어지고 있으며, 이에 기반한 최근의 연구는 VVC 화면 내 코딩 기술보다 우수한 코딩 효율성을 제공하고 있다. 그러나 변환된 피쳐 데이터에 대한 특성 분석은 부족한 실정이며, 이에 본 논문에서는 엔트로피 최소화 기반 종단간 이미지 압축 네트워크의 피쳐 공간 데이터에 대한 공간적 (spatial) 상관관계와 채널간(inter-channel) 상관관계(correlation)를 분석하고, 나아가 최근 제안된 종단간 이미지 압축 네트워크의 문맥 기반 예측 기능을 통해 잔존하는 데이터 중복성이 효과적으로 제거됨을 보인다.

  • PDF

Recommendation System Based on Correlation Analysis of User Behavior Data in Online Shopping Mall Environment (온라인 쇼핑몰 환경에서 사용자 행동 데이터의 상관관계 분석 기반 추천 시스템)

  • Yo Han Park;Jong Hyeok Mun;Jong Sun Choi;Jae Young Choi
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.13 no.1
    • /
    • pp.10-20
    • /
    • 2024
  • As the online commerce market continues to expand with an increase of diverse products and content, users find it challenging in navigating and in the selection process. Thereafter both platforms and shopping malls are actively working in conducting continuous research on recommendations system to select and present products that align with user preferences. Most existing recommendation studies have relied on user data which is relatively easy to obtain. However, these studies only use a single type of event and their reliance on time dependent data results in issues with reliability and complexity. To address these challenges, this paper proposes a recommendation system that analysis user preferences in consideration of the relationship between various types of event data. The proposed recommendation system analyzes the correlation of multiple events, extracts weights, learns the recommendation model, and provides recommendation services through it. Through extensive experiments the performance of our system was compared with the previously studied algorithms. The results confirmed an improvement in both complexity and performance.

Outlier Detection in Time Series Monitoring Datasets using Rule Based and Correlation Analysis Method (규칙기반 및 상관분석 방법을 이용한 시계열 계측 데이터의 이상치 판정)

  • Jeon, Jesung;Koo, Jakap;Park, Changmok
    • Journal of the Korean GEO-environmental Society
    • /
    • v.16 no.5
    • /
    • pp.43-53
    • /
    • 2015
  • In this study, detection methods of outlier in various monitoring data that fit into big data category were developed and outlier detections were conducted for both artificial data and real field monitoring data. Rule-based methods applied rate of change and probability of error for monitoring data are effective to detect a large-scale short faults and constant faults having no change within a certain period. There are however, problems with misjudgement that consider the normal data with a large scale variation as outlier caused by using independent single dataset. Rule-based methods for noise faults detection have a limit to application of real monitoring data due to the problem with a choice of proper window size of data and finding of threshold for outlier judgment. A correlation analysis among different two datasets were very effective to detect localized outlier and abnormal variation for short and long-term monitoring dataset if reasonable range of training data could be selected.

A new classification method using penalized partial least squares (벌점 부분최소자승법을 이용한 분류방법)

  • Kim, Yun-Dae;Jun, Chi-Hyuck;Lee, Hye-Seon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.5
    • /
    • pp.931-940
    • /
    • 2011
  • Classification is to generate a rule of classifying objects into several categories based on the learning sample. Good classification model should classify new objects with low misclassification error. Many types of classification methods have been developed including logistic regression, discriminant analysis and tree. This paper presents a new classification method using penalized partial least squares. Penalized partial least squares can make the model more robust and remedy multicollinearity problem. This paper compares the proposed method with logistic regression and PCA based discriminant analysis by some real and artificial data. It is concluded that the new method has better power as compared with other methods.

An Experimental Study on Smoothness Regularized LDA in Hyperspectral Data Classification (하이퍼스펙트럴 데이터 분류에서의 평탄도 LDA 규칙화 기법의 실험적 분석)

  • Park, Lae-Jeong
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.20 no.4
    • /
    • pp.534-540
    • /
    • 2010
  • High dimensionality and highly correlated features are the major characteristics of hyperspectral data. Linear projections such as LDA and its variants have been used in extracting low-dimensional features from high-dimensional spectral data. Regularization of LDA has been introduced to alleviate the overfitting that often occurs in a small-sized training data set and leads to poor generalization performance. Among them, a smoothness regularized LDA seems to be effective in the feature extraction for hyperspectral data due to its capability of utilizing the high correlatedness. This paper studies the performance of the regularized LDA in hyperspectral data classification experimentally with varying conditions of the training data. In addition, a new dual smoothness regularized LDA is proposed and evaluated that makes use of both the spectral-domain and spatial-domain correlations between neighboring pixels.