• Title/Summary/Keyword: 상관 데이터

Search Result 2,834, Processing Time 0.03 seconds

Design Method of Smart Device User Clustering for Correlation Analysis between Immersive and Biological Signals (몰입도와 생체신호 간 상관관계분석을 위한 스마트기기 사용자 군집방법설계)

  • Lee, KiHoon;Kim, JinAh;Moon, NamMee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.323-325
    • /
    • 2018
  • 본 논문은 몰입도와 생체신호 간의 상관관계를 분석하기 위한 데이터 수집 및 데이터 군집에 대한 연구이다. 스마트기기를 이용해 걸음 수, 심박 수, 수면깊이와 같은 생체 데이터수집과, 수집한 데이터를 토대로 사용자의 행동패턴을 분석한다. 사용자 생체 데이터를 k-means 클러스터링과 계층적 클러스터링을 혼합해 이용해 앞서 나열한 데이터와 사용자의 집중도와 연관관계분석이 최종 목표이다.

Covid 19 news data analysis (코로나 19 뉴스데이터 분석 및 시각화)

  • Hur, Tai-seong;Hwang, In Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.241-242
    • /
    • 2021
  • 본 논문에서는 2020년 1월부터 2020년 8월까지 8개월간의 유통되었던 코로나 19와 관련된 뉴스 데이터를 이용하여 기간 및 지역별 단어의 빈도수를 구하고, 그 결과를 활용해 코로나 19와의 상관관계를 분석하고, 시각화하였다. 뉴스데이터는 한국언론진흥재단에서 운영하는 뉴스 빅데이터 시스템인 '빅카인즈'에서 수집된 데이터를 이용하였다. 본 논문에서 웹서비스를 활용해 시각화하였으며 지역과 기간을 선택하면 분석한 결과를 불러와 전체 지역대비 선택한 지역의 뉴스 빈도수, 선택한 지역의 주요 키워드, 주요 키워드의 지역별 일자별 변화 등을 보여주고 있다. 이러한 시각화를 통해 이전에 발생되었던 사건에 대해 주요 키워드와 코로나 19의 상관관계를 쉽게 파악을 할 수 있다.

  • PDF

KJJVC를 위한 VERA2000 고속재생기 도입과 시험운영

  • O, Se-Jin;Yeom, Jae-Hwan;No, Deok-Gyu;Park, Seon-Yeop;Kawaguchi, Noriyuki;Kobayashi, Hideyuki
    • The Bulletin of The Korean Astronomical Society
    • /
    • v.35 no.1
    • /
    • pp.44.1-44.1
    • /
    • 2010
  • 한국천문연구원에서는 2009년 1단계 한일공동VLBI상관기(Korea-Japan Joint VLBI Correlator, KJJVC)의 개발과 설치를 완료하였다. KJJVC는 한국우주전파관측망(Korean VLBI Network, KVN), KVN과 일본 내의 VLBI 관측망을 포함하는 한일공동VLBI관측망(Korea-Japan Joint VLBI Network, KJJVN), 그리고 한중일의 VLBI관측망인 동아시아 VLBI관측망(East Asian VLBI Network, EAVN)으로 관측한 VLBI 데이터를 상관처리할 수 있도록 설계 제작되었다. 그리고 고속재생기, 데이터 동기재생처리시스템(Raw VLBI Data Buffer, RVDB), VLBI상관서브시스템(VLBI Correlation Subsystem, VCS), 데이터 아카이브 시스템(Peta-scale Epoch Data Archive, PEDA)로 구성된다. 특히 일본국립천문대 VERA에서는 테이프 형태의 DIR2000 고속기록기를 사용하고 있는데, DIR2000의 제품단종으로 인해 이 데이터를 VCS에 재생하기 위해 DIR1000을 개량한 VERA2000 고속재생기를 개발하였다. 즉, VSI 형태의 데이터를 1Gbps 속도로 재생만 하기 위해 기존의 시스템을 개량하였으며, 2009년 10월에 VLBI상관기실에 설치되었다. 본 논문에서는 VERA2000 시스템의 구성 및 개발, 시험운영 등에 대해 간략히 소개하고자 한다.

  • PDF

Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method (전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류)

  • 유시호;조성배
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.3
    • /
    • pp.83-92
    • /
    • 2004
  • Gene expression profile is numerical data of gene expression level from organism measured on the microarray. Generally, each specific tissue indicates different expression levels in related genes, so that we can classify cancer with gene expression profile. Because not all the genes are related to classification, it is needed to select related genes that is called feature selection. This paper proposes a new gene selection method using forward selection method in regression analysis. This method reduces redundant information in the selected genes to have more efficient classification. We used k-nearest neighbor as a classifier and tested with colon cancer dataset. The results are compared with Pearson's coefficient and Spearman's coefficient methods and the proposed method showed better performance. It showed 90.3% accuracy in classification. The method also successfully applied to lymphoma cancer dataset.

Neural Network Pair with Negatively Correlated Genes for Cancer Classification (암의 분류를 위한 음의 상관관계 유전자의 신경망 쌍)

  • 원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.359-361
    • /
    • 2003
  • 정확한 암의 분류는 암의 진단 및 치료에 있어 매우 중요하지만, 암을 진단하기 위한 기존의 여러 방법들은 종종 불완전한 결과를 도출한다. 최근의 마이크로어레이 기술에 기반한 분자 수준의 진단은 정확하고 객관적이며 체계적인 암의 분류를 위한 방법론을 제시해준다. 유전자 발현 데이터는 일반적으로 수천개 이상의 유전자를 포함하는데, 유전자 발현 데이터의 모든 유전자가 암과 관련이 있는 것이 아니므로 정확한 암을 분류하기 위하여 중요한 유전자만을 추출하는 것이 바람직하다. 본 논문에서 음의 상관관계를 갖는 두 개의 이상적인 유전자 벡터를 정의한 후 이와 유사한 정도를 기준으로 중요한 유전자 집단을 추출하고, 각각을 신경망으로 학습하여 결합하는 신경망 쌍을 제안한다. 실험 결과는 음의 상관관계를 갖는 두 개의 유전자 집단이 암의 클래스를 잘 구분할 수 있음을 보여주었다. 이 유전자 집단을 특징으로 하여 각각 학습한 신경망을 베이시안 방법으로 결합한 결과, 벤치마크 데이터에 대하여 신경망 쌍이 개별 분류기에 비해 우수한 성능을 보임을 확인하였다.

  • PDF

Fuzzy Time Series Prediction with Data Preprocessing and Error Compensation Based on Correlation Analysis (상관해석을 기반으로 한 데이터의 전처리와 오차 보정을 갖는 퍼지 시계열 예측)

  • Bang, Young-Keun;Lee, Chul-Heui
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1773-1774
    • /
    • 2008
  • 유동적 비선형 특성을 보이는 혼돈 시계열에 대한 정확한 예측을 위해 예측 입력으로 차분 데이터를 사용하면 보다 나은 예측이 가능하다. 그러므로 본 논문에서는 상관 해석에 기반한 데이터의 전처리를 통해 적절한 최적 차분 간격 후보군을 선정하고 이들 각각에 대한 TS 퍼지 예측기로 다중 모델을 구성하여 성능 지수 평가에 의해 최적의 퍼지 예측기를 선택하여 예측을 수행하도록 하였으며, TS 퍼지 규칙 후건부에서 결정되는 예측 출력에 상관 해석에 기반한 오차 보정 메거니즘을 추가함으로써 예측 성능을 더욱 향상시킬 수 있도록 하였다.

  • PDF

Construction of a biological network using recursive adaptive partitioning (재귀적 적응 분할 방식을 사용한 생물학적 네트워크의 구축)

  • Lee, Sunyoung;Lee, Minhyeok;Kang, Yeong Seon;Seok, Junhee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.624-626
    • /
    • 2016
  • 본 논문에서는 생물학적 네트워크 구성을 개선하기 위해서 노이즈의 영향으로 상관관계가 명확하게 나타나지 않았던 기존의 방법을 보완할 수 있는 새로운 방법을 제안한다. 제안된 방법은 재귀적응분할 방법으로 상관행렬에서 노이즈의 영향을 줄여 표본간의 상관관계를 명확히 보여 줄 수 있다. 시뮬레이션 결과 네트워크 구성의 오류를 15% 줄여 기존의 방법보다 향상된 결과가 나타났다. 또한, 유전자 발현 데이터를 이용한 실례 연구에서는 원 데이터에 잘 나타나지 않았던 조건별 네트워크 구성이 제안된 방법으로는 잘 분리되어 있는 것을 확인 할 수 있었다. 본 논문에서 제안된 방법은 유전자 발현 데이터 분석 등의 생물학적 네트워크 구성에 활용될 수 있을 것으로 기대한다.

Exploratory data analysis for Chatterjee's ξ coefficient (Chatterjee의 ξ 계수에 대한 탐색적자료분석)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.3
    • /
    • pp.421-434
    • /
    • 2022
  • Chatterjee (2021) proposed a new correlation coefficient ξ. Focusing on two questions (1. Is ξ coefficient distinguishable for Anscombe's quartet data set?, 2. How does the ξ coefficient value change according to the number of data for various kinds of scatterplots?), an exploratory data analysis is attempted for ξ coefficient. We can compare three measures (ξ coefficient, Pearson's correlation coefficient and mutual information).

Analysis of Factors Influencing upon the Metro Wear Using the Classification and Regression Trees (CART 분석을 이용한 지하철 마모 영향인자 분석)

  • Jeong, Min Chul;Lee, Won Woo;Kim, Jung Hoon;Kong, Jung Sik
    • 한국방재학회:학술대회논문집
    • /
    • 2011.02a
    • /
    • pp.38-38
    • /
    • 2011
  • 일반적으로 레일마모는 열차의 주행안전 및 승차감에 미치는 영향이 크고, 소음 진동의 주요원인으로 작용한다. 또한 레일마모가 발생할 경우 궤도구조의 파괴를 촉진시킴으로써 차량 및 궤도유지보수비를 크게 증가시킨다. 따라서 구간 특성 및 환경 영향 인자 등 현장에서 발생하는 마모 원인을 체계적으로 분석함으로써 마모를 저감할 수 있도록 차량운행 조건과 선로선형 및 궤도구조를 설계하는 것은 중요한 과제이다. CART(Classification And Regression Tree; 분류와 회귀나무) 분석은 패키지화된 좋은 분류 및 예측도구 기법으로 나무의 상위 분리수준에서 일반적으로 나타나는 가장 중요한 입력변수들을 사용하는 등의 입력변수를 선정하는 경우 매우 유용하다. 본 연구에서는 다변수 구간특성 및 환경인자를 고려한 검측 자료 상관관계 분석을 위한 회귀 나무기반 모델(TBM: Tree Based Model) 분석 수행을 위해 지하철 2호선 마모 데이터와 마모 데이터에 영향을 미치는 각종 다변수 구간특성 및 환경인자를 사용하였다. 2호선 지하철의 구간특성 인자 및 환경인자는 레일의 종류, 레일의 위치, 도상, 곡률반경, 캔트 슬랙 및 운행 일수 등으로 구분하였다. 레일의 종류는 ks-50kg과 ks-60kg 두 종류의 레일이 있으며, 레일의 위치는 지상과 지하로 크게 구분할 수 있다. 도상은 콘크리트 도상, 자갈 도상과 일부 구간의 방진상 콘크리트 도상으로 구분할 수 있으며, 곡률반경은 직선구간과 완화곡선 구간 및 최소 250m부터 627m까지 분포된 원 곡선 구간으로 구분할 수 있다. 캔트 간격은 최소 96cm 부터 120cm 간격으로 구분하며, 슬랙은 5~9cm에 분포하고, 운행 기간은 해당 기간 동안 유지보수 이력이 없는 구간을 선정하여 2005년부터 2006년까지 4번에 걸쳐 검측된 지하철 2호선 내선 마모데이터를 사용하였다. 총 X1부터 X7까지 총 7개의 구간특성 또는 환경특성을 영향인자로 선정하였으며, 이러한 영향인자에 의해 결정되는 종속 인자로 Y1인 직마모와 Y2인 측마모를 선정하여 이 중 실질적으로 지하철 궤도의 성능 평가에 주요 판단인자로 사용되는 측마모와 구간특성 및 환경영향인자와의 상관관계 분석을 수행하였다. 해당 마모 데이터가 검측되는 기간 동안 유지보수 이력이 없는 12272 point의 데이터를 검출하였고 CART 프로그램을 이용하여 데이터를 분석하였으며, CART 프로그램의 해석을 위해 종속변수인 직마모량은 각 검측 지점의 마모량에 해당하는 등급으로 변환하여 분석을 수행하였다. 레일의 마모에 영향을 미치는 구간특성 및 환경인자와 종속 변수로 사용된 레일의 마모량 사이의 CART를 이용한 상관관계 분석은 실제 구조물에서 영향인자간의 상관 관계와 유사하며, 추후 연구에서는 이를 바탕으로 하여 정량화된 검측 데이터를 종속변수로 하여 구간특성 또는 환경인자 등 외부 영향인자를 고려한 궤도 검측데이터와의 상관관계 분석을 수행할 계획이다.

  • PDF