• 제목/요약/키워드: 상관 데이터

검색결과 2,830건 처리시간 0.031초

빅데이터를 활용한 미세먼지와 질병 간의 상관관계 분석 (Analysis of the Correlation between Fine Dust and Disease Using Big Data)

  • 남경윤;문소영;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.368-370
    • /
    • 2022
  • WHO 산하의 국제암연구소는 2013 년부터 미세먼지를 1 급 발암 물질로 분류하고 있으며 미세먼지 노출에 대한 질병 발생의 심각성은 점점 수면 위로 드러나고 있는 추세다. 본 연구에서는 국민건강보험공단의 진료 내역 정보 데이터와 2015 년부터 2021 년까지의 미세먼지 및 초미세먼지 월 평균 농도 데이터를 이용하여 미세먼지 및 초미세먼지 농도와 순환기계와 호흡기계 질병 간의 상관 관계를 보이고, 연관성있는 질병을 찾아내었다. 이를 위해 시계열분석, 상관분석, 빈도분석을 시행하였으며 실험 결과 호흡기질환에서는 급성 부비동염, 코의 농양 등의 질병과 순환기질환에서는 상세불명의 원발성 고혈압, 폐색전증이 상관관계가 높은 질병으로 판명되었다.

대전상관기에서 복층패턴 문제의 해결에 관한 연구 (A Study on Solving of Double-layer Pattern Problem in Daejeon Correlator)

  • 오세진;노덕규;염재환;정동규;오충식;황주연
    • 융합신호처리학회논문지
    • /
    • 제16권4호
    • /
    • pp.162-167
    • /
    • 2015
  • 본 논문에서는 한일상관센터에서 운영하고 있는 대전상관기의 복층패턴에 대한 원인과 문제 해결에 대해 기술한다. 대전상관기의 상관결과에서 입력신호의 전력파워가 잡음에 묻힐 정도로 작은 경우에는 잘 보이지 않지만, 전력파워가 큰 경우 입력신호에 특정한 패턴을 가진 신호가 출현하는 문제가 보고되었다. 이는 관측데이터의 상관결과와 소프트웨어 상관기와 비교하여 AIPS 소프트웨어에서 분석할 때 관측결과의 천체신호 진폭이득에는 3% 정도의 영향을 미치고 있음이 확인되었다. 따라서 복층패턴의 문제를 해결하기 위해 주기적으로 발견되는 복층패턴의 원인으로 상관기의 데이터 입력과 직렬화를 담당하는 모듈에서 메모리 관리 영역에 문제가 있음을 발견하였다. 즉, 직렬화 모듈에서 데이터를 직렬화할 때 할당된 각 메모리 영역의 데이터가 반복적으로 읽혀져 직렬화되면서 중복된 데이터가 마지막으로 할당된 메모리의 데이터와 중첩이 되면서 발생하는 것이다. 따라서 직렬화 모듈의 메모리 관련 영역의 FPGA 프로그램을 수정하여 문제를 해결하여, 정상적인 상관결과가 출력되는 것을 확인하였다.

공간상관 센서네트워크에서 신뢰성 있는 데이터 수집을 위한 측정의 분배 (A Measurement Allocation for Reliable Data Gathering in Spatially Corrected Sensor Networks)

  • 변상선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.434-437
    • /
    • 2016
  • 이 논문에서는 공간상관 (spatial correlation) 센서네트워크에서 효과적이고 신뢰성있는 센서 데이터 수집을 위한 각 센서의 측정 확률 분배를 고려한다. 즉, 신뢰성이 높은 측정 데이터를 전달해주는 센서에게 더 높은 측정 확률을 분배하여 더 자주 측정되게 하는 것이다. 상관 모델은 각 센서의 전송파워 제한, 측정과정과 무선전송과정에서 발생될 수 있는 노이즈, 무선 채널의 감쇄를 고려하여 만들어진다. 그리고, 데이터 수집의 신뢰성은 데이터 수집 노드 (sink node)에서 왜곡 오차 (distortion error)를 계산함으로써 측정된다. 우리는 이 측정 분배를 정의된 공간상관상에서 협력게임으로 모델링하고 각 센서의 측정 확률을 Shapley Value를 통해 할당한다. Shapley Value는 협력게임에서 각 플레이어의 공헌도를 측정하는 방법으로, 공간상관 센서네트워크에서 각 센서들의 데이터 수집의 공헌도를 측정하는 데 사용될 수 있다. 따라서, 우리는 각 센서의 공헌도에 비례하여 측정 확률을 분배하는 것이다.

  • PDF

인터넷 주식 토론방과 주식 시장의 상관관계 분석을 통한 투자 종목 선정 시스템 (The Stock Portfolio Recommendation System based on the Correlation between the Internet Stock Message Board and the Stock Market)

  • 이윤정;김건우;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.967-970
    • /
    • 2014
  • 인터넷 게시판이나 트위터 같은 온라인 매체는 쉬운 접근성과 실시간 특성으로 어떤 사건에 대한 사용자들의 반응이 즉각적으로 나타난다. 또한, 실시간으로 엄청난 양의 데이터가 생성되고 있어 이 데이터를 잘 분석한다면 실제 사회에서 나타나는 다양한 현상들에 대해 파악할 수 있다. 최근 주식 시장에서도 이러한 온라인 데이터들을 분석하여 주가 변동이나 주식 시장 상황을 이해하려는 연구가 시도되고 있다. 이 논문에서는 주식 토론방의 게시물과 주가 사이에 어떤 상관관계가 있는지를 분석하고, 이를 이용한 주식 투자 종목 추천 시스템을 제안하고자 한다. 먼저 주가와 주식 토론방 게시물들 사이의 상관관계를 분석하기 위해서 KOSPI200에 속한 회사 중 55개의 회사를 대상으로 주가와 주식 토론방 게시물을 분석하였다. 2008년부터 2013년까지 6년 동안 각 회사의 주가와 게시물의 상관관계를 분석한 결과 개별 주가와 게시물 수 사이에는 특별한 상관관계가 나타나지 않았다. 하지만 주가와 게시물 수의 상관관계가 높을수록 주식 수익률이 높은 경향을 보였다. 이 논문에서는 주가와 게시물 수의 상관관계 정보를 이용한 투자 종목 추천 알고리즘을 제안하였고, 모의투자 실험을 통해 제안 방법의 효율성을 보였다. 2008년 1월부터 2013년 12월까지의 주가와 주식 토론방 데이터를 이용한 모의투자 실험에서 제안 방법으로 구성한 포트폴리오의 1개월 평균 수익률은 약 1.82%로, 주식 네트워크 특성을 이용한 기존 방법보다 약 0.64% 높은 수익률을 보였다. 또한, 마코위츠의 효율적 포트폴리오와 KOSPI200 수익률보다 각각 약 0.85%와 1.48% 높게 나타났다.

전진 선택법을 이용한 유전자 발현정보 기반의 암 분류 (Cancer Classification with Gene Expression Profiles using Forward Selection Method)

  • 유시호;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.293-296
    • /
    • 2003
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 microarray상에서 측정한 것으로 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에, 유전발현 데이터를 통하여 암을 분류할 수 있다. 하지만 분류에 모든 유전자가 관여하지는 않으므로 관련성 있는 유전자만을 선별해내는 작업인 특징 선택방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선택하고 분류하는 방법을 제안한다. 실험데이터는 대장암 데이트를 사용하였고, 분류기는 KNN을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택 방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징 선택방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다.

  • PDF

종단간 인공신경망 기반 이미지 압축 기술의 피쳐 공간 상관관계 분석 (Correlation Analysis of Feature Space Data in End-to-end Image Compression Network)

  • 이주영;정세윤;최진수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.151-154
    • /
    • 2020
  • 뉴럴넷 기술이 발전과 힘께 다양한 분야에서 획기적인 성능 향상이 이루어지고 있다. 이미지 압축 분야에서도 기존의 전통적인 툴 제인 구조의 압축 방식에서 벗어나 종단간(end-to-end) 뉴렬넷 기반의 이미지 압축 기술에 대한 연구가 활발히 이루어지고 있다. 특히 최근 네트워크를 통해 변환된 피쳐 데이터의 엔트로피를 최소화하는 방식에 대한 연구가 활발히 이루어지고 있으며, 이에 기반한 최근의 연구는 VVC 화면 내 코딩 기술보다 우수한 코딩 효율성을 제공하고 있다. 그러나 변환된 피쳐 데이터에 대한 특성 분석은 부족한 실정이며, 이에 본 논문에서는 엔트로피 최소화 기반 종단간 이미지 압축 네트워크의 피쳐 공간 데이터에 대한 공간적 (spatial) 상관관계와 채널간(inter-channel) 상관관계(correlation)를 분석하고, 나아가 최근 제안된 종단간 이미지 압축 네트워크의 문맥 기반 예측 기능을 통해 잔존하는 데이터 중복성이 효과적으로 제거됨을 보인다.

  • PDF

온라인 쇼핑몰 환경에서 사용자 행동 데이터의 상관관계 분석 기반 추천 시스템 (Recommendation System Based on Correlation Analysis of User Behavior Data in Online Shopping Mall Environment)

  • 박요한;문종혁;최종선;최재영
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제13권1호
    • /
    • pp.10-20
    • /
    • 2024
  • 매년 증가하는 온라인 상거래 시장과, 점차 다양해지는 상품과 콘텐츠로 인해 사용자들은 선택 과정에 어려움을 느낀다. 이에 여러 기업들은 온라인 쇼핑몰에서 사용자가 선호할 상품을 선별하여 제공하기 위해 추천 시스템에 대한 지속적인 연구를 진행하고 있다. 대다수의 추천 시스템 연구에서는 비교적 획득하기 쉬운 사용자의 이벤트 데이터를 기반하여 연구를 진행하였으나 한 종류의 사용자 행동만을 고려하기 때문에 사용자의 선호도를 파악하는 것에 오차가 발생한다. 이에 본 논문에서는 여러 종류의 사용자 행동 데이터의 상관관계를 고려하여 사용자의 선호도를 분석하는 추천 시스템을 제안한다. 제안하는 추천 시스템은 사용자의 사용자 행동 데이터의 상관관계를 분석하고 가중치를 생성하여 추천 모델을 학습한다. 실험에서는 기존 연구의 알고리즘과의 성능 비교를 통해 제안하는 시스템의 복잡도와 성능 향상을 확인하였다.

규칙기반 및 상관분석 방법을 이용한 시계열 계측 데이터의 이상치 판정 (Outlier Detection in Time Series Monitoring Datasets using Rule Based and Correlation Analysis Method)

  • 전제성;구자갑;박창목
    • 한국지반환경공학회 논문집
    • /
    • 제16권5호
    • /
    • pp.43-53
    • /
    • 2015
  • 본 연구에서는 빅데이터 범주에 포함되는 각종 계측 데이터를 대상으로 각종 이상치를 판단하기 위한 기법을 고안하고, 인공 데이터 및 실 계측 데이터를 이용한 이상치 분석을 수행하였다. 계측결과에 대한 1차 차분 값 및 오차율을 적용한 규칙기반 방법은 큰 규모의 Short fault 분석 및 일정 기간 계측값에 변화가 발생하지 않는 경우의 Constant fault 분석에 효과적으로 적용될 수 있었으나, 독립적인 단일 데이터셋만을 이용하는 관계로 큰 변화폭을 보이는 실 계측 데이터의 정상 데이터를 이상치로 오판하는 문제점이 있었다. 규칙기반 방법을 이용한 Noise fault 분석은 적정 데이터 윈도우 사이즈의 선택 및 이상치 판정용 한계값 선정상의 문제로 인해 실 계측 데이터 적용에 한계가 있었다. 이종 데이터 간 상관분석 방법은 학습 데이터의 적정범위 선정이 선행된다면 장단기 계측 데이터의 이상 거동 및 국부적 이상치 판정에 매우 효과적으로 이용될 수 있음을 알 수 있었다.

벌점 부분최소자승법을 이용한 분류방법 (A new classification method using penalized partial least squares)

  • 김윤대;전치혁;이혜선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.931-940
    • /
    • 2011
  • 분류분석은 학습표본으로부터 분류규칙을 도출한 후 새로운 표본에 적용하여 특정 범주로 분류하는 방법이다. 데이터의 복잡성에 따라 다양한 분류분석 방법이 개발되어 왔지만, 데이터 차원이 높고 변수간 상관성이 높은 경우 정확하게 분류하는 것은 쉽지 않다. 본 연구에서는 데이터차원이 상대적으로 높고 변수간 상관성이 높을 때 강건한 분류방법을 제안하고자 한다. 부분최소자승법은 연속형데이터에 사용되는 기법으로서 고차원이면서 독립변수간 상관성이 높을 때 예측력이 높은 통계기법으로 알려져 있는 다변량 분석기법이다. 벌점 부분최소자승법을 이용한 분류방법을 실제데이터와 시뮬레이션을 적용하여 성능을 비교하고자 한다.

하이퍼스펙트럴 데이터 분류에서의 평탄도 LDA 규칙화 기법의 실험적 분석 (An Experimental Study on Smoothness Regularized LDA in Hyperspectral Data Classification)

  • 박래정
    • 한국지능시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.534-540
    • /
    • 2010
  • 고차원 특성과 높은 상관성은 하이퍼스펙트럴 데이터의 주요 특징이다. LDA와 그 변형 선형 투사 방법들이 고차원 스펙트럴 정보로부터 저차원의 특징을 추출하는데 사용되었다. LDA는 학습 데이터가 적은 경우 흔히 발생하는 과대적합으로 인해 일반화 성능이 낮아지는 문제가 발생하는데, 이를 완화하기 위하여 LDA 규칙화(regularization) 방법들이 제시되었다. 그 중, 평탄도(smoothness) 제약에 기반한 LDA 규칙화 기법은 높은 상관성을 갖는 하이퍼스펙트럴 데이터의 특성에 적합한 특징 추출 기법이다. 본 논문에서는 하이퍼스펙트럴 데이터 분류에서 평탄도 제약을 갖는 LDA 규칙화 방법을 소개하고 학습 데이터 조건에 따른 성능을 실험적으로 분석한다. 또한, 분류 성능의 향상을 위한 스펙트럴 정보와 공간적 정보의 상관성을 함께 활용하는 이중 평탄도 LDA 규칙화 기법을 제시한다.