• 제목/요약/키워드: 상관 데이터

검색결과 2,834건 처리시간 0.031초

범주형 다변량 데이터의 상관관계분석에 관한 기초적 연구(II) (A Study on the Correlation Analysis about Categorical Multivariate Data(II))

  • 노형진
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.142-150
    • /
    • 2000
  • 범주형 다변량 데이터의 상관관계분석을 위하여 개발한 수량화이론 III류나 대응분석 등의 기법은 다차원 공간상에서 점간의 거리로써 두 요소집합간의 관련성을 설명하는 데 있어서 매우 유용하다. 본 연구에서는 상관관계분석을 위한 대응분석의 특성을 수량화이론 III류와 비교하여 설명하고 그 유용성을 논하기로 한다. 이 기법은 사회과학 분야의 상관관계분석에 널리 활용될 것으로 기대된다.

  • PDF

행동 및 생리측정기반 개인 간 다중 감각정서 반응일치성 (Consistency between Individuals of Affective Responses for Multiple Modalities based on Behavioral and Physiological Data)

  • 장준혁;김종완
    • 감성과학
    • /
    • 제26권1호
    • /
    • pp.43-54
    • /
    • 2023
  • 본 연구는 참가자 간 상관(Intersubject correlation: ISC)기법을 통해 정서 유발 자극에 대한 한 참가자의 반응과 그 참가자를 제외한 나머지 참가자들의 반응 간 일치성이 각 정서표상 범주(지배가, 각성가, 정서가)와 다양한 감각양상(청각, 시각, 촉각)에서 어떠한 차이가 있는지 밝히고자 하였다. 참가자 간 상관을 계산하기 위해 사용된 데이터는 참가자들의 청각, 시각, 촉각 자극에 대한 생리 측정치와 정서 평정치로 구성되었으며, 한 참가자의 데이터 세트와 나머지 참가자들의 데이터 세트의 평균으로 구분한 뒤 가능한 모든 자극 쌍에 대해 상관을 구하는 방식으로 참가자 간 상관을 계산하였다. 연구 결과, 지배가를 기준으로 재정렬한 데이터 세트에 대한 참가자들의 반응 일치성은 청각 감각양상 조건보다 시각 감각양상 조건에서 높은 ISC 값을 얻었다. 다음으로 각성가로 재정렬한 데이터 세트의 경우 시각 감각양상과 청각 감각양상에서 차이가 있음은 같았지만, 지배가 기준으로 재정렬한 데이터 세트와 결과가 상반되었다. 마지막으로, 정서가를 기준으로 재정렬된 데이터 세트는 모든 감각양상에서 부정적인 데이터 세트들이 긍정적인 데이터 세트보다 참가자들의 반응 일치성이 더 높았다. 모든 데이터 세트에서 정서표상 범주의 높고 낮음과 상관없이 촉각 감각양상에서 높은 ISC 값을 얻었다. 본 연구의 결과는 참가자 간 상관의 다양한 감각양상과 정서표상에 대한 반응의 일치성이 의미하는 바에 대한 해석을 제시하며, ISC 분석 방법이 참가자 반응의 차이에 대한 패턴을 측정하는 유용한 도구가 될 가능성을 제시하였다.

공간적 자기상관성의 정도에 따른 MAUP에서의 스케일 효과 연구 - LBSNS 데이터를 중심으로 - (A Study on Scale Effects of the MAUP According to the Degree of Spatial Autocorrelation - Focused on LBSNS Data -)

  • 이영민;권필;유기윤;허용
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.25-33
    • /
    • 2016
  • 포인트 속성의 위치 기반 소셜 네트워크 서비스(Location-Based Social Network Services, LBSNS) 데이터를 멀티스 케일의 타일맵상에 효과적으로 시각화하기 위해서는 격자 기반으로 군집화하여 표현해야 할 필요성이 있다. 이때 격자의 크기 및 개수를 결정해야 하는데, 이에 대한 기준은 정해진 것이 없으며 데이터의 종류와 분석 목적에 따라 달라지므로 연구자의 주관이 개입될 수밖에 없다. 이때 연구 결과에 영향을 끼치는 공간단위 임의성의 문제(Modifiable Areal Unit Problem, MAUP)가 발생한다. 본 연구에서는 LBSNS 중 지오태깅(geotagging)된 트위터(Twitter) 데이터를 대상으로 하여 이러한 MAUP의 영향을 스케일 효과(scale effect)의 측면에서 탐색해 보고자 하였다. 이를 위해 공간오차모델(spatial error model)을 이용하여 데이터의 공간적 자기상관성(spatial autocorrelation)의 정도를 조절하였으며, 이에 대해 격자의 크기를 달리함에 따른 공간적 자기상관성의 변화를 Moran's I를 통해 분석하였다. 실험 결과, 원 데이터에는 양의 공간적 자기상관성이 존재하는 것을 확인하였으며, 이러한 경우에는 공간오차모델의 공간자기회귀계수(spatial autoregressive coefficient)의 값이 증가할수록 공간적 자기상관성이 감소하는 것을 알 수 있었다. 이러한 특성을 이용하여 트위터 데이터의 공간적 자기상관성의 강도를 5단계로 조절하였으며, 각 단계에 대하여 격자의 크기를 9단계로 나누어 각각에서의 Moran's I를 계산하였다. 그 결과, 합역 수준이 높아질수록 공간적 자기상관성이 증가하다가 격자의 크기가 600m에서 1,000m 사이일 때 감소하는 것을 알 수 있었으며, 공간적 자기상관성이 강할수록 MAUP에서의 스케일 효과는 감소하는 경향이 있는 것을 확인하였다.

사람 성격과 선호 장소의 상관관계 분석 (Analysis of Relationship Between Personality and Favorite Location)

  • 이은별;송하윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.380-383
    • /
    • 2014
  • 사람의 성격 분석에 따라 그 사람의 이동패턴을 알 수 있다. 따라서 성격 데이터를 이용하면, 사람의 행동 패턴을 유추해 낼 수 있다. 사람의 행동 패턴은 주로 그 사람이 선호하는 장소의 집합으로 규정 할 수 있다. 본 논문에서는 사람의 성격과 장소 데이터 사이의 상관관계를 알아보고자 한다. 포스퀘어에서 얻어진 장소정보와 성격요인 분석을 통해 얻어진 사람 성격과의 상관관계를 파악하기 위한 기법으로 회귀분석을 사용했다. 장소정보는 그 장소에 해당하는 업종으로 변환되었다. 위치 데이터와 업종 분류표와의 분석을 어떻게 적용 하였는지 설명하고, 회귀분석을 통해서 성격 데이터와 업종 분류 데이터를 분석한다.

유전자 발현 데이터에 적용한 거시적인 바이클러스터링 기법 (Macroscopic Biclustering of Gene Expression Data)

  • 안재균;윤영미;박상현
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.327-338
    • /
    • 2009
  • 마이크로어레이 데이터는 유전자의 집합이 어떠한 조건 혹은 샘플의 집합 하에서 얼마나 발현되는지를 수치화한 2차원 행렬 데이터이다. 바이클러스터는 마이크로어레이의 샘플의 부분 집합과 이 샘플 부분 집합 하에서 일정한 증감 패턴을 보이는 유전자의 부분 집합을 말한다. 이렇게 같은 패턴을 보이는 유전자의 부분 집합은 일정한 정도의 유의 수준으로 비슷한 기능을 한다고 말할 수 있다. 따라서 바이클러스터링 알고리즘은 같은 기능에 연관된 유전자의 집합과, 이 기능이 발현되고 있는 조건의 집합을 밝혀내는데 있어서 매우 유용하다. 본 논문에서는 다항식 시간 복잡도를 유지하면서, 높은 기능적 상관관계를 가지는 바이클러스터를 밝혀 낼 수 있는 알고리즘을 제안한다. 이 알고리즘은 1) 마이크로어레이 데이터에 심한 노이즈가 있을 경우 패턴으로 인식하지 못하는 기존 알고리즘과 달리, 노이즈 레벨이 심하더라도 거시적으로 비슷한 모양을 보이는 패턴을 찾아내는 방식을 이용하여 숨어있는 패턴들을 찾아낼 수 있고, 2) 바이클러스터 상호간에 오버랩을 허용하며, 또한 다양성이 보장되는 복수의 바이클러스터를 찾아내며, 3) 찾아진 유전자 부분 집합의 기능적 상관관계가 매우 높은 특성을 지니고, 4) 유전자 및 샘플의 순서와 상관없이 결정적인(deterministic) 결과를 도출한다. 또한 본 논문에서는 알고리즘이 찾아낸 바이클러스터의 기능적 상관관계의 정도와, 비교 알고리즘이 찾아낸 바이클러스터의 기능적 상관관계의 정도를 유전자 온톨로지(Gene Ontology)를 통해서 측정함으로써 비교하고 있다.

변형된 캐스케이드-상관 학습 알고리즘을 적용한 그룹 고장 데이터의 소프트웨어 신뢰도 예측 (Software Reliability Prediction of Grouped Failure Data Using Variant Models of Cascade-Correlation Learning Algorithm)

  • 이상운;박중양
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.387-392
    • /
    • 2001
  • 많은 소프트웨어 프로젝트는 시험이나 운영단계에서 고장시간이나 고장 수 데이타보다 그룹 고장 데이터(여러 고장 간격에서 또는 가변적인 시간 간격에서의 고장들)가 수집된다. 본 논문은 그룹 고장 데이터에 대해 가변적인 미래의 시간에서 누적 고장 수를 예측할 수 있는 신경망 모델을 제시한다. 2개의 변형된 캐스케이드-상관 학습 알고리즘을 제안하였다. 제안된 신경망 모델들은 다른 잘 알려진 신경망 모델과 통계적 소프트웨어 신뢰도 성장 모델과 비교되었다. 실험결과, 그룹 데이터에 대해 변형된 캐스케이드-상관 학습 알고리즘이 좋은 예측 결과를 나타내었다.

  • PDF

주상변압기 부하 상관식 조정에 관한 실증적 연구 (Practical Study on Adjustment of Load Correlation Equations of Pole Transformer)

  • 박창호;김두봉;김기현;배주천;윤상윤;김재철
    • 조명전기설비학회논문지
    • /
    • 제14권1호
    • /
    • pp.102-108
    • /
    • 2000
  • 본 논문은 주상변압기의 부하관리를 위한 부하 상관식 조정에 관한 실증적 연구 결과를 제시하였다. 부하 상관식 조정을 위하여 주상 변압기의 사용전력량[kWh]과 최대 부하[A] 사이의 상관 관계를 분석하였다. 또한 상관식의 정확성을 높이기 위하여 12개의 지역 패턴으로 분류하였다. 그리고 각 지역 패턴에 24개씩의 표본 주상 변압기를 선정하였다. 부하 상관식에 사용된 데이터의 신뢰성을 위하여 표본 주상변압기에 부하관리기를 설치하였다. 온-라인 데이터 취득을 통하여, 데이터 베이스를 구축하였다. 부하 상관식 조정에 있어서 본 논문에서는 두 부분에 대해 고려를 하였다. 그중 하나는 부하 상관식의 적합성 또 하나는 과부하로 인한 주상변압기 손실 방지이다. 최종적으로 1, 2차 상관함수를 병용하는 상관식올 제안하였다. 또한 사례 연구를 통하여 제안한 부하 상관식이 기존에 사용하는 상관식 보다 오차 비율이 감소했음을 입증하였다.

  • PDF

SRTM과 NED를 이용한 식생수고 및 수령 추정 (Vegetation Height and Age Estimation using Shuttle Radar Topography Mission and National Elevation Datasets)

  • 김진우;허준;손홍규
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.127-130
    • /
    • 2006
  • SRTM 데이터와 USGS의 NED (National Elevation Datasets) 데이터를 사용하였으며 두 데이터를 차분함으로써 식생수고도(vegetation height map)를 얻었다. 또한 차분값과 shape 파일에 포함된 식수년도의 비교를 통해 상관관계여부를 판단하고자 했다. 회귀분석을 통해 차분데이터와 식수년도 사이의 큰 상관관계가 존재함을 확인할 수 있었으며 결국 수령추정과 수령정보의 맵핑이 가능함을 보였다. 추가적으로 지역별 지형특성, 숲의 균일도 등에 의해 선형성이 영향을 받는지 관찰하였다.

  • PDF

장기관측자료 시계열분석을 통한 대수층 특성 평가

  • 원이정;김형수;구민호;서형기
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2002년도 추계학술발표회
    • /
    • pp.265-268
    • /
    • 2002
  • 경상북도 고령군 다산면, 천안시 풍세면 삼태리 및 부여 정동ㆍ자왕 지역의 장기수위관측 데이터 및 강수, 대기압 자료의 시계열 분석을 통하여 대수층의 함양특성 및 특히, 대기압에 대한 지하수위 변화 특성을 통한 대수층의 특성(properties) 유추 가능 여부를 보고자 하였다. 하천에 인접한 자왕지구의 경우 자기상관분석에 의하면 다른 세 지역에 비해 데이터 값이 안정적이지 못하며, 대기압 변화에 대한 상관분석에서도 낮은 상관성을 나타낸다. 강수에 대한 함양 특성을 상호상관분석을 통해 해 보았으나, 강설에 의한 영향인지 대체적인 지연시간이 길게 나타났다. 차후 장기적인 데이터 수집 및 분석을 통해 좀 더 정확한 대수층 특성을 밝히고자 한다.

  • PDF

상관관계 분석을 통한 소비예측 시 필요 요소 도출 및 LSTM을 이용한 소비예측 모델 (Correlation analysis is needed to predict consumption and consumption prediction model using LSTM)

  • 이기훈;김진아;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.539-541
    • /
    • 2019
  • 오프라인 소비자의 의사결정은 크게 라이프스타일, 동기, 개성, 학습 등 개인적인 영향요인과 문화, 기후, 가족 등 기타 상황적 요인을 포함하는 환경적 영향요인에 의해 결정된다. 이러한 요인들을 입력 값으로 하는 다양한 딥러닝 모델을 이용한 소비예측 연구들이 진행되고 있다. 딥러닝을 이용한 예측모델을 사용하기 위해서는 먼저 요인들이 의사를 결정하는데 있어 얼마나 상관관계가 있는지 파악하는 작업이 중요하다. 본 논문에서는 이를 위해 다양한 상관관계 분석모델을 이용해 소비 의사결정 요소 중 기후, 문화와 같은 상황적 요인과 소비와의 상관관계를 도출하고, 기후, 문화를 대변하는 미세먼지 데이터와, SNS 버즈량 데이터와 소비데이터를 학습하는 소비예측 LSTM모델을 제안하고자 한다.