• 제목/요약/키워드: 분산-상관계수행렬

검색결과 9건 처리시간 0.02초

이변량 Laplace 분포와 응용

  • 홍성식;홍종선
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.127-130
    • /
    • 2003
  • 주변분포가 Laplace 분포인 세 가지 형태의 이변량 Laplace 분포를 연구한다. 각각의 이변량 Laplace 분포의 확률밀도함수와 누적분포함수를 유도하고, 분포의 그래프를 그려봄으로써 분포의 형태를 알아본다. 조건부 적률을 정리하여 조건부 첨도와 조건부 왜도를 구하고 분포의 성질을 파악한다. 상관계수를 구하여 다른 이변량 분포의 상관계수와 비교해 보았다. 그리고 정의된 분포함수를 응용하여 이변량 Laplace 분포를 따르는 난수벡터를 발생하는 알고리즘을 제안하였으며, 생성된 난수벡터의 표본으로부터 구한 표본평균과 중앙값의 분산-공분산 행렬식을 구하고 이변량 정규분포에 대응하는 행렬식과 비교 토론하였다.

  • PDF

상관계수의 안전한 다자간 계산 (Secure Multi-Party Computation of Correlation Coefficients)

  • 홍선경;김상필;임효상;문양세
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.799-809
    • /
    • 2014
  • 본 논문에서는 분산 컴퓨팅 환경에서 데이터 제공자들이 각자 소유한 데이터의 프라이버시는 보호하면서도 피어슨(Pearson) 상관계수와 스피어만(Spearman)의 순위상관계수를 안전하게 계산하는 해결책을 각각 제안한다. 분산 컴퓨팅 환경에서 마이닝(또는 데이터 분석)을 수행하기 위해서는 원본 데이터를 상대방에게 제공해야 한다. 그러나, 원본 데이터는 민감한 정보를 포함하는 경우가 많고, 이때 데이터 제공자(소유자)는 프라이버시 보호를 이유로 정확한 값을 직접 노출하기를 원하지 않는다. 본 논문에서는 분산 컴퓨팅 환경의 데이터 제공자들이 각자 소유한 데이터는 상대방에게 공개하지 않으면서 상관관계를 계산하는 문제, 즉 안전한 상관관계 계산(SCC: Secure Correlation Computation) 문제를 정형적으로 정의한다. 그리고, 임의 행렬 기반 안전한 스칼라 곱을 사용하여 피어슨 상관계수와 순위상관계수에 대한 SCC 문제를 해결하는 방법을 각각 제안한다. 제안한 해결책이 바르게 수행함을 보이기 위해, 정확성과 안전성을 정리로 제시하고 증명한다. 또한, 실험을 통해 제안한 기법이 수행 시간 측면에서도 실용적인 방법임을 보인다.

변동계수행렬을 이용한 주성분분석 (Principal Component Analysis with Coefficient of Variation Matrix)

  • 김지현
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.385-392
    • /
    • 2015
  • 주성분분석은 차원축소를 위한 대표적 기법이다. 주성분분석에서 변수들이 측정단위가 다르거나 분산의 불균형이 심할 경우 흔히 변수를 표준화한 다음 분석할 것이 권장된다. 표준화 변환은 표준편차를 나누어주는 변환인데, 측정단위에 무관하게 만들기 위해서라면 평균을 나누어주는 변환도 고려해볼 수 있다. 표준화 변환을 한 다음 주성분분석하는 것은 상관행렬로 주성분분석하는 것과 같은데, 평균을 나누어주는 변환을 한 후 주성분분석하는 것은 변동계수와 관련된 행렬로 주성분분석하는 것과 같음을 보이고, 그렇게 변환을 한 다음 주성분분석을 실시하는 것이 왜 필요한가를 설명하였다.

베이지안 누적 프로빗 선형 혼합모형을 이용한 사업체 패널조사데이터 분석 (Workplace panel survey data analysis using Bayesian cumulative probit linear mixed model)

  • 권민지;이근백
    • 응용통계연구
    • /
    • 제37권6호
    • /
    • pp.783-799
    • /
    • 2024
  • 경시적 자료는 같은 개체에서 시간에 따라 반복 측정된 자료이다. 따라서 반복 측정된 자료는 상관관계가 존재하며 이것을 설명하면서 공변량의 반응변수의 효과를 추정해야 한다. 경시적 순서형 자료분석에서는 잠재변수의 조건부 누적확률을 로짓 연결함수 또는 프로빗 연결함수를 이용한 선형혼합 모형을 이용하여 공변량의 효과를 추정한다. 본 논문에서는 경시적 순서형 자료분석을 위한 두 가지 형태의 연결함수를 가지는 일반화선형혼합모형 및 주변화모형을 고찰한다. 그리고 최근에 제안된 프로빗 연결함수를 가지는 베이지안 누적 프로빗 선형혼합모형을 이용하여 경시적 순서형자료인 사업체 패널조사자료를 분석한다. 이 모형은 잠재변수의 조건부 상관계수 행렬의 모형화에 초구분해를 고려하여 고차원이며 양정치성을 만족하는 상관계수를 추정하는 방법이다. 사업체 패널 조사자료는 반응변수로 순서형 자료인 사업체의 교육훈련참여율을 고려하였고, 상관계수 행렬은 자기상관구조를 가정한 여러 모형을 비교하고 가장 적합한 모형을 제시한다. 그리고 그 모형을 이용하여 연도별 효과와 성과배분제도 실시여부, 1인당 연평균 교육시간, 노동조합여부가 유의미한 것을 찾았다.

로지스틱 회귀모형에서 이변량 정규분포에 근거한 로그-밀도비 (Log-density Ratio with Two Predictors in a Logistic Regression Model)

  • 강명욱;윤재은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.141-149
    • /
    • 2013
  • 로지스틱회귀모형에서 두 설명변수의 조건부 분포가 모두 이변량 정규분포라고 할 수 있다면 설명변수들의 함수로 표현되는 로그-밀도비를 통해 모형에 포함시켜야하는 항을 알 수 있다. 두개의 이변량 정규분포에서 분산-공분산행렬이 같은 경우에는 이차항과 교차항 없이 일차항만으로 충분하다. 상관계수가 모두 0이면 교차항은 설명변수의 분산과 관계없이 필요하지 않다. 또한 로지스틱회귀모형에서 로그-밀도비를 통해 이차항과 교차항이 필요하지 않게 되는 다른 조건들도 알아본다.

동시통화 및 주변 잡음을 고려한 핸즈프리 환경의 반향제거기 (An Acoustic Echo Canceler for Hands-Free Telephony, Considering Double Talk and Environment Noise)

  • 김현태;이찬희;박장식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.471-473
    • /
    • 2009
  • 본 논문에서는 핸즈프리 전화통신을 위한 동시통화(double-talk) 및 잡음에 강건한 반향제거 시스템을 제안한다. 제안하는 반향제거 시스템은 동시통화 상황을 판별하기 위해 마이크 입력신호와 추정한 마이크 입력신호의 분산을 기반으로한 동시통화 검출 알고리즘을 사용하고 반향 경로 추정을 위한 적응 필터는 잔여반향 오차 전력과 AP 알고리즘의 투영차수를 곱하여 입력 신호의 자기공분산 행렬에 더해 정규화시킨 알고리즘을 적용한다. 컴퓨터 시뮬레이션을 통한 동시통화 및 주변 잡음이 큰 핸즈프리 환경에서 제안하는 방법이 AIC(acoustic interference cancellation) 측면에서 우수함을 보인다.

  • PDF

혼합모형을 이용한 반복 측정된 변수들 간의 상관분석 (Assessing Correlation between Two Variables in Repeated Measurements using Mixed Effect Models)

  • 한경화;정인경
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.201-210
    • /
    • 2015
  • 생명과학 또는 의학 연구에서는 반복 측정된 변수들 간의 상관 관계를 보고자 하는 경우가 발생한다. 반복 측정된 것을 고려하지 않으면 상관관계를 과소 추정하는 경향이 나타나므로 이를 고려해야 하며, 선형혼합모형의 분산-공분산 행렬을 이용하여 상관관계를 추정할 수 있다. 본 연구에서는 변수들의 반복 측정이 동시에 된 경우와 그렇지 않은 경우로 나누어 혼합모형을 이용한 상관계수의 추정방법을 소개한다. 고속 음향 복사력 임펄스 영상(acoustic radiation force impulse imaging; ARFI)으로 간과 비장에서 각각 세 번씩 전단파 속도를 반복 측정하고 복부 초음파 검사로 비장 길이를 측정한 자료에서 전단파 속도와 비장 길이 간의 상관 관계를 분석하기 위해 본 논문에서 소개한 방법들을 적용하였고 SAS의 PROC MIXED를 이용하는 방법을 제시하였다.

비동기 CDMA 채널을 위한 의사 역행렬 형태의 역상관 검출기 (Pseudo-inverse-filtering type decorrelating detector for asynchronous CDMA channels)

  • 맹승주;이병기
    • 한국통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.2072-2079
    • /
    • 1998
  • 본 논문에서는 비동기 CDMA 채널을 위한 의사 역행렬 형태의 역상관 검출기를 제안한다. 본 논문에서는 먼저 동기 CDMA 채널에서 역상관 검출기의 동작이 확산 수열로 구성된 행렬의 의사 역행렬 처리와 동일함을 보이고, 이 사실을 이용하여 역상관 검출기가 다중접속 간섭신호를 완전히 제거하는 선형 검출기들 중 최대의 신호대 잡음비를 가짐을 보인다. 그 후, 의사 역행렬 형태를 비동기 채널로 확장하여 새로운 역상관 검출기를 제안하고, QR-분해를 이용한 구현 방법에 대해 논의한다. 제안 방법은 각 사용자별로 분산적인 형태를 가지기 때문에 사용자 수 변화에 대한 검출기 계수의 갱신을 효율적으로 수행할 수 있다. 본 논문에서는 마지막으로 제안된 역상관 검출기의 성능을 비트오류율의 관점에서 분석한 후, 컴퓨터 모의 실험을 통해 기존의 정합 필터링 방법에 대한 성능 향상 정도를 확인한다.

  • PDF

유전체 관계행렬 구성에 따른 Landrace 순종돈의 육종가 비교 (Comparison of Breeding Value by Establishment of Genomic Relationship Matrix in Pure Landrace Population)

  • 이준호;조광현;조충일;박경도;이득환
    • Journal of Animal Science and Technology
    • /
    • 제55권3호
    • /
    • pp.165-171
    • /
    • 2013
  • 돼지 유전체 전장의 고밀도 단일염기다형 유전자형을 이용하여 혈연관계행렬을 구성하고 이를 이용하여 유전체 육종가를 추정하였다. 이상치를 제거한 랜드레이스 순종돈 448두의 40,706개 단일염기다형 유전자형 정보를 이용하였으며, G05, GMF, GOF, $GOF^*$ 및 GN의 5가지 방법을 이용하여 유전체 관계행렬을 구성하고 이를 이용하여 유전체 육종가를 추정하였다. GOF 방법에 의하여 계산된 혈연계수가 기존의 혈통정보를 이용한 혈연계수와 가장 작은 편차를 나타내고 평균소수대립유전자빈도를 이용하는 GMF 방법에서는 큰 차이가 나타나 대립유전자빈도 기준이 혈연계수의 평균이동을 유발함을 확인하였으며, $GOF^*$를 제외한 모든 방법에서 정규 분포형태의 멘델리안샘플링이 나타나는 것을 확인하였다. 등지방두께 평균과 90 kg 도달일령에 대한 육종가 추정 모형을 설정하고 유전체 관계행렬을 이용하여 유전모수와 육종가를 추정한 결과 혈통정보를 이용한 육종가와의 상관은 GOF 방법에서 가장 높게 나타났으며, 유전체 관계행렬의 척도(scale)에 베타함수를 이용한 $GOF^*$의 경우 모든 형질에서 유전분산이 크게 추정되어 분모부분을 구성하는 척도는 유전모수 추정치 영향하는 것을 확인하였다. 동일한 표현형 정보량을 이용할 경우 유전체관계행렬을 이용한 육종가 추정의 정확도가 혈통정보를 이용한 육종가보다 높게 나타났으며, 90 kg 도달일령보다는 등지방두께 평균에서 그 차이가 더 크게 나타났다. 집단 내 누적 표현형자료가 부족한 경우, 외래 유전자원이 도입되어 집단 내 혈연관계가 부족할 경우 또는 멘델리안 분포가 전혀 고려되지 않는 어린 동복자손의 육종가를 예측해야 하는 경우에 유전체 정보를 활용하면 유전능력 평가의 정확성을 크게 향상시킬 수 있을 것으로 사료된다.