• 제목/요약/키워드: 정준상관

검색결과 100건 처리시간 0.024초

오믹스 자료를 이용한 정준방법 비교 (A comparison study of canonical methods: Application to -Omics data)

  • 이승수;민은정
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.157-176
    • /
    • 2024
  • 생명현상의 복잡한 시스템에 대한 이해를 위한 융합분석의 중요성이 점점 커지고 있다. 하나의 연구대상을 다양한 관점에서 관찰하여 얻게 되는 여러 데이터의 융합분석은 통해 좀 더 대상에 대한 깊은 이해를 가능하게 한다. 본 연구에서는 그중에서도 특히 하나의 샘플에서 두개의 고차원 데이터가 생성된 경우 다룰 수 있는 분석인 공관성분석과 정준상관분석을 비교하였다. 정준상관분석의 경우 고차원 데이터를 다룰 수 없는 단점이 있기에, 해당 문제를 극복하기 위하여 능형상수를 이용하는 방법(CCA-ridge)과 각 데이터의 공분산행렬을 항등행렬로 가정하여 벌점화 특이값분해를 이용한 방법(CCA-PMD) 두 가지를 고려하였으며 각 방법을 NCI60 세포주 패널에서 얻은 RNA 시퀀싱 데이터와 단백질 시퀀싱 데이터 분석에 적용하였다. 그 결과 정준상관분석의 경우 두 정준변수간의 상관관계에 좀 더 집중하는 반면 공관성분석은 각 데이터의 선형조합간의 상관관계뿐 아니라 각 선형조합의 변동성을 함께 고려함을 확인할 수 있었다. 또한 공관성분석의 경우 여러가지의 가중치행렬을 고려하여 그 결과값을 비교하고 중요 시사점을 도출하였다.

토양(土壤)의 이화학적(理化學的) 특성(特性)과 대나무 생장(生長)과의 관계(關係) (Relationships between Soil-Site Properties and Bamboo (Phyllostachys bambusoides) Growth)

  • 정영관
    • 한국산림과학회지
    • /
    • 제79권1호
    • /
    • pp.16-20
    • /
    • 1990
  • 17개(個)의 토양인자(土壤因子)와 대나무의 직경(直徑), 간고(稈高) 그리고 절간(節間) 생장량(生長量)과의 관계(關係)를 구명(究明)하기 위하여 정준상관분석(正準相關分析)을 실시(實施)하였다. 첫번째 정준상관(正準相關)은 매우 유의적(有意的) 이었고, 변수(變數)의 2조합(組合)에서 분산(分散)은 크고, 그리고 정준변량(正準變量)은 생물학적(生物學的)으로 의의(意義)가 있었다. 따라서 표층토심(表層土深), 전질소(全窒素) 그리고 유기물함량(有機物含量)등은 첫번째 토양성질(土壤性質)의 정준변량(正準變量)과 매우높은 정(正)의 상관(相關)을 나타내었다. 그리고 점토함량(粘土含量)과 치환성용량(置煥性容量)은 부(負)의 상관(相關)으로 나타났다. 17개(個) 변수(變數) 가운데 8개(個) 변수(變數)만이 대나무의 생장(生長)을 예측(豫測)하는데 관계(關係)되는 것으로 사료(思料)된다.

  • PDF

위성영상의 토지정보 분석정확도 향상을 위한 응용체계의 개발 - 다중시기 영상과 주성분분석 및 정준상관분류 알고리즘을 이용하여 - (Development of a Compound Classification Process for Improving the Correctness of Land Information Analysis in Satellite Imagery - Using Principal Component Analysis, Canonical Correlation Classification Algorithm and Multitemporal Imagery -)

  • 박민호
    • 대한토목학회논문집
    • /
    • 제28권4D호
    • /
    • pp.569-577
    • /
    • 2008
  • 본 연구의 목적은 위성영상으로부터 보다 정확한 토지정보를 취득하기 위해 다중시기데이터의 혼합과 특정 영상강조기법 및 영상분류알고리즘을 병합하여 적용하는 응용분류체계의 개발이다. 즉, 본 연구에서는 혼합된 다중시기데이터를 주성분분석한 후 정준상관분류기법을 적용하는 분류과정을 제안한다. 이 분류과정의 결과를 단일영상별 정준상관분류결과, 다중시기혼합영상의 정준상관분류결과, 시기별 주성분분석 후 정준상관분류결과와 비교한다. 사용된 위성영상은 1994년 7월 26일과 1996년 9월 1일에 취득된 Landsat 5 TM 영상이다. 정확도평가를 위한 지상실제데이터는 지형도 및 항공사진으로부터 취득되었으며, 연구대상영역 전체가 정확도평가 대상으로 사용되었다. 제안된 응용분류체계는 단일영상만을 사용하여 정준상관분류를 수행한 경우보다 분류정확도면에서 약 8.2% 상승되는 우수한 효과를 보여주었다. 특히, 복잡한 토지특성이 혼합되어 있는 도시역을 정확히 분류하는데 유효하였다. 결론적으로 Landsat TM 영상을 사용한 토지피복정보 추출시 분류정확도를 높이기 위해서, 다중시기영상을 사전에 주성분분석 후 정준상관분류기법을 적용하면 매우 효과적임을 확인하였다.

정준상관분석을 이용한 수중표적 분석 (Underwater Target Analysis Using Canonical Correlation Analysis)

  • 석종원;김태환;배건성
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1878-1883
    • /
    • 2012
  • 일반적으로 수중표적 인식에서는 표적의 형상/재질에 따른 수신 표적신호의 공간적인 정보를 특징인자로 추출하여 식별하고자 하는 특징을 추출하였다. 또한, 표적신호의 수신 위치에 덜 민감한 특징파라미터 추출을 위해 다양한 신호처리 기법을 적용하는 연구가 수행되어 왔다. 본 논문에서는 표적신호의 수신위치에 상대적으로 민감하지 않은 정준상관분석(Canonical correlation Analysis; CCA)을 사용하여 합성된 수중물체의 특징을 분석하였다. 다중각도 환경에서 특징추출을 위해 정준산관분석기법이 적용되었으며, 각각 다른 각도에서 수중물체에 반사되어 되돌아오는 연속적인 두개의 소나신호를 대상으로 정준상관분석을 수행하여 두 신호의 상관성을 분석하였다.

가중주성분분석을 활용한 정준대응분석과 가우시안 반응 모형에 의한 정준대응분석의 동일성 연구 (Equivalence study of canonical correspondence analysis by weighted principal component analysis and canonical correspondence analysis by Gaussian response model)

  • 정형철
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.945-956
    • /
    • 2021
  • 본 연구에서는 가중주성분분석으로부터 정준대응분석을 유도하는 Legendre와 Legendre (2012)의 알고리즘을 고찰하였다. 그리고, 가중주성분분석에 기반한 Legendre와 Legendre (2012)의 정준대응분석이 가우시안 반응모형에 기초한 Ter Braak (1986)의 정준대응분석과 동일함을 다루었다. 생태학에서 종의 발현 정도를 잘 설명할 수 있는 가우시안 반응곡선에서 도출된 Ter Braak (1986)의 정준대응분석은 종 패킹 모형(species packing model)이라는 기본 가정을 사용한 후 일반화선형모형과 정준상관분석을 결합시키는 방법으로 도출된다. 그런데 Legendre와 Legendre (2012)의 알고리즘은 이러한 가정없이 Benzecri의 대응분석과 상당히 유사한 방법으로 계산되는 특징을 지닌다. 그러므로 가중주성분석에 기초한 정준대응분석을 사용하면, 결과물 활용에 약간의 유연성을 지닐 수 있게 된다. 결론적으로 본 연구에서는 서로 다른 모형에서 출발한 두 방법이 장소점수(site score), 종 점수(species score) 그리고 환경변수와의 상관관계가 서로 동일함을 보인다.

결측값이 있는 정준상관 행렬도의 형상변동 연구 (A Study on Shape Variability in Canonical Correlation Biplot with Missing Values)

  • 홍현욱;최용석;신상민;강창완
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.955-966
    • /
    • 2010
  • 정준상관 행렬도는 두 변수군 사이에 연관성이 있는 데이터 행렬을 시각적으로 묘사하고 데이터가 가진 패턴을 찾는데 유용하고, 분석의 더욱 정형화된 방법으로써 결과를 보여주기에도 유용하다. 그럼에도 불구하고, 자료에 결측값이 존재하는 경우에 대부분의 행렬도는 바르게 적용되지 않는다. 이 문제를 해결하기 위해, 결측률에 따라 중앙값과 평균, EM알고리즘, MCMC대체법을 사용해서 결측 자료를 추정한다. 완전하지 않은 자료의 행렬도의 결측값을 추정하더라도, 대체법과 결측률에 따라 행렬도의 모양이 달라진다. 따라서 Shin 둥 (2008)에서 제안한 RMS(root mean square)와 원 행렬도와 추정된 행렬도간의 형상 변동을 측정하고 비교하기 위한 PS(Procrustes statistic)를 사용한다.

정준상관분석기법을 이용한 지역간 경제적 의존성 분석 (수도권 출근목적통행량을 기준으로) (An Analysis of Economic Interdependency between Regions using the Canonical Correlation (for the working trip in Seoul metropolitan area))

  • 노정현;변미정;김태균;차경준
    • 대한교통학회지
    • /
    • 제20권7호
    • /
    • pp.5-13
    • /
    • 2002
  • 고도의 산업화성장에 따라 도시의 기능이 지역간의 완전분리가 아닌 경제적 사회적 상호 연관성이 점점 증가하고 그 내용도 복잡하고 다양해짐에 따라 이에 대한 체계적인 분석이 필요하게 되었으며, 그에 대한 연구 또한 활발히 진행되고 있다. 그러나 기존에 연구에서 제시하고 있는 각 지역단위별로 취업자수에 대한 고용자수 비율 또는 출근통행의 유출량에 대한 유입량 비율 등의 단순지표를 이용한 지역간의 경제적 의존성을 설명하는 데는 한계가 있다고 할 수 있다. 따라서 본 연구는 지역간의 경제적 연관관계 즉 경제적 의존성을 복합적이고 표준화 할 수 있는 계량치로 추정하기 위해 두 변수 집합간의 연관성을 추정하는데 매우 유용한 분석기법인 정준상관분석 기법을 이용하여 추정하고자 하였다. 이에 수도권 72개존의 출근통행자료을 이용하여 지역간의 경제적 의존성을 측정하였으며, 각 존들로 구성된 지역간의 정준상관계수 및 각 존들의 정준가 중계수를 통해 통계적으로 정산되어진 표준화된 계수를 산출하였다. 그 결과 대존의 경우 경기도와 인천시는 각각 0.9753. 0.2968 정도의 서울에 대한 경제적 의존정도를 보이는 것으로 나타나 서울에 대한 경기도의 경제적 의존성이 높은 것으로 나타났으며, 산출된 정준가중계수를 살펴보면 분당구와 서울시의 중구는 서울에 대한 경기도의 경제적 의존성에 가장 높은 영향을 미친 것으로 나타났으며, 또한 중존에 해당되는 인천의 3개 권역, 경기의 16개 권역의 서울 5개 권역에 대한 경제적 의존성도 분석되었다.

Canonical correlation between body information and lipid-profile: A study on the National Health Insurance Big Data in Korea

  • Jo, Han-Gue;Kang, Young-Heung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.201-208
    • /
    • 2021
  • 본 연구에서는 2009-2016 보건의료 빅데이터를 활용하여 신체 정보와 혈액 내 지질 농도의 연관성을 다변량 분석하여 주요 요소들 사이의 영향력 정도를 비교 분석함으로써, 한국인의 이상지질혈증 예측모델 개발을 위한 근거를 제시하고자 한다. 3,312,971 명의 건강검진정보 자료를 통해서 신체 정보(나이, 신장, 체중, 허리둘레) 항목과 혈액검사(총콜레스테롤, 중성지방, HDL 콜레스테롤, LDL 콜레스테롤) 항목 간의 다차원적 선형상관관계를 도출하고, 항목 간의 영향력을 정준변량(canonical variate)으로 분석하였다. 그 결과 허리둘레가 크고 체중이 많이 나가면 중성지방이 높아지고 HDL 콜레스테롤 수치가 낮아지는 다차원적 상관관계를 도출하였다. 또한, 나이, 체중, 허리둘레, HDL 콜레스테롤 항목은 그 영향력 정도가 성별에 따라 유의미한 차이를 보였다. 특히, 나이에 따른 영향력의 정도는 체중, 허리둘레, HDL 콜레스테롤 항목이 40-50 전후 여성에게서 뚜렷한 변화를 보였다. 보건의료 빅데이터를 정준상관분석 기법을 적용하여 분석한 다차원적 상관관계는 비침습적인 방법으로 간편하게 측정 가능한 신체정보를 바탕으로 건강 상태를 평가할 수 있는 예측모델을 개발하는 데 활용될 수 있을 것이다.

정준상관분석을 이용한 막장등급평가 수량화기법 연구 (Quantification Method of Tunnel Face Classification Using Canonical Correlation Analysis)

  • 서용석;김창용;김광염;이현우
    • 지질공학
    • /
    • 제15권4호
    • /
    • pp.463-473
    • /
    • 2005
  • 국내에서 터널 설계 시 널리 사용되는 RMR 분류법과 Q-system은 모든 암종에 대해 동일한 배점 체계를 적용하기 때문에, 지역적인 지질학적 특성을 반영할 수 없으며 암반의 공학적 이방성을 충분히 표현하지 못한다. 본 연구에서는 암종별 지질학적 특성차에 의한 각 RMR 항목의 중요도를 살펴보기 위하여, 퇴적암, 화강암, 천매암을 기반암으로 하는 터널을 대상으로 막장관찰자료에 대해 정준상관분석을 실시하였다. 분석결과에 의하면 암종의 변화에 따라 전체 RMR배점에서 각 인자가 차지하는 영향은 서로 큰 차이를 보였다

하이퍼스펙트럴영상 분류에서 정준상관분류기법의 유용성 (Usefulness of Canonical Correlation Classification Technique in Hyper-spectral Image Classification)

  • 박민호
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.885-894
    • /
    • 2006
  • 본 논문의 의도는 하이퍼스펙트럴 영상의 다량의 밴드를 사용하면서도 효율적인 분류기법의 개발에 초점을 두고 있다. 본 연구에서는 하이퍼스펙트럴 영상의 분류에 있어 이론적으로 밴드수가 많아질수록 분류정확도가 높을 것이라 예상되는, 다변량 통계분석기법중의 하나인 정준상관분석을 적용한 분류기법을 제안한다. 그리고 기존의 대표적인 전통적 분류기법인 최대 우도분류 방법과 비교한다. 사용되는 하이퍼스펙트럴 영상은 2001년 9월 2일 취득된 EO1-Hyperion 영상이다. 실험을 위한 밴드수는 LANDSAT TM 영상에서 열밴드를 제외한 나머지 데이터의 파장대와 일치하는 부분을 감안하여 30개 밴드로 선정하였다. 지상실제데이터로서 비교기본도를 채택하였다. 이 비교기본도와 시각적으로 윤곽을 비교하고, 중첩분석하여 정확도를 평가하였다. 최대우도분류의 경우 수역 분류를 제외하고는 전혀 분류기법으로서의 역할을 하지 못하는 것으로 판단되며, 수역의 경우도 큰 호수 외에 작은 호수나 골프장내 연못, 부분적으로 물이 존재하는 작은 영역 등은 전혀 분류하지 못하고 있는 것으로 나타났다. 그러나 정준상관분류결과는 비교기본도와 형태적으로 시각적 비교를 해볼 때 골프장잔디를 거의 명확히 분류해 내고 있으며, 도시역에 대해서도 고속도로의 선형 등을 상당히 잘 분류해내고 있음을 알 수 있다. 또한 수역의 경우도 골프장 연못이나 대학교내 연못, 기타지역의 연못, 웅덩이 등 까지도 잘 분류해내고 있음을 확인할 수 있다. 결과적으로 정준상관분석 알고리즘의 개념상 트레이닝 영역 선정시 시행착오를 겪지 않고도 정확한 분류를 할 수 있었다. 또한 분류항목 중에서 잔디와 그 외 식물을 구분해 내는 능력과 수역을 추출해 내는 능력이 최대우도분류기법에 비해 우수하였다. 이상의 결과로 판단해 볼 때 하이퍼스펙트럴영상에 적용되는 정준상관분류기법은 농작물 작황 예측과 지표수 탐사에 매우 유용하리라 판단되며, 나아가서는 분광적 고해상도 영상인 하이퍼스펙트럴 데이터를 이용한 GIS 데이터베이스 구축에 중요한 역할을 할 수 있을 것으로 기대된다.