• 제목/요약/키워드: 주성분회귀법

검색결과 38건 처리시간 0.028초

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.

희소주성분분석을 이용한 텍스트데이터의 단어선택 (Feature selection for text data via sparse principal component analysis)

  • 손원
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.501-514
    • /
    • 2023
  • 텍스트데이터는 일반적으로 많은 단어로 이루어져 있다. 텍스트데이터와 같이 많은 변수로 구성된 데이터의 경우 과적합 등의 문제로 분석에 있어서의 정확성이 떨어지고, 계산과정에서의 효율성에도 문제가 발생하는 경우를 흔히 볼 수 있다. 이렇게 변수가 많은 데이터를 분석하기 위해 특징선택, 특징추출 등의 차원 축소 기법이 자주 사용되고 있다. 희소주성분분석은 벌점이 부여된 최소제곱법 중 하나로 엘라스틱넷 형태의 목적함수를 사용하여 유용하지 않은 주성분을 제거하고 각 주성분에서도 중요도가 큰 변수만 식별해내기 위해 활용되고 있다. 이 연구에서는 희소주성분분석을 이용하여 많은 변수를 가진 텍스트데이터를 소수의 변수만으로 요약하는 절차를 제안한다. 이러한 절차를 실제 데이터에 적용한 결과, 희소주성분분석을 이용하여 단어를 선택하는 과정을 통해 목표변수에 대한 정보를 이용하지 않고도 유용성이 낮은 단어를 제거하여 텍스트데이터의 분류 정확성은 유지하면서 데이터의 차원을 축소할 수 있음을 확인하였다. 특히 차원축소를 통해 고차원 데이터 분석에서 분류 정확도가 저하되는 KNN 분류기 등의 분류 성능을 개선할 수 있음을 알 수 있었다.

케모메트릭 방법과 결합된 레이저 유도 플라즈마 분광법을 적용한 유류 지문의 법의학적 분류 연구 (Forensic Classification of Latent Fingerprints Applying Laser-induced Plasma Spectroscopy Combined with Chemometric Methods)

  • 양준호;여재익
    • 한국광학회지
    • /
    • 제31권3호
    • /
    • pp.125-133
    • /
    • 2020
  • 본 논문에서는 다변량 분석법과 결합된 레이저 유도 플라즈마 분광법을 사용하여 겹친 유류 지문을 분리하는 혁신적인 방법을 연구하였다. LIPS는 겹친 유류 지문의 화학 성분에 대한 데이터뿐 아니라 실시간 분석 및 고속 스캐닝이 가능한 분광법이다. 레이저 유도 플라즈마 분광법을 통해 도출된 스펙트럼은 적절한 다변량 분석이 적용되어 법의학적 분류와 겹친 유류 지문의 재구성에 유용한 화학적 성분을 제공한다. 본 연구에서는 LIPS 스펙트럼에서 4가지의 유류 지문을 분류하기 위하여, 주성분 분석 방식과 부분 최소 제곱 회귀 분석을 사용하였다. 제안된 방법은 SIMCA 및 PLS-DA와 같은 구별 방식을 사용하여 4개의 유류 지문의 분류를 성공적으로 입증하였다. 본 연구의 결과는 대략 85% 이상의 정확도를 가졌으며, external validation 실험에서도 분류의 가능함을 보였다. 최종적으로, 125 ㎛의 공간 간격으로 레이저 스캐닝 분석을 통한 겹친 유류 지문의 2차원 형태의 분리가 가능함을 입증하였다.

가중치 산출방법에 따른 고객만족도지수의 비교 (Comparison of Customer Satisfaction Indices Using Different Methods of Weight Calculation)

  • 이상준;김용태;김성윤
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 연구는 다양한 가중치 산출방법을 적용하여 각 차원별 가중치 및 고객만족도지수를 비교하고 시사점을 밝혀보고자 한다. 이를 위해 가중치 산출방법을 주관적 방법과 통계적 방법으로 구분하고, 다시 주관적 방법은 고정총합법, 그리고 통계적 방법은 상관분석, 회귀분석, 주성분분석, 요인분석, 구조방정식으로 세분화하였다. 연구결과 주관적 방법과 통계적 방법에 의한 가중치는 서로 차이가 있는 것으로 나타났고, 분석방법에 따른 가중치의 순위는 유사한 패턴으로 구분되었다. 그리고 가중치 산출방법에 따른 각 차원별 가중치는 큰 편차를 보여 차원간의 변별력 및 안정성에 차이를 나타냈다. 마지막으로 다양한 가중치 산출방법에 따른 고객만족도지수는 구조방정식, 회귀분석, 상관분석, 산술평균, 주성분분석, 고정총합법, 요인분석의 순으로 높게 나타났고, 각 방법론에 따른 고객만족도지수는 통계적으로 유의한 차이가 있는 것으로 나타났다.

다변량 분석법을 이용한 Tryptophan과 Tyrosine의 형광분광법적 정량 (Simultaneous Determination of Tryptophan and Tyrosine by Spectrofluorimetry Using Multivariate Calibration Method)

  • 이상학;박주은;손범목
    • 대한화학회지
    • /
    • 제46권4호
    • /
    • pp.309-317
    • /
    • 2002
  • 형광분광법에 의하여 주성분 회귀분석(principal component regression, PCR)과 부분 최소자승법(Partial least squares, PLS)을 이용하여 아미노산(Tryptophan and Tyrosine)을 동시에 정량하는 방법에 대하여 연구하였다. 아미노산 혼합물의 형광 스펙트럼은 들뜸파장을257nm로 고정하여 측정하였다. 두 가지 아미노산이 서로 다른 농도로 혼합되어 있는 32개의 시료용액을 280nm∼500nm 범위에서 스펙트럼들을 얻었고 이를 이용하여 PCR과 PLS회귀모델을 얻었다. 두 가지 아미노산이 서로 다른 농도로 포함된 6개의 외부검정용 시료들의 스펙트럼들을 이용해서 회귀모델의 적합성을 검정하기 위하여 외부검정용 시료의 농도를 계산하였다. 계산된 농도를 이용하여 relative standard error of prediction($RSEP_a$)를 얻었고 같은 방법으로 overall relative standard error of prediction($RSEP_m$) 도 구하였다

쌀의 KOH 농도별 붕괴양상에 따른 품종변이 해석 (Analysis of Varietal Variation in Alkali Digestion of Milled Rice at Several Levels of Alkali Concentration)

  • 최해춘;손영희
    • 한국작물학회지
    • /
    • 제38권1호
    • /
    • pp.31-37
    • /
    • 1993
  • 우리나라 주요 벼 재배품종 및 신육성계통(자포니카: 25품종, 통일형:8품종)에 대한 쌀 알칼리 붕괴성의 품종적 특이성을 분시검토하여 보고자 KOH 농도를 0.8-1.8까지 0.2% 간격으로 처리하여 농도별 쌀의 알칼리 붕괴반응을 조사하고 주성분분석법을 적용하여 품종적 유형을 분류하였다. 주성분분석에서 상위 2개 주성분치의 변이가 전변이량의 92%을 차지하였고 제1 및 제2 주요분치 좌표상의 품종분포에 따라 크게 4개 유형으로 군집화 시킬 수 있었다. 제 I 군에서는 전 KOH 농도에 걸쳐 거의 비슷하게 알칼리 붕괴성(ADV)가 낮은 도봉벼만 유일하게 분포하였고, 제 II군에는 1.4% KOH 농도에서 중간정도의 ADV 이면서 고-저 알칼리 농도 ADV간차가 중도인 백운찰벼, 신선찰벼 및 수원 34002 등 찰벼가 포함되어 있었다. 제 III군에는 1.4% KOH 농도에서 중-중고의 ADV 이면서 저-고 KOH 농도간 ADV 변화가 심했던 대부분의 통일형 품종과 자포니카 조생계가 분포되어 있었고 육도농림찰 001와 한강 찰벼등은 이 유형에 포함되어 있었다. 제 IV군에는 1.4% KOH 농도에서 ADV가 중고이상으로 높으면서 고-저 알칼리 농도 ADV간차가 중-중고인 중생 및 중만생 자포니카 품종들이 주로 분포 하였으며 조생인 금조벼가 이 유형에 속하였다. 여기서 제 1 주성분은 전 알칼리 농도에서 평균적으로 표현되는 붕괴성 정도였고 제 2 주성분은 저-고 KOH 농도의 ADV간 차 또는 KOH 농도에 따른 ADV 변화의 회귀계수와 밀접하게 관련된 요소였다. 1.2%-1.4% KOH 농도에서의 ADV는 저-고 KOH 농도간 ADV차와 2차 곡선 회귀계수를 나타내었다.

  • PDF

통계학적 실험계획법 해석을 통한 MOF-235 합성 최적화 (Optimization of MOF-235 Synthesis by Analysis of Statistical Design of Experiment)

  • 정민지;유계상
    • 공업화학
    • /
    • 제30권5호
    • /
    • pp.615-619
    • /
    • 2019
  • 통계학적 실험계획법을 이용하여 다공성 구조체인 MOF-235 합성 공정 최적화를 수행하였다. 합성에 사용되는 주성분인 terephthalic acid (TPA), Iron (III) chloride hexahydrate, N,N-dimethylformamide (DMF) 및 ethanol의 농도가 MOF-235의 결정구조를 형성하는데 중요한 요소가 되었다. 다양한 농도의 4가지 성분을 이용하여 MOF-235를 합성한 후 XRD를 이용하여 결정도를 측정하였다. 16가지 실험조건을 통해 합성한 MOF-235의 결정도 결과를 통계학적 해석을 통해 주성분의 조성이 입자의 합성에 미치는 영향을 분석하였다. F 검정법을 이용한 분산분석에서 에탄올의 농도가 입자의 결정도에 가장 큰 영향을 미치고 TPA가 가장 영향력이 작은 것으로 분석되었다. 결정도를 예측할 수 있는 회귀모델을 도출하였고 2가지 합성변수에 대한 예측결과를 등고선도를 이용하여 제시하였다. 마지막으로 혼합물법을 이용하여 3가지 합성인자가 미치는 결정도를 예측하여 제시하였다.

교량 모니터링 빅데이터를 이용한 광안대교의 교통량 의존 변위 추정 모델 (Traffic Volume Dependent Displacement Estimation Model for Gwangan Bridge Using Monitoring Big Data)

  • 박지현;신성우;김수용
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.183-191
    • /
    • 2018
  • 본 연구에서는 차종별 교통량 데이터와 연직 변위 데이터의 상관관계를 바탕으로 광안대교의 차종별 교통량 데이터를 이용한 연직 변위 추정 모델을 개발하였다. 추정 모델의 개발 과정에서 구조화 회귀 분석에 기반한 모델링 방법과 주성분 분석법에 기반한 모델링 방법이 적용되었으며, 각각의 방법으로 개발된 모델의 변위 추정 성능을 비교 분석하였다. 개발된 모델을 이용하여 추정된 변위는 실측 변위와 유사한 것으로 분석되었으며, 이로부터 차종별 교통량 데이터를 광안대교의 교통량 의존 변위 추정에 적용 가능한 것을 알 수 있었다. 또한, 구조화 회귀 분석에 기반한 모델과 주성분 분석에 기반한 모델의 변위 추정 성능은 상호간에 큰 차이가 없다는 것을 알 수 있었다. 결론적으로 본 연구에서 개발한 차종별 교통량 데이터를 이용한 연직 변위 추정 모델은, 광안대교의 교통하중에 따른 거동 분석 등에 유효하게 활용될 수 있을 것으로 사료된다.

FT-NIR를 이용한 Naphtha Cracking 공정중 NaOH, $Na_2CO_3$$Na_2S$ 정량분석 (Determination of NaOH, $Na_2CO_3$ and $Na_2S$ Concentration in a Naphtha Cracking Process by FT-NIR Spectroscopy)

  • 장미진;김현욱;조일영
    • 분석과학
    • /
    • 제11권6호
    • /
    • pp.448-451
    • /
    • 1998
  • 납사 그랙킹 공정과정에서 사용되는 caustic 농도와 부산물로 형성되는 $Na_2CO_3$, $Na_2S$ 농도를 신속하고 정확하게 분석할 수 있는 검량법의 개발과 근적외선 분광기의 적용가능성에 대하여 연구하였다. 주성분 회귀분석을 이용한 검량법과 근적외선 분광기의 조합은 현재 사용되고 있는 습식 적정법의 대체 분석법으로 빠르고 비파괴적으로 적용 가능한 기기이며, 0.1 표준예측오차의 정밀한 분석을 할 수 있다.

  • PDF

벽지의 디자인 요소 및 감성적 특성에 의한 고급감 모델 개발 (Development of a Luxuriousness Model for Wall Paper Design based on Visual and Tactile Characteristics)

  • 반상우;이주환;김인기;이철;윤명환
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.193-197
    • /
    • 2006
  • 본 연구는 감성 공학적 접근법을 사용하여, 벽지의 디자인 요소와 소비자의 감성과의 관계를 정량적으로 규명하는 것을 목표로 한다. 문헌조사, 인터뷰 전문가 의견 등을 종합하여, 총 13개의 주관적 감성 변수(6개의 시각적 변수, 7개의 촉각적 변수) 와 4개의 벽지 디자인 요소(color, texture pattern, embossing depth, gloss)들이 추출되었으며, 최종 목표 감성은 '고급감'으로 정하였다. 9점 척도와 100점 척도으로 구성된 설문지를 통하여, 28개의 샘플 벽지에 대해서 30명의 목표 고객들을 대상으로 감성 평가 실험을 실시하였고, 주성분 회귀 분석, 수량화 이론 등을 이용한 분석을 통하여, 소비자의 감성과 디자인 요소와의 관계를 정량적으로 분석했으며, 고급감을 향상시킬 수 있는 감성 변수 조합과 디자인 요소 조합을 규명하였다.

  • PDF