• 제목/요약/키워드: 다변량 통계모델

검색결과 48건 처리시간 0.033초

딥러닝 기반 무역 수출 가격 예측 모델 (Predicting the Future Price of Export Items in Trade Using a Deep Regression Model)

  • 김지훈;이지항
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권10호
    • /
    • pp.427-436
    • /
    • 2022
  • 산업통상자원부에서 제공하는 KOTRA 무역 데이터는 해당 품목과 해당 국가에 대하여 GDP, 관세율, 비즈니스 점수, 과/차년도 수출금액 등을 제공한다. 그러나 무역 수출품목은 수없이 많을뿐더러 그에 따른 대량의 데이터를 매년 수작업 기반 분석을 통해 유의미한 결과를 이끌어내는 것은 상당히 큰 시간과 비용을 요구한다. 따라서 이번 연구에선 대량의 데이터를 학습하여 단기간에 저비용으로 결과 예측이 가능한 다층 퍼셉트론 모델을 구현하고 성능을 평가하였다. 먼저 딥러닝 기반 무역 수출 가격 예측 모델을 일반적 다변량 회귀 모델과 비교하였을 때, 예측 오류와 학습 시간 측면에서 통계적으로 우수한 성능을 보였다. 수출 가격 데이터는 시계열 속성이 있을 것으로 예상하는 바, 은닉 노드들이 모두 연결된 다층 퍼셉트론과 순환 신경망을 이용하여 수출 가격 데이터를 예측하였다. 그 결과 새로운 데이터에 대해 수출 가격 예측을 위한 일반화 능력은 순환 신경망이 우수한 성능을 보였으나, 다층 퍼셉트론이 무역 수출 가격 예측에서 더 뛰어난 성능을 보였다. 추후 장기간 데이터를 확보한다면, 순환 신경망 혹은 트랜스포머 기반 딥러닝 모델을 이용하여 더 뛰어난 수출 가격 예측이 가능할 것으로 사료된다.

하수처리장의 고도처리 upgrading 설계와 공정 최적화를 위한 다변량 통계분석 (Design of a Wastewater Treatment Plant Upgrading to Advanced Nutrient Removal Treatment Using Modeling Methodology and Multivariate Statistical Analysis for Process Optimization)

  • 김민정;김민한;김용수;유창규
    • Korean Chemical Engineering Research
    • /
    • 제48권5호
    • /
    • pp.589-597
    • /
    • 2010
  • 하수처리 시스템에서의 생물학적 영양염류 기준이 강화됨에 따라, 표준활성슬러지공법으로 운전 중인 하수처리장의 고도처리 공법으로의 개보수 필요성이 증가하고 있다. 그러나 실제 하수처리 시스템에서의 다양한 유입조건 및 운전조건의 복잡한 반응 구성으로 인해 실험을 통하여 개보수된 고도처리공법의 최적조건을 찾는 것은 쉽지 않은 일이며, 이는 많은 시간과 비용을 소모하여 비효율적이다. 따라서 본 연구에서는 활성슬러지공정모델(ASMs)을 기반으로 한 하수처리장의 모델링 및 시뮬레이션 기법을 통하여 하수처리장의 고도처리공법으로의 upgrading 설계를 수행하며, 이를 통계적이며 체계적으로 접근하기 위해 반응표면분석법(Response surface method)을 통한 고도처리공법의 설계 최적화를 수행하였다. 또한 실규모 하수처리장에서의 운전 최적화를 위해서는 하수처리의 동력학적 매개변수에 대한 정확한 분석이 수행되어야 한다. 본 연구에서는 다변량 통계분석 기법인 부분최소승자법(PLS)을 통하여 하수처리 시스템의 동력학적 매개변수 간의 상관관계를 파악하며, 고도처리공법 하수처리장의 운전 결과에 가장 큰 영향을 미치는 매개변수를 도출하였다. 본 연구를 통해 하수처리장의 고도처리공법 upgrading 설계 및 운전 최적화를 위한 방법론을 제시하였으며, 이를 통하여 설계시간 및 경비 절감 등 고도처리공법으로의 고효율적인 개보수가 가능할 것으로 예상된다.

다변량통계기법을 이용한 부가가치생산성 구조모델의 구상에 관한 연구 (A Study on Constuct of Value-Added Productivity Structure Model using Multivariate Statistical Method)

  • 이영찬;조성훈;김태성
    • 산업경영시스템학회지
    • /
    • 제19권38호
    • /
    • pp.117-129
    • /
    • 1996
  • This Study intends to analysis what 3 factors, which are indices of Capital, Labor and Distribution, really affect to Value-Added Productivity through Statistical Analysis. For this, We selected 12 indices of Value-Added from the edition of 'Annual report of Korean companies' published in 'Korea Investors Service., Inc', especially in parts of Chemicals and Chemical products of total 85 companies. Using this data, Multivariate Statistical Analysis such as Principal Component Analysis, Factor Analysis, Covariance Structure Analysis is taken for modeling the effect of 3 factor(Labor Productivity, Capital Productivity and the Index of Distribution) on Value-Added Productivity.

  • PDF

이미지 검색을 위한 색상 성분 분석 (Color Component Analysis For Image Retrieval)

  • 최영관;최철;박장춘
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.403-410
    • /
    • 2004
  • 최근 의료 영상 분석(Medical Image Analysis)이나 영상 검색(Image Retrieval)을 위한 전처리(Preprocessing) 단계로 영상 분석(Image Analysis)에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 영상 검색에서 색상 성분(Color Component)의 활용 방법을 제안하고자 한다. 이미지를 검색하기 위해 색상 성분을 기반으로 하고, 색상(Color)을 분석하기 위한 기법으로 CLCM(Color Level Co-occurrence Matrix)과 통계적 기법을 이용하고 있다. CLCM은 기하학적 회전 변환(Geometric Rotate Transform)을 통해서 색상 성분을 3차원 공간상에 투영(Projection)하여 공간 관계(Spatial Relationship)로부터 나타나는 분포를 해석하는 방법으로, 본 논문에서 제안하는 주제이다. CLCM은 색상 모델에서 만들어지는 2차원 히스토그램을 지칭하며 색상 모델의 기하학적인 회전 변환을 통해서 생성된다. 그리고 이를 분석하기 위한 방법으로 통계 기법을 활용하고 있다. CLCM과 유사하게 2차원 분포도를 사용하는 GLCM(Gray Level Co-occurrence Matrix)[1]과 불변 모멘트(Invariant Moment)[2,3] 같은 알고리즘은 2차원적인 데이터를 해석하기 위하여 기본적인 통계 기법을 활용하고 있다. 하지만 GLCM과 불변 모멘트가 각각의 도메인에 최적화되어 있다 하더라도 공간 좌표상에 존재하는 불규칙적인 데이터를 완전히 해석할 수는 없다. 즉 GLCM과 불변 모멘트는 기초 통계 기법만을 사용하고 있기 때문에 추출된 특징들의 신뢰성이 낮다는 것이다. 본 논문에서는 이러한 단점을 보완하여 공간 관계를 해석함과 동시에 데이터의 가중치를 해석하기 위해 전형적인 다변량 통계에서 사용하는 주성분 분석(Principal Component Analysis)[4,5]을 이용하고 있다. 그리고 데이터의 정확도를 높이기 위해서 3차원 공간상에 색상 성분을 투영하여 이를 회전시키면서 데이터의 특성을 다각도에서 추출하는 방법을 제시한다.

방사선치료를 받은 근 침윤성 방광암의 예후 인자 (The Prognostic Factors Affecting Survival in Muscle Invasive Bladder Cancer Treated with Radiotherapy)

  • 정웅기;오봉렬;안성자;나병식;권동득;박광성;류수방;박양일
    • Radiation Oncology Journal
    • /
    • 제20권2호
    • /
    • pp.130-138
    • /
    • 2002
  • 목적 : 근 침윤성 방광암에서 생존율에 영향을 주는 예후 인자를 분석하고 방사선 치료의 역할을 알아보고자 하였다. 대상 및 방법 : 1986년 1월부터 1998년 12월까지 전남대학교병원에서 근 침윤성 방광암으로 진단 받고 계획된 치료를 완료한 28명의 환자를 대상으로 후향적 분석을 시행하였다. 전체 28명 중 남자가 21명 여자가 7명이었으며 환자의 연령은 49세에서 84세까지 분포하였고 중앙값은 72세였다. 조직학적으로 모두 이행상피암으로 확진되었으며 grade 1은 1명, grade 2는 15명, grade 3는 9명, 불명인 경우가 3명이었다. 방사선치료는 선형가속기의 6 MV 또는 10 MV X-ray를 이용하였으며 일회선량은 1.8 내지 2.0 Gy로 3문 내지 4문 조사를 시행하였다. 투여된 총방사선량은 59 내지 66.6 Gy였고 중앙값은 61.24 Gy였다. 생존율은 Kaplan-Meier법으로 산출하였고 두 군간의 비교는 Log-rank test를 이용하였다. 생존율에 영향을 미치는 요인들을 Cox 비례위험모델로 다변량 분석하였다. 결과 : 생존율은 1, 2, 3, 5년에 각각 76, 46, 33, $33\%$로 나타났다. 중앙 생존 기간은 19개월이었다. 생존율에 영향을 미치는 가능성 있는 예후 인자로서 연령(70세 미만 대 이상), 성별, 당뇨병, 고혈압, 수신증 동반 여부, T-병기 (T3a 대 T3b 이상), TUR, 항암화학요법 여부, 방사선치료기간, 방사선량(60 Gy 미만 대 60 Gy 이상), 방사선치료반응정도를 분석에 포함시켰으며, 이들 중 단변량분석에서 T-병기(p=0.078)와 방사선량(p=0.051)이 통계학적 의의에 접근하였으며 방사선치료반응 정도(p=0.011)가 통계학적으로 의의 있게 나타났다. 그러나 다변량분석에서는 통계학적 의의를 가지는 인자가 없었다. 결론 : 근 침윤성 방광암에서 생존율에 미치는 예후 인자로 방사선량, 방사선치료반응 정도가 단변량분석에서 의미있게 나타났으나 다변량 분석에서는 확인되지 못하였으며 향후 더욱 많은 증례를 대상으로 이에 대한 전향적 무작위 임상 시험이 필요할 것으로 생각된다.

Comparative Study of NIR-based Prediction Methods for Biomass Weight Loss Profiles

  • Cho, Hyun-Woo;Liu, J. Jay
    • 청정기술
    • /
    • 제18권1호
    • /
    • pp.31-37
    • /
    • 2012
  • 바이오매스가 가진 재생 가능성과 환경적인 장점으로 인해 바이오매스는 바이오에너지와 다른 제품의 주요 원료가 되었다. 바이오매스의 중요 성질을 예측하기 위해 분광학 데이터를 이용하는 연구를 포함한 많은 연구가 수행되었는데 근적외선 분광학은 빠르고 신뢰성 있는 결과를 저비용으로 제공하는 비파괴 방법이기 때문에 널리 사용되었다. 이 연구에서는 서로 다른 여섯가지의 목질계 바이오매스의 근적외선 스펙트럼 데이터를 기반으로 질량 손실 프로파일을 예측하는 다변량 통계기법을 개발하였으며, 상관없는 잡음을 제거하고 근적외선 데이터를 잘 설명하는 파장대역을 선택하기 위해 웨이블릿 분석이 사용되었다. 실제 근적외선 데이터를 가지고 개발된 방법을 예시하였는데 이 때 여러가지 예측모델이 예측 성능을 기준으로 평가되었고 적절한 근적외선 스펙트럼 전처리법의 장점 또한 설명되었다. 웨이블릿으로 압축된 근적외선 스펙트럼을 이용한 부분최소자승법 예측모델이 가장 좋은 성능을 보였으며 개발된 방법은 바이오매스의 빠른 분석에 쉽게 적용될 수 있음 또한 증명되었다.

실험계획 법에 의한 혈중 글루코즈 측정 시 타 성분의 영향 분석 (Influence of Other Blood Components in Predicting Glucose Concentration using Design of Experiment)

  • 김연주;윤길원;전계진
    • 대한의용생체공학회:의공학회지
    • /
    • 제22권6호
    • /
    • pp.497-502
    • /
    • 2001
  • 혈액 속의 글루코즈 농도를 측정 시 타 성분이 미치는 영향을 분석하였다. 이를 위하여 헤모글로빈을 포함한 총 5 가지의 주요 성분을 이용하여 혈액 팬텀을 만들었으며 글루코즈의 배음대역을 포함하는 1500 ~ 1850nm의 흡수스펙트럼을 측정하여 농도 추정 모델을 세웠다. 농도 예측은 다변량통계분석 모델인 부분최소자승회귀분석을 이용하였다 다른 성분들이 글루코즈 측정에 있어 미치는 영향은 실험계획법을 적용한 인자 분석에 의하여 조사하였다. 트리 글라이세라이드는 영향을 미치지 않는 것으로 나타났으며. 알부민과 글로불린의 경우 적은 범위의 영향을 주는 것으로 나타났다 하지만 헤모글로빈의 영향은 큰 것으로 나타나 글루코즈 측정에 있어 헤모글로빈의 농도 보상이 필요한 것으로 판명되었다.

  • PDF

풍기 지역 지하수의 수리지구화학 및 환경동위원소 특성 연구 (Hydrogeochemical and Environmental Isotope Study of Groundwaters in the Pungki Area)

  • 윤성택;채기탁;고용권;김상렬;최병영;이병호;김성용
    • 대한지하수환경학회지
    • /
    • 제5권4호
    • /
    • pp.177-191
    • /
    • 1998
  • 경북 풍기읍 일대의 선캠브리아기 편마암 지역에 부존하는 지하수계의 수리지구화학.수리지질학적 특성을 규명하기 위하여, 지표수, 천층 지하수(심도<70 m) 및 심층 지하수(심도 500~810 m)를 대상으로 수리화학, 다변량 통계, 열역학, 환경 동위원소(삼중수소, 산소-수소, 탄소, 황) 및 질량 보존 모델링을 포함한 종합적인 연구를 수행하였다. 천층 지하수의 수질은 Ca, Mg, SO$_4$및 NO$_3$의 함량이 높은 'Ca-HCO$_3$' 유형으로 특징되는 반면, 심층 지하수는 Na, Ba, Li, H$_2$S, F 및 Cl의 함량이 높고 방해석에 대해 포화 상태를 보이는 'Na-HCO$_3$' 유형으로 특징된다. 본 지역 자연수의 수질은 크게 두 유형, 즉 1) 지표수 및 천층 지하수와 2) 심층 지하수 및 일부천층 지하수로 대분되며, 앞의 유형은 계절적인 조성 변화를 나타낸다. 다변량 통계 분석 결과, 심층 지하수의 수질을 지배하는 세 개의 요인이 도출되었다. 이들 요인은 총 86%의 설명력을 가지는데, 1) 사장석의 용해와 방해석의 침전, 2) 황산염의 환원, 3) 수산화 광물(특히 운모류)의 산성 가수 분해 반응으로 요약될 수 있다. 열역학적 해석 결과와 결합한 질량 보존 모델링을 통하여, 심층 지하수의 수질 특성을 지배하는 수/암 반응을 적절히 설명해 주는 네 개의 모델을 제시하였다. 각 모델은 사장석, 고령토 및 운모류 용해와 방해석, 일라이트, 로몬타이트, 녹니석 및 스멕타이트의 침전을 보여준다. 산소 및 수소 동위원소 연구 결과, 심층 지하수의 경우는 먼 거리의 고지대(소백산 일대)에서 충진된 강우로부터 기원한 후 광역적인 심층 순환을 하면서 상당한 정도의 수/암 반응을 수반한 반면, 천층 지하수는 근처의 저지대에서 충진되었음을 알 수 있다. 삼중수소 자료에 따르면, 심층 지하수(0.2 TU)의 충진 연령은 핵실험 이전인 반면, 천층 지하수(5.66~7.79 TU)는 핵실험 이후였다. 용존 황산염의 황동위원소 조성 분석을 통하여, 본 지역의 심층 지하수에서 특징적으로 높은 함량을 보이는 황화수소(최대 3.9mg/l) 는 황산염의 환원에 기인함을 밝혔다. 또한, 용존 탄산염의 탄소 동위원소비는 토양 이산화탄소에 의한 탄산염 광물의 용해(천층 지하수의 경우), 또는 방해석의 재침전(심층 지하수의 경우)에 의해 조절되고 있음을 확인하였다. 본 지역에 부존하는 지하수의 기원과 유동 및 화학적 진화를 종합적으로 보여주는 모델을 제시한다.

  • PDF

GC-MS 기반 대사체학 기법을 이용한 산수유의 산지판별모델 (Discrimination model of cultivation area of Corni Fructus using a GC-MS-Based metabolomics approach)

  • 임재윤
    • 분석과학
    • /
    • 제29권1호
    • /
    • pp.1-9
    • /
    • 2016
  • 생약의 원산지를 판별하는 논리적인 일련의 기준을 개발한다면, 현재 유통되는 한약을 좀 더 과학적으로 관리 할 수 있을 것이다. 이러한 노력은 전통적인 한약 산업 발전에 기여할 것이라고 사료된다. 산수유의 원산지 판별법을 개발하기 위해, 본 연구에서는 우선 국산 산수유와 중국산 산수유를 각각 수증기 증류하고 이 때 얻은 휘발성분을 GC/MS를 이용하여 분석하였다. NIST mass spectral library의 데이터베이스로부터 정성분석한 결과를 바탕으로 데이터를 범주화(binning)하여 변수를 얻고, 이에 대하여 PCA, OPLS-DA 등 다변량 통계 분석을 수행함으로써 신속, 정확하게 국산 산수유와 중국산 산수유의 산지를 판별할 수 있는 산지 판별모델을 확립하였다. 산지 판별모델 개발을 위해서 학습집합(n=53)을 분석하여 산지 판별모델을 수립한 후, 검증집합(n=12)을 산지 판별모델에 적용함으로써 그 타당성을 확인하였다. 더불어 1-ethylbutyl-hydroperoxide, nonadecane, butylated hydroxytoluene, 5β,7βH,10α-Eudesm-11-en-1α-ol, 7,9-bis (2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione, 그리고 2-decyldodecyl-benzene 등 6개의 마커성분을 선정할 수 있었다. 최근에 NMR을 활용한 산수유 원산지 판별에 대한 보고는 있었으나, GC/MS를 기반으로 한 대사체학 연구기법을 이용하여 산지판별 모델을 제시하는 것은 최초의 보고로서 그 의미가 크다. 본 연구결과를 활용하여 한약의 원산지 판별모델 확립과 산수유 원산지의 과학적인 관리에 적용할 수 있으리라 사료된다.

주성분 회귀분석 및 인공신경망을 이용한 AE변수와 응력확대계수와의 상관관계 해석 (Analysis on Correlation between AE Parameters and Stress Intensity Factor using Principal Component Regression and Artificial Neural Network)

  • 김기복;윤동진;정중채;박휘립;이승석
    • 비파괴검사학회지
    • /
    • 제21권1호
    • /
    • pp.80-90
    • /
    • 2001
  • AE 신호와 재료의 기계적 물성과의 관계를 정량적으로 제시할 수 있는 방법을 개발하였다. 재료의 여러 가지 기계적 성질들 중 피로균열 거동에 관련된 응력확대계수를 중심으로 AE 신호와 같은 다변량 데이터의 처리에 많이 사용되고 있는 주성분 회귀분석과 비선형적 문제 해결에 적합한 신경회로망 기법을 이용하였다. 이를 위하여 강교량 부재인 SWS490B 강에 대한 피로균열전파 실험을 수행하였으며 표준 CT 시편에 대한 피로균열진전 시 발생하는 AE 신호의 각 변수와 응력확대계수와의 관계를 고찰하였다. 통계분석 방법인 변수선택법을 적용한 결과 AE 카운트(RC), 에너지(EN), 신호지속시간(ED)의 각각에 대한 유의성이 높은 것으로 나타났으나 전반적으로 전체 AE 변수를 모두 이용할 경우 통계적 유의성이 높은 것으로 나타났다. 부재의 반복하중 시 발생하는 피로균열진전을 정량적으로 도출할 수 있는 응력확대계수 추정모델을 개발하고 평가하였다. 미지 시료에 대하여 개발된 모델의 응력확대계수 예측 성능을 분석한 결과 주성분 회귀모델과 인공신경망 모델 모두 우수한 예측성능을 나타내었으나 전반적으로 인공신경망 모델이 주성분 회귀모델보다 다소 양호한 것으로 분석되었다.

  • PDF