• 제목/요약/키워드: Multivariate Statistical Analysis

검색결과 639건 처리시간 0.029초

Study of Metabolic Profiling Changes in Colorectal Cancer Tissues Using 1D 1H HR-MAS NMR Spectroscopy

  • Kim, Siwon;Lee, Sangmi;Maeng, Young Hee;Chang, Weon Young;Hyun, Jin Won;Kim, Suhkmann
    • Bulletin of the Korean Chemical Society
    • /
    • 제34권5호
    • /
    • pp.1467-1472
    • /
    • 2013
  • Metabolomics is a field that studies systematic dynamics and secretion of metabolites from cells to understand biological pathways based on metabolite changes. The metabolic profiling of intact human colorectal tissues was performed using high-resolution magic angle spinning (HR-MAS) NMR spectroscopy, which was unnecessary to extract metabolites from tissues. We used two different groups of samples, which were defined as normal and cancer, from 9 patients with colorectal cancer and investigated the samples in NMR experiments with a water suppression pulse sequence. We applied target profiling and multivariative statistical analysis to the analyzed 1D NMR spectra to identify the metabolites and discriminate between normal and cancer tissues. Cancer tissue showed higher levels of arginine, betaine, glutamate, lysine, taurine and lower levels of glutamine, hypoxanthine, isoleucine, lactate, methionine, pyruvate, tyrosine relative to normal tissue. In the OPLS-DA (orthogonal partial least square discriminant analysis), the score plot showed good separation between the normal and cancer groups. These results suggest that metabolic profiling of colorectal cancer could provide new biomarkers.

Multivariate statistical study on naturally occurring radioactive materials and radiation hazards in lakes around a Chinese petroleum industrial area

  • Yan Shi;Junfeng Zhao;Baiyao Ding;Yue Zhang;Zhigang Li;Mohsen M.M.Ali;Tuya Siqin;Hongtao Zhao;Yongjun Liu;Weiguo Jiang;Peng Wu
    • Nuclear Engineering and Technology
    • /
    • 제56권6호
    • /
    • pp.2182-2189
    • /
    • 2024
  • The high-purity germanium gamma-ray spectrometer was used to measure the radioisotope in surface water of lakes in a Chinee petroleum industrial area. 92 samples were collected from surface water of three lakes. Activity concentrations of 232Th, 226Ra and 40K in three lakes were measured, distributed in the range of 101.8-209.4, 192.1-224.9 and 335.0-548.9 mBq/L, respectively. Results were all within the limits of WHO and China. Potential environmental and health risks were assessed by calculating some radiation hazard indicators, radium equivalent index, annual effective dose, excess lifetime cancer risk, absorbed dose rate, external hazard index, internal hazard index, annual gonadal dose equivalent, activity utilization index and representative gamma index, which ranged 0.38-0.54 Bq/L, 0.06-0.08 mSv/y, 0.23 × 10-3-0.31 × 10-3, 0.17-0.24 nGy/h, 1.01 × 10-3-1.46 × 10-3, 1.55 × 10-3-2.02 × 10-3, 1.16-1.66 μSv/y, 3.13 × 10-3-4.45 × 10-3 and 2.60 × 10-3-3.77 × 10-3. The results were all at acceptable levels, meaning no impact on human health. The relationship between the electrical conductivity of surface water and the activity concentration of 232Th, 226Ra and 40K was evaluated. The electrical conductivity value was 0.241-0.369 mS/cm, showing a significant correlation coefficient between 226Ra and 40K and electrical conductivity. Multivariate statistical methods were used to determine the relationship between the activity concentrations of 232Th, 226Ra, and 40K, radiation hazard indicators and electrical conductivity.

통계분석을 이용한 낙동강 창녕함안보 구간의 수질특성 연구 (Characterization of Water Quality in Changnyeong-Haman Weir Section Using Statistical Analyses)

  • 곽보라;김일규
    • 대한환경공학회지
    • /
    • 제38권2호
    • /
    • pp.71-78
    • /
    • 2016
  • 본 연구에서는 낙동강 창녕함안보 구간의 수질을 통계분석을 이용하여 수질 특성을 파악하였다. 다양한 통계분석기법 중에서 상관분석과 주성분분석 및 요인분석을 실시하였으며, 강우에 따른 조류의 천이양상을 연구하였다. 이는 향후 창녕함안보 구간의 수질관리정책 수립을 위한 기초 자료를 구축하는데 매우 중요한 자료이다. 측정 자료의 상관성 분석 결과, 클로로필-a와 조류는 상관성이 유의하지 않게 나타났으며, 요인분석 결과로 3개의 주성분이 추출되었으며, 제 1요인으로는 COD, TOC, BOD, pH, 수온이 분류되었다. 또한, 강우에 따른 조류의 천이양상을 분석한 결과, 강우 후에는 남조류의 수중개체 농도가 감소하는 추세를 보인 반면, 규조류와 녹조류의 개체 농도는 다소 증가하였다.

모바일 스마트 장치 배터리의 남은 시간 예측에 적용 가능한 통계 기법들의 평가 (Performance Evaluation of Statistical Methods Applicable to Estimating Remaining Battery Runtime of Mobile Smart Devices)

  • 탁성우
    • 한국정보통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.284-294
    • /
    • 2018
  • 모바일 스마트 장치 배터리의 남은 시간 예측에 통계적 기법이 많이 사용되고 있다. 그러나 특정 통계 기법만을 사용한 기존 연구들의 결과만으로는, 통계적 기법이 배터리의 남은 시간 예측에 적합한지가 판단하기 어렵다. 이에 본 논문에서는 스마트 장치 배터리의 남은 시간 예측에 적용 가능한 다양한 통계 기법들의 성능을 평가하였다. 평가에 사용된 통계 예측 기법은 단순 및 이동 평균, 선형 회귀, 다변수 적응 회귀, 자기 회귀, 다항식 회귀, 이중 및 삼중 지수평활 기법이다. 분석 결과는, 향후 통계적 기법을 배터리 남은 사용 시간 예측에 적용하려는 IT 엔지니어에게 중요한 자료로 활용될 수 있다.

A Multivariate Statistical Approach to Comparison of Essential Oil Composition from Three Mentha Species

  • Park, Kuen-Woo;Kim, Dong-Yi;Lee, Sang-Yong;Kim, Jun-Hong;Yang, Dong-Sik
    • 원예과학기술지
    • /
    • 제29권4호
    • /
    • pp.382-387
    • /
    • 2011
  • The chemical composition of essential oils obtained from aerial parts in spearmint, apple mint and chocolate mint, was investigated by gas chromatography/mass spectrometry analyses. (-)-Carvone (33.0%) was quantitatively major compound in spearmint, followed by R-(+)-limonene (11.7%) and ${\beta}$-phellandrene (9.7%); (-)-carvone (37.4%) and germacrene D (11.9%) in apple mint; and (-)-menthol (34.3%), p-menthone (18.4%) and menthofuran (9.8%) in chocolate mint. Hierarchical cluster analysis and principle components analysis showed the clear difference in chemical composition of the three mint oils.

승용차 도심 주행패턴에 의한 연비 성능 분석 (A Study on the Fuel Economy based on the Driving Patterns for Passenger Car in the Metropolitan Area)

  • 정남훈;이우택;선우명호
    • 한국자동차공학회논문집
    • /
    • 제11권1호
    • /
    • pp.25-31
    • /
    • 2003
  • There are a lot of factors influencing on the automobile fuel economy such as average speed, average acceleration, acceleration sum per kilometer, and so on. In this study, various driving data were recorded during road tests. The accumulated road test mileage in Seoul metropolitan area is around 1,300 kilometers. The data were analyzed by multivariate statistical techniques including correlation analysis, principal component analysis, and multiple linear regression analysis. The analyzed results show that the average trip time per kilometer is one of the most important factors to fuel consumption and the increase of the average speed is desirable for reducing emissions and fuel consumption.

논문 - 인자 및 군집분석을 이용한 둑 높이기 저수지 유형분류에 관한 연구 (The Classification of Dam Heightening Reservoir using Factor and Cluster Analysis)

  • 김해도;이광야;정인균;정광욱;권진욱
    • 한국관개배수논문집
    • /
    • 제18권2호
    • /
    • pp.66-75
    • /
    • 2011
  • Multivariate statistical analysis was applied to 110 dam heightening reservoir to classify the building conditions for waterfront centered around cultivated area using data of land cover, landscape, additional water quantity, local economic, tourism resources, and accessibility related variables. Five factors were extracted through factor analysis based on eigen value criteria of more than one. These five factors together account for 68.2% of the total variance. Characteristics of five factors for the downstream of dam heightening reservoirs are building conditions of waterfront, economic conditions, additional water quantity, eco-tours, and accessibility of tourism resources respectively. Five clusters were classified through cluster analysis based on factor score. The classified result shows that third cluster has remunerative terms for building waterfront.

  • PDF

건설투자(建設投資)의 단기예측모형(短期豫測模型) 비교(比較) (Short-term Construction Investment Forecasting Model in Korea)

  • 김관영;이창수
    • KDI Journal of Economic Policy
    • /
    • 제14권1호
    • /
    • pp.121-145
    • /
    • 1992
  • 본고(本稿)에서는 현재의 경제상황을 잘 반영하는 건설투자활동(建設投資活動)의 단기예측모형(短期豫測模型)을 정립하고자 먼저 관련 시계열자료의 안정성(安定性) 여부(與否)와 순환성(循環性), 계절성(季節性)의 특성을 살펴본 후 여러 단기모형의 예측력(豫測力), 정합성(整合性), 설명력(說明力)을 비교 검토했다. 단위근(單位根) 검정(檢定)과 자기상관계수(自己相關係數) 스펙트랄 밀도함수 분석의 결과, 건설관련 시계열자료들이 대체로 단위근(單位根)을 갖지 않음으로써 안정적이고 주기적인 순환변동을 하고 있으며, 시차변수의 설명력이 높은 특성을 나타내었다. 또한 건설투자자료의 특성이 선행지표(先行指標)인 건축허가연면적(建築許可延面積) 및 건설수주액(建設受注額)과 아주 유사하여 건설투자 단기예측에 있어서 두 지표 사이의 시차관계(時差關係) 파악이 중요함을 알 수 있었다. 제(第)III장(章)에서는 단변량(單變量) 시계열모형(時系列模型)으로 ARIMA모형(模型)과 승법선형추세예측모형(乘法線型趨勢豫測模型)을, 다변량(多變量) 시계열모형(時系列模型)으로는 첫째, 선행지표(先行指標)를 이용한 1차자기회귀모형(次自己回歸模型), VAR모형(模型), 둘째 GNP자료를 이용한 거시경제모형의 단순한 축약형모형(縮約型模型)과 VAR모형(模型)을 제시하고 이들을 비교 평가하였다. 이에 따르면 단변량 시계열모형보다는 다변량 시계열모형이 시간이 경과할수록 예측오차(豫測誤差)가 커지지 않는다는 점에서 우수한 것으로 나타났으며, 다변량모형 중에서도 벡터자기회귀모형이 여타 모형보다 절대예측오차평균(絶對豫測誤差平均), 평균자승근(平均自乘根) 퍼센트 오차(誤差), 결정계수(決定係數) 등 모든 면에서 우수한 것으로 평가되었다. 이는 최근 건설투자가 추세에서 벗어난 급증세를 지속하고 있음을 고려할 때 타당한 결론이라 생각된다.

  • PDF

다변량 경시적 자료 분석을 위한 공분산 행렬의 모형화 비교 연구 (Comparison study of modeling covariance matrix for multivariate longitudinal data)

  • 곽나영;이근백
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.281-296
    • /
    • 2020
  • 같은 개체로부터 반복 측정한 자료를 경시적 자료(longitudinal data)라고 한다. 이러한 자료를 분석하려면 흔히 사용되는 횡단 자료 분석과는 다른 분석 방법이 필요하다. 즉, 경시적 자료에서 공변량의 효과를 추정할 때에는 반복 측정된 결과 간의 상관성을 고려해야 하며, 따라서 공분산행렬을 모형화 하는 것이 매우 중요하다. 그러나 추정해야 할 모수가 많고, 추정된 공분산행렬이 양정치성을 만족해야 하므로 공분산 행렬의 모형화는 쉽지 않다. 특히 다변량 경시적 자료분석을 위한 공분산행렬의 모형화는 더욱더 심층적인 방법론을 사용해야 한다. 본 논문은 다변량 경시적 자료분석을 위한 공분산행렬을 모형화하기 위해 두 가지 방법론을 고찰한다. 두 방법 모두 수정된 콜레스키 분해(modified Cholesky decomposition)를 이용하여 시간에 따른 응답변수들의 상관관계를 설명하고 있다. 하지만 같은 시간에서 관측된 응답변수들간의 상관관계를 설명하는 방법이 다르다. 첫 번째 방법론에서는 향상된 선형 공분산 모형(enhanced linear covariance models)을 사용하여 공분산행렬이 양정치성을 만족하도록 한다. 두 번째 방법론에서는 분산-공분산 분해(variance-correlation decomposition)와 초구분해(hypersphere decomposition)을 이용하여 공분산 행렬을 모형화 한다. 이 두 방법론의 성능을 비교하고자 모의실험을 진행한다.

다변량 선형회귀모형의 벌점화 최소거리추정에 관한 연구 (Penalized least distance estimator in the multivariate regression model)

  • 신정민;강종경;방성완
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.1-12
    • /
    • 2024
  • 동일한 설명변수 집합에 여러 개의 반응 변수들이 종속되어 있는 경우를 많은 실제 자료에서 볼 수 있다. 특히, 여러 개의 반응변수가 서로 상관관계를 가지고 있으면 각각의 반응변수에 대한 개별적인 분석보다는 반응변수들 사이의 상관관계를 고려한 동시 추정(simultaneous estimation)이 매우 효과적이다. 이러한 다변량 회귀분석에서 최소거리추정량(least distance estimator; LDE)은 반응변수들간의 상관관계를 모형 적합 과정에 반영하여 다차원 유클리드 공간에서 각 훈련 개체와 추정값 사이의 거리를 최소화하도록 회귀계수들을 동시에 추정한다. 뿐만 아니라 최소거리추정량은 이상치에 대한 강건성을 제공한다. 본 논문에서는 다변량 선형 회귀분석에서의 최소거리추정법에 대해 살펴보고, 나아가 효율적인 변수선택을 위한 벌점화 최소거리추정량을 제시하였다. 본 연구에서 제안하는 adaptive group LASSO 벌점항을 적용한 AGLDE 기법은 반응변수들간의 상관관계를 모형 적합에 반영함과 동시에 설명변수의 중요도에 따라 효율적으로 변수선택을 수행할 수 있다. 제안 방법의 유용성은 모의실험과 실제 자료 분석을 통해 확인하였다.