• 제목/요약/키워드: PLS 회귀

검색결과 65건 처리시간 0.142초

근적외선분광법을 이용한 수수×수단그라스 교잡종 종자의 품종 판별 (Variey Discrimination of Sorghum-Sudangrass Hybrids Seed Using near Infrared Spectroscopy)

  • 이기원;송요욱;김지혜;라하만 아티쿨;오미래;박형수
    • 한국초지조사료학회지
    • /
    • 제40권4호
    • /
    • pp.259-264
    • /
    • 2020
  • 본 연구는 근적외선분광법을 이용하여 국내에서 재배중인 수수×수단그라스 교잡종 품 판별 가능성을 검토하고자 수행되었다. 근적외선분광기를 이용하여 수수×수단그라스 교잡종 종자를 가시파장 대역대 (680 - 1,099 nm), NIRS 파장 대역대 (1,100 - 2,500 nm) 및 NIRS 전체 파장 대역대 (680 - 2,500 nm)로 구분하여 스펙트라를 얻은 후 1차 미분과 8 nm gap으로 수 처리를 수행하였으며 부분최소자승 (PLS) 회귀분석법을 통해 품종판별 검량식을 개발하고 판별 정확성을 검증하였다. 수수×수단그라스 교잡종품종 판별의 정확성은 NIR파장대역에서 SECV 8.44 그리고 R2CV 0.89로 가장 판별 정확성이 낮았으며 NIRS 전체 파장대역에서 SECV 7.88 그리고 R2CV 0.90로 가장 높은 판별 정확성을 나타내었다. 파장대역별 예측 정확성은 NIR 파장대역 (1,100 - 2,500 nm)이 가장 우수하였으며, 교차검증오차 (SECV) 8.44에서 예측오차 (SEP) 12.03로 높아졌으며 가시영역대 (680 - 1,099)는 SECV 8.23에서 SEP 12.51로 높아졌다. Discrimination equation 분석법에 의한 NIRS 전체 파장대역별 수수×수단그라스 교잡종 종자의 판별 결과는 품종간에 판별 정확성의 차이가 크게 나타났으며 1, 2, 4 그리고 8번 품종 (G-7, BMR Gold II, Honey chew and SX-17)에서는 100 %의 정확성으로 가장 높게 나타났다. 따라서 NIRS를 이용한 수수×수단그라스 교잡종 종자의 판별분석이 가능할 것으로 판단되었다.

FT-IR 스펙트럼 데이터의 다변량 통계분석을 이용한 고기능성 아프리칸 얌 식별 및 기능성 성분 함량 예측 모델링 (Discrimination of African Yams Containing High Functional Compounds Using FT-IR Fingerprinting Combined by Multivariate Analysis and Quantitative Prediction of Functional Compounds by PLS Regression Modeling)

  • 송승엽;지은이;안명숙;김동진;김인중;김석원
    • 원예과학기술지
    • /
    • 제32권1호
    • /
    • pp.105-114
    • /
    • 2014
  • 본 연구에서는 UV-VIS spectrophotometer를 이용한 total carotenoids, flavonoids, phenolics 함량 데이터와 FT-IR 스펙트럼 데이터를 다변량통계분석법을 통하여 기능성 성분 함량이 높은 아프리칸 얌 고속 선발 시스템을 구축하였다. 62개 아프리칸 얌의 total carotenoids 함량은 $0.01-0.91{\mu}g{\cdot}g^{-1}$ dry wt 나타냈다. Total flavonoids와 phenolics 함량은 $12.9-229.0{\mu}g{\cdot}g^{-1}$ dry wt와 $0.29-5.2mg{\cdot}g^{-1}$ dry wt로 각각 나타났다. 아프리칸 얌은 FT-IR 스펙트럼상의 1700-1500, 1500-1300, $1,100-950cm^{-1}$, 부위에서 중요한 스펙트럼 변화가 나타났다. 이 부위는 각각 amide I과 II을 포함하는 아미노산 및 단백질계열의 화합물, phosphodiester group을 포함한 핵산 및 인지질 그리고 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들의 질적, 양적 정보를 반영하는 부위이다. PCA 분석과 PLS-DA 분석에서 62개 아프리칸 얌은 유연성이 높은 종으로 3개의 그룹을 형성하였다. 아프리칸 얌의 FT-IR 스펙트럼 데이터와 UV-VIS spectrophotometer을 이용한 total carotenoids, flavonoids, phenolics 함량 데이터 간에 PLS regression 분석하였다. Total carotenoids, flavonoids, phenolics 함량 성분의 실측 값과 예측 값간에 상관계수($R^2$)가 각각 0.83, 0.86, 0.72로 나타났다. 이 결과, 아프리칸 얌으로부터 FT-IR 스펙트럼을 이용한 total carotenoids, flavonoids, phenolics 함량 예측이 가능하였다. 본 연구에서 확립된 대사체 수준에서 아프리칸 얌의 유용 기능성 성분 함량 예측 모델링을 통해 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 예상된다.

PCBs 독성 예측을 위한 주요 분자표현자 선택 기법 및 계산독성학 기반 QSAR 모델 개발 (Development of QSAR Model Based on the Key Molecular Descriptors Selection and Computational Toxicology for Prediction of Toxicity of PCBs)

  • 김동우;이승철;김민정;이은지;유창규
    • Korean Chemical Engineering Research
    • /
    • 제54권5호
    • /
    • pp.621-629
    • /
    • 2016
  • EU의 REACH 제도 도입에 따라 각종 화학물질에 대한 독성 및 활성 정보 확보를 위해 화학물질의 분자구조 정보를 기반으로 화학물질의 독성 및 활성을 예측하는 정량적구조활성관계(QSAR)에 대한 연구가 최근 활발히 진행되고 있다. QSAR 모델에 사용되는 분자표현자는 매우 다양하기 때문에 화학물질의 물성 및 활성을 잘 표현할 수 있는 주요한 분자표현자를 선택하는 과정은 QSAR 모델 개발에 있어 중요한 부분이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 통계적 선택 방법과 부분최소자승법(Partial least square: PLS) 기반의 새로운 QSAR 모델을 제안하였다. 제안된 QSAR 모델은 130종의 폴리염화바이페닐(Polychlorinated biphenyl: PCB)에 대한 분배계수(log P)와 14종의 PCBs에 대한 반수 치사 농도(Lethal concentration 50%: $LC_{50}$) 예측에 사용되고, 제안된 QSAR 모델 예측 정확도는 기존의 OECD QSAR Toolbox에서 제공하는 QSAR 모델과 비교하였다. 관심 화학물질의 분자표현자와 활성정보 간의 높은 상관관계를 갖는 주요 분자표현자를 선별하기 위해서, 상관계수(r)와 variable importance on projections (VIP)기법을 적용하였으며, 화학물질의 독성 및 활성정보를 예측하기 위해 선별된 분자표현자와 활성정보를 이용해 부분최소자승법(PLS)를 사용하였다. 회귀계수($R^2$)와 prediction residual error sum of square (PRESS)을 이용한 성능평가결과, 제안된 QSAR 모델은 OECD QSAR Toolbox의 QSAR 모델보다 PCBs의 log P와 $LC_{50}$에 대하여 각각 26%, 91% 향상된 예측력을 나타내었다. 본 연구에서 제안된 계산독성학 기반의 QSAR 모델은 화학물질의 독성 및 활성정보에 대한 예측력을 향상시킬 수 있고 이러한 방법은 유독 화학물질의 인체 및 환경 위해성 평가에 기여할 것으로 판단된다.

적외선 분광스펙트럼 및 기체크로마토그라피 분석 데이터의 다변량 통계분석을 이용한 대두 종자 지방산 함량예측 (Simultaneous estimation of fatty acids contents from soybean seeds using fourier transform infrared spectroscopy and gas chromatography by multivariate analysis)

  • 안명숙;지은이;송승엽;안준우;정원중;민성란;김석원
    • Journal of Plant Biotechnology
    • /
    • 제42권1호
    • /
    • pp.60-70
    • /
    • 2015
  • 본 연구의 목적은 적외선 분광스펙트럼 데이터를 이용하여 대두 종자내의 지방산 함량을 동시에 예측할 수 있는지 여부를 조사하기 위한 것이다. 총 153종의 대두(Glycine max Merrill) 종자로부터 적외선 분광스펙트럼 및 지방산의 함량을 기체크로마토그라피 분석을 통하여 확인하였다. 적외선 분광스펙트럼 조사결과 대두는 단백질이나 아미노산의 amide bond region ($1,700{\sim}1,500cm^{-1}$), 핵산이나 인지질의 phosphodiester groups ($1,500{\sim}1,300cm^{-1}$) 그리고 탄수화물 등 다당류의 sugar region ($1,200{\sim}1,000cm^{-1}$)에서 계통별로 큰 차이가 이루어짐을 알 수 있었다. 총 29라인의 대두 계통별 시료로부터 지방산 함량을 조사한 결과 총 지방산의 함량은 건조 시료 0.1 g 당 $185.57{\mu}g$에서 $325.9{\mu}g$으로 계통간에 차이가 있었음을 알 수 있었으며 평균 함량은 $244.48{\mu}g$이었다. PLS regression 분석을 이용하여 총 5개 지방산(팔미틱산, 스테아릭산, 올레익산, 리노레익산 그리고 리노레닉산) 함량 예측 calibration models의 실측 검증 결과, 팔미틱산($R^2=0.8002$), 올레익산($R^2=0.8909$) 그리고 리노레익산($R^2=0.815$)은 회귀분석 상관계수가 0.8 이상으로 정확도 높음을 알 수 있었다. 그러나 스테아릭산($R^2=0.4598$)과 리노레닉산($R^2=0.6868$)의 경우 상관계수가 0.7 이하로 상대적으로 예측정확도가 낮음을 알 수 있었다. 본 연구에서 확립된 기술은 지방산의 조성 변환을 통하여 새로운 대두 품종 개발을 위한 계통선발 과정에서 매우 효율적인 수단으로 활용이 가능할 것으로 사료된다. 더 나아가 본 기술은 대두는 물론 대두 유래 농산물이나 식품의 품질 검증 수단으로 활용이 가능할 것으로 기대된다.

근적외선 분광분석법을 이용한 국산 주요 수종의 섬유포화점 이하 함수율 예측 모델 개발 (Moisture Content Prediction Model Development for Major Domestic Wood Species Using Near Infrared Spectroscopy)

  • 양상윤;한연중;박준호;정현우;엄창득;여환명
    • Journal of the Korean Wood Science and Technology
    • /
    • 제43권3호
    • /
    • pp.311-319
    • /
    • 2015
  • 근적외선 반사율 분광분석법을 이용하여 리기다 소나무, 소나무, 잣나무, 백합나무의 섬유포화점 이하 함수율 예측모델을 개발하였다. 시편들을 다양한 평형함수율 상태로 유도한 후 1000 nm~2400 nm 파장영역의 반사율 스펙트럼을 획득하였다. 최적 함수율 예측 모델을 선정하기 위해 5가지의 수학적 전처리(moving average (smoothing point: 3), baseline, standard normal variate (SNV), mean normalization, Savitzky-Golay $2^{nd}$ derivatives (polynomial order: 3, smoothing point: 11))를 8가지 조합으로 각 시편의 반사율 스펙트럼에 적용하였다. 수학적 전처리 후, 변형된 스펙트럼을 이용하여 PLS 회귀분석을 실시하였다. 그 결과, 최적 함수율 예측 모델을 도출한 전처리 방법은 리기다 소나무와 소나무의 경우 moving average/SNV, 잣나무와 백합나무의 경우 moving average/SNV/Savitzky-Golay $2^{nd}$ derivatives이며, 모든 모델은 3개의 주성분을 포함하고 있었다.

그룹 구조를 갖는 고차원 유전체 자료 분석을 위한 네트워크 기반의 규제화 방법 (Network-based regularization for analysis of high-dimensional genomic data with group structure)

  • 김기풍;최지윤;선호근
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1117-1128
    • /
    • 2016
  • 고차원 유전체 자료를 사용하는 유전체 연관 분석에서는 벌점 우도함수 기반의 회귀계수 규제화 방법이 질병 및 표현형질에 영향을 주는 유전자를 발견하는데 많이 이용된다. 특히, 네트워크 기반의 규제화 방법은 유전체 연관성 연구에서의 유전체 경로나 신호 전달 경로와 같은 생물학적 네트워크 정보를 사용할 수 있으므로, Lasso나 Elastic-net과 같은 다른 규제화 방법들과 비교했을 경우 네트워크 기반의 규제화 방법이 보다 더 정확하게 관련 유전자들을 찾아낼 수 있다는 장점을 가지고 있다. 그러나 네트워크 기반의 규제화 방법은 그룹 구조를 갖고 있는 고차원 유전체 자료에는 적용시킬 수 없다는 문제점을 가지고 있다. 실제 SNP 데이터와 DNA 메틸화 데이터처럼 대다수의 고차원 유전체 자료는 그룹 구조를 가지고 있으므로 본 논문에서는 이러한 그룹 구조를 가지고 있는 고차원 유전체 자료를 분석하고자 네트워크 기반의 규제화 방법에 주성분 분석(principal component analysis; PCA)과 부분 최소 자승법(partial least square; PLS)과 같은 차원 축소 방법을 결합시키는 새로운 분석 방법을 제안하고자 한다. 새롭게 제안한 분석 방법은 몇 가지의 모의실험을 통해 변수 선택의 우수성을 입증하였으며, 또한 152명의 정상인들과 123명의 난소암 환자들로 구성된 고차원 DNA 메틸화 자료 분석에도 사용하였다. DNA 메틸화 자료는 대략 20,000여개의 CpG sites가 12,770개의 유전자에 포함되어 있는 그룹 구조를 가지고 있으며 Illumina Innium uman Methylation27 BeadChip으로부터 생성되었다. 분석 결과 우리는 실제로 암에 연관된 몇 가지의 유전자를 발견할 수 있었다.

SNS에서 지각된가치와 스트레스가 지속사용의도에 미치는 영향 : SNS 유형의 조절효과를 중심으로 (The Effects of Perceived Value and Stress on Continuous Intention in SNS : Focused on the Moderating Effect of SNS Type)

  • 권기철;김현아;서영욱
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.120-130
    • /
    • 2020
  • 본 연구는 SNS에서 지각된가치(기능적가치, 사회적가치)와 스트레스(복잡성, 불안감)가 지속사용의도에 미치는 영향을 고찰하였다. 특히 본 연구는 SNS 유형이 SNS 지속사용의도에 미치는 직·간접적인 영향을 살펴보고자 하였다. 연구모형은 SNS를 사용하고 있는 461명의 응답자를 대상으로 테스트하였으며, 신뢰도, 타당성, 경로 및 위계적 회귀분석을 수행하기 위해 SPSS 21.0과 PLS 2.0이 사용되었다. 연구결과는 다음과 같다. 첫째, 기능적가치와 사회적가치는 만족에 긍정적인 영향을 미친다. 둘째, 복잡성은 만족에 부정적인 영향을 미친다. 셋째, 불안감과 만족은 지속사용의도에 긍정적인 영향을 미친다. 넷째, SNS 유형은 지속사용의도에 부정적인 영향을 미친다. 다섯째, 불안감과 지속사용의도 간의 관계에서 SNS 유형은 조절효과를 가지는 것으로 나타났다. 특히 불안감은 개방형 SNS 보다 폐쇄형 SNS에서 지속 사용의도에 더 강한 영향을 미쳤다. 이러한 연구결과를 바탕으로 다음과 같은 실무적 시사점을 제시하였다. 첫째, 폐쇄형 SNS의 기업들은 개방형 SNS 사용자들을 유인하는 전략과 사용자 이탈을 방지하는 전략을 동시에 추진해야 할 것이다. 반면에 개방형 SNS의 기업들은 새로운 신규가입자 유치를 위해 노력해야 할 것이다. 둘째, 폐쇄형 SNS의 기업들은 여러 가지 부가 아이템과 시스템적 장치를 제공함으로써 SNS 사용자들이 불안감을 떨치기 위해 노력하여야 할 것이다. 반면에, 개방형 SNS의 기업들은 SNS 사용자들이 충분히 사회적 관계를 잘 유지하고 있다는 메시지를 지속적으로 제공하여야 할 것이다.

테크노스트레스가 사용자 저항과 성과에 미치는 영향 (The Effect of Technostress on User Resistance and End-User Performance)

  • 김경준;이기동
    • 경영정보학연구
    • /
    • 제19권4호
    • /
    • pp.63-85
    • /
    • 2017
  • 최근의 정보기술은 인간이 할 수 있는 거의 모든 영역에서 적용될 만큼 눈부신 발전을 거듭하고 있지만, 직업 상실의 위협과 같은 사건들로 인하여 개인에게는 기술로 인한 지침, 압박감과 같은 테크노스트레스를 유발시키기도 한다. 이러한 테크노스트레스는 정보기술이 중심이 될 미래 사회에서 사용자의 성과나 생산성에 영향을 미칠 수 있는 중요한 요인이기 때문에 그 관계성에 대한 연구는 매우 중요하다. 본 연구에서는 정보기술 사용자에게 발생되는 테크노스트레스가 성과에 대한 직, 간접적인 영향을 밝히고자 한다. 이를 위해서 테크노스트레스의 발생절차에 대하여 문헌검토를 통해 구체화 하였으며, 사용자의 반응에 대한 유발과 개인적 결과인 성과에 미치는 영향을 실증분석하였다. 따라서 테크노 스트레스와 혁신저항 이론을 통합한 연구모형을 개발하였으며, 317명의 설문조사 응답 자료를 분석하였다. PLS 구조방정식과 매개회귀분석을 통한 분석결과 개인의 테크노스트레스 유발시키는 정보기술의 특성에는 급변성, 연결성, 신뢰성, 복잡성이 영향요인이었으며, 테크노스트레스는 혁신저항을 통해서 간접적으로만 최종 사용자의 성과에 영향을 미치는 것으로 분석되었다. 본 연구는 그동안 정보시스템 분야에서 제기되었던 테크노스트레스와 성과의 인과관계에 대하여 새로운 관점을 제시하여, 학문적이고 실무적인 시사점을 제공할 것이다.

희소 부분 최소 제곱법을 이용한 우리나라 청소년 인터넷 중독 자료 분석 (Analysis of internet addiction in Korean adolescents using sparse partial least-squares regression)

  • 한정섭;박수빈;이동환
    • 응용통계연구
    • /
    • 제31권2호
    • /
    • pp.253-263
    • /
    • 2018
  • 본 연구에서는 우리나라 청소년의 인터넷 중독 자료를 희소 부분 최소제곱법을 적용 하여 분석하였다. 서울 성모병원에서 수집된 자가보고 방식의 인터넷 중독 측도와 다양한 임상 및 정신 병리학적 설문 문항들을 자료로 활용하였다. 표본의 개수보다 설문 문항의 수가 많은 고차원 자료이며, 각 세부문항끼리는 상관관계가 높아 부분 최소제곱법이 좋은 회귀분석 모형이다. 보다 높은 예측 성능과 해석력을 얻기위해 희소성 제약 조건이 가능한 희소 부분 최소 제곱법을 이용하였고, 2가지 다른 벌칙함수를 이용하여 가장 좋은 방법을 선택하였다. 또한, 제안된 최종 모형을 통해 인터넷 중독이 임상 및 정신 병리학적 측도들로 잘 설명됨을 보이고, 공격성과 관련된 다른 설문 문항이 설문 문항이 모형의 잠재성분을 구별하고 설명하는데 역할을 한다는 유의미한 결과를 도출하였다.

근적외 분광분석법을 응용한 마요네즈의 식염 농도측정 (Measurement of Mayonnaise Salt Content by Near-Infrared Reflectance Spectroscopy)

  • 차익수;김진호;김현위;김형찬;이윤경;박기문;유무영
    • 한국식품과학회지
    • /
    • 제28권1호
    • /
    • pp.40-43
    • /
    • 1996
  • 비파괴적이고 신속분석이 가능한 근적외 분광분석법으로 마요네즈의 식염분석을 시도하였다. 식염은 근적외선영역에서 주성분 피크가 존재하지 않음으로 식염 함량을 다양한 통계처리 기법중에 PLS회귀법을 사용하여 100시료로 검량식을 작성하였다. $1{\sim}15$개 요인변수를 사용하여 작성된 검량식 중에서 최소값의 SECV, SE를 갖는 3개의 검량식(요인변수 : 10, 11, 12)을 선택하였다. 이 검량식들을 독립된 40시료의 검정용 시료에 적용시켜 검정한 결과, 요인변수 11의 검량식이 R 0.946, SEP 0.0166%로 가장 우수하게 평가되었다. 이 결과로부터 마요네즈의 식염분석이 근적외 분광분석법으로 측정 가능함을 확인할 수 있었다.

  • PDF