• 제목/요약/키워드: Ridge Regression

검색결과 118건 처리시간 0.031초

Genome-association analysis of Korean Holstein milk traits using genomic estimated breeding value

  • Shin, Donghyun;Lee, Chul;Park, Kyoung-Do;Kim, Heebal;Cho, Kwang-hyeon
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제30권3호
    • /
    • pp.309-319
    • /
    • 2017
  • Objective: Holsteins are known as the world's highest-milk producing dairy cattle. The purpose of this study was to identify genetic regions strongly associated with milk traits (milk production, fat, and protein) using Korean Holstein data. Methods: This study was performed using single nucleotide polymorphism (SNP) chip data (Illumina BovineSNP50 Beadchip) of 911 Korean Holstein individuals. We inferred each genomic estimated breeding values based on best linear unbiased prediction (BLUP) and ridge regression using BLUPF90 and R. We then performed a genome-wide association study and identified genetic regions related to milk traits. Results: We identified 9, 6, and 17 significant genetic regions related to milk production, fat and protein, respectively. These genes are newly reported in the genetic association with milk traits of Holstein. Conclusion: This study complements a recent Holstein genome-wide association studies that identified other SNPs and genes as the most significant variants. These results will help to expand the knowledge of the polygenic nature of milk production in Holsteins.

DNA 연산을 이용한 기억 인출 시뮬레이션 (Memory retrieval with a DNA computing)

  • 김준식;이은석;노영균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.34-36
    • /
    • 2006
  • 본 연구는 특정 사물을 계속 접하면서 그 사물에 대한 기억 강도가 의식적 노력 없이도 점점 강화되는 암묵적 기억 인출과정 associative memory retrieval의 DNA 연산 가능성을 논한다. 예를 들어 한 표적 단어에 대한 노출이 이를 관찰하는 시스템에게 그 단어의 기억 강도를 강화시키는 반면, 그와 유사한 다른 단어는 천천히 감소되고 나머지 가장 다른 단어는 일찍 잊혀지는 현상을 생각할 수 있다. 이들 단어들과 알파벳 철자들을 DNA 염기서열로 표현하고 simulated annealing을 통하여 결합 결과를 얻는다. Ridge regression 형태의 supervised 학습을 통하여 한 가지 표적 단어가 많이 생성되도록 DNA 조각들의 개수 분포를 변화시켜 진행한다. 실험 예로 'tic' 'tac' 'toe' 세 가지 단어를 그 아이템으로 정하여 계속 자극받는 표적 단어의 갯수가 증가함을 DNA annealing 시뮬레이션을 통하여 확인할 수 있다. 또한 'tac' 과 't' 와 'c'를 공유하는 'tic' 의 감소 점도가 't'만을 공유하는 'toe' 보다 느림을 확인할 수 있다. 위의 실험들을 통해 연합기억associative memory의 암묵적 인출과정을 분자 층위에서 표현할 수 있음을 확인 할 수 있다.

  • PDF

Optimization of Tri-enzyme Extraction Procedures for the Microbiological Assay of Folate in Red Kidney Bean and Roasted Peanut Using Response Surface Methodology

  • Choi, Young-Min;Eitenmiller, Ronald R.;Kim, Seon-Hee;Lee, Jun-Soo
    • Food Science and Biotechnology
    • /
    • 제18권1호
    • /
    • pp.31-35
    • /
    • 2009
  • Total folate content was determined by microbiological assay using Lactobacillus casei spp. rhamnosis (ATCC 7469) with a 96-well microplate technique. Using roasted peanut and red kidney beans as representative legume samples, response surface methodology (RSM) was supplied to optimize the trienzyme procedures for the determination of folate in legumes. After response surface regression (RSREG), the second-order polynomial equation was fitted to the experimental data. Ridge analysis showed that the optimal digestion times were <2 hr for $Pronase^{(R)}$ and $\alpha$-amylase, and <5 hr for conjugase to obtain maximal folate values for legume samples. This study confirms that established digestion times for cereal products (AOAC Method 2004.05) of 3 for protease and 2 hr for $\alpha$-amylase are applicable to legumes. Conjugase treatment can be reduced to 5 from 16 hr and the conjugase level to 5 from 20 mg per sample, providing significant cost saving.

GIS와 로지스틱 회귀분석을 이용한 멧돼지 서식지 모형 개발 (Wild Boar (Sus scrofa corranus Heude ) Habitat Modeling Using GIS and Logistic Regression)

  • 서창완;박종화
    • Spatial Information Research
    • /
    • 제8권1호
    • /
    • pp.85-99
    • /
    • 2000
  • 보호동물사에 대한 서식지 분포정보는 개발압력이 심한 우리나라에서는 서식지 관리에 있어 매우 중요하다. 본 연구는 GIS와 로지스틱 회귀분석을 이용하여 멧돼지의 서식지 적합성모형을 개발하여 서식지 분포도를 작성하고 본 연구의 결과를 토대로 현재 우리나라의 멸종위기종과 야생동물보호종들의 서식지 관리를 위한 기초를 마련하고자한다. 서식지 모형을 구현하기 위한 연구내용 및 방법은 다음과 같다. 첫째, 멧돼지의 서식지 특성을 파악하기 위하여 GIS 자료를 구축하였다. 멧돼지의 위치파악을 위해 원격무선측정기법과 GPS를 이용하였다 둘째, 멧돼지의 서식지 이용과 유용성에 영향을 미치는 환경인자를 파악하기위해 원격무선측정기법과 GPS를 이용하였다. 둘째, 멧돼지의 서식지 이용과 유용성에 영향을 미치는 환경인자를 파악하기 위해 χ²검정(Chi-square test)을 실시하였다. 마지막으로, 최적 서식지의 분포를 예측하기위한 서식지 적합성모형 개발을 위해 로지스틱 회귀분석을 이용하였다. 본 연구의 결과는 다음과 같다. 첫째, 멧돼지의 서식지 이용특성 분석의 결과, 성별 그리고 활동유형별에서는 뚜렷한 차이를 볼 수 없으나, 계절별 그리고 서식지 유형별에서는 서식지 이용특성의 차이가 뚜렷한 것을 볼 수있었다. 둘째, 서식지 유용성 분석의 결과 멧돼지의 서식환경에 영향을 미치는 자연적인 환경요인으로 표고, 향, 임상 그리고 영급이 유의성이 있는 인자로 나타났다. 반면에, 경사, 능선/계곡 , 물 그리고 일사량의 경우 통계적 유의성이 적어 전반적으로 서식지를 결정하는 환경인자라고 볼 수 없었다. 마지막으로, 개발된 서식지 적합성모형의 결과 예측확률 0.5를 기준으로 전제서식지는 75.00%, 커버서식지는 84.26% 의 높은 분류정확도를 나타내었다. 모형검증의 결과 대상지 내부의 경우 전체서식지가 75.00%로 나타나 본 모형이 신뢰성이 있는 것으로 판단되었다.

  • PDF

황해 중동부 경기만의 후기 제4기 순차층서 연구 (Late Quaternary Sequence Stratigraphy in Kyeonggi Bay, Mid-eastern Yellow Sea)

  • 권이균
    • 한국지구과학회지
    • /
    • 제33권3호
    • /
    • pp.242-258
    • /
    • 2012
  • 황해 경기만은 제4기에 반복된 해침과 해퇴로 4개의 해침-해퇴 퇴적체(DS-1, DS-2, DS-3, DS-4)를 형성하였다. 본 연구는 황해 경기만 퇴적체의 형성을 6개 퇴적단계로 나누어 설명한다. A 단계는 MIS-6 저해수면 시기로서 큰 규모의 해수면 하강으로 인해 대부분의 지역이 대기에 노출되고 광범위한 하도 침식 및 풍화작용의 영향을 받았다. 이어지는 B 단계는 MIS-5e 까지 빠른 해수면 상승과정에서 MIS-5 시퀀스의 하부 해침퇴적체가 형성되었고, 다음에 이어지는 MIS-5d부터 MIS-4 저해수면 시기까지의 C 단계에서는 MIS-5 시퀀스의 상부인 해퇴퇴적체가 만들어졌다. 다음의 D 단계는 MIS-4 저해수면 시기부터 MIS-3c 고해수면 시기까지로 하도 침식 및 하도 충전 구조로 이루어진 MIS-3 해침 퇴적체가 형성되었다. 다음의 E 단계에서는 LGM 시기까지 계속적인 해수면 하강이 있었고 외해쪽에서는 천해 기원의 MIS-3 해퇴퇴적체가 만들어진 반면에, 내륙쪽에서는 노출된 환경에서 하도 충전 퇴적체나 범람원 퇴적체가 형성되었다. 마지막 단계인 F 단계는 황해 전체적으로 홀로세 해침이 발생하였고, 이 시기에 외해쪽에서는 대륙붕 사질 퇴적체와 조석사주 퇴적체가 형성되어 고해수면 시기인 현재까지 퇴적이 일어나고 있다.

Prediction of Postoperative Lung Function in Lung Cancer Patients Using Machine Learning Models

  • Oh Beom Kwon;Solji Han;Hwa Young Lee;Hye Seon Kang;Sung Kyoung Kim;Ju Sang Kim;Chan Kwon Park;Sang Haak Lee;Seung Joon Kim;Jin Woo Kim;Chang Dong Yeo
    • Tuberculosis and Respiratory Diseases
    • /
    • 제86권3호
    • /
    • pp.203-215
    • /
    • 2023
  • Background: Surgical resection is the standard treatment for early-stage lung cancer. Since postoperative lung function is related to mortality, predicted postoperative lung function is used to determine the treatment modality. The aim of this study was to evaluate the predictive performance of linear regression and machine learning models. Methods: We extracted data from the Clinical Data Warehouse and developed three sets: set I, the linear regression model; set II, machine learning models omitting the missing data: and set III, machine learning models imputing the missing data. Six machine learning models, the least absolute shrinkage and selection operator (LASSO), Ridge regression, ElasticNet, Random Forest, eXtreme gradient boosting (XGBoost), and the light gradient boosting machine (LightGBM) were implemented. The forced expiratory volume in 1 second measured 6 months after surgery was defined as the outcome. Five-fold cross-validation was performed for hyperparameter tuning of the machine learning models. The dataset was split into training and test datasets at a 70:30 ratio. Implementation was done after dataset splitting in set III. Predictive performance was evaluated by R2 and mean squared error (MSE) in the three sets. Results: A total of 1,487 patients were included in sets I and III and 896 patients were included in set II. In set I, the R2 value was 0.27 and in set II, LightGBM was the best model with the highest R2 value of 0.5 and the lowest MSE of 154.95. In set III, LightGBM was the best model with the highest R2 value of 0.56 and the lowest MSE of 174.07. Conclusion: The LightGBM model showed the best performance in predicting postoperative lung function.

침지조작에 의한 레스베라트롤 증가조건의 최적화 (Optimization for the Post-Harvest Induction of trans-Resveratrol by Soaking Treatment in Raw Peanuts)

  • 이선숙;서선정;이부용;이희봉;이준수
    • 한국식품영양과학회지
    • /
    • 제34권4호
    • /
    • pp.567-571
    • /
    • 2005
  • 레스베라트롤은 항암작용, 항혈전작용, 항산화작용 및 심혈관계질환의 발병을 낮추는작용이 있다고 보고되어 있다. 본 실험에서는 땅콩에 함유되어 있는 레스베라트롤의 함량을 증가시키기 위한 침지조건을 반응표면분석법을 이용하여 최적화하였다. 레스베라트롤의 함량에 영향을 미치는 요인으로는 침지 시 물의 양(농도), 침지시간 그리고 침지 후 건조시간을 검토하였으며, 실험결과 침지 시 물의 양(농도)은 $67.15\%$, 침지시간은 19.57 hr, 침지 후 건조시간은 65.56 hr으로 나타났다. 이 조건하에서 레스베라트롤은 $0.1\;{\mu}g/g$에서 $4.55\;{\mu}g/g$으로 약 45배 정도 증가함을 확인할 수 있었다. 레스베라트롤의 증가에 가장 큰 영향을 주는 요인으로는 침지시간이었으며 그 다음으로 침지 시 물의 양(농도)이 영향을 주었으며, 침지 후 건조시간은 별 영향을 주지 않았다. 본 실험의 이차 다항 회귀 곡선식에 대한 적합도를 결정 계수로 조사한 결과 높은 적합도를 나타내었으며, 분석 방법에 대한 검증에서도 그 결과가 우수하였다.

Boron-doped Diamond 전극을 이용한 Rhodamine B와 N, N-Dimethyl-4-nitrosoanilin의 전기화학적 분해에 반응표면분석법의 적용과 공정 최적화 (Application of the Response Surface Methodology and Process Optimization to the Electrochemical Degradation of Rhodamine B and N, N-Dimethyl-4-nitrosoanilin Using a Boron-doped Diamond Electrode)

  • 김동석;박영식
    • 한국환경보건학회지
    • /
    • 제36권4호
    • /
    • pp.313-322
    • /
    • 2010
  • The aim of this research was to apply experimental design methodology to optimization of conditions of electrochemical oxidation of Rhodamine B (RhB) and N, N-Dimethyl-4-nitrosoaniline (RNO, indicative of the OH radical). The reactions of electrochemical oxidation of RhB degradation were mathematically described as a function of the parameters of current ($X_1$), NaCl dosage ($X_2$) and pH ($X_3$) and modeled by the use of the central composite design. The application of response surface methodology (RSM) yielded the following regression equation, which is an empirical relationship between the removal efficiency of RhB and RNO and test variables in a coded unit: RhB removal efficiency (%) = $94.21+7.02X_1+10.94X_2-16.06X_3+3.70X_1X_3+9.05X_2X_3-{3.46X_1}^2-{4.67X_2}^2-{7.09X_3}^2$; RNO removal efficiency (%) = $54.78+13.33X_1+14.93X_2- 16.90X_3$. The model predictions agreed well with the experimentally observed result. Graphical response surface and contour plots were used to locate the optimum point. The estimated ridge of maximum response and optimal conditions for the RhB degradation using canonical analysis was 100.0%(current, 0.80 A; NaCl dosage, 2.97% and pH 6.37).

전기응집/부상 공정을 이용한 염료 처리에 중심합성설계와 반응표면분석법의 적용 (Application of the Central Composite Design and Response Surface Methodology to the Treatment of Dye using Electrocoagulation/flotation Process)

  • 김동석;박영식
    • 한국물환경학회지
    • /
    • 제26권1호
    • /
    • pp.35-43
    • /
    • 2010
  • This experimental design and response surface methodology (RSM) have been applied to the investigation of the electrocoagulation/flotation of dye wastewater. The electrocoagulation/flotation reactions were mathematically described as a function of parameters current (A), NaCl concentration (B), initial RhB concentration (C) and time (D) being modeled by use of the central composite design (CCD). The application of RSM using the CCD yielded the following regression equation, which is an empirical relationship between the RhB removal (%) and test variables in RhB removal (%) = $-300.42+129.21{\cdot}Current+46.99{\cdot}NaCl-0.11{\cdot}RhB-+43.71{\cdot}Time-5.67{\cdot}Current{\cdot}NaCl-3.18{\cdot}Current{\cdot}Time-2.41{\cdot}NaCl{\cdot}Time-19.79{\cdot}Current^2-2.27{\cdot}NaCl^2-1.59{\cdot}Time^2$. the model predictions agreed well with the experimentally observed result ($R^{2}=0.9728$). The estimated ridge of maximum response and optimal conditions for RhB removal (%) using canonical analysis was 99.4% (A: 1,77 A, NaCl concentration: 2.23 g/L, RhB concentration: 56.12 mg/L, Time: 9.98 min). To confirm this optimum condition, three additional experiments were performed and RhB removal (%) were within range of 86.87% (95% PI low)~111.93% (95% PI high) obtained.

전기-UV 복합 공정을 이용한 E. coli 소독 : 실험계획법중 박스-벤켄법을 이용한 소독 특성 및 최적화 (Disinfection of E. coli Using Electro-UV Complex Process: Disinfection Characteristics and Optimization by the Design of Experiment Based on the Box-Behnken Technique)

  • 김동석;박영식
    • 한국환경과학회지
    • /
    • 제19권7호
    • /
    • pp.889-900
    • /
    • 2010
  • The experimental design and response surface methodology (RSM) have been applied to the investigation of the electro-UV complex process for the disinfection of E. coli in the water. The disinfection reactions of electro-UV process were mathematically described as a function of parameters power ($X_1$), NaCl dosage ($X_2$), initial pH ($X_3$) and disinfection time ($X_4$) being modeled by use of the Box-Behnken technique. The application of RSM using the Box-Behnken technique yielded the following regression equation, which is an empirical relationship between the residual E. coli number and test variables in actual variables: Ln (CFU) = 23.57 - 0.87 power - 1.87 NaCl dosage - 2.13 pH - 2.84 time - 0.09 power time - 0.07 NaCl dosage pH + 0.14 pH time + 0.03 $power^2$ + 0.47 NaCl $dosage^2$ + 0.20 $pH^2$+ 0.33 $time^2$. The model predictions agreed well with the experimentally observed result ($R^2$ = 0.9987). Graphical response surface and contour plots were used to locate the optimum point. The estimated ridge of maximum response and optimal conditions for the E. coli disinfection using canonical analysis was Ln 1.06 CFU (power, 15.40 W; NaCl dosage, 1.95 g/L, pH, 5.94 and time, 4.67 min). To confirm this optimum condition, the obtained number of the residual E. coli after three additional experiments were Ln 1.05, 1.10 and Ln 1.12. These values were within range of 0.62 (95% PI low)~1.50 (95% PI high), which indicated that conforming the reproducibility of the model.