• 제목/요약/키워드: random data analysis

검색결과 1,721건 처리시간 0.028초

의사결정트리 프로그램 개발 및 갑상선유두암에서 질량분석법을 이용한 단백질 패턴 분석 (Development of Decision Tree Software and Protein Profiling using Surface Enhanced laser Desorption/lonization - Time of Flight - Mass Spectrometry (SELDI-TOF-MS) in Papillary Thyroid Cancer)

  • 윤준기;이준;안영실;박복남;윤석남
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제41권4호
    • /
    • pp.299-308
    • /
    • 2007
  • 본 연구의 목적은 의사결정트리를 생성하는 생물정보학 프로그램을 개발하고, 이를 갑상선유두암 혈청의 질량분석자료로 시험해 보는 것이다. 대상 및 방법: C4.5를 커스터마이징하여 의사결정트리 분석을 수행할 수 있는 'Protein analysis'라는 프로그램을 개발하였다 61개의 혈청시료(갑상선유두암 27, 자가면역성 갑상선염 17, 대조군 17)를 일정 기간 동안 순차적으로 냉동한 후 실온에서 일시에 해동하여 분석에 사용하였다. 모든 시료는 탈지질화 과정을 거쳐 준비한 후, 2종류의 단백질칩(CM10, IMAC3)에 각각 60개, 50개 시료를 적용하였다. 갑상선유두암의 특징적인 단백질 패턴을 찾기 위해 질량분석기를 이용하여 단백질칩을 분석했다. 'Protein analysis' 프로그램을 이용하여 단백질분포 자료로부터 의사결정트리를 작성하고, 생체표지자 후보물질을 검출하였다. CM10칩에서 발견된 생체표지자 후보물질을 무작위 표본추출 방법을 이용하여 검증하였다. 결과: 단백질분포 자료의 훈련과 검증이 가능한 의사결정트리 프로그램이 개발되었으며, 이 프로그램은 트리 구조와 노드 정보, 트리 구성 과정을 표시하는 3개의 창으로 구성되었다. CM10칩을 이용한 분석에서 총 113개의 단백질 피크 중 23개가 3그룹 간에 유의한 차이가 있었으며, IMAC3는 41개의 단백질 피크 중 8개가 3그룹 간에 유의한 차이가 있었다. 3그룹 분석에서 의사결정트리는 CM10칩과 IMAE3의 단백질분포 자료로부터 각각 60개와 50개의 시료를 높은 정확도로 분류하였으며(오차율 = 각각 3.3%, 2.0%), 각각 4개와 7개의 생체표지자 후보물질을 검출하였다. 암시료와 비암시료를 구분하는 2그룹 분석 에서, 의사결정트리는 모든 암시료를 정확히 구분하였으며(모두 오차율 = 0%), CM10칩을 이용한 분석에서는 단일 노드를 사용하고, IMAC3칩을 이용한 분석에서는 여러 개의 노드를 사용하였다. CM10칩의 단백질 분포자료를 5번의 무작위 추출에 의해 시행한 검증에서 암시료와 비암시료를 구분하는데 높은 정확도를 보였으나(정확도 = 98%, 54/55), 3그룹을 구분할 때는 중등도의 정확도를 보였다(정확도 = 65%, 36/55). 결론: 우리가 개발한 프로그램은 질량분석 자료로부터 성공적으로 의사결정트리를 생성하고, 생체표지자 후보물질을 검출할 수 있었다. 따라서 이 프로그램은 혈청 시료를 이용한 생체표지자 발굴 및 갑상선유두암의 추적관찰에 유용하게 사용될 수 있을 것이다.

메탄올의 이산화탄소 흡수평형 추산에 대한 PC-SAFT모델식과 Two-model approach 모델식의 비교연구 (Comparative Study on the Estimation of CO2 absorption Equilibrium in Methanol using PC-SAFT equation of state and Two-model approach.)

  • 노재현;박회경;김동선;조정호
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.136-152
    • /
    • 2017
  • 본 연구에서는 $CO_2$ 제거 용매로써 메탄올 수용액을 사용하는 $Rectisol^{(R)}$공정을 모델링하기 위한 열역학 모델식으로는 PC-SAFT(Perturebed-Chain Statistical Associating Fluid Theory) 상태방정식과 액체활동도계수 모델식을 기본으로 조합된 Two-model approach식{NRTL(Non Random Two Liquid) + Henry + Peng-Robinson}을 비교하였다. 또한 PC-SAFT 상태방정식의 이성분계 상호작용 매개변수와 Two-model approach식의 Henry 상수를 새롭게 결정하기 위해서 273.25K과 262.35K에서 $CO_2$와 메탄올 간의 흡수평형실험을 수행하고 회귀분석을 하였다. 그리고 새롭게 결정한 매개변수의 정확성은 실험 데이터의 추산결과를 통해 검증하였다. 이러한 모델식과 검증한 매개변수를 사용하여 $CO_2$ 제거공정을 모델링 하였다. 그 결과 Two-model approach식을 사용한 경우가 PC-SAFT EOS을 사용한 경우에 비해 $CO_2$ 99.00% 제거하기 위해 요구되는 메탄올 용매 유량이 약 43.72% 더 높게 추산되었으며, 증류탑에서의 냉각수 소모량은 39.22%정도, 스팀소모량은 43.09%정도 더 소요됨을 알 수 있었다. 결론적으로 고압에서 운전되는 $Rectisol^{(R)}$ 공정을 Henry관계식의 도움을 받는 액체활동도계수 모델식을 사용하여 모델링을 하는 경우 PC-SAFT 상태방정식을 사용한 경우에 비해서 크게 설계된 다는 것을 알 수 있었다. 이러한 이유는 액상에 대한 용해도가 낮은 가스성분이 일정한 온도에서 액상에 녹아드는 양은 기상의 분압에 비례하여 증가하는 것으로 계산되는 Henry 관계식의 특성 때문에 메탄올에 대해 용해도가 큰 $CO_2$의 경우 메탄올과 $CO_2$간의 흡수특성을 잘 예측하지 못하는 것을 알 수 있었다.

종분포모형을 이용한 참매의 서식지 예측 -충청북도를 대상으로- (Predicting the Goshawk's habitat area using Species Distribution Modeling: Case Study area Chungcheongbuk-do, South Korea)

  • 조해진;김달호;신만석;강태한;이명우
    • 한국환경생태학회지
    • /
    • 제29권3호
    • /
    • pp.333-343
    • /
    • 2015
  • 본 연구는 국내에서 아직 미흡한 조류 번식지 예측 모형을 이용해 참매의 서식지 예측 및 대체번식지로서 이용 가능한 지역을 선정하고, 향후 참매 번식 가능지역을 대상으로 보호관리 지역을 확대할 수 있는 근거를 제시하기 위한 방안이다. 참매의 번식지는 현장조사에서 확인된 둥지(N=10)를 이용하였으며, 출현지점은 제3차자연환경조사를 통해 확인된 참매출현지점(N=23)을 활용해 분석하였다. 모형변수로는 지형인자 4가지, 자연환경인자(식생) 3가지, 거리인자 7가지, 기후변수 9가지를 활용하였다. 활용변수 중 Random sampling을 통해 확보된 비출현 좌표와 출현좌표간 비모수 검증을 통해 최종 환경변수를 선정하였다. 유의성 검증을 통해 선택된 변수는 번식지 대상 10가지, 출현지점 대상 7가지였으며, 이 변수를 활용해 최종 서식지 예측 모형(MaxEnt)을 구축하였다. 모델 구축결과 번식에 활용된 각 변수별 모형 기여도는 온도의 계절적 변동, 혼효림 과의 거리, 입목밀도, 경급의 순이었으며, 출현지점에 활용된 각 변수별 모형 기여도는 온도의 계절적 변동, 수계와의 거리, 경작지와의 거리, 경사도의 순이었다. 번식지점을 대상으로 한 모델링은 기후환경과 숲 내부에서 번식하는 참매의 특성이 반영된 것으로 판단된다. 예상서식지는 충청북도 중부 이북지역으로 예상되었으며, 그 면적은 $189.5km^2$(2.55%)였다. 충북 이남지역은 청주와 충주 등의 비교적 큰 도시가 발달되어 있는 반면 충청북도 북부지역의 경우 산림과 경작지가 고루 발달되어 있어 번식에 있어 일정한 세력권과 먹이원이 필요한 참매로서는 번식에 유리한 지역일 것으로 판단된다. 출현지점 대상으로 한 모델링은 면적이 $3,071km^2$(41.38%)으로 확인되었으며, 이는 출현지점을 대상으로 하여 단순이동 관찰 및 계절적인 변동 미고려 등의 한계가 있기 때문에 번식지점을 대상으로 한 모델링보다 광범위한 서식예상지역을 예측하였다. 결과에서 확인된 예측지점은 번식지를 대상으로 하였을 경우 정밀한 서식예측이 가능하나, 둥지의 특성상 확인되는 지점이 적고, 참매의 행동영역을 반영하지 못하는 단점이 있다. 반면 출현지점을 대상으로 하였을 경우 더 광범위한 지점에 대한 결과 도출이 가능하였으나, 단순 이동이나 지속적인 이용실태를 반영하지 못하기 때문에 정밀도에서는 다소 떨어진다고 할 수 있다. 다만 이러한 결과들을 통해 참매의 서식지를 예측할 수 있으며, 특히 정밀한 번식지역의 예측자료는 환경영향평가나 개발계획 수립시 서식지 모형 결과를 도입하여 반영할 필요성이 있다.

머신러닝 기법의 산림 총일차생산성 예측 모델 비교 (Predicting Forest Gross Primary Production Using Machine Learning Algorithms)

  • 이보라;장근창;김은숙;강민석;천정화;임종환
    • 한국농림기상학회지
    • /
    • 제21권1호
    • /
    • pp.29-41
    • /
    • 2019
  • 산림생태계에서 총일차생산성(Gross Primary Production, GPP)은 기후변화에 따른 산림의 생산성과 그에 영향을 미치는 식물계절, 건강성, 탄소 순환 등을 대표하는 지표이다. 총일차생산성을 추정하기 위해서는 에디공분산 타워 자료나 위성영상관측자료를 이용하기도 하고 물리지형적 한계나 기후변화 등을 고려하기 위해 기작기반모델링을 활용하기도 한다. 그러나 총일차생산성을 포함한 산림 탄소 순환의 기작기반 모델링은 식물의 생물, 생리, 화학적 기작들의 반응과 지형, 기후 및 시간 등과 같은 환경 조건들이 복잡하게 얽혀 있어 비선형적이고 유연성이 떨어져 반응에 영향을 주는 조건들을 모두 적용하기가 어렵다. 본 연구에서는 산림 생산성 추정 모델을 에디공분산 자료와 인공위성영상 정보를 사용하여 기계학습 알고리즘을 사용한 모델들로 구축해 보고 그 사용 및 확장 가능성을 검토해 보고자 하였다. 설명변수들로는 에디공분산자료와 인공위성자료에서 나온 대기기상인자들을 사용하였고 검증자료로 에디공분산 타워에서 관측된 총일차생산성을 사용하였다. 산림생산성 추정 모델은 1) 에디공분산 관측 기온($T_{air}$), 태양복사($R_d$), 상대습도(RH), 강수(PPT), 증발산(ET) 자료, 2) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD 자료(개량식생지수 제외), 3) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD, 개량식생지수(EVI) 자료를 사용하는 세 가지 경우로 나누어 구축하여 2006 - 2013년 자료로 훈련시키고 2014, 2015년 자료로 검증하였다. 기계학습 알고리즘은 support vector machine (SVM), random forest (RF), artificial neural network (ANN)를 사용하였고 단순 비교를 위해 고전적 방법인 multiple linear regression model (LM)을 사용하였다. 그 결과, 에디공분산 입력자료로 훈련시킨 모델의 예측력은 피어슨 상관계수 0.89 - 0.92 (MSE = 1.24 - 1.62), MODIS 입력자료로 훈련시킨 모델의 예측력은 개량식생지수 제외된 모델은 0.82 - 0.86 (MSE = 1.99 - 2.45), 개량식생지수가 포함된 모델은 0.92 - 0.93(MSE = 1.00 - 1.24)을 보였다. 이러한 결과는 산림총일차생산성 추정 모델 구축에 있어 MODIS인공위성 영상 정보 기반으로 기계학습 알고리즘을 사용하는 것에 대한 높은 활용가능성을 보여주었다.

페널 데이터모형을 적용한 소매업 매출액 결정요인 추정에 관한 연구 (Estimating the Determinants for the Sales of Retail Trade:A Panel Data Model Approach)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제8권3호
    • /
    • pp.83-92
    • /
    • 2008
  • 소매업 매출액는 그룹(소매업)별, 시간별로 다양한 원인에 의해서 매출액 결정이 이루어지고 있어 복잡성을 띠고 있다. 본 연구에서는 복잡성을 띠고 있는 소매업 매출액의 제 변인들을 파악하기 위해 패널 데이터를 이용한 연구 모형을 설정하고 이를 통해 소매업 매출액에 결정적으로 영향을 미치는 제 변인에 대하여 조사, 분석, 검증한다. 본 연구는 7 그룹(백화점, 대형마트, 슈퍼마켓, 편의점, 기타종합소매점, 무점포판매점, 사이버쇼핑몰, 기타무점포판매점, 전문상품소매점)을 분석대상으로 하였다. 분석기간은 2005년 1월부터 2007년 12월 까지의 자료를 이용하였고. 소매업 판매액을 종속변수로 설정하고 종합주가지수, 사이버쇼핑몰 사업체수, 동행(경기)종합지수, 아파트매매가격지수, 고용률, 평균가동률, 소비자물가 지수를 변수로 투입하였다. 소매업 결정요인을 추정한 결과 동행(경기)종합지수와 아파트매매가격지수, 고용률, 제조업 평균가동률의 계수값이 각각 유의적인 정(+)의 영향을 미치는 것으로 나타나고 소비자물가지수는 부(-)의 영향을 미치는 것으로 나타났다. 종합주가지수와 사이버 쇼핑몰 사업체수는 매출액에 큰 영향으로 주지는 않은 것으로 나타났다.

  • PDF

국내산 돼지고기의 원산지 검증을 위한 SNP Marker Set 개발 (Development of SNP Markers for Domestic Pork Traceability)

  • 김상욱;이소평;이윤미;김종주;김태헌;최봉환;김관석
    • Journal of Animal Science and Technology
    • /
    • 제52권2호
    • /
    • pp.91-96
    • /
    • 2010
  • 본 연구는 돼지고기 원산지 식별에 활용될 수 있는 최적의 SNP marker set을 개발 및 확립하기 위해 수행되었다. 선발된 51개의 SNP marker들의 효율성, 다형성 및 독립성 검증을 실시하였으며 51개의 SNP marker set은 MassARRAY method에 의해서 Multiplex-PCR panel 4개로 디자인 되었으며, 농장별, 생산조합별, 모돈별, 웅돈별로 효과적으로 고유 유전자형 지문분석이 가능하게 제작되었고, 다른형태의 SNP 유전자형 분석 플랫폼에 적용될 수 있는 적절한 마커 갯수이다. 또한 51개의 SNP marker set을 적용하여 모의 실험 및 친자감별확율을 계산하였을 때 무작위 교배 집단(PI), 반형매 교배집단($PI_{half-sib}$)과 전형매 교배집단($PI_{sibs}$)을 통해 모의 실험을 한 결과 $5.63{\times}10^{-33}$, $4.35{\times}10^{-15}$ 그리고 $1.32{\times}10^{-15}$로 분석되었으며 친자확인률에서도 모두 100%에 가까운 확률값을 나타내었다. 따라서 본 연구에서 개발된 SNP marker set을 이용하여 돈육제품의 원산지를 추적에 이용한다면 개별돼지의 고유한 DNA 지문 정보를 생성할 뿐만 아니라, 이를 통하여 모돈과 웅돈을 식별하여 농장원산지를 확인이 가능 할 수 있을 것으로 사료된다. 따라서 국내산 돼지의 생산에서부터 돈육제품으로의 소비까지 이력추적이 가능한 도구로 제공 될 것이다.

3차원 수치지도 정확도 검증을 위한 GPS 기반 기준점 오차의 영향 분석 (Analysis of the GPS-derived Control Point Errors for Quality Assurance of 3D Digital Maps)

  • 배태석;이동천
    • 한국측량학회지
    • /
    • 제28권1호
    • /
    • pp.153-160
    • /
    • 2010
  • 향후 구축될 3차원 수치지도의 정확도 검증을 위해서는 기준점 또는 검사점 역할을 할 수 있는 건물 모서리와 같은 대상점에 대한 정확한 3차원 좌표값이 반드시 필요하다. 건물 모서리 점에 대한 좌표는 GPS를 이용하여 결정한 지상기준점으로부터 거리 또는 각을 이용한 지상측량의 방법으로 결정할 수 있는데, 지상기준점의 오차는 지상측량을 통해서 최종적으로 건물 모서리좌표에 영향을 미치므로 이는 반드시 고려되어야 한다. 본 연구에서는 GPS 등으로 결정한 지상기준정의 오차정보가 지상측량을 통해 최종적인 미지수인 건물 모서리 점의 추정값에 미치는 영향에 대해서 수학적으로 분석하고 시뮬레이션 데이터틀 통해 수치적으로 테스트 했다. 지상기준점의 오차는 수평방향 1-4cm 수직방향 2-8cm에 대해서 각각 테스트 했으며 GPS 위치결정의 특성상 수칙방향의 오차가 수평방향의 오차의 두 배가 되도록 했다. 위치결정을 위한 지상측량 방법은 거리측량을 기준으로 테스트했으며, 추정된 건물 모서리점의 정밀도는 지상기준점의 오차에 거의 선형적으로 비례함을 알 수 있었다. 또한 건물 모서리 점의 최종 추정좌표는 관측장비의 정밀도에 따라 부여한 랜덤오차에 따라 달라지지만 추정 정밀도는 거의 일정함을 알 수 있었다.

치과위생사 업무에 따른 임상실습 만족도 연구 (A Study on the Satisfaction of Clinical Training According to Dental Hygienist Duties)

  • 박일순;이선희
    • 치위생과학회지
    • /
    • 제7권4호
    • /
    • pp.295-302
    • /
    • 2007
  • 본 연구는 치위생과 학생들의 임상실습에 대한 만족도와 주요 업무에 대한 만족도를 구체적으로 조사분석함으로써 보다 효율적인 임상실습 교육을 위한 기초자료로 활용하기 위하여 이루어졌다. 본 연구는 임상실습과정을 경험한 치위생과 23학년 재학생 427명을 대상으로 설문조사한 자료를 SPSS(Statistical Package for the Social Science) WIN 11.5로 분석하였고 t-검정, One-way ANOVA 그리고 ${\chi}^2$-검정을 실시하여 다음과 같은 결론을 얻었다. 임상실습 만족도는 3.34로 보통정도인 것으로 나타났으며, 실습내용에 대한 만족도와 임상실습 경험에 대한 업무별 만족도 역시 보통정도인 것으로 나타났다. 그리고 실습 내용의 전문성에 대한 만족도 중 실습 내용이 단순한 보조 업무라고 인식하는 학생이 44.9%로 높게 나타났다. 임상실습 기간에 대한 만족도는 비교적 적당하다고 인식하는 학생이 60%로 높게 나타났으며, 치과위생사 역할에 대한 만족도는 3.48로 높게 나타났다. 임상실습 만족도를 높이기 위하여 의료기관은 실습생들에게 단순 보조역할만 요구할 것이 아니라 학습한 이론을 실습현장에서 효과적으로 적용할 수 있도록 실습 환경을 조성해야 한다. 뿐만 아니라 교육기관과의 협조 하에 치과위생사의 업무분야를 구분한 체계적인 지도가 이루어지도록 하여 학생들이 임상실습을 통하여 실질적으로 임상에 대한 지식과 업무에 대한 자신감을 획득할 수 있도록 하여야 한다.

  • PDF

소비자 성별(消費者 性別)에 따른 의류제품(衣類製品) 쇼윈도우 디스플레이 유형(類型)에 대한 태도 요인(態度 要因) (Factors that affect consumer attitude by the types of show-window display and the difference by the gender of consumer)

  • 권혜숙;신은경
    • 패션비즈니스
    • /
    • 제10권5호
    • /
    • pp.93-104
    • /
    • 2006
  • The main purpose of this research is to examine what are the factors that affect consumer attitude by the types of clothing window display, and find if there is any difference by gender of consumer group. Total 357 data from random sample of 347 adults(156 male and 191 female) who were between 19 to 49 years of age were analyzed. Sources for the sample were companies and apartment complexes and several colleges in Seoul and Chonan to diversify by such demographics as age and social status. Factors were measured by respondents' rating of 9 statements using a 5-point Likert-type scale. SPSS(Statistical Package for Social Science) Version 10.0, is used for factor analysis in order to comprehend the factors of consumer attitude and Cronbauch's ${\alpha}$ in order to measure the credibility of questions in each factor. The main findings are as follows: First, three dimensions of consumer attitude to two types of window-display of product centered display and image centered display were identified as interest, information, and impression and theses are same to both male and female consumer group. Second, for both male and female consumer group, three dimensions of consumer attitude toward two types of window-display were same, however, included sub categories in each dimension showed a little difference. In product centered display, both male and female consumer group showed high interest in the sub categories of 'fashion' and 'informations related to the product' and they were considered same factor. Otherwise, In image centered display, two sub categories of 'having some interests in the display' and 'recognize the display that projects the image or impression of clothing well' were showed high relationship each other and they were also considered same factor. Third, Cronbauch's ${\alpha}$ of three dimensions of consumer attitude demonstrated high credibility from 0.75 to 0.91. Mean score of subcategories of attitudes toward the type of display by the gender of consumer showed high scores of 'interest' and 'impression' categories in image centered display and showed high scores of 'information' category in product centered display for both gender.

대학생의 건강교육 경험 및 요구 (Experience of and Needs for Health Education in University Students)

  • 김정희;송미령;김고은;김소희;김수미;박수정;박진아;안혜숙;이정모
    • 한국보건간호학회지
    • /
    • 제11권1호
    • /
    • pp.66-81
    • /
    • 1997
  • This study examined the experience of health education and assessed the needs for health education in the students attending a university located in Inchon. The primary subjects were 749. who were selected from each college by using systematic random sampling. Of these students. 457 subjects responded to the self-reported questionnaire. revealing the response rate of $61.01\%$. As for the analysis of the data. percentages. chi-square test. and correlation and regression analyses were adopted. The experience rate of health education was 39.02% and the rate was higher in women than in men. The students experienced the education about smoking and first-aid most frequently. whereas they experienced stress management much less frequently. Stress management was given the highest priority among the subjects of health education which they proposed to need. Physical health states of the students were better than their mental health states. The women tended to eat meals irregularly compared to men. Those students living not with their family nor with their relatives were more likely to eat meals twice a day compared to those who live at their homes. Those who recognized the need for health education showed the willingness to join health education to be given. The willingness was, also observed in those who had better self-evaluated mental health. regardless of the recognition of the need for health education. These findings revealed both objective and subjective needs for educating management of mental health. Education on healthy eating habit should be given particularly to woman students and those who do not live with family nor with relatives. When educating for the management of mental health. there should be strategies to facilitate the participation of the students who do not have good mental health.

  • PDF