• 제목/요약/키워드: Statistical prediction

검색결과 1,553건 처리시간 0.035초

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

소아 신장질환에서 요 β2-microglobulin검사의 분석 (Analysis of urine β2-microglobulin in pediatric renal disease)

  • 김동운;임인석
    • Clinical and Experimental Pediatrics
    • /
    • 제50권4호
    • /
    • pp.369-375
    • /
    • 2007
  • 목 적 : 각 소아 신장 질환에서 요 ${\beta}_2$-M 검사 결과를 비교해 보고, 일차성 신증후군에서 ${\beta}_2$-M 수치와 스테로이드를 사용한 기간과의 상관관계를 확인하고, 신세뇨관 손상을 반영하는 요 ${\beta}_2$-M과 신기능의 보편적 지표인 BUN, Ccr을 비교하여 신기능의 지표로 ${\beta}_2$-M이 유용한 지를 보았다. 방 법 : 2003년 1월부터 2006년 1월까지 중앙대학교 용산병원에 내원하여 24시간 소변검사를 시행 받고 ${\beta}_2$-M 검사를 시행 받은 혈뇨, 부종, 단백뇨 등의 증상이 있는 0-4세 사이의 환아 102명의 신장질환자와 같은 연령대의 대조군 22명을 대상으로 하여 후향적인 자료분석을 하였다. 각 신장 질환을 구분하여 독립변수로 삼았다. 각 신장 질환의 요 ${\beta}_2$-M 검사치를 종속변수로 삼아 독립표본 T검정을 이용하여 통계적 차이를 검증하였다. 또한 일차성 신증후군에서 ${\beta}_2$-M 수치가 의미 있게 높았던 군(양성)과 낮은 군을 구분하여(기준=$150{\mu}g/g-Cr$), 소변에서 단백뇨가 호전되어 퇴원하기까지의 치료기간을 비교하였다. 결 과 : 신장 질환자 102명 중 신증후군이 52명(MCNS(n=45, $72{\pm}45{\mu}g/g-Cr$), MPGN(n=3, $154{\pm}415{\mu}g/g-Cr$), FSGS(n=4, 1$188{\pm}046{\mu}g/g-Cr$), APSGN은 6명($93{\pm}404{\mu}g/g-Cr$), IgA 신병증은 7명($3414{\pm}106{\mu}g/g-Cr$), 급성 신우신염은 9명($742{\pm}160{\mu}g/g-Cr$), 방광염은 16명($179{\pm}168{\mu}g/g-Cr$), 그리고 HSPN은 12명($109{\pm}898{\mu}g/g-Cr$)으로 신증후군 환자가 65%로 가장 많았다. 그 중 IgA 신병증 과 급성 신우신염이 다른 군과 비교하여 24시간 요 ${\beta}_2$-M이 유의하게 높았다(P<0.05). 일차성 신증후군환자의 ${\beta}_2$-M 검사상 높은 군이 낮은 군과 비교하여 유의하게 치료기간이 길었으나(P<0.05), 각 신장질환에서 신기능 지표인 Ccr과 BUN, Cr 등은 24시간 요 ${\beta}_2$-M 과 유의한 차이가 없었다(P>0.05). 결 론 : 각 신장 질환의 24시간 요 ${\beta}_2$-M 수치를 조사한 결과 IgA nephropathy와 급성신우염이 다른 신질환 군과 비교하여 24시간 요 ${\beta}_2$-M 값이 유의하게 높았다. ${\beta}_2$-M 수치는 전반적인 신기능의 지표와 조직병리소견의 예측인자로써는 부적합하나, 상부 하부 요로감염의 감별과 신증후군 환자의 치료기간을 예측하는 데는 유용해 보였다.

유우의 번식과정에 따른 유즙중의 성호르몬 수준 변화에 관한 연구 (Studies on the Changes of Sex Hormone Concentrations in Milk during the Reproductive Stages of Dairy Cows)

  • 김상근;이재근
    • 한국가축번식학회지
    • /
    • 제9권1호
    • /
    • pp.9-30
    • /
    • 1985
  • The study was carried out to find out the changes of the sex hormone levels in the milk of Holstein cows during the reproductive stages such as the estrous cycle, pregnancy and periparturient period. The FSH, LH, estradiol-17$\beta$ and progesterone from the milk samples were assayed by radioimmunoassay methods. The results of this study were summarized as follows: 1. The levels of progesterone and estradiol-17$\beta$ were similar among inter-quarters, but they were higher in after milking than before milking times, with no statistical significance. 2. The milk progesterone levels during the estrous cycles reached a peak mean level of 3.55$\pm$0.26ng/$m\ell$ at 15 days after estrus and they did not show any differences among the length of estrous cycles. The estradiol-17$\beta$ levels during the estrous cycles showed a peak level of 36.40$\pm$2.38pg/$m\ell$ at estrus, and decreased(17.20$\pm$0.46 pg/$m\ell$ to 18.65$\pm$1.26pg/$m\ell$) at luteal phase. 3. The FSH levels during the estrous cycles ranged from 2.25$\pm$0.23mIU/$m\ell$ to 4.35$\pm$0.24mIU/$m\ell$ showing significant changes. The LH levels during the estrous cycles gradually increased and remained a peak level of 10.90$\pm$0.36mIU/$m\ell$ from 20 to 25 days after estrus. 4. The progesterone levels during the pregnancy were decreased from 30 to 60 days after artificial insemination, and therafter continuously increased until 240 days. The estradiol-17$\beta$ levels during the pregnancy were 24.56$\pm$1.19pg/$m\ell$ at day 30 after artificial inseminaton, and increased rapidly until 180 days. The levles were agagin decreased by 26.17$\pm$3.03pg/$m\ell$ until 210 days and markedly increased by 68.00$\pm$8.70pg/$m\ell$ until 240 days. 5. The prolactin levels during the pregnancy were 31.27$\pm$2.31ng/$m\ell$ and 42.60$\pm$2.37ng/$m\ell$ at day 150 and 240 after artificial insemination respectively. The LH levels during the pregnancy reached a peak of 27.47$\pm$7.90mIU/$m\ell$ at day 30 after artificial insemination, and thereafter gradually decreased. 6. The progesterone levels during the periparturient period reached a peak of 4.61$\pm$0.34ng/$m\ell$ at day 3 prepartum, and thereafter gradually decreased, and showed 2.05$\pm$0.60ng/$m\ell$ at day 7 postpartum. The estradiol-17$\beta$ levels during the periparturient period showed high level from 207.23$\pm$6.04pg/$m\ell$ at day 1 prepartum to 239.90$\pm$13.90pg/$m\ell$ at day 2 prepartum, and thereafter began to decline and reached 51.87$\pm$1.72pg/$m\ell$ at by 7 postpartum. 7. The prolactin levels during the periparturient period showed relatively higher level at the time of parturition. The LH levels during the periparturient period rnage from 6.32$\pm$0.32mIU/$m\ell$ to 13.90$\pm$1.37mIU/$m\ell$ showing significant changes. 8. The progesterone levels(4.6$\pm$0.8ng/$m\ell$) of the pregnant cows were significantly higher than those (1.84$\pm$1.4ng/$m\ell$) of nonpregnant cows. The cows of artificial insemination from 61 to 90 days after parturition showed higher progesterone levels. 9. During 20 to 25 days after artificial insemination, the accuracy of pregnancy diagnosis from milk progesterone levels were 94.4% for nonpregnant cows(<2.3ng/$m\ell$), and 75.0% for pregnant cows( 3.2ng/$m\ell$). The average overall accuracy of pregnancy prediction for nonpregnant and pregnant cows 83.3% 10. The results obtained this study suggest that the understanding of the endocrinological mechanisms by means of milk hormone analysis during the estrous cycle, pregnancy and parturition would give the basic information needed for increasing efficiency of reproduction. This study would not only provide an accurate method of the early pregnancy diagnosis by milk progesterone levels but also contribute to the research of providing the method of detecting of FSH levels in milk, which was difficult in blood serum.

  • PDF

한 대학병원에서 철야 수면다원검사를 시행한 환자들의 수면설문조사 결과 분석 (Analysis of Sleep Questionnaires of Patients who Performed Overnight Polysomnography at the University Hospital)

  • 강지호;이상학;권순석;김영균;김관형;송정섭;박성학;문화식;박용문
    • Tuberculosis and Respiratory Diseases
    • /
    • 제60권1호
    • /
    • pp.76-82
    • /
    • 2006
  • 연구배경 : 수면설문조사가 환자의 수면과 관련된 문제점을 파악하고 수면다원검사의 시행을 필요로 하는 환자를 선별하는 검사로써 임상적 유용성이 있는지 여부를 알아보고자 하였다 방 법 : 가톨릭대학교 성바오로병원 수면장애 클리닉에 의뢰되어 수면다원검사와 수면설문조사를 시행한 환자 를 대상으로, 수면설문조사에 포함되어 있는 환자의 일반적 특성, 병력, 수면-각성주기 동안의 행동, 코골이, 수면과 관련된 호흡장애 및 주간 졸음증과 관계된 증상 등 각각의 항목과 수면다원검사의 각 지표를 비교 분석하였다. 결 과 : 전체 환자수는 1081명으로 남자 849명, 여자 232명이었고 나이는 $44.2{\pm}12.8$세였다. AHI<5인 군은 38 .9%, $5{\leq}AHI<20$는 27.9%, $20{\leq}AHI<40$는 13.2% 그리고$AHI{\geq}40$는 20.0%였다. 검사를 시행하게 된 주된 동기는 코골이(91.7%), 무호흡(74.5%), 주간 졸음증(8.0%), 불면증(4.3%), 이갈이(1.1%), 집중력 장애(0.5%)였다. 수면 중 깨는 횟수는 평균 1.6회 였으며 그 이유는 소변을 보기 위함이 46.3%로 가장 많았다. Epworth Sleepiness Scale과 무호흡-저호흡지수(AHI)는 상관관계가 있었다(r=0.209, p<0.01). 수면설문 조사 항목 중 코골이, 주간 졸음증, 수면 후 각성 상태의 중증도에 따른 각 군간의 평균 AHI는 통계적으로 유의한 차이를 보였다. 결 론 : 수면설문조사에서 나타나는 ESS, 코골이, 주간 졸음증이나 수면 후 각성 상태 등 주관적 임상증상의 중증도는 수면다원검사 결과의 수면 무호흡의 중증도와 유의한 상관관계가 있음을 관찰할 수 있었다. 따라서 수면설문조사는 환자의 수면장애 특히 수면과 관련된 호흡장애의 정도를 예측하는데 유용하게 이용될 수 있을 것으로 생각한다.

비정상성 분위사상법을 이용한 GCM 장기예측 편차보정 (Bias Correction for GCM Long-term Prediction using Nonstationary Quantile Mapping)

  • 문수진;김정중;강부식
    • 한국수자원학회논문집
    • /
    • 제46권8호
    • /
    • pp.833-842
    • /
    • 2013
  • 분위사상법(QM, Quantile Mapping)은GCM(Global Climate Model) 자료의 계통적 오차를 보정하여 보다 신뢰성 높은 자료로 재생성하기 위해 활용되고 있다. 이 기법은 사상(mapping)시키려는 대상(object) 자료의 통계분포모수가 정상적(stationarity)이라는 가정 하에 대상 자료의 누적확률분포(CDF, Cumulative Distribution Function)를 목표(target) CDF에 통계적으로 투영시키는 것이 일반적이다. 따라서 GCM에서 제공되는 미래 기후시나리오의 강우시계열과 같이 비정상성(non-stationarity)을 갖는 장기 시계열자료에 대한 적용에는 문제점을 보이고 있다. 본 연구에서는 비정상성을 갖는 장기시계열자료의 오차보정을 위해 통계분포모수에 경향성을 부여하는 비정상성 분위사상법(NSQM, Nonstationary Quantile Mapping)을 적용하였다. NSQM 적용을 위한 확률분포로 수문분야에서 광범위하게 쓰이고 있는Gamma 분포를 선정하였으며, 대상 시나리오는 CCCma (Canadian Centre for Climate modeling and analysis)에서 제공하고 있는 CGCM3.1/T63모형의 20C3M(reference scenario)과 SRES A2 시나리오(projection scenario)를 활용하였다. 한강유역 내 관측기간이 충분한 10개의 지상관측소로부터 강우량을 수집하였다. 또한 6월과 10월사이에 연 강수량의 65% 이상이 집중되는 한반도의 계절성을 반영하기 위해 홍수기(6~10월)와 비홍수기(11~5월)를 구분하였고, 기준기간(Baseline)은 1973~2000년, 전망기간(Projection)은 2011~2100년으로 구분하였다. 다양한 목표분포의 설정을 통하여 NSQM의 적용성을 평가하고자 하였으며, 전망기간은 FF시나리오(Foreseeable Future Scenario, 2011~2040년), MF시나리오(Mid-term Future Scenario, 2041~2070년), LF시나리오(Long-term Future Scenario, 2071~2100년)의 3개의 구간으로 설정하여 기준기간과 전망기간의 연평균 강우량에 대한 경향성분석을 실시하였다. 그 결과NSQM이 FF시나리오에서 330.1mm(25.2%), MF시나리오에서 564.5mm(43.1%), LF시나리오에서 634.3mm(48.5%)로 증가하는 전망결과를 나타내고 있었다. 정상성기법을 적용한 결과, 전망기간 중 전체적으로는 동일한 평균값을 갖는 목표통계모수를 사용한다고 하여도, 전망전반부에서 과다하고, 후반부에서 오히려 과소한 전망을 보여주고 있었다. 이러한 결과는 비정상성기법을 사용함으로써 상당부분 개선될 수 있음을 확인하였다.

휴리스틱 함수를 이용한 feature selection에 관한 연구 (Research about feature selection that use heuristic function)

  • 홍석미;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.281-286
    • /
    • 2003
  • 실생활에서 해결하고자 하는 문제에 대해 수많은 feature들이 수집되어지나 그 feature들을 모두 문제 해결에 활용하는 것은 어렵다. 모든 feature들에 대한 정확한 자료의 수집이 어려우며 관련된 feature들을 모두 학습에 이용할 경우 복잡한 학습 모델이 생성되어지며 좋은 수행 결과도 얻을 수 없다. 또한 수집된 자료들 간에는 상호 관계나 계층적 관계가 존재하는데, 경험적 지식이나 통계적 방법을 이용하여 feature들간의 관계를 분석함으로써 feature의 수를 줄일 수 있다. 휴리스틱 기법은 반복적인 시행 착오와 경험을 통한 학습으로써 미래가 불확실하고 완전한 정보를 갖고 있지 못할 때, 인간의 사고 기능을 통하여 기억이나 경험을 살려, 스스로 해결방안을 모색하면서 점차로 해에 접근해 가는 방법이다. 전문가들은 경험에 의한 의견 수렴 과정을 거쳐 해당 문제 영역에 접근 가능하며, 이러한 특성을 학습에 사용될 feature의 수를 줄이는데 활용할 수 있다. 전문가들은 원시 자료들을 이용하여 새로운 feature들을 생성할 수 있다 새로이 산출된 feature들과 원시 데이터 내의 feature들을 혼합하여 학습 모델 생성에 이용한다. 본 논문에서는 휴리스틱 함수를 이용하여 학습에 사용될 feature의 수를 줄이고, 추출된 feature들을 신경망의 입력값으로 사용하는 기계 학습 모델을 제시한다. 모델의 성능 평가를 위해 프로야구 경기의 승패 예측 문제를 이용하였다. 실험 결과는 신경 회로망과 휴리스틱 모델을 단독으로 사용했을 때 보다 두 기법을 혼합한 모델이 신경 회로망의 복잡성을 감소시킬 뿐 아니라 분류(classification)의 정확성이 향상되었다.아니라 Hep G2 세포에서도 명백히 단백질의 발현을 관찰할 수 있었다. 또한, Hep G2와 COS세포 모두에서 endogenous RXR의 발현이 일어남을 확인하였고 RXR expression plasmid를 transfection시켰을 때 두 세포 모두에서 단백질의 발현이 현저하게 증가되었다. Constitutive Androstane Receptor (CAR)에 의한 CYP2B의 PBRU 활성효과를 다르게 분화된 세포에서 차이가 일어나는지를 비교하기 위하여 CAR에 의해 매개되는 PBRU의 transactivation효과를 Hep G2와 COS세포에서 조사하였다. Hep G2 세포에서는 transfection된 CAR의 발현에 의해 firefly luciferase 보고단백질의 활성이 약 12배 증가하였다. CAR 발현유전자를 15 ng transfection하였을 때 주어진 보고유전자의 양에 대하여 최대반응을 나타내었고 CYP2B1PBRU가 제거된 CYP2C1 promotor/firefly luciferase를 보고유전자로 사용하였을 때는 CAR에 의한 luciferase의 활성이 나타나지 않았다. Hep G2와는 달리, COS세포에서는 transfection된 CAR의 발현이 PBRU에 의한 firefly luciferase보고단백질의 발현에 영향을 주지 못하였다. 이러한 결과들은 분화된 세포의 종류에 따라서 constitutive androstane receptor의 CYP2BPBRU 활성효과가 다르게 나타날 수 있음을 제시할 뿐만 아니라, 간세포에서 Phenobarbital에 의한 PBRU의 활성유도에 영향을 주는 endogenous 매개 인자들 중 CAR와 RXR과는 다

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

흉부 디지털촬영에서 입사표면선량 예측 (Prediction of Entrance Surface Dose in Chest Digital Radiography)

  • 이원정;정순철
    • 한국방사선학회논문지
    • /
    • 제13권4호
    • /
    • pp.573-579
    • /
    • 2019
  • 환자 피폭선량 관리에 입사표면선량(ESD, entrance surface dose)이 국내외적으로 진단참고준위(국내 흉부촬영 $340{\mu}Gy$)로 사용되고 있지만, ESD측정을 위해서는 선량계가 필요하다. 하지만 대부분 병의원에서는 선량계가 구비되어 있지 않고 정기검사 시 전문 업체 측정에 의해 확인할 수 있다. 따라서 본 연구에서는 흉부 디지털촬영에서 사용자가 쉽게 ESD를 예측할 수 있는 방법에 대해 알아보았다. 흉부 디지털촬영에서 평판형 디텍터(FP, Flat-panel detector)와 IP (Imaging plate detector)를 대상으로 하였고, ESD는 선량계(XI-Platinum, Unfors, Sweden)를 흉부 팬텀(07-646 Duke QC chest phantom, Supertech, Elkhart, USA)의 중앙 표면에 부착시킨 후, 튜브와 디텍터를 180cm 거리를 유지시켜 각 노출조건 조합(관전압과 노출선량)에서 3회 반복측정한 후 평균값을 얻었다. 흉부 팬텀 영상의 다이콤 헤더 정보에서 FP영상은 선량면적곱(DAP, dose-area product)을 확인하였고, IP영상에서는 노출 지수(EI, exposure index)를 확인하였다. 단순선형회귀분석을 통해 FP촬영에서 DAP로부터, IP촬영에서 EI로부터 ESD를 예측할 수 있는 회귀방정식($y={\alpha}+{\beta}X$, ${\alpha}$=직선의 절편, ${\beta}$=직선의 기울기)을 구하였다. FP가 IP 보다 유의하게 낮은 선량을 보였고($85.7{\mu}Gy$ vs. $124.6{\mu}Gy$, p=0.017), 두 디텍터 모두 ESD와 화질 간에 높은 양의 상관성을 보였다. FP에서 수정된 R 제곱(adjusted R2)은 0.978로 ESD의 변동은 DAP 변동에 의해 97.8%의 높은 설명력을 보였다. 단순 회귀식은 $ESD=0.407+68.810{\times}DAP$ 이었다. 위의 회귀식을 이용하여 국내 권고선량($340{\mu}Gy$)과 같은 DAP를 추정한 결과($DAP=0.021+0.014{\times}340{\mu}Gy$), DAP는 4.781 이었다. IP에서 수정된 R 제곱(adjusted R2)은 0.645로 ESD의 변동은 EI 변동에 의해 64.5%의 설명력을 보였다. 단순 회귀식은 $ESD=-63.339+0.188{\times}EI$ 이었다. 위의 회귀식을 이용하여 국내 권고선량($340{\mu}Gy$)과 같은 EI를 추정한 결과($EI=565.431+3.481{\times}340{\mu}Gy$), EI는 1748.97 이었다. 흉부 디지털 촬영에서는 팍스 워크스테이션 영상의 다이콤 헤더 정보에서 ESD를 사용자가 쉽게 예측할 수 있다.

머신러닝 기법의 산림 총일차생산성 예측 모델 비교 (Predicting Forest Gross Primary Production Using Machine Learning Algorithms)

  • 이보라;장근창;김은숙;강민석;천정화;임종환
    • 한국농림기상학회지
    • /
    • 제21권1호
    • /
    • pp.29-41
    • /
    • 2019
  • 산림생태계에서 총일차생산성(Gross Primary Production, GPP)은 기후변화에 따른 산림의 생산성과 그에 영향을 미치는 식물계절, 건강성, 탄소 순환 등을 대표하는 지표이다. 총일차생산성을 추정하기 위해서는 에디공분산 타워 자료나 위성영상관측자료를 이용하기도 하고 물리지형적 한계나 기후변화 등을 고려하기 위해 기작기반모델링을 활용하기도 한다. 그러나 총일차생산성을 포함한 산림 탄소 순환의 기작기반 모델링은 식물의 생물, 생리, 화학적 기작들의 반응과 지형, 기후 및 시간 등과 같은 환경 조건들이 복잡하게 얽혀 있어 비선형적이고 유연성이 떨어져 반응에 영향을 주는 조건들을 모두 적용하기가 어렵다. 본 연구에서는 산림 생산성 추정 모델을 에디공분산 자료와 인공위성영상 정보를 사용하여 기계학습 알고리즘을 사용한 모델들로 구축해 보고 그 사용 및 확장 가능성을 검토해 보고자 하였다. 설명변수들로는 에디공분산자료와 인공위성자료에서 나온 대기기상인자들을 사용하였고 검증자료로 에디공분산 타워에서 관측된 총일차생산성을 사용하였다. 산림생산성 추정 모델은 1) 에디공분산 관측 기온($T_{air}$), 태양복사($R_d$), 상대습도(RH), 강수(PPT), 증발산(ET) 자료, 2) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD 자료(개량식생지수 제외), 3) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD, 개량식생지수(EVI) 자료를 사용하는 세 가지 경우로 나누어 구축하여 2006 - 2013년 자료로 훈련시키고 2014, 2015년 자료로 검증하였다. 기계학습 알고리즘은 support vector machine (SVM), random forest (RF), artificial neural network (ANN)를 사용하였고 단순 비교를 위해 고전적 방법인 multiple linear regression model (LM)을 사용하였다. 그 결과, 에디공분산 입력자료로 훈련시킨 모델의 예측력은 피어슨 상관계수 0.89 - 0.92 (MSE = 1.24 - 1.62), MODIS 입력자료로 훈련시킨 모델의 예측력은 개량식생지수 제외된 모델은 0.82 - 0.86 (MSE = 1.99 - 2.45), 개량식생지수가 포함된 모델은 0.92 - 0.93(MSE = 1.00 - 1.24)을 보였다. 이러한 결과는 산림총일차생산성 추정 모델 구축에 있어 MODIS인공위성 영상 정보 기반으로 기계학습 알고리즘을 사용하는 것에 대한 높은 활용가능성을 보여주었다.

산림생태계 보호구역에서 외래식물 분포 예측을 위한 최적 모형의 선발 (Selection of Optimal Models for Predicting the Distribution of Invasive Alien Plants Species (IAPS) in Forest Genetic Resource Reserves)

  • 임치홍;정성희;정수영;김남신;조용찬
    • 한국환경생태학회지
    • /
    • 제34권6호
    • /
    • pp.589-600
    • /
    • 2020
  • 효과적인 보호구역의 보전 관리를 위해서는 외래종의 정착 모니터링 및 확산 위험에 대한 저감 노력이 수반되어야 한다. 본 연구는 울진에 위치한 산림유전자원보호구역(2,274ha)에서 조사된 외래식물 분포 정보를 대상으로 활용도가 높은 세가지 종분포모형(Bioclim, GLM, MaxEnt)을 활용하여 외래식물의 잠재출현지역을 모의하였고, 모의 결과를 비교하여 지역적 지리 및 생태 관리 특성이 반영된 현실성 및 적합성 높은 종분포모형을 선발하였다. 분석에서 예측된 외래식물의 출현지역은 실제 분포와 같이 도로 같은 선형 경관 요소를 따라 분포하는 경향이었으며, 일부 벌채지가 포함되었다. 본 연구에서 적용한 각 모형의 예측력과 정확도를 통계적으로 비교한 결과, GLM과 MaxEnt 모형은 대체로 높은 예측력과 정확도를 보였지만, Bioclim 모형은 낮았다. Bioclim은 가장 넓은 면적을 출현예상지역으로 계산하였고, GLM, 그리고 MaxEnt 순으로 면적이 작았다. 모의 결과의 현상학적 검토에서는 GLM과 Bioclim 모형은 표본 수에 따라 예측력이 크게 영향을 받는 것으로 나타났고, 표본 수와 관계없이 가장 일관성 높은 모형은 MaxEnt로 평가되었다. 종합적으로, 본 연구에 사용된 모형 중 외래식물 분포 예측을 위한 최적 모형은 MaxEnt 모형인 것으로 판단되었다. 본 연구에서 제시한 정밀 생물종 분포 자료 기반의 모델 선발 접근 방식은 산림생태계 보호구역의 보전 관리 및 지역 특성이 반영된 현실적이고 정교한 모델 발굴 연구에 도움이 될 것이다.