• 제목/요약/키워드: 정확도 및 범주별 통계

검색결과 7건 처리시간 0.025초

딥러닝모델을 이용한 국가수준 LULUCF 분야 토지이용 범주별 자동화 분류 (Automatic Classification by Land Use Category of National Level LULUCF Sector using Deep Learning Model)

  • 박정묵;심우담;이정수
    • 대한원격탐사학회지
    • /
    • 제35권6_2호
    • /
    • pp.1053-1065
    • /
    • 2019
  • 신기후체제에 대응하여 정확한 탄소흡수 및 배출량을 산정하기 위해 토지이용 범주별 통계량 산출은 활동자료로서 매우 중요한 자료이다. 본 연구는 효과적인 토지이용 범주별 판독을 위하여 산림항공사진(이하 FAP)에 딥러닝모델을 적용하여 토지이용 범주별 자동화 판독 분류를 한 후 샘플링기법을 통해 국가단위 통계량을 산출하였다. 딥러닝모델에 적용한 데이터세트(이하, DS)는 국가산림자원조사 고정표본점 위치 기반 FAP의 이미지를 추출하여 훈련데이터세트(이하, 훈련DS)와 시험데이터세트(이하, 시험 DS)로 구분하였다. 훈련 DS는 토지이용 범주별 정의에 따라 이미지별 레이블을 부여하였으며, 딥러닝모델을 학습하고 검증하였다. 검증 시 모델의 학습정확도는 학습 횟수 1500회에서 정확도가 약 89%로 가장 높았다. 학습된 딥러닝모델을 시험DS에 적용한 결과, 이미지 레이블의 판독 분류정확도는 약 90%로 높았다. 샘플링기법을 통해 범주별 분류 결과에 대해 면적을 추정하여 국가통계와 비교한 결과 정합성 또한 높아 향후 LULUCF(Land Use, Land Use Change, Forestry)분야 국가 온실가스 인벤토리 보고서의 활동자료로 활용하기에 충분하다고 판단된다.

질의응답 시스템을 위한 술어정보 기반 질의분석 (Predicate-based Question Analysis for Korean Question-Answering System)

  • 김원남;신승은;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.296-300
    • /
    • 2004
  • 질의 응답 시스템이 정확한 정답을 제시하기 위해서는 사용자가 요구하는 정답의 유형을 결정할 필요가 있다. 질의분석의 일반적인 접근법으로는 의문사 정보, 규칙 그리고 통계 정보에 기반한 방법들이 있다. 본 논문에서는 술어정보를 이용한 질의분석을 제안한다. 먼저 의문사 정보를 이용하여 상위정답유형을 결정하고 질의문의 술어 정보와 구문 구조 정보를 이용하여 초점단어(focus word)를 추출한다. 초점단어란 정답유형을 결정하는데 단서가 되는 단어로써, 추출된 초점단어에 의해 75개의 하위정답유형 중 하나가 결정된다. 실험에 앞서 정답 유형별로 6개의 상위범주와 75개의 하위범주를 정의하였으며, 실험에는 학습 데이터의 일부와 일반 Web에서 수집한 테스트 데이터가 사용되었다. 실험결과 상위범주는 97.6%, 하위범주는 77.8%의 정확도를 보였으며 초점단어는 92.5%의 정확도를 보였다.

  • PDF

구속영장발부 여부에 관한 통계모형 (A Statistical Model for Decisions on Arrest Warrants)

  • 김정훈;이나래;이계민
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1225-1234
    • /
    • 2010
  • 구속영장 기각시 그 기각사유로 단순히 도주 및 증거인멸 우려가 없다고만 기재되는 경우가 대부분이다. 이로 인해 사건의 어떤 측면이 구속영장발부에 영향을 미쳤는지 전혀 알 수 없고, 구속영장을 발부하는 정확한 기준이 무엇인지에 대해 끊임없이 제기되고 있다. 본 연구에서는 창원지방검찰청 진주지청에서 2006-2008년의 3개년도 영장청구자료를 범죄 유형에 따라 7가지로 분류하고 각 범죄별로 구속영장 기각 여부를 결정하는 변수를 알아보고자 한다. 7대 범주별 교차분석을 통하여 구속영장 기각 여부에 대한 통계모형을 다루었다.

인공지능을 이용한 수도권 학교 미세먼지 취약성 평가: Part II - 학교 미세먼지 범주화 (Vulnerability Assessment for Fine Particulate Matter (PM2.5) in the Schools of the Seoul Metropolitan Area, Korea: Part II - Vulnerability Assessment for PM2.5 in the Schools)

  • 손상훈;김진수
    • 대한원격탐사학회지
    • /
    • 제37권6_2호
    • /
    • pp.1891-1900
    • /
    • 2021
  • 직경 2.5 ㎛ 이하인 초미세먼지는 급격한 도시화와 인구 증가로 인해 대도시에서 많이 발생하며, 유아 및 청소년기는 성인에 비해 초미세먼지에 취약하고 만성 질환으로 이어질 가능성이 높다. 특히 대부분의 청소년들은 학교에서 가장 많은 시간을 보내고 있으며, 다양한 이유에 의해 실외에서 발생한 초미세먼지가 실내로 유입된다. 본 연구는 외부 요인에 의해 발생하는 학교 초미세먼지를 예측하고 학교별 초미세먼지 범주화를 수행하였다. 10-fold cross validation과 grid-search method를 적용한 random forest (RF) 모델에 화학과 기상 인자, 위성 기반의 aerosol optical depth (AOD)를 입력 자료로 하여 학교 초미세먼지를 예측하고 정확도 평가를 위해 4가지 통계 지표를 이용하였다. 학교 미세먼지 범주화를 위해 6가지 유형을 가진 느슨한 기준과 엄격한 기준을 정의하였으며, 범주화 결과 느슨한 기준의 경우 유형 2와 3에, 엄격한 기준의 경우 유형 3과 4에 가장 많은 학교가 포함되었다.

COMS 위성의 가시 및 적외 영상 채널로부터 복원된 대류운의 강우강도 향상과 검증 (Improvement and Validation of Convective Rainfall Rate Retrieved from Visible and Infrared Image Bands of the COMS Satellite)

  • 문윤섭;이강열
    • 한국지구과학회지
    • /
    • 제37권7호
    • /
    • pp.420-433
    • /
    • 2016
  • 본 연구의 목적은 2011년 4월 22일부터 10월 22일까지 우리나라에서 강수가 있는 총 75일 동안 COMS 위성의 적외 채널 $10.8{\mu}m$ 휘도 온도(IR), 적외 채널 $10.8{\mu}m$와 수증기 채널 $6.7{\mu}m$의 휘도 온도차(IR-WV), 정규화 된 가시반사도(VIS)와 기상 레이더의 강우강도를 이용하여 2-D와 3-D 대류운의 강우강도 (CRR) 조견표를 향상시키는 것이다. 특별히 한국형 2-D와 3-D CRR 조견표를 검증하기 위해 2011년 강수가 있는 24일 동안의 기상 레이더 강우강도 자료가 사용된다. 2-D와 3-D CRR 조견표는 각 채널의 등급 범주별 강우 총수와 비강우 총수의 행렬을 이용하여 구한 강우 확률에 평균 누적강우강도와 최대 강우강도를 각각 곱함으로써 2-D (IR, IR-WV)와 3-D (IR, IR-WV, VIS) 조견표의 기본과 최대 행렬을 얻을 수 있다. 최종적으로 새로운 2-D와 3-D의 CRR 조견표는 경험적으로 기본과 최대 강우강도 행렬의 회귀 분석으로 얻어진다. 그 결과 새로운 CRR 조견표는 기존보다 낮은 IR 휘도 온도, 낮은 IR-WV 휘도 온도차일 때에도 비교적 많은 강우 현상을 나타내며, $10mm\;h^{-1}$ 이상의 강우강도 영역이 확대되어 나타난다. 정확도와 범주별 통계가 주어진 기간 동안 발생했던 CRR 자료에 대해 계산된다. 새로운 2-D와 3-D CRR 조견표의 평균 오차, 평균절대 오차, 제곱근평균 오차가 기존 조견표보다 작게 나타나며, 예측 거짓경고비율은 감소하고, 탐지확률은 증가하며, 임계성공지수는 개선된다. 태풍과 뇌우와 같은 기상 이변에서의 강한 호우를 고려하기 위해서 습윤 보정 계수를 교정한다. 이 인자는 수치모델이나 COMS에서 복원한 지면에서 500 hPa까지 평균한 총가강수량과 상대습도의 곱 (PW RH)으로 정의된다. 이 연구에서는 PW RH에 근거하여 IR 운정 휘도 온도가 210 K 이하일 때, 상대습도가 40% 이상일 때 1에서 2사이를 경험적으로 정한다. 새로운 2-D와 3-D CRR 조견표를 적용한 결과 평균 오차, 평균 절대 오차, 제곱근 평균 오차가 줄어든다.

성인에서 AUDIT와 손상의 연관성 (Drinking Pattern and Nonfatal Injuries of Adults in Korea)

  • 유인숙;최은미;권호장;이상규
    • 한국산학기술학회논문지
    • /
    • 제13권4호
    • /
    • pp.1690-1698
    • /
    • 2012
  • 음주는 손상의 가장 위험 요인으로 정확한 평가를 위하여 세계보건기구에서 개발한 Alcohol Use Disorders Identification Test (만성음주행태측정 이하 AUDIT)와 같은 도구를 이용하여 성인에서의 음주행태와 손상 발생률 및 손상 세부 특성과의 연관성을 평가하고자 실시 하였다. 본 연구는 2009년도 국민건강영양조사를 이용하였으며 성인 만 19세 이상 성인 중 7,893명이 참여하여 손상에 응답한 7,511명, 그 중 음주행태조사 참여는 6,6362명 설문에 무응답 104명을 제외 최종 6,258명 연구 대상으로 분석하였다. AUDIT범주에 따른 손상 발생률 및 세부특성 즉 신체부위, 유형, 기전별 손상 발생율의 비교위험도를 T-test, ANOVA, Logistic regression 이용하여 산출하였다. 통계분석은 SPSS 19.0 통계프로그램을 사용하였다. 분석결과 체전손상에서 남자가 손상의 발생이 유의하게 높았다. 음주 관련 손상의 경우에서 남자가 여자에 비해 손상의 발생 위험이 8.3배 높았다. 교육은 고등학교 졸업자가 AUDIT이 가장 높은 비율을 보여 유의하였으며, 결혼한 사람과 월소득이 201-300만원인 사람들이 AUDIT가 가장 높게 나타났으며 유의하였다. 문제음주자와 알코올의존자에서 의미있게 증가된 신체부위의 손상은 두 경부에서 0.0371로 유의하게 나타났고 AUDIT와 손상외인 기전에서는 운수사고, 미끄러짐, 기타, 부딪힘, 추락의 순으로 나타났으며, 손상의 유형 분류상 기타(열상, 좌상, 중독, 관통상 등)에서 유의하였다. 음주로 인한 손상 및 손상외인의 기전은 매우 중요하며, 상담자를 통한 동기유발 조정이 이루어 지게 되면 음주횟수를 줄여 음주로 인한 손상을 완화시킬 수 있는 장치가 필요하다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.