• 제목/요약/키워드: Confusion matrix

검색결과 114건 처리시간 0.025초

랜덤 포레스트 모델을 활용한 국내 청소년 성경험 영향요인 분석 연구: 2019~2021년 청소년건강행태조사 데이터 (Factors Influencing Sexual Experiences in Adolescents Using a Random Forest Model: Secondary Data Analysis of the 2019~2021 Korea Youth Risk Behavior Web-based Survey Data)

  • 양윤석;권주원;양영란
    • 대한간호학회지
    • /
    • 제54권2호
    • /
    • pp.193-210
    • /
    • 2024
  • Purpose: The objective of this study was to develop a predictive model for the sexual experiences of adolescents using the random forest method and to identify the "variable importance." Methods: The study utilized data from the 2019 to 2021 Korea Youth Risk Behavior Web-based Survey, which included 86,595 man and 80,504 woman participants. The number of independent variables stood at 44. SPSS was used to conduct Rao-Scott χ2 tests and complex sample t-tests. Modeling was performed using the random forest algorithm in Python. Performance evaluation of each model included assessments of precision, recall, F1-score, receiver operating characteristics curve, and area under the curve calculations derived from the confusion matrix. Results: The prevalence of sexual experiences initially decreased during the COVID-19 pandemic, but later increased. "Variable importance" for predicting sexual experiences, ranked in the top six, included week and weekday sedentary time and internet usage time, followed by ease of cigarette purchase, age at first alcohol consumption, smoking initiation, breakfast consumption, and difficulty purchasing alcohol. Conclusion: Education and support programs for promoting adolescent sexual health, based on the top-ranking important variables, should be integrated with health behavior intervention programs addressing internet usage, smoking, and alcohol consumption. We recommend active utilization of the random forest analysis method to develop high-performance predictive models for effective disease prevention, treatment, and nursing care.

Efficient Sign Language Recognition and Classification Using African Buffalo Optimization Using Support Vector Machine System

  • Karthikeyan M. P.;Vu Cao Lam;Dac-Nhuong Le
    • International Journal of Computer Science & Network Security
    • /
    • 제24권6호
    • /
    • pp.8-16
    • /
    • 2024
  • Communication with the deaf has always been crucial. Deaf and hard-of-hearing persons can now express their thoughts and opinions to teachers through sign language, which has become a universal language and a very effective tool. This helps to improve their education. This facilitates and simplifies the referral procedure between them and the teachers. There are various bodily movements used in sign language, including those of arms, legs, and face. Pure expressiveness, proximity, and shared interests are examples of nonverbal physical communication that is distinct from gestures that convey a particular message. The meanings of gestures vary depending on your social or cultural background and are quite unique. Sign language prediction recognition is a highly popular and Research is ongoing in this area, and the SVM has shown value. Research in a number of fields where SVMs struggle has encouraged the development of numerous applications, such as SVM for enormous data sets, SVM for multi-classification, and SVM for unbalanced data sets.Without a precise diagnosis of the signs, right control measures cannot be applied when they are needed. One of the methods that is frequently utilized for the identification and categorization of sign languages is image processing. African Buffalo Optimization using Support Vector Machine (ABO+SVM) classification technology is used in this work to help identify and categorize peoples' sign languages. Segmentation by K-means clustering is used to first identify the sign region, after which color and texture features are extracted. The accuracy, sensitivity, Precision, specificity, and F1-score of the proposed system African Buffalo Optimization using Support Vector Machine (ABOSVM) are validated against the existing classifiers SVM, CNN, and PSO+ANN.

한국형 산불피해강도지수(KCBI)의 개발 및 검증 (Development and Validation of Korean Composit Burn Index(KCBI))

  • 이현주;이주미;원명수;이상우
    • 한국산림과학회지
    • /
    • 제101권1호
    • /
    • pp.163-174
    • /
    • 2012
  • 산불피해강도지수(CBI, Composite Burn Index)는 미국 산림청(USDA Forest Service)에서 위성영상을 이용하여 산불 피해강도 측정을 위해 개발한 산불피해 현장 조사 지수이다. 국내의 경우 별도의 산불피해 지수가 없어, 미국 CBI를 산불 피해지 조사에 준용하여 왔으나, CBI는 국내 여건에 맞지 않다는 지적이 제기되어 산불피해강도지수(KCBI, Korean Composite Burn Index)를 개발하게 되었다. 따라서 본 연구는 미국 CBI에 기초하여 한국형 산불피해강도지수(KCBI, Korean Composite Burn Index)의 개발과 검증에 목표를 두고 수행되었다. KCBI는 CBI에 기초하여 국내 현장적용 후 문제점을 파악 후 정교화 하였으며, 위성영상 결과와의 적합성 검토를 위하여 2011년도 산불 피해지중 상대적으로 피해 규모가 큰 울진과 영덕 산불피해지를 연구 대상지로 선정 후 각 44개 지점에서 산불피해 강도를 평가하였다. 산불피해강도(BS, Burn Severity)는 산불발생 후 1개월 후에 촬영된 SPOT 영상을 이용하여 NDVI(Normalized Difference Vegetation Index) 값으로 계산하였으며, 상관분석과 오류메트릭스(Confusion Matrix)를 이용하여 유효성을 검증하였다. 분석 결과 울진피해지는 (r = -0.544, P<0.01), 영덕피해지 (r = -0.616, P<0.01)로 나타났다. 부의 상관관계를 나타난 이유는 NDVI의 DN 값은 낮을 수 록 높은 피해강도를로 나타내며, 높을수록 낮은 피해강도를 나타내기 때문이다. 본 결과로 제시된 KCBI는 국내 산불 피해 현장에서 적용 가능한 것으로 판단되었다. 하지만 등급분류 방법과 기대치 보다 낮은 상관도 등의 문제점도 나타났다. 또한 오류메트릭스 분석결과 KCBI가 일부 높은 산불 강도 등급에 치우쳐 분포하는 현상 등이 나타났다. 제기된 문제점들을 바탕으로 향후 KCBI를 더 많은 한국 산불피해지에 적용함으로써, 추후 연구를 진행해야 할 것이다.

Sentinel-1 위성 영상을 활용한 침수 탐지 기법 방법론 비교 연구 (Comparative study of flood detection methodologies using Sentinel-1 satellite imagery)

  • 이성우;김완엽;이슬찬;정하규;박종수;최민하
    • 한국수자원학회논문집
    • /
    • 제57권3호
    • /
    • pp.181-193
    • /
    • 2024
  • 기후변화에 의해 발생하는 대기 불균형은 강우량의 증가로 이어지고, 침수 발생 빈도가 증가함에 따라 이를 탐지할 수 있는 기술의 필요성이 증가하고 있다. 침수 피해를 최소화하기 위해 지속적인 모니터링이 필요하며, 날씨의 영향을 받지 않는 합성개구레이더(Synthetic Aperture Radar, SAR) 영상을 활용하여 침수지역을 탐지하였다. 관측된 데이터는 median 필터를 통해 노이즈를 감소시키는 전처리 과정을 진행하였으며, 객체 탐지 기법을 통해 수체와 비수체를 분류하여 각 기법의 침수탐지 활용성을 평가하고자 하였다. 본 연구에서는 Otsu 기법과 SVM 기법을 통해 수체 및 침수 탐지를 수행하였으며, Confusion Matrix를 통해 전체적인 모델의 성능을 평가하였다. Otsu 기법은 수체와 비수체의 경계를 구분하는데 적합함을 보였으나, 혼합물의 영향을 받아 오탐지의 비율이 높게 나타났다. 반면, SVM 기법을 사용한 경우, 오탐지 비율이 낮고 혼합물에 의한 영향에 민감하지 않은 것으로 관측되었다. 이에 따라 침수 상태를 제외한 다른 조건에서 SVM 기법의 정확도가 높게 나타났다. Otsu 기법이 침수 조건에서 SVM 기법보다 다소 높은 정확도를 보였지만, 정확도의 차이가 5% 미만임을 확인할 수 있었다(Otsu: 0.93, SVM: 0.90). SVM 기법이 Otsu 기법보다 침수 전, 침수 후의 조건에서 정확도 차이가 최대 15% 이상 발생하여 수체 및 침수탐지에 더 적합하게 나타났다(Otsu: 0.77, SVM: 0.92). 이러한 결과는 SVM 기법이 수체 및 침수탐지에서 효과적으로 활용될 수 있음을 시사하며, 미래의 수재해 탐지 시스템에 적용될 때 유용한 정보를 제공할 수 있을 것으로 기대된다.

이종의 공간 데이터 셋의 면 객체 자동 매칭 방법 (Automated Areal Feature Matching in Different Spatial Data-sets)

  • 김지영;이재빈
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.89-98
    • /
    • 2016
  • 본 연구에서는 축척과 갱신 주기가 상이한 이종의 공간 데이터 셋을 융합하기 위하여 사용자의 개입을 최소화하면서 다대다 관계에도 적용이 가능한 기하학적 방법론 기반의 면 객체 자동 매칭 방법을 제안하였다. 이를 위하여 첫째, 포함함수가 0.4 이상인 객체(노드)는 인접행렬에서 에지로 연결되었고, 이들 인접행렬의 곱을 반복적으로 수행하여 다대다 관계를 포함하는 후보 매칭 쌍을 선정하였다. 다대다 관계인 면 객체들은 알고리즘으로 생성된 convex hull로 단일 면 객체로 변환하였다. 기하학적 매칭을 위하여, 매칭 기준을 설정하고, 이들을 유사도 함수를 이용하여 유사도를 계산하였다. 다음으로 변환된 유사도와 CRITIC 방법으로 도출된 가중치를 선형 조합하여 형상 유사도를 계산하였다. 마지막으로 훈련자료에서 모든 가중치에 대한 정확도와 재현율을 나타낸 PR 곡선의 교차점인 EER로 임계값을 선정하고, 이 임계값을 기준으로 매칭 유무를 판별하였다. 제안된 방법을 수치지도와 도로명 주소기본도에 적용한 결과, 일부 다대다 관계에서 잘못 매칭되는 경우를 시각적으로 확인할 수 있었으나, 통계적 평가에서 정확도, 재현율, F-measure가 각각 0.951, 0.906, 0.928로 높게 나타났다. 이는 제안된 방법으로 이종의 공간 데이터 셋을 자동으로 매칭하는데 그 정확도가 높음을 의미한다. 그러나 일부 오류가 발생한 다대다 관계인 후보 매칭 쌍을 정확하게 정량화하기 위해서 포함함수나 매칭 기준에 대한 연구가 진행되어야 할 것이다.

3차원 물체 재구성 과정이 통합된 실시간 3차원 특징값 추출 방법 (Real-time 3D Feature Extraction Combined with 3D Reconstruction)

  • 홍광진;이철한;정기철;오경수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권12호
    • /
    • pp.789-799
    • /
    • 2008
  • 상호작용이 가능한 컴퓨팅 환경에서 사람과 컴퓨터 사이의 자연스러운 정보 교환을 위해 동작 인식과 관련한 연구가 활발하게 이루어지고 있다. 기존의 2차원 특징값을 이용하는 인식 알고리즘은 특징값 추출과 인식 속도는 빠르지만, 정확한 인식을 위해서 많은 환경적인 제약이 따른다. 또한 2.5차원 특징값을 이용하는 알고리즘은 2차원 특징값에 비해 높은 인식률을 제공하지만 물체의 회전 변화에 취약하고, 3차원 특징값을 이용하는 인식 알고리즘은 특징값 추출을 위해 3차원 물체를 재구성하는 선행 과정이 필요하기 때문에 인식 속도가 느리다. 본 논문은 3차원 물체 재구성 단계와 특징값 추출 단계를 통합하여 실시간으로 3차원 정보를 가지는 특징값 추출 방법을 제안한다. 제안하는 방법은 기존의 GPU 기반 비주얼 헐 생성 방법의 세부 과정 중에서 동작 인식에 필요한 데이타 생성 부분만을 수행하여 임의의 시점에서 3차원 물체에 대한 3종류의 프로젝션 맵을 생성하고, 각각의 프로젝션 맵에 대한 후-모멘트(Hu-moment)를 계산한다. 실험에서 우리는 기존의 방법들과 단계별 수행 시간을 비교하고, 생성된 후-모멘트에 대한 혼동 행렬(confusion matrix)을 계산함으로써 제안하는 방법이 실시간 동작 인식 환경에 적용될 수 있음을 확인하였다.

지표유출메커니즘을 활용한 홍수취약지구 표출 기법 (Mapping Technique for Flood Vulnerable Area Using Surface Runoff Mechanism)

  • 이재영;한건연;김현일
    • 한국지리정보학회지
    • /
    • 제22권4호
    • /
    • pp.181-196
    • /
    • 2019
  • 홍수는 다양한 원인으로 발생할 수 있으며, 주로 내수배제 불량이나 외수범람을 홍수의 주요 원인으로 주목하고 있으며, 대규모 유역 유출을 발생시키는 강우 또한 빈번히 발생하고 있는 실정이다. 기존의 홍수위험지도는 수리·수문학적 모델링을 통한 분석을 기반으로 하여 방대한 자료의 수집과 복잡한 분석과정으로 인한 장시간의 소요시간으로 넓은 지역에 대한 홍수위험지도 작성이 어려운 실정이다. 본 연구에서는 이를 극복하고자 홍수위험도 산정 시 필요한 시간과 노력을 절감하고 광범위한 지역에 대한 세밀한 분석을 실시하기 위해 지표유출메커니즘을 고려한 홍수취약지구 선정 기법을 제안하고자 한다. 홍수취약지구 선정 기법을 대상지역인 서울시에 적용하여 2×2 혼동행렬과 ROC(Receiver Operation Characteristic) 곡선을 활용하여 검증함으로써 선정된 취약지구 인근에서 침수피해가 발생하기 쉽다는 것을 확인할 수 있었다. 본 연구의 결과를 이용하여 관리 우선순위를 반영하여 효율적인 예산 배분과 체계적인 방재대책 수립이 가능할 것으로 판단된다.

생물계절 상 분석을 통한 Level 3 type 북한 토지피복 특성 (Level 3 Type Land Use Land Cover (LULC) Characteristics Based on Phenological Phases of North Korea)

  • 유재심;박종화;이승호
    • 대한원격탐사학회지
    • /
    • 제27권4호
    • /
    • pp.457-466
    • /
    • 2011
  • 본 연구의 목적은 Level 3 type 북한 토지피복도를 작성하고 생물계절 특성을 파악 하는 데 있다. 2008년과 2009년에 촬영된 88장과 8장의 MODIS NDVI를 MVC 하여 질이 향상된 영상에 ISODATA 알고리즘을 적용하였다. 생물계절 상 분석을 기반으로 북한의 토지피복도를 구축하고 중분류에 대해서는 정확도 검정을 하였다. 결과, 총 27개 클래스의 북한 토지피복도가 생산되었다. 토지피복은 17개의 산림 서식지, 토지이용은 7개의 농경지와 2개의 시가지, 그리고 한 개의 수역을 포함한다. Level 3 type 생물계절 특성은 휴지기(${\sigma}^2$ = 0.348)와 식생이 급격히 생장하는 봄철(${\sigma}^2$ = 0.347)의 역동성이 가장 컸다. Level 2 type에 대한 정확도 검정에서, 전체 정확도는 85.85%(851/955), Kappa 계수는 0.84 였다. 현장 접근이 불가능한 북한의 토지피복도 구축에 생물계절 상 분석기법 적용은 오분류를 최소화하고 분류정확도를 향상시키는데 기여하였다.

SPOT5영상과 현장조사자료를 융합한 대형산불지역의 피해강도 분석 (Analysis of Burn Severity in Large-fire Area Using SPOT5 Images and Field Survey Data)

  • 원명수;김경하;이상우
    • 한국농림기상학회지
    • /
    • 제16권2호
    • /
    • pp.114-124
    • /
    • 2014
  • 본 연구는 2011년 100ha 이상의 대형산불 피해지인 울진과 영덕지역을 대상으로 하였으며 산불피해강도를 평가하기 위해 현장조사와 고해상도 위성영상자료 분석을 병행하였다. 위성영상자료 분석 시 산불피해지역의 피해강도를 가장 적절하게 평가할 수 있는 영상분류기법들을 비교 분석하여 최적의 피해강도 평가방법을 선정하였다. 대형산불 피해지역의 최적의 피해강도 평가기법으로는 현장조사에서 획득한 트레이닝 지역의 정보를 이용한 최대우도법을 적용하였을 때 가장 좋은 평가결과를 보였다. 산불피해강도의 정확도 검증 결과, 평균 전체정확도는 88.38%와 Kappa coefficient는 0.8147로 나타났다. 분류정확도는 최대우도법, NDVI, 최소거리법 순으로 나타났다. 산불피해강도 현장조사 결과와 위성영상자료에서 추출한 피해강도의 상관관계는 울진산불 피해지에서 r = -0.544, 영덕산불 피해지는 r = -0.616으로 나타났다.

휴대형 근적외선/가시광선 분광기를 이용한 의약품 분류기법 (Classification of Tablets Using a Handheld NIR/Visible-Light Spectrometer)

  • 김태동;이승현;백경진;장병준;정경훈
    • 한국전자파학회논문지
    • /
    • 제28권8호
    • /
    • pp.628-635
    • /
    • 2017
  • 의약품은 인간의 건강 및 생명과 밀접한 관련이 있기 때문에 증상에 맞는 의약품을 처방받아 복용하는 것은 매우 중요한 문제이다. 더욱이 세계적으로 위조 의약품이 증가하는 상황에서 정품 의약품들을 정확하게 분류하는 기술은 점점 중요해진다. 그러나 의약품을 제대로 분류할 수 있는 전문적인 지식을 갖춘 인력이 제한적이라는 측면에서 의약품을 자동적으로 분류하는 기술이 필요하다. 본 논문에서는 휴대용 분광기를 이용하여 의약품의 근적외선 및 가시광선 스펙트럼을 추출하고, Support Vector Machine(SVM) 기법을 이용하여 추출한 스펙트럼 데이터를 학습시켜 분류하는 방법을 제안하였다. 모의실험을 통해 근적외선과 가시광선 스펙트럼 데이터를 사용하여 6종의 의약품을 학습시키고 분류하였을 때 평균적으로 99.9 %의 정확도를 얻었다. 또한 본 논문에서는 위조 의약품 검출을 위한 2단계 SVM 분류 기법을 제안하였으며, 이를 통해 정품과 위조 의약품을 구분하는 정확도가 향상되고, 처리속도가 개선되는 것을 확인하였다.