• 제목/요약/키워드: Threshold update

검색결과 52건 처리시간 0.015초

모델빌더 기반 하천망의 DEM 각인 및 추출 툴 개발 (A tool development for forced striation and delineation of river network from digital elevation model based on ModelBuilder)

  • 최승수;김동수;유호준
    • 한국수자원학회논문집
    • /
    • 제52권8호
    • /
    • pp.515-529
    • /
    • 2019
  • 하천망과 유역 등 하천 네트워크 관련 공간자료는 각종 하천관리, 하천계획 및 설계, 수리수문학적 해석 등의 근간을 이루는 기초자료로 활용되고 있다. 기존 RIMGIS 등에서 제공하는 하천정보도 현행화 및 적절한 관리 부족으로 공간정보시스템간 불일치와 실제 하천지형과 이격이 나타나고 있는 실정이다. 또한, 고해상도 수치지형도(DEM)이 국가하천 주변 등 일부 지역에서만 제공되어, 저해상도 DEM으로부터 추출된 하천네트워크 정보의 신뢰도가 낮고 가용한 기수립 하천네트워크 정보와의 불일치는 DEM 기반 다양한 하천정보 추출 및 탄력적 활용을 저하시키고 있는 실정이다. 본 연구에서는 우선 국내 하천공간정보시스템이 제공하는 하천망 정보의 공간정확도, 정보체계간 일치성 등을 평가하고, 낮은 해상도의 DEM에 기수립된 하천망을 DEM에 강제로 각인시키는 방법으로 DEM을 개선하여 추후 하천망 혹은 유역 추출 시 기수립 하천망 혹은 유역대로 재현이 가능하게 하여 하천분야에 DEM의 활용성을 높일 수 있는 방법론과 소프트웨어(Forced river Network Striation and Delineation tool: FNSD)을 개발하고자 하였다. 개발된 FNSD는 ArcGIS의 ModelBuilder에서 순차적으로 관련 모듈을 연계시켜 자동화되도록 설계되었고, 한강수계의 섬강 유역에 시범 적용되었으며 항공사진 정보를 기반으로 수작업을 통해 도출된 하천망을 기수립 하천망으로 간주하여 30 m 저해상도 DEM에 각인시켜 하천망을 재추출한 후 주어진 기수립 하천망과 비교하여 재현 정확도를 검토하였다. 섬강유역에 적용한 결과 FNSD는 기수립 하천망을 정확하게 재현할 수 있음을 확인하였다. 이러한 검증결과는 각인된 DEM이 다양한 차수의 하천망 및 유역을 신뢰성 있게 재현할 수 있어 저해상도 DEM의 하천활용도를 높이는데 기여할 가능성이 있음을 의미한다.

대용량 소셜 미디어 감성분석을 위한 반감독 학습 기법 (Semi-supervised learning for sentiment analysis in mass social media)

  • 홍소라;정연오;이지형
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.482-488
    • /
    • 2014
  • 대표적인 소셜 네트워크 서비스(SNS)인 트위터의 내용을 분석하여 자동으로 트윗에 나타난 사용자의 감성을 분석하고자 한다. 기계학습 기법을 사용해서 감성 분석 모델을 생성하기 위해서는 각각의 트윗에 긍정 또는 부정을 나타내는 감성 레이블이 필요하다. 그러나 사람이 모든 트윗에 감성 레이블을 붙이는 것은 비용이 많이 소요되고, 실질적으로 불가능하다. 그래서 본 연구에서는 "감성 레이블이 있는 데이터"와 함께 "감성 레이블이 없는 데이터"도 활용하기 위해서 반감독 학습기법인 self-training 알고리즘을 적용하여 감성분석 모델을 생성한다. Self-training 알고리즘은 "레이블이 있는 데이터"의 레이블이 있는 데이터를 활용하여 "레이블이 없는 데이터"의 레이블을 확정하여 "레이블이 있는 데이터"를 확장하는 방식으로, 분류모델을 점진적으로 개선시키는 방식이다. 그러나 데이터의 레이블이 한번 확정되면 향후 학습에서 계속 사용되므로, 초기의 오류가 계속적으로 학습에 영향을 미치게 된다. 그러므로 조금 더 신중하게 "레이블이 없는 데이터"의 레이블을 결정할 필요가 있다. 본 논문에서는 self-training 알고리즘을 이용하여 보다 높은 정확도의 감성 분석 모델을 생성하기 위하여, self-training 중 "감성 레이블이 없는 데이터"의 레이블을 결정하여 "감성 레이블이 있는 데이터"로 확장하기 위한 3가지 정책을 제시하고, 각각의 성능을 비교 분석한다. 첫 번째 정책은 임계치를 고려하는 것이다. 분류 경계로부터 일정거리 이상 떨어져 있는 데이터를 선택하고자 하는 것이다. 두 번째 정책은 같은 개수의 긍/부정 데이터를 추가하는 것이다. 한쪽 감성에 해당하는 데이터에만 국한된 학습을 하는 것을 방지하기 위한 것이다. 세 번째 정책은 최대 개수를 고려하는 것이다. 한 번에 많은 양의 데이터가 "감성 레이블이 있는 데이터"에 추가되는 것을 방지하고 상위 몇%만 선택하기 위해서, 선택되는 데이터의 개수의 상한선을 정한 것이다. 실험은 긍정과 부정으로 분류되어 있는 트위터 데이터 셋인 Stanford data set에 적용하여 실험하였다. 그 결과 학습된 모델은 "감성 레이블이 있는 데이터" 만을 가지고 모델을 생성한 것보다 감성분석의 성능을 향상 시킬 수 있었고 3가지 정책을 적용한 방법의 효과를 입증하였다.