• 제목/요약/키워드: machine learning techniques

검색결과 1,074건 처리시간 0.024초

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

한반도 모자이크 영상의 토지피복분류 활용 가능성 탐색을 위한 비교 연구 (A Comparative Study on the Possibility of Land Cover Classification of the Mosaic Images on the Korean Peninsula)

  • 문지윤;이광재
    • 대한원격탐사학회지
    • /
    • 제35권6_4호
    • /
    • pp.1319-1326
    • /
    • 2019
  • 한국항공우주연구원은 지속적으로 증가하는 공공분야의 위성영상 수요에 대응하기 위해 정부 위성정보활용협의체를 운영하고 있으며, 사용자 편의성 증진 및 위성영상 활용 활성화를 위해 매년 한반도 모자이크 영상을 제작하여 제공하는 등 다양한 지원사업을 수행하고 있다. 특히 한반도 모자이크 영상의 활용도를 높이고 사용자가 손쉽게 분류 영상을 현업에 활용할 수 있도록 모자이크 영상을 분류 및 갱신하는 방안을 모색하고 자 하였다. 그러나 한반도 모자이크 영상은 영상 융합 및 컬러 밸런싱 등을 적용하기 때문에 분광정보, 즉 색상왜곡이 발생하고 R, G, B 밴드만 보유하고 있다는 한계점이 있기 때문에 모자이크 영상으로 만들어낸 분류 결과가 현업에서 활용될 수 있는 수준인지 확인 및 검증이 필요하다. 따라서 본 연구에서는 모자이크 영상으로 분류를 수행했을 때 그 결과물의 신뢰도를 KOMPSAT-3 영상과 비교하여 확인해보고자 하였다. 연구 결과, KOMPSAT-3 영상의 분류 정확도는 약 81~86%(전체 정확도 약 85%)로 나타난 반면, 모자이크 영상분류 결과의 정확도는 약 69~72%(전체 정확도 약 72%)로 다소 낮게 나타났다. 이러한 현상은 모자이크 영상을 생성하는 과정에서 영상 융합과 모자이크 과정을 거치며 본래의 분광정보가 왜곡되었을 뿐만 아니라, 컬러밴드인 R, G, B 세 가지의 밴드만 제공함에 따라 NDVI나 NDWI 정보를 실제 모자이크 영상이 아닌 KOMPSAT-3 영상에서 추출하였기 때문으로 해석된다. 비록 현재로서는 모자이크 영상으로 토지피복분류를 수행하여 사용자에게 배포하기에는 무리가 있을 것으로 판단되나, 추후 모자이크 영상을 제작할 때 분광정보 왜곡을 최소화할 수 있는 방법을 모색하고 R, G, B 밴드뿐만 아니라 NIR 밴드도 함께 제공하거나 모자이크 영상에 적합한 영상분류 기술을 개발할 필요가 있을 것으로 생각된다. 또한 지형특성별 분류결과 비교분석과 관심객체별 기계학습 등을 통한 영상분류 방법을 개발하는 등 관련 연구를 지속한다면, 추후 분광정보가 제한된 영상들도 활용도가 높아질 수 있을 것으로 기대된다.

SWAT 및 random forest를 이용한 기후변화에 따른 한강유역의 수생태계 건강성 지수 영향 평가 (Assessment of climate change impact on aquatic ecology health indices in Han river basin using SWAT and random forest)

  • 우소영;정충길;김진욱;김성준
    • 한국수자원학회논문집
    • /
    • 제51권10호
    • /
    • pp.863-874
    • /
    • 2018
  • 본 연구에서는 SWAT 모형과 random forest를 이용하여 미래 기후변화에 따른 한강유역($34,148km^2$)의 수생태계 건강성을 평가하였다. 국립환경과학원에서 8년간(2008~2015년) 봄철(4~6월)에 모니터링한 부착돌말류 지수(TDI), 저서형 대형무척추동물지수(BMI), 어류평가지수(FAI)는 0~100점, A~E등급으로 평가되며, 이를 본 연구에서 사용하였다. 수생태 건강성에 영향을 미치는 변수로는 수질(T-N, $NH_4$, $NO_3$, T-P, $PO_4$)과 수온을 선정하였으며, 수질 오염도가 낮은 경우에는 수생태계 건강성 점수가 광범위하게 분포되지만 수질 오염도가 높은 경우 수생태계 건강성 점수가 낮아지는 역상관관계를 확인하였다. 기계학습의 분류 분석 기법 중 하나인 random forest 모델을 이용한 세 개의 수생태 건강성 지수 등급분류 결과 정밀도, 재현율, f1-score 모두 0.81 이상의 예측 정확도를 나타내었다. 기상청의 HadGEM3-RA RCP 4.5와 8.5 시나리오를 적용한 미래 SWAT 수문, 수질 결과 기저유출의 증가로 인해 질소 계열 수질 농도는 기준년도 대비 최대 43.2% 증가하였고, 지표유출 감소로 인해 인 계열수질 오염도는 최대 18.9% 감소하는 것으로 분석되었다. 미래 FAI, BMI의 등급은 개선되는 경향을 보이지만 TDI는 등급이 악화되는 것으로 나타났다. 이를 통해 TDI는 질소 계열 수질에 민감하고 FAI, BMI는 인 계열 수질에 더 민감하다고 판단하였다.

MODIS와 ASOS 자료를 이용한 식물계절 모델링 (Modeling of Vegetation Phenology Using MODIS and ASOS Data)

  • 김근아;윤유정;강종구;최소연;박강현;천정화;장근창;원명수;이양원
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.627-646
    • /
    • 2022
  • 최근 지구 온난화로 인한 기후 변화와 관련된 문제의 심각성이 커지고 있으며 평균 기온 또한 상승하고 있다. 이로 인해 온도에 민감한 다양한 생물과 생물이 살아가는 환경에 영향을 미치고 있으며, 생태계의 변화 역시 감지되고 있다. 계절은 그 지역에 사는 생물의 종류, 분포, 생육 특성 등에 영향을 미치는 중요한 요인의 하나이다. 기후 변화 영향 평가의 지표 중 가장 대중적이고 쉽게 인식될 수 있는 식물 계절 중 개화일과 단풍나무 절정일의 모델링을 수행하였다. 모델링에 사용된 식물의 종류에는 봄을 대표하는 식물로 볼 수 있는 개나리와 벚나무, 가을을 대표하는 식물로 볼 수 있는 단풍 나무와 은행 나무를 사용하였다. 모델링을 수행할 때 사용된 기상 자료로는 기상청의 Automated Surface Observing System (ASOS) 관측소를 통해서 관측된 기온, 강수, 일사 자료를 사용하였으며, 개나리, 벚나무의 개화일과 약 -0.2, 은행나무, 단풍나무의 단풍 절정일과 약 0.3 정도의 상관 계수를 가지는 Moderate Resolution Imaging Spectroradiometer (MODIS) 식생지수를 사용하여 모델링을 수행하였다. 사용된 모델로는 선형 모델인 다중 회귀 모형과, 비선형 모델인 Random Forest (RF)를 사용하여 모델을 수립하였다. 또한 각 모형으로 추정된 예측 값을 공간 내삽 기법을 이용하여 등치 선도로 2003~2020년의 식물 계절 변화 경향 성을 표현하였다. 향후에 높은 시공간 해상도를 가지는 식생지수를 사용한다면 더 높은 식물 계절 모델링의 정확도를 높일 수 있을 것으로 판단된다.