• 제목/요약/키워드: analysis of algorithms

검색결과 3,535건 처리시간 0.032초

디테일 디스크립터를 이용한 이미지 영역 분석과 개선에 관한 연구 (A study on image region analysis and image enhancement using detail descriptor)

  • 임재성;정영탁;이지혁
    • 한국산학기술학회논문지
    • /
    • 제18권6호
    • /
    • pp.728-735
    • /
    • 2017
  • 디지털 디바이스가 범용적으로 보급되면서, 영상을 획득하는 과정에서 다량의 부가적 백색 잡음 노이즈(additive white Gaussian noise, AWGN)가 발생하고 있다. 대부분 알려져 있는 대표적인 디노이징 기법들은 노이즈를 제거하는 것에 초점을 맞추고 있어, 영상정보를 포함하는 디테일 성분들이 노이즈를 제거가 되는 과정에서 비례적으로 없어지게 된다. 그러므로, 제안하는 알고리즘은 영상 디테일을 보존하면서 효과적으로 노이즈를 제거하는 방법을 제시하고자 한다. 제안하는 방법에서는, 노이즈의 랜덤성을 이용하여 엣지 강도 및 엣지 연결성을 이용하여 의미 있는 디테일 성분을 분리하는 것을 목적으로 한다. 결과적으로, 노이즈 수준이 높아져도, 제안하는 방법은 연결된 디테일성분을 효과적으로 추출하기 때문에 타 벤치마크 방법에 비해 나은 디노이징 결과를 보여준다. 또한, 실험결과에서 보듯이, 제안하는 방법은 다양한 노이즈 수준에서도 타 벤치마크 방법들에 비교하여 제안하는 방법은 SSIM(structural similarity index), PSNR(peak signal-to-noise ratio)측면에서 각각 우수한 수치를 보여주었다. 높은 수치의 SSIM의 결과로 알 수 있듯이, 결과 영상들이 인간의 시각인지체계(human visual system, HVS)를 반영하고 있는 것을 확증해 주고 있다.

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.

사용자 관심 이슈 분석을 통한 추천시스템 성능 향상 방안 (Improving Performance of Recommendation Systems Using Topic Modeling)

  • 최성이;현윤진;김남규
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.101-116
    • /
    • 2015
  • 많은 기관들이 데이터에 기반을 둔 의사결정을 수행해 왔으며, 특히 수치자료를 비롯한 정형 데이터가 이러한 목적으로 널리 활용되어 왔다. 하지만 최근에는 스마트기기와 소셜미디어의 발달로 인해 다양한 형태를 가진 방대한 양의 정보가 생성, 공유, 저장되면서, 전통적인 정형 데이터 기반 의사결정으로부터 비정형 빅데이터 기반 의사결정으로 관심의 전환이 이루어지고 있다. 데이터 기반 의사결정의 대표적 분야인 추천시스템 분야에서도 성능 향상을 위해 비정형 데이터를 활용해야 한다는 필요성이 최근 꾸준히 제기되고 있다. 특히 사용자의 성향이나 선호도는 고객의 니즈와 직결되기 때문에, 비정형 데이터 분석을 통해 사용자의 성향을 파악하고 이를 통해 상품 추천 및 구매 예측의 정확도를 향상시키기 위한 노력이 매우 시급하게 이루어질 필요가 있다. 따라서 본 연구에서는 사용자의 성향을 측정하여 재구매 예측 정확도, 특히 카테고리별 재구매 예측 정확도를 높임으로써, 궁극적으로 추천시스템의 성능을 향상시킬 수 있는 방안을 제시한다. 구체적으로는 사용자의 일상적인 인터넷 사용 기록을 분석하여 고객이 조회하는 뉴스 기사의 이슈를 식별하고 다양한 이슈에 대한 고객의 관심을 계량화한 후, 이를 활용하여 고객의 카테고리별 재구매 여부를 예측하는 모델을 제안하고자 한다. 실제 웹 트랜잭션으로부터 도출된 인터넷 뉴스 조회 기록 및 쇼핑몰 구매 기록을 대상으로 실험을 수행한 결과, 고객의 과거 구매이력만을 활용한 카테고리 재구매 예측 모형에 비해 본 연구에서 제안한 모형, 즉 고객의 과거 구매이력과 관심 이슈를 모두 활용한 예측 모형의 정확도가 다소 우수한 것으로 나타났다.

천리안위성 1·2A호 지표면 알베도 상호 오차 분석 및 비교검증 (A Comparative Errors Assessment Between Surface Albedo Products of COMS/MI and GK-2A/AMI)

  • 우종호;최성원;진동현;성노훈;정대성;심수영;변유경;전우진;손은하;한경수
    • 대한원격탐사학회지
    • /
    • 제37권6_1호
    • /
    • pp.1767-1772
    • /
    • 2021
  • 장기간에 걸친 전 지구적인 위성관측 지표면 알베도 자료는 전 지구 기후 및 환경의 변화 감시에 활발히 이용되고 있으며 그 활용도와 중요성이 크다. 우리나라의 경우 정지궤도위성 천리안위성 1호(Communication, Ocean and Meteorological Satellite, COMS) MI(Meteorological Imager) 센서와 천리안위성 2A호(GEO-KOMPSAT-2A, GK-2A) AMI (Advanced Meteorological Imager) 센서의 세대교체를 통해 지속적인 지표면 알베도 산출물의 확보가 가능하다. 그러나 COMS/MI 및 GK-2A/AMI의 지표면 알베도 산출물은 센서 및 알고리즘의 차이로 인해 산출물 간의 차이가 존재한다. 따라서 COMS/MI와 GK-2A/AMI 지표면 알베도 산출 기간을 확장하고 지속적인 기후변화 감시 연계성 확보를 위해 두 위성 산출물 간의 오차 분석이 선행되어야 한다. 본 연구에서는 COMS/MI 및 GK-2A/AMI 지표면 알베도 자료의 중복기간을 대상으로 지상관측자료 AERONET (Aerosol Robotic Network)와 타 위성자료 GLASS (Global Land Surface Satellite)와 함께 비교 분석하였다. 오차 분석 결과 AERONET과의 검증에서 COMS/MI의 평균 제곱근 오차(Root Mean Square Error, RMSE)가 0.043로 GK-2A/AMI의 RMSE인 0.015보다 높게 나타났다. 또한 GLASS와 비교하였을 때 COMS/MI의 RMSE는 0.029로 GK-2A/AMI의 0.038보다 낮게 나타났다. 이러한 오차특성을 이해하고 COMS/MI 및 GK-2A/AMI의 지표면 알베도 자료를 사용할 때 장기간 기후변화 감시에 적극적으로 활용할 수 있을 것이다.

뇌파의 비선형 분석을 위한 신호추출조건 및 계산 알고리즘 (A Proposed Algorithm and Sampling Conditions for Nonlinear Analysis of EEG)

  • 신철진;이광호;최성구;윤인영
    • 수면정신생리
    • /
    • 제6권1호
    • /
    • pp.52-60
    • /
    • 1999
  • 목 적 : 임상 뇌파의 비선형 분석시, 분석시간을 단축시킬 수 있는 방법과 보다 정확한 상관차원을 얻기 위한 새로운 알고리즘 고안을 시도하였다. 또 뇌파신호 분석을 위한 적절한 신호획득 조건을 결정하는 방법을 제시하기 위하여 여러 상이한 실험조건에서 상관차원을 계산하였으며, 여기서 얻은 결과를 이용하여 각 실험실마다 공통적으로 적용할 수 있는 표준화된 실험 조건을 결정하고자 하였다. 방 법 : 임의의 한 개인을 대상으로 13개의 두피전극에서 얻은 뇌파신호를 대상으로 하였다. 12비트 해상도에서 1000 헤르츠로 32초간 얻은 뇌파신호를 디지털화 하여 각 전극당 32000개의 시계열자료를 얻었다. 이 자료를 10, 20, 30초 간격의 시간단위로 나누고, 각각에 대해 1000, 500, 250, 125, 62.5 Hz 등 5가지 신호추출조건을 달리 하여 각 전극마다 총 15개의 시계열 자료를 만들었다. 여기에 상관차원 계산시간 단축을 위해 고안된 계산 알고리듬 및 상관차원 추정 정확도를 개선하기 위해 적용한 최소절단자승기법을 적용하여 상관 차원을 계산하였다. 이렇게 얻은 상관차원 결과를 신호획득시간과 신호추출빈도에 따라 비교하였다. 또 로그연산을 비트 연산으로 바꾸어 계산시간 단축의 효과를 평가하였으며, 최소 절단자승기법과 최소자승추정기법을 비교하였다. 결 과 : 신호추출시간이 증가함에 따라 상관차원의 값도 통계적으로 유의하게 증가하는 양상을 보였다. 신호추출빈도가 62.5Hz일때는 신호추출시간에 무관하게 높은 상관차원값을 나타냈으나 그밖의 빈도에서는 유사한 상관차원값을 보였다. 본 연구에서 고안된 계산 알고리듬은 종래 사용하던 알고리듬에 비해 통계적으로 유의한 계산시간 단축효과를 보였다. 또 종래의 방법인 최소자승추정에 의한 상관차원에 비하여 본 연구에 적용된 최소절단자승추정법은 보다 안정된상관차원 값을 추정하였다. 결 론 : 본 연구는 다량의 뇌파 시계열 자료를 분석하는데 신속하고 보다 정확한 상관차원 추정에 알맞는 분석방법을 제공하였다. 또한 뇌파 시계열 자료의 상관차원 계산시 12비트의 해상도에서 125Hz의 신호추출빈도로 20초간 뇌파신호를 획득하면 적정한 수준의 상관차원을 계산할 수 있음을 보였다.

  • PDF

RNN(Recurrent Neural Network)을 이용한 기업부도예측모형에서 회계정보의 동적 변화 연구 (Dynamic forecasts of bankruptcy with Recurrent Neural Network model)

  • 권혁건;이동규;신민수
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.139-153
    • /
    • 2017
  • 기업의 부도는 이해관계자들뿐 아니라 사회에도 경제적으로 큰 손실을 야기한다. 따라서 기업부도예측은 경영학 연구에 있어 중요한 연구주제 중 하나로 다뤄져 왔다. 기존의 연구에서는 부도 예측을 위해 다변량판별분석, 로짓분석, 신경망분석 등 다양한 방법론을 이용하여 모형의 부도 예측력을 높이고 과적합의 문제를 해결하고자 시도하였다. 하지만 기존의 연구들이 시간적 요소를 고려하지 않아 발생할 수 있는 문제점들을 갖고 있음에도 불구하고 부도 예측에 있어서 동적 모형을 이용한 연구는 활발히 진행되고 있지 않으며 따라서 동적 모형을 이용하여 부도예측모형이 더욱 개선될 여지가 있다는 점을 확인할 수 있었다. 이에 본 연구에서는 RNN(Recurrent Neural Network)을 이용하여 시계열 재무 데이터의 동적 변화를 반영한 모형을 만들었으며 기존의 부도예측모형들과의 비교분석을 통해 부도 예측력의 향상에 도움이 된다는 것을 확인할 수 있었다. 모형의 유용성을 검증하기 위해 KIS Value의 재무 데이터를 이용하여 실험을 수행하였고 비교모형으로는 다변량판별분석, 로짓분석, SVM, 인공신경망을 선정하였다. 실험 결과 제안된 모형이 비교 모형에 비해 우수한 예측력을 보이는 것으로 나타났다. 따라서 본 연구는 변수들의 변화를 포착하는 동적 모형을 부도예측에 새롭게 제안하여 부도예측 연구의 발전에 기여할 수 있을 것으로 기대된다.

대표 패턴 마이닝에 활용되는 패턴 압축 기법들에 대한 분석 및 성능 평가 (Analysis and Performance Evaluation of Pattern Condensing Techniques used in Representative Pattern Mining)

  • 이강인;윤은일
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.77-83
    • /
    • 2015
  • 데이터 마이닝에서 활발히 연구되고 있는 주요 분야들 가운데 하나인 빈발 패턴 마이닝은 대규모의 데이터 집합 또는 데이터베이스로부터 숨겨진 유용한 패턴 정보를 추출하기 위한 방법이다. 또한 이 기법으로 얻을 수 있는 결과물을 통해 데이터베이스내의 다양하고 중요한 특징들을 더욱 손쉽게 자동적으로 분석할 수 있기 때문에 많은 응용영역에도 활발히 적용되고 있다. 하지만 이러한 데이터베이스로부터 단순히 사용자에 의해 설정된 최소 지지도 임계값만을 가지고 이를 만족하는 모든 패턴들을 추출하는 기존의 전통적인 빈발 패턴 마이닝 방식은 데이터베이스의 특성과 임계값 설정의 정도에 따라 극도로 많은 수의 결과 패턴을 생성하는 문제를 가지며, 이에 따른 시간 및 공간 자원의 낭비를 초래한다. 또한 과도하게 생성된 패턴에 대한 분석의 어려움 역시 심각한 문제가 된다. 기존의 빈발 패턴 마이닝 접근방법들이 직면한 이러한 문제를 해결하고자, 데이터베이스로부터 가능한 모든 빈발 패턴들을 마이닝하는 것이 아닌, 이들에 대한 대표 패턴들만은 선별적으로 추출할 수 있도록 하는 대표 패턴 마이닝의 개념과 다양한 관련 기법들이 제안되었다. 본 논문에서는 생성되는 각 패턴의 최대성 또는 폐쇄성을 고려하는 패턴 압축 기법들에 대한 특성들을 기술하고, 이에대한 비교 및 분석을 진행한다. 최대 빈발 패턴 혹은 닫힌 빈발 패턴들을 마이닝함으로써, 효과적인 패턴 압축이 가능하며, 더 적은 시공간 자원으로 마이닝 작업을 수행할 수 있다. 또한 압축된 패턴들은 필요시 다시 원래의 패턴 형태로 복구가 가능한 특징이 있으며, 특히 닫힌 패턴 접근 방법을 이용하면 패턴을 압축하고 다시 해제하는 과정에서 어떠한 정보의 손실도 일어나지 않는다. 본 논문에서는 같은 플랫폼 상에서 동일한 구현 수준의 알고리즘에 대해 실세계로부터 축적된 실 데이터셋들을 가지고 상기 기법들에 대한 성능평가를 진행함으로써, 각 기법이 패턴 생성, 수행 시간, 메모리 사용량과 같은 실제적인 마이닝 성능에 대해 어떠한 영향을 미치는지에 대한 심층적 분석결과를 보인다.

식생의 뿌리 점착력과 지표유출의 흐름 조건을 고려한 산사태의 발생 특성 분석: 충청북도 제천지역의 사례를 중심으로 (Analysis of Landslide Occurrence Characteristics Based on the Root Cohesion of Vegetation and Flow Direction of Surface Runoff: A Case Study of Landslides in Jecheon-si, Chungcheongbuk-do, South Korea)

  • 이재욱;조용찬;김석우;김민석;오현주
    • 한국산림과학회지
    • /
    • 제112권4호
    • /
    • pp.426-441
    • /
    • 2023
  • 본 연구에서는 수확벌채에 따른 수목의 뿌리 점착력의 변화와 토양의 포화를 가정한 지표유출의 세 가지 흐름 기법(SFD; Single flow direction, MFD; Multiple flow direction, IFD; Infinite flow direction)을 무한사면 안전율 공식에 적용하여 산사태 발생 예측 모델링의 정확성을 분석하였다. 이를 위해 2020년 8월 집중호우의 영향으로 자연사면과 벌채사면에서 다수의 산사태가 발생한 제천지역을 연구지역으로 선정하였다. 위성영상과 25cm급 항공사진을 이용한 산사태 인벤토리 맵핑 결과, 연구지역 내에서 총 830개소의 산사태 발생원이 확인되었다. 산사태 모델링 결과, 벌채에 따른 뿌리 점착력의 변화를 고려한 경우(MFD: 0.81, IFD: 0.80, SFD: 0.80)가 벌채의 영향을 고려하지 않은 경우(MFD: 0.79, IFD: 0.79, SFD: 0.78)에 비하여 AUROC(Area Under the Receiver Operating Characteristics) 분석에서 정확성이 1.3~2.6% 향상되는 것으로 나타났다. 또한, MFD 알고리즘을 이용한 경우는 다른 알고리즘과 비교하여 AUROC 분석에서 정확성이 최대 1.3% 향상되었다. 이러한 결과는 식생조건의 변화를 고려한 뿌리 점착력의 차등 적용과 지표유출수 흐름기법의 선정이 산사태 예측 모델링에 영향을 미칠 수 있음을 시사한다. 향후 이 연구의 결과는 현지 수문모니터링과 함께 수종별 뿌리 점착력의 특징 및 변화를 고려하여 검증되어야 할 것이다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

다시기 Landsat TM 영상과 기계학습을 이용한 토지피복변화에 따른 산림탄소저장량 변화 분석 (Change Analysis of Aboveground Forest Carbon Stocks According to the Land Cover Change Using Multi-Temporal Landsat TM Images and Machine Learning Algorithms)

  • 이정희;임정호;김경민;허준
    • 한국지리정보학회지
    • /
    • 제18권4호
    • /
    • pp.81-99
    • /
    • 2015
  • 가속되는 지구온난화로 인해 한반도 주변의 탄소순환에 대한 명확한 이해의 필요성이 제기되고 있다. 산림은 이산화탄소의 주요 흡수원으로 지상 탄소량의 대부분을 저장하고 있어 이에 대한 추정이 필요하다. 우리나라에서는 국가산림자원조사의 표본점에서 측정되는 헥타르당 임목축적량을 활용하여 산림 탄소저장량을 추정한다. 하지만 탄소저장량은 요약된 수치 형태로 발표하고 있어 탄소저장량의 공간적 분포를 파악하는 것이 어렵다. 본 연구에서는 토지피복변화가 빠르고 국가산림자원조사 표본점 배치가 부족한 도시지역을 대상으로 UNFCCC의 Approach 3와 Tier 3를 충족하는 격자 기반 산림탄소저장량을 추정하였다. 토지피복변화 및 산림탄소저장량은 1991, 1992, 2010, 2011년에 취득된 Landsat 5 TM 영상과 고해상도 항공사진, 제 3차 및 제 5, 6차 국가산림자원조사 자료를 이용하여 추정하였다. 토지피복변화는 기계학습을 이용하여 변화된 토지피복과 변화되지 않은 토지피복 항목을 한 번에 분류하여 추정하였으며, 산림탄소저장량은 반사도, 밴드비율, 식생지수, 지형변수를 입력변수로 하여 기계학습을 통해 추정하였다. 연구 결과, 산림이 그대로 산림으로 유지되는 지역의 경우 33.23tonC/ha의 흡수를 하였으며 비산림이 산림으로 변한 지역의 경우 이보다 큰 36.83tonC/ha의 흡수가 진행된 것으로 추정되었다. 산림이 비산림으로 바뀐 경우에는 -7.35tonC/ha로, 배출이 일어난 것으로 추정되었다. 본 연구를 통하여 토지피복변화에 따른 산림탄소저장량 변화를 정량적으로 이해할 수 있었으며, 향후 효율적인 산림관리에 기여할 수 있을 것으로 판단된다.