• 제목/요약/키워드: Supervised Classification

검색결과 421건 처리시간 0.024초

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

원격탐사 영상의 분류정확도 향상을 위한 인공지능형 시스템의 적용 (An Application of Artificial Intelligence System for Accuracy Improvement in Classification of Remotely Sensed Images)

  • 양인태;한성만;박재국
    • 한국측량학회지
    • /
    • 제20권1호
    • /
    • pp.21-31
    • /
    • 2002
  • 이 연구는 원격탐사 영상의 분류정확도를 향상시키기 위한 방법으로써 신경망 이론과 퍼지집합이론을 각각 적용하였다. 원격탐사 영상은 토지피복도, 식생도, 지질도 등 주제도를 만드는데 많이 이용되고 있다. 원격탐사 영상의 감독분류에 대한 정확도는 트레이닝 지역의 선정, 분류항목의 할당 문제로 인해 많은 차이를 보인다. 일반적인 영상 분류법은 영상 내의 모든 영상소가 균질하다고 가정한다. 그러나, 이러한 가정은 영상내의 수많은 혼합 영상소를 분류해내는 데에는 적합하지 않다. 이러한 문제를 극복하기 위해 퍼지 집합이론을 적용하였으며, 퍼지 집합이론의 멤버쉽을 이용하였다. 퍼지 집합이론은 하나의 영상소를 멤버쉽의 정도에 따라 여러 가지 항목으로 분류할 수 있는 장점이 있다. 그러나, 퍼지분류법과 통계학적인 분류법은 화소값의 분포가 비정규적일 때 좋지 않은 분류 결과를 나타내며 처리 시간이 늦고 많은 컴퓨팅 비용이 드는 단점이 있다. 그 대안적인 방법으로서 신경망분류법을 들 수 있는데, 신경망 분류법은 비모수적 분류법으로서 일반적인 분류기법보다 좀 더 좋은 결과를 나타내고 있고, 한번 트레이닝 되면 빠르게 데이터를 분류할 수 있다.

객체 기반 영상 분류를 위한 히스토그램 역투영을 이용한 클래스 샘플 추출 기법에 관한 연구 (A Study on Class Sample Extraction Technique Using Histogram Back-Projection for Object-Based Image Classification)

  • 예철수
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.157-168
    • /
    • 2023
  • 고해상도 원격탐사 영상을 이용하여 지표면을 모니터링 하기 위해서 영상 분할 및 감독 기반의 분류 기법이 널리 사용된다. 다양한 객체를 분류하기 위해서는 각 객체에 해당하는 클래스를 정의하고 각 클래스에 속하는 샘플들을 선택하는 과정이 필요하다. 클래스 샘플을 추출하는 기존의 방법은 각 클래스 별로 유사한 밝기값 특성을 가지는 충분한 개수의 샘플을 선택해야 한다. 이 과정은 사용자의 육안 식별에 의존하는 과정으로 많은 시간이 소요되며 사용자에 따라 추출되는 클래스의 대표 샘플들이 달라질 가능성이 높고 결과적으로 분류 성능이 클래스 샘플 추출 결과에 크게 영향을 받게 된다. 본 연구에서는 클래스 샘플 추출 시 히스토그램 역투영 기법을 적용하여 샘플 추출 시 사용자의 개입을 최소화하고 클래스에 속하는 샘플들의 밝기값 특성이 일관성을 가지는 영상 분류 기법을 제안한다. 제안한 히스토그램 역투영을 이용한 분류 기법은 차세대중형위성 1호(Compact Advanced Satellite 500-1) 영상의 색상 서브채널을 이용한 분류 실험과 원영상을 이용한 분류 실험에서 히스토그램 역투영을 사용하지 않은 기법에 비해 모두 향상된 분류 정확도를 보였다.

드론과 이미지 분석기법을 활용한 구조물 외관점검 기술 연구 (Study on Structure Visual Inspection Technology using Drones and Image Analysis Techniques)

  • 김종우;정영우;임홍철
    • 한국건축시공학회지
    • /
    • 제17권6호
    • /
    • pp.545-557
    • /
    • 2017
  • 이 연구는 사회 기반 구조물의 노후화에 대한 안전점검 기술분야에서 구조물 외관점검 기술의 효율적 대안에 관한 연구이다. 기존 육안점검 및 조사를 대신하여 산업용 드론과 딥 러닝기반의 이미지 분석 기법을 접목함으로써 막대한 인력과 시간소요 및 비용을 절감하고 높은 구역 및 돔 구조물의 접근 한계를 극복하고자 하였다. 구조물의 0.3mm 이상의 균열 손상을 검지할 수 있는 고 해상도 카메라와 라이다 센서, 임베디드 이미지 프로세서 모듈로 구성된 탑재체를 제작하여 산업용 드론에 탑재하였다. 이를 현장 시험에 적용하여 자동비행항법을 통해 시편의 손상 이미지를 촬영하였다. 또한 균열경을 이용하여 기존 육안 점검 방법으로 백태, 박리박락과 같은 면적형 손상과 선형 손상인 균열의 폭과 길이를 측정하여 최종 이미지 분석 검출 결과와 비교하고자 하였다. 촬영된 이미지 중 80장의 샘플을 골라 이미지 분석 기법을 적용하여 사전처리작업(pre-processing)-분리작업(segmentation)-특징점 추출작업(feature extraction)-분류 작업(Classification)-지도학습작업(supervised learning) 등의 과정을 거쳐 손상을 분리하고, 이를 딥러닝 기반 플랫폼으로 지도학습하여 분석 파라미터를 추출하였다. 지도학습을 수행하지 않은 임의의 이미지 샘플 60장을 신규로 추가하여 추출된 파라미터를 기반으로 이미지 분석을 수행한 결과, 손상 검출율의 90.5%로 나타났다.

지도학습을 이용한 새로운 선형 쇄파지표식 개발 (A Proposal of New Breaker Index Formula Using Supervised Machine Learning)

  • 최병종;박창욱;조용환;김도삼;이광호
    • 한국해안·해양공학회논문집
    • /
    • 제32권6호
    • /
    • pp.384-395
    • /
    • 2020
  • 연안에서 천수변형에 의해 발생하는 쇄파는 표사이동, 연안류의 생성, 충격파압의 발생 등과 같은 연안역의 다양한 물리현상과 밀접한 관계를 갖고 있다. 따라서, 연안구조물의 설계 시 쇄파파고 및 쇄파수심과 같은 쇄파지표를 정확하게 예측하는 것이 중요하다. 과거부터 많은 연구자들에 의해 쇄파현상을 규명하고 예측하기 위한 많은 과학적인 노력들이 이루어져 왔다. 대표적인 쇄파에 연구들은 주로 수리모형실험을 통해 쇄파지표 예측을 위한 많은 경험식이 제안되어 왔다. 하지만, 기존의 쇄파지표에 대한 경험식은 일정한 방정식의 가정하에 자료의 통계적 분석을 통해 가정한 방정식의 계수들을 결정하고 있다. 본 논문에서는 회귀 혹은 분류문제와 관련된 다양한 연구분야에 있어서 높은 예측성능을 보여주는 대표적인 선형기반의 지도학습 머신러닝 기법을 적용하였다. 적용된 머신러닝 기법을 기반으로 기존의 쇄파에 대한 실험자료로부터 쇄파지표 예측을 위한 모델을 개발하고, 학습된 모델로부터 쇄파예측을 위한 새로운 선형식을 제시하였다. 새롭게 제안된 쇄파지표식은 단순한 선형식임에도 불구하고 기존의 경험 공식에 비해 유사한 예측성능을 보였다.

원격탐사와 지리정보시스템을 이용한 시화지구 일대의 지표환경변화와 토공량 예측연구 (Geo-surface Environmental Changes and Reclaimed Amount Prediction Using Remote Sensing and Geographic Information System in the Siwha Area)

  • 양소연;송무영;황정
    • 지질공학
    • /
    • 제9권2호
    • /
    • pp.161-176
    • /
    • 1999
  • 해안매립의 적지로 선정된 시화지구 일대의 시화방조제와 안산신도시개발과 관련된 지표지형의 변화를 관측하기 위해 년도별 인공위성영상을 이용하였으며, 시화방조제 완공으로 노출된 간척지의 매립량을 분석하기 위하여 지리정보시스템을 이용하였다. 시화지구 일대의 인위적인 인간활동과 관련된 년도별 지형의 변화양상과 퇴적물의 분포양상, 산림의 토지피복상태, 그리고 변화된 토지피복현황을 관측하기 위해, 일반적으로 널리 이용되는 위성영상합성, Tasseled cap, 식생지수와 감독분류기법을 이용하였다 매립계획이 수립된 간척지의 매립량을 토목공사 이전에 추측하기 위하여 지질도, 시화간척지 조성계획도, 지상 DEM, 해저 DEM자료층을 지형도, 지질도, 해도, 시화지구 계획도면으로부터 추출하였다. 또한, 인공위성 영상자료 중 감독분류 영상을 분석하여 인근육지의 절취예상 가능위치를 추출하였다 해안선 및 연안지역의 지표지형변화 관측을 위한 처리기법 중 Tasseled cap으로 노출된 조간대의 퇴적물의 침식과 퇴적지역을 관찰하였고, 식생지수 기법으로 식생지수의 차이를 이용하여 산림피복 분포양상을 파악하였으며, 감독분류 영상으로부터 년도별 토지피복 변화현황을 관찰하였다. 수치지형분석으로 계산된 시화지구 간척지의 총매립량은 $581,485,354\textrm{m}^3$이고, 이를 호수공원 하부에서 준설할 경우 예상되는 최종 호수공원의 깊이는 9.2m이다. 또한, 계획단지 주변에 제방을 축조할 경우, 소요될 매립량은 $3,387,360\textrm{m}^3$이며, 이를 인근육지로부터 절취한다고 가정할 때, 선감도와 송산면일부, 대부도일부 예정지의 절취량은 각각 $5,229,576\textrm{m}^3,{\;}79,227,072\textrm{m}^3,{\;}47,026,008\textrm{m}^3$이다. 따라서, 제방 축조시 필요한 토공량은 대부도일부의 절취량만으로도 충분히 충당할 수 있음을 알 수 있었다.

  • PDF

블록 기반의 영상 분할과 수계 경계의 확장을 이용한 수계 검출 (Water body extraction using block-based image partitioning and extension of water body boundaries)

  • 예철수
    • 대한원격탐사학회지
    • /
    • 제32권5호
    • /
    • pp.471-482
    • /
    • 2016
  • 본 논문에서는 수계 영역의 감독 분류 성능을 향상시키기 위하여 블록 기반의 영상 분할과 수계 경계의 확장을 이용하는 수계 검출 방법을 제안한다. 초기 수계 영역을 추출하기 위하여 수계 훈련 지역의 Normalized Difference Water Index (NDWI) 및 Near Infrared (NIR) 밴드 영상의 분광 정보를 이용하여 Mahalanobis 거리 영상을 생성한다. Mahalanobis 거리 영상에 포함된 잡음 성분의 영향을 감소시키기 위해서 인접한 화소의 연결 강도에 의해 확산 계수가 제어되는 평균 곡률 확산을 적용한 후에 초기 수계 영역을 추출한다. 추출된 수계 영상을 같은 크기의 블록으로 분할한 후에 수계 경계에 속하는 수계 영역의 정보를 이용하여 수계 영역을 갱신한다. 수계 경계에 속하는 수계 영역과 수계 훈련 지역 사이의 통계적인 거리가 임계값 이하이면, 수계 영역 갱신을 반복적으로 수행한다. 제안한 알고리즘을 KOMPSAT-2 영상에 적용한 결과 블록 크기가 $11{\times}11$에서 $19{\times}19$사이인 경우에 overall accuracy는 99.47%에서 99.53%, Kappa coefficient는 95.07%에서 95.80%의 분류 정확도를 보였다.

기술과학 분야 학술문헌에 대한 학습집합 반자동 구축 및 자동 분류 통합 연구 (Semi-automatic Construction of Learning Set and Integration of Automatic Classification for Academic Literature in Technical Sciences)

  • 김선우;고건우;최원준;정희석;윤화묵;최성필
    • 정보관리학회지
    • /
    • 제35권4호
    • /
    • pp.141-164
    • /
    • 2018
  • 최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)

  • 감미아;송민
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.53-77
    • /
    • 2012
  • 본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.

Landsat TM 화상자료(畵像資料)를 이용한 평택시지역 지표피복분류(地表被覆分類) (Land Cover Classification by Using Landsat Thematic Mapper Data in Pyeongtaeg City)

  • 임상규;홍석영;정원교;김무성
    • 한국토양비료학회지
    • /
    • 제34권5호
    • /
    • pp.342-349
    • /
    • 2001
  • Landsat TM 인공위성 자료(1997년 6월 16일 촬영)를 이용하여 평택시에 대한 지표피복분류도를 만들고 정확도를 평가하였고, 또한 우리 나라의 농업실정에 맞는 지표피복 분류체계를 세우기 위해 Anderson의 지표피복분류안을 응용하여 새로운 분류안을 만들었다. 분류방식으로는 감독분류를 사용하였는데 결과에 직접적인 영향을 주는 훈련장소(training site)의 선정을 위해 지형도, 항공사진 등과 현지 실사자료인 DGPS 자료를 사용하여 논, 밭 등 13개의 훈련조(training sets)를 작성 후 최대우도법(最大尤度法)(maximum likelihood classifier)을 적용하여 주제도를 만들었다. 이의 정확도 평가를 위해 DGPS, 항공사진, 지형도 등을 이용한 분류정확도 평가에서 전체 정확도는 86.8%이며, 카파계수가 85.4%로 매우 양호한(Excellent) 것으로 판명되었다. 그러나 도시/촌락, 비닐하우스 등의 사용자 정확도는 60% 정도로서 낮은 편이며, 도로, 비닐하우스 등의 생산자 정확도는 70% 정도로 낮은 편인데, 이는 인공건조물이라는 특징에 따른 분광학적 반사특성과 이질성(異質性)과 분포면적이 적은데 기인된 것으로 생각된다. 한편 원격탐사자료를 이용하여 토지피복 분류도를 작성할 때 우리나라 농업실정에 알맞은 농업적(農業的) 지표피복분류안(地表被覆分類案)을 만들었는데, 수준 I에는 농경지, 산림지, 물, 불모지, 도시나 인공건조물 등으로 나눌 수 있다.

  • PDF