• 제목/요약/키워드: 지지 벡터기계

검색결과 100건 처리시간 0.034초

자료기반 학습 알고리즘을 이용한 지하수위 변동 예측 모델의 국가지하수관측망 자료 적용에 대한 비교 평가 연구 (Application of groundwater-level prediction models using data-based learning algorithms to National Groundwater Monitoring Network data)

  • 윤희성;김용철;하규철;김규범
    • 지질공학
    • /
    • 제23권2호
    • /
    • pp.137-147
    • /
    • 2013
  • 지하수자원의 효율적인 관리를 위해 강우에 대한 지하수위 변화를 예측하는 것은 중요한 문제이다. 본 연구에서는 자료기반 학습 알고리즘인 인공신경망과 지지벡터기계를 이용하여 시계열 예측 모델을 만들고 이를 국가지하수관측망 중 가산, 신광, 청성 관측소 지하수위 변화 예측에 적용하였다. 모델의 입력 성분 구성 방법에 따라 네 가지 모형을 설정하고 각 관측소 및 모델 별 예측 결과를 비교 평가하였다. 강우 입력 모형의 경우 지하수위 감쇠 및 기저 변화 예측을 위해 큰 규모의 입력 성분 구성이 필요하지만 강우 및 지하수위 입력 모형은 보다 작은 규모의 입력 성분으로 효과적으로 지하수위 변화를 예측하는 것으로 나타났다. 강우 및 지하수위 입력 모형의 활용성 증대를 위해 고안된 반복 예측 모형의 경우 관측값과 예측값 사이에 0.75~0.95의 상관계수를 보여 적용 가능성이 큰 것으로 판단된다. 전체적으로 강우-지하수위 교차상관계수가 낮은 신광 관측소의 예측 오차가 크게 나타났고 ANN 모델에 비해 SVM의 예측력이 다소 높은 것으로 조사되었다. 또한 반복 예측 모형의 모델 파라미터 선정 과정에서 보정 단계 오차에 대한 예측 단계 오차의 비의 분포를 조사한 결과 SVM의 경우가 더 작게 나타나 SVM이 본 연구 자료에 대해 보다 안정적이고 효율적인 모델임을 평가하였다.

기계학습에 기초한 국내 학술지 논문의 자동분류에 관한 연구 (An Analytical Study on Automatic Classification of Domestic Journal articles Based on Machine Learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.37-62
    • /
    • 2018
  • 문헌정보학 분야의 국내 학술지 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히, "정보관리학회지"에 수록된 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 용어 가중치부여 기법, 학습집합 크기, 분류 알고리즘, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 각 요소를 적절하게 적용하는 것이 효과적이며, 보다 단순한 모델의 사용으로 상당히 좋은 수준의 성능을 도출할 수 있었다. 또한, 국내 학술지 논문의 분류는 특정 논문에 하나 이상의 범주를 할당하는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있다. 따라서 이러한 환경을 고려하여 단순하고 빠른 분류 알고리즘과 소규모의 학습집합을 사용하는 최적의 분류 모델을 제안하였다.

항적 데이터 학습을 통한 추천 항로 구성에 관한 연구 (Composing Recommended Route through Machine Learning of Navigational Data)

  • 김주성;정중식;이성용;이은석
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2016년도 춘계학술대회
    • /
    • pp.285-286
    • /
    • 2016
  • 해상교통관제센터에 의해 실시간으로 수집되는 선박의 항해 데이터를 바탕으로 선박 항적 패턴 인식을 수행하고 이를 바탕으로 항적 모델을 추출하여 사전에 선위를 예측하는 기법을 제안한다. 항적 데이터의 처리와 가공, 항적 모델링을 위하여 Support Vector Regression 알고리즘이 사용되었으며, 적정 파라미터 선정을 위하여 k-fold cross validation과 grid search가 사용되었다. 제안된 항적 데이터 모델링 기법을 통하여 사전에 선박의 선위를 예측하여 해상교통과제사의 의사결정을 지원하고자 한다.

  • PDF

학습문서의 개수에 따른 편차기반 분류방법의 분류 정확도 (Classification Accuracy by Deviation-based Classification Method with the Number of Training Documents)

  • 이용배
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.325-332
    • /
    • 2014
  • 일반적으로 자동분류는 학습문서의 개수에 영향을 받는다고 알려져 있지만 실제로 학습문서의 수가 텍스트 자동분류에 어떻게 영향을 주는지 입증한 연구는 거의 없었다. 본 연구에서는 학습문서 수가 자동분류에 어떤 영향을 주는지 알아보기 위해 최근에 개발된 편차기반 분류방법을 중심으로 다른 분류 알고리즘과 비교하는데 초점을 두었다. 실험결과, 편차기반 분류모델은 학습문서의 수가 총 21개(7개 장르)인 상황에서 정확도가 0.8로 베이지안이나 지지벡터기계보다 우수하게 나타났다. 이것은 편차기반 분류모델이 장르내의 주제정보를 이용하여 학습하기 때문에 학습문서의 수가 적더라도 다른 학습방법보다 좋은 자질 선택 능력을 갖는다는 것을 입증한 것이다.

일반적, 영역 의존적 특성을 반영한 감정 자질의 의미지향성 추정 방법 (A Semantic Orientation Prediction Method of Sentiment Features Based on the General and Domain-Dependent Characteristics)

  • 황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-159
    • /
    • 2009
  • 본 논문은 한국어 문서 감정분류를 위한 중요한 어휘 자원인 감정자질(Sentiment Feature)의 의미지향성(Semantic Orientation) 추정을 위해 일반적인 특성과 영역(Domain) 의존적인 특성을 반영하여 한국어 문서 감정분류(Sentiment Classification)의 성능 향상을 얻을 수 있는 기법을 제안한다. 감정자질의 의미지 향성은 검색 엔진을 통해 추출한 각 감정 자질의 스니핏(Snippet)과 실험 말뭉치를 이용하여 추정할 수 있다. 검색 엔진을 통해 추출된 스니핏은 감정자질의 일반적인 특성을 반영하며, 실험 말뭉치는 분류하고자 하는 영역 의존적인 특성을 반영한다. 이렇게 얻어진 감정자질의 의미지향성 수치는 각 문장의 감정강도를 추정하기 위해 이용되며, 문장의 감정 강도의 값을 TF-IDF 가중치 기법에 접목하여 감정자질의 가중치를 책정한다. 최종적으로 학습 과정에서 긍정 문서에서는 긍정 감정자질, 부정 문서에서는 부정 감정자질을 대상으로 추가 가중치를 부여하여 학습하였다. 본 논문에서는 문서 분류에 뛰어난 성능을 보여주는 지지 벡터 기계(Support Vector Machine)를 사용하여 제안한 방법의 성능을 평가한다. 평가 결과, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 3.1%의 성능향상을 보였다.

  • PDF

Support Vector Machine과 인공신경망을 이용한 가스터빈 엔진의 결함 진단에 관한 연구 (Defect Diagnostics of Gas Turbine Engine Using Support Vector Machine and Artificial Neural Network)

  • 박준철;노태성;최동환;이창호
    • 한국추진공학회지
    • /
    • 제10권2호
    • /
    • pp.102-109
    • /
    • 2006
  • 본 논문에서 항공기용 터보 축 엔진의 결함 진단 알고리즘을 개발하기 위해 Support Vector Machine(SVM)과 인공신경망(ANN)을 이용하였다. 신경망을 이용한 시스템은 비선형성이 과도한 데이터를 학습할 때 지역 최소점(Local Minima)에 빠져 분류 정확률이 낮아질 수 있다. 이러한 위험성을 보안하기 위해 SVM에 의한 ANN의 분할 학습 알고리즘(SLA)을 제안하였다. 이것은 SVM을 이용하여 결함 위치를 판별 한 후 신경망이 선택적으로 학습을 하는 방법으로 학습 데이터의 비선형성을 줄여 분류 정확률을 높이기 때문에 신경망을 단독으로 사용할 때보다 개선된 성능을 보여주었다.

차분진화 기반의 Support Vector Clustering (A Differential Evolution based Support Vector Clustering)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제17권5호
    • /
    • pp.679-683
    • /
    • 2007
  • Vapnik의 통계적 학습이론은 분류, 회귀, 그리고 군집화를 위하여 SVM(support vector machine), SVR(support vector regression), 그리고 SVC(support vector clustering)의 3가지 학습 알고리즘을 포함한다. 이들 중에서 SVC는 가우시안 커널함수에 기반한 지지벡터를 이용하여 비교적 우수한 군집화 결과를 제공하고 있다. 하지만 SVM, SVR과 마찬가지로 SVC도 커널모수와 정규화상수에 대한 최적결정이 요구된다 하지만 대부분의 분석작업에서 사용자의 주관적 경험에 의존하거나 격자탐색과 같이 많은 컴퓨팅 시간을 요구하는 전략에 의존하고 있다. 본 논문에서는 SVC에서 사용되는 커널모수와 정규화상수의 효율적인 결정을 위하여 차분진화를 이용한 DESVC(differential evolution based SVC)를 제안한다 UCI Machine Learning repository의 학습데이터와 시뮬레이션 데이터 집합들을 이용한 실험을 통하여 기존의 기계학습 알고리즘과의 성능평가를 수행한다.

라즈베리파이 센서 네트워크 구현 (Implementation of a Raspberry-Pi-Sensor Network)

  • 문상국
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.915-916
    • /
    • 2014
  • 사물 인터넷 시대에 들어서면서 센서 네트워크는 더욱 주목을 받고 있다. 라즈베리파이는 작고 기능이 많아 센서 네트워크로 사용 시 인터넷 프로토콜을 사용하여 센서 노드로 동작이 가능하며, 하둡 클러스터 네트워크 구성이 가능하다. 본 논문에서는 5대의 라즈베리파이를 사용하여 실험적인 하둡 센서 네트워크 테스트베드 상의 5개의 노드를 가진 맵리듀스 하둡 소프트웨어 프레임워크를 구성하였다. 다양한 파라미터를 변경해가면서 네트워크 아키텍쳐를 분석하여 효율성, 자원분배, 처리속도를 비교하였다. 테스트 워크로드로는 지지벡터머신 기계학습을 사용하였고, 실험 결과 라즈베리파이는 센서 네트워크 노드로서 위치측정을 위한 분산 컴퓨팅 노드의 역할을 충분히 수행하였다.

  • PDF

평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출 (Relation Extraction based on Extended Composite Kernel using Flat Lexical Features)

  • 최성필;정창후;최윤수;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.642-652
    • /
    • 2009
  • 본 논문에서는 기존의 관계 추출 성능을 향상시키기 위해서 기존의 자질 기반 방법에서 추구하였던 개체 주변 문맥 다양성 정보의 추출 및 적용과 커널 기반 방법의 강점인 관계 인스턴스에 대한 구문 구조적 자질 정보의 통합 활용을 통한 확장된 혼합 커널을 제안한다. ACE RDC 코퍼스를 활용한 실험에서, 기존의 합성곱 구문 트리 커널 기반 혼합 커널을 기반으로 총 9 종류의 평면적 어휘 자질 집합을 정의하고 이를 적용함으로써 성능 향상에 기여하는 어휘 자질 유형을 파악할 수 있었으며, 적은 규모의 학습 집합으로도 현재 최고 수준의 성능에 필적하는 결과를 얻을 수 있었다. 결론적으로 관계 추출을 위한 세 가지 핵심 정보, 즉 개체 자질, 구문 구조적 자질, 주변 문맥 어휘 자질을 통합 적용하면 관계 추출의 성능을 향상시킬 수 있음을 알 수 있었다.

문장 감정 강도를 반영한 개선된 자질 가중치 기법 기반의 문서 감정 분류 시스템 (A Document Sentiment Classification System Based on the Feature Weighting Method Improved by Measuring Sentence Sentiment Intensity)

  • 황재원;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권6호
    • /
    • pp.491-497
    • /
    • 2009
  • 본 논문은 한국어 문서감정 분류에서 각 문장의 감정 정도의 차이를 고려하여 자질의 가중치를 계산하는 방법을 제안한다. 감정자질은 어휘 자원으로서 감정을 가지는 단어들의 집합이며, 학습데이터를 이용하여 이 감정자질의 카이제곱 통계량 값(${\chi}^2$ statistic)을 얻을 수 있다. 이렇게 얻어진 카이제곱 통계량 값으로 문서에서 출현한 각 문장의 감정강도를 수치화 할 수 있다. 각 문장의 감정강도는 문서에서 가장 강한 감정을 가진 문장에 근한 비율로 계산되며, 이 값을 TF-IDF 가중치 기법에 적용하여 최종적인 자질의 가중치를 결정하게 된다. 그리고 일반적으로 문서 분류에서 뛰어난 성능을 보여주는 지지벡터기계(Support Vector Machine)를 사용하여 기계학습을 수행한 후 성능을 평가한다. 성능평가에서 제안된 기법은 문장감정의 강도를 고려하지 않은 내용어(Content Word) 기반의 자질을 사용한 경우보다 약 2.0%의 성능향상을 얻었다.