• 제목/요약/키워드: Supervised learning

검색결과 747건 처리시간 0.025초

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

서포트 벡터 머신 기반 손동작 뇌전도 구분에 대한 연구 (SVM-Based EEG Signal for Hand Gesture Classification)

  • 홍석민;민창기;오하령;성영락;박준석
    • 한국전자파학회논문지
    • /
    • 제29권7호
    • /
    • pp.508-514
    • /
    • 2018
  • 뇌전도는 뇌 활동 시 발생하는 뇌 세포 간 상호작용으로 생성된 전기적 활동이며, 손동작 시 뇌 활동으로 인해 뇌전도가 발생한다. 본 연구에서는 16채널 뇌전도 측정 장비를 이용하여 손동작 전과 좌 혹은 우 손동작 시 발생되는 뇌전도를 측정하였으며, 측정된 데이터는 지도 학습 모델인 서포트 벡터 머신으로 분류하며, 서포트 벡터 머신의 학습 시간을 단축 위해 동작관련 정보 손실을 최소화하고, 뇌전도 정보를 축약할 수 있는 필터링을 통한 특징 추출과 벡터 차원 축소 기법을 제안한다. 분류 결과, 전두엽 부위의 전극에서 손동작 전 상태-손동작사이에서 평균 72.7 %의 정확도로 분류되었다.

신경망의 민감도 분석을 이용한 귀납적 학습기법의 변수 부분집합 선정 (Feature Subset Selection in the Induction Algorithm using Sensitivity Analysis of Neural Networks)

  • 강부식;박상찬
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.51-63
    • /
    • 2001
  • 데이터로부터 학습하여 룰을 추출하는 귀납적 학습기법은 데이터 마이닝의 주요 도구 중 하나이다. 귀납적 학습 기법은 불필요한 변수나 잡음이 섞인 변수를 포함하여 학습하는 경우 생성된 룰의 예측 성능이 떨어지고 불필요하게 룰이 복잡하게 구성될 수 있다. 따라서 귀납적 학습 기법의 예측력을 높이고 룰의 구성도 간단하게 할 수 있는 주요 변수 부분집합을 선정하는 방안이 필요하다. 귀납적 학습에서 예측력을 높이기 위해 많이 사용되는 부분집합 선정을 위한 포장 기법은 최적의 부분집합을 찾기 위해 전체 부분집합을 탐색한다. 이때 전체 변수의 수가 많아지면 부분집합의 탐색 공간이 너무 커져서 탐색하기 어려운 문제가 된다. 본 연구에서는 포장 기법에 신경망 민감도 분석을 결합한 귀납적 학습 기법의 변수 부분집합 선정 방안을 제시한다. 먼저, 신경망의 민감도 분석 기법을 이용하여 전체 변수를 중요도 순으로 순서화 한다. 다음에 순서화된 정보를 이용하여 귀납적 학습 기법의 예측력을 높일 수 있는 부분집합을 찾아 나간다. 제안된 방법을 세 데이터 셋에 적용한 결과 일정한 반복 회수 이내에 예측력이 향상된 부분집합을 얻을 수 있음을 볼 수 있다.

  • PDF

적응적 탐색 전략을 갖춘 계층적 ART2 분류 모델 (Hierarchical Ann Classification Model Combined with the Adaptive Searching Strategy)

  • 김도현;차의영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.649-658
    • /
    • 2003
  • 본 연구에서는 ART2 신경회로망의 성능을 개선하기 위한 계층적 구조를 제안하고, 구성된 클러스터에 대하여 적합도(fitness) 선택을 통한 빠르고 효과적인 패턴 분류 모델(HART2)을 제안한다. 본 논문에서 제안하는 신경회로망은 비지도 학습을 통하여 대략적으로 1차 클러스터를 형성하고, 이 각각의 1차 클러스터로 분류된 패턴에 대해 지도학습을 통한 2군 클러스터를 생성하여 패턴을 분류하는 계층적 신경회로망이다. 이 신경회로망을 이용한 패턴분류 과정은 먼저 입력패턴을 1차 클러스터와 비교하여 유사한 몇 개의 1차 클러스터를 적합도에 따라 선택한다. 이때, 입력패턴과 클러스터들간의 상대 측정 거리비에 기반한 적합도 함수를 도입하여 1차 클러스터에 연결된 클러스터들을 Pruning 함으로써 계층적인 네트워크에서의 속도 향상과 정확성을 추구하였다. 마지막으로 입력패턴과 선택된 1차 클러스터에 연결된 2차 클러스터와의 비교를 통해 최종적으로 패턴을 분류하게 된다. 본 논문의 효율성을 검증하기 위하여 22종의 한글 및 영어 글꼴에 대한 숫자 데이타를 다양한 형태로 변형시켜 확장된 테스트 패턴에 대하여 실험해 본 결과 제안된 신경회로망의 패턴 분류 능력의 우수함을 증명하였다

이미지의 질과 왜곡을 고려한 적대적 생성 신경망과 이를 이용한 비정상 검출 (Anomaly Detection of Generative Adversarial Networks considering Quality and Distortion of Images)

  • 서태문;강민국;강동중
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.171-179
    • /
    • 2020
  • 최근 연구 결과에 따르면, 컨볼루션 신경 회로망은 이미지 분류, 객체 검출, 이미지 생성 등의 문제에서 최고의 성능을 보여주고 있다. 비전 카메라를 사용한 결함 검사는 다른 결함 검사보다 경제적이기 때문에 공장 자동화에 있어서 아주 중요하고, 딥러닝의 지도학습은 전통 기계학습 방식의 결함 검사 성능을 월등히 뛰어넘었다. 하지만, 딥러닝의 지도학습은 엄청난 양의 데이터 주석 작업을 요구하기 때문에, 이를 실제 산업 현장에 적용하는 것은 효율적이지 않다. 따라서 본 연구는 최근 이미지 생성 과업에서 큰 성공을 보여주고 있는 변분 오토인코더와 적대적 생성 신경망을 활용하여 비지도 방식의 비정상 검출을 위한 신경망 회로 구조를 제안하였고, 이를 MNIST, 용접 결함 데이터에 적용하여 비정상 검출 성능을 검증하였다.

온라인 학습을 이용한 비전 기반의 차량 검출 및 추적 (Vision-Based Vehicle Detection and Tracking Using Online Learning)

  • 길성호;김경환
    • 한국통신학회논문지
    • /
    • 제39A권1호
    • /
    • pp.1-11
    • /
    • 2014
  • 본 논문에서는 추적중인 차량의 외형 변화에 대해 온라인 학습 능력이 있는 비전 기반의 차량 검출 및 추적 시스템을 제안한다. 제안하는 시스템은 새로 검출된 차량의 연속된 프레임 간 움직임을 빠르고 강건하게 추정하기 위해 특징점 기반 추적 방법을 사용한다. 동시에 추적중인 차량에 대해 온라인 차량 검출기를 훈련시키고, 일시적인 차량 추적 실패 시 검출기의 결과를 이용해 추적기를 재초기화하여 강건한 추적을 가능하게 한다. 특히 차량 외형 모델의 업데이트 방법을 개선하여 시스템의 추적 성능을 높이고 처리시간을 단축시켰다. 다양한 주행환경에서 획득한 데이터세트를 사용하여 제안하는 시스템의 차량 검출 및 추적 성능을 평가하였다. 특히 우천 및 터널통과와 같은 악조건에서 기존의 방법에 비해 차량 추적 성능이 상당히 개선된 것을 증명하였다.

학계와 산업계의 정보 대중성 변동과 인용 정보에 기반한 최신 기술 동향 식별 시스템 (An Emerging Technology Trend Identifier Based on the Citation and the Change of Academic and Industrial Popularity)

  • 김선호;이준규;와카스 라시드;여운동
    • 기술혁신학회지
    • /
    • 제14권spc호
    • /
    • pp.1171-1186
    • /
    • 2011
  • 본 연구는 대용량 학술 및 특허 데이터 분석을 기본으로하여 중소 기업이 필요로 하는 유망기술을 도출하는 모형을 제시하고자 하였다. 유망기술 발굴은 국가와 기관의 주요 결정권자가 시간이나 돈과 같은 제한된 자원을 효과적으로 사용할 수 있게 하기 위한 중요한 연구이다. 많은 연구자들이 유망기술 발굴 방법에 대한 연구를 수행하고 있고 모델을 제시하고 있지만 아직까지 더 향상된 방법론의 개발이 필요하다. 이 논문은 학계와 산업계의 데이터를 동시에 이용하여 주어진 기술의 유망 기술 여부를 판단하는 모델을 제안한다. 대부분의 다른 유망기술 발굴 모델과는 다르게 이 논문에서 제안하는 모델은 완전자동 학습 방식이 아닌, 전문가가 개입하는 준-자동 학습 방식의 기계 학습 방법을 이용한다. 이는 학습 속도을 양보하고 대신 정확성을 높이기 위한 방법으로 유망기술 발굴 시스템의 원래 목적에 적당하다. 또한 이 모델은 유망기술 초기 신호를 감지하기 위해 학술 데이터의 인용정보를 분석하여 학습하도록 하였다.

  • PDF

유전자 알고리즘을 사용한 구조적응 자기구성 지도의 최적화 (Optimization of Structure-Adaptive Self-Organizing Map Using Genetic Algorithm)

  • 김현돈;조성배
    • 한국지능시스템학회논문지
    • /
    • 제11권3호
    • /
    • pp.223-230
    • /
    • 2001
  • 자기구성 지도는 주어진 입력에 대해 올바른 출력 값이 제공되지 않는 비교사 방식으로 학습된다. 또한, 반응하는 순서나 위치를 통해 위상이 보존(topology preserving)되는 특성을 가지고 있어 많은 분야에 응용되고 있다. 그러나, 자기 구성지도는 학습이 되기 전에 위상을 미리 고정시켜야 하기 때문에 실제 문제에 적용하기 어렵다는 단점을 가지고 있다. 구조 적응형 자기구성 지도는 자기구성 지도의 고정된 구조 때문에 발생하는 문제를 해결하기 위해 지도의 구조를 학습 중에 적절하게 변경시킨다. 이때, 변화된 구조의 가중치를 어떻게 초기화시킬 것인가 하는 것이 또한 중요한 문제이다. 이 논문에서는 구조 적응형 자기구성 지도 모델에서 유전자 알고리즘을 이용하여 분화된 노드의 가중치를 결정하는 방법을 제안한다. 이 방법은 기존의 구조 적응형 자기구성 지도보다 다소 높은 인식률을 보였고, 숫자 별 인식률 편차를 줄일 수 있었다. 오프라인 필기 숫자 데이터로 실험한 결과, 제안한 방법이 유용함을 알 수 있었다.

  • PDF

전역적 범주화를 위한 샘플 분할 포인트를 이용한 점진적 기법 (An Incremental Method Using Sample Split Points for Global Discretization)

  • 한경식;이수원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권7호
    • /
    • pp.849-858
    • /
    • 2004
  • 대부분의 교사학습 알고리즘은 수치형 변수 처리의 어려움을 해결하기 위해 전처리 단계에서 연속형 변수를 범주형으로 변환시킨 후 적용된다. 이러한 전처리 단계를 전역적 범주화라 하며 빈즈(Bins)라는 클래스 분포 리스트를 이용한다. 그러나 대부분의 전역적 범주화 기법은 단일 빈즈를 필요로 하기 때문에 데이타가 대용량이고 범주화를 수행할 변수의 범위가 매우 클 경우, 단일 빈즈를 생성하기 위해 많은 정렬 및 병합을 수행해야한다. 또한, 기존의 방법은 일괄처리 방식으로 범주화를 수행하기 때문에 새로운 데이타가 추가되면 이 데이타가 반영된 범주를 생성하기 위해 처음부터 범주화를 다시 수행해야한다. 본 논문은 이러한 문제점을 해결하기 위해 샘플 분할 포인트를 추출하고 이로부터 범주화를 수행하는 기법을 제안한다. 본 논문의 접근 방법은 단일 빈즈를 생성하기 위한 병합이 필요 없기 때문에 대용량 데이타에 대한 범주화를 수행할 때 효율적이다. 본 연구에서는 실제 데이타와 가상의 데이타를 이용하여 기존의 방법과 비교 실험하였다.

블라인드 등화를 위한 최소 에러 엔트로피 성능기준들에 관한 연구 (A Study on the Minimum Error Entropy - related Criteria for Blind Equalization)

  • 김남용;권기현
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권3호
    • /
    • pp.87-95
    • /
    • 2009
  • 정보이론적 학습 기법에 해당하는 에러 엔트로피 최소화 (MEE) 성능기준과 상호 상관 엔트로피 최대화 (MCC) 성능기준은 그 동안 깊이 있게 많은 연구가 이루어져 왔다. 에러 엔트로피 최소화 성능기준은 정보 포텐셜을 최대화하는 것으로 귀결되고 상호 상관 엔트로피 최대화 성능기준은 시스템의 출력과 원신호의 상호 상관도를 최대화하는 것으로 정의된다. 이 두 성능기준을적정 가중치를 두고 합성한 것이 기준점을 내포한 에러 엔트로피 최소화 기법 (MEEF) 인데 이 또한 많은 연구가 이루어지고 있다. 이 논문에서는 블라인드 채널 등화를 위해 CMA에 쓰이는 상수 모듈러스 에러 (CME)를 도입하여 이 정보이론적 학습기법에 적용하고자 그 가능성과 문제점을 찾고자 연구하였다. 또한 MEEF 성능기준에도 이 CME 적용가능성을 연구하였다. 연구결과로부터 CME를 적용한 MEE (MEE-CME)는 상수 모듈러스 정보를 잃게 되는 결과를 낳았다. 이 결과 MEE-CME나 MEE를 사용하는 MEEF-CME 모두에게서 수렴하지 못하거나 CME를 사용하는 다른 방식과 비교할 때 수렴이 늦게 되는 문제점을 발견하게 되었다.

  • PDF