• 제목/요약/키워드: 기계학습법

검색결과 170건 처리시간 0.026초

문서 클러스터링 기법을 활용한 병렬 정보 검색 (Parallel Information Retrieval using Document Clustering Techniques)

  • 강유경;박세진;류광렬;정상화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.750-752
    • /
    • 1998
  • 본 논문은 고품질의 정보를 신속하게 제공할 수 있으며, cost-effective 한 medium-grained 병렬 정보 검색 시스템을 제시하고 있다. 본 검색 시스템은 병렬 모델의 효율을 극대화하는 방안으로 문서 라이브러리를 작은 단위의 클러스터로 세분화하고 검색 시 클러스터 단위로 프로세서에 할당될 수 있게 하여 할당될 작업의 단위를 적절히 중규모화하였을 뿐만 아니라, 각 클러스터마다 독립적인 염색인 파일을 별도로 두어 순위 부여 계산시 통신을 최소화 할 수 있도록 하였다. 또한, 기계 학습 기법을 이용하여 가능한 한 유사한 문서군이 되도록 클러스터링 함으로써 불필요한 크러스터가 검색될 가능성을 최소화하여 성능을 높였다. 본 검색 시스템은 분산메모리 MIMD 구조의 트랜스퓨터에서 구현되었으며, Connection machine에서 사용되는 Stanfill방법과의 비교 실험을 통하여 계층적인 접근법의 성능을 비교, 평가하였다. 그리고 random클러스터링 기법과 비교하여 기계학습을 통한 클러스터링 접근방법이 우수함을 보이고 있다.

  • PDF

최적의 퍼지제어규칙을 얻기위한 퍼지학습법 (A Learning Algorithm for Optimal Fuzzy Control Rules)

  • 정병묵
    • 대한기계학회논문집A
    • /
    • 제20권2호
    • /
    • pp.399-407
    • /
    • 1996
  • A fuzzy learning algorithm to get the optimal fuzzy rules is presented in this paper. The algorithm introduces a reference model to generate a desired output and a performance index funtion instead of the performance index table. The performance index funtion is a cost function based on the error and error-rate between the reference and plant output. The cost function is minimized by a gradient method and the control input is also updated. In this case, the control rules which generate the desired response can be obtained by changing the portion of the error-rate in the cost funtion. In SISO(Single-Input Single- Output)plant, only by the learning delay, it is possible to experss the plant model and to get the desired control rules. In the long run, this algorithm gives us the good control rules with a minimal amount of prior informaiton about the environment.

나이브 베이지안 학습법에 기초한 북마크 분류 에이전트 (Bookmark Classification Agent Based on Naive Bayesian Learning Method)

  • 최정민;김인철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.405-408
    • /
    • 2000
  • 최근 인터넷의 발전으로 많은 정보와 지식을 우리는 인터넷에서 제공받을 수 있게되었다. 인터넷에 존재하는 정보는 수많은 웹서버에 산재되어 있으며, 정보의 위치는 주소(URL)를 가지고 존재하게 되는데 사용자는 자신이 관심있는 정보의 주소를 저장하기 위하여 웹브라우저 북마크(Bookmark)기능을 사용한다. 그러나 북마크 기능은 웹문서의 주소 저장에 일차적인 목적을 두고 있으며, 이후 북마크의 개수가 증가하면, 사용자는 북마크관리가 어렵게되므로 사용자 북마크 파일을 자동으로 분류하여 관리할수 있는 에이전트 기술을 사용하고자 한다. 대표적인 분류에이전트 시스템으로는 전자우편 분류 에이전트인 Maxims, 뉴스기사 분류 에이전트인 NewT, 엔터테인먼트(Entertainment) 선별 에이전트인 Ringo 등이 있다. 이러한 시스템들은 분류할 대상에 따라 조금씩 다른 모습의 에이전트 기능을 보이고 있으며, 본 논문은 기계학습 이론중 교사학습 알고리즘인 나이브 베이지안 학습방법(Naive Bayesian Learning method)을 사용하여 사용자가 분류하지 못한 북마크를 자동으로 분류하는 단일 에이전트 기반 북마크 분류기를 설계, 구현하고자한다.

  • PDF

게임 프로그램 이해를 통한 ″프로그래밍″학습 (Programing Learning by Understanding of Game Programs)

  • 신재훈;김종훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.661-663
    • /
    • 2001
  • '컴퓨터 교육'이라는 개념은 컴퓨터를 이용한 교육과 컴퓨터를 배우는 교육 두 가지 의미를 동시에 가지고 있기 때문에 사용하는데 주의를 기울여야 한다. 후자의 개념으로서 '컴퓨터 교육'은 전산학에 대한 개론 및 프로그래밍과 관련된 학습이 핵심을 이룬다. 특히 프로그래밍의 학습의 경우는 코딩, 컴파일링, 디버깅 등의 복잡한 과정과 함께 운영체제 및 하드웨어에 대한 지식 같은 프로그래밍 외적인 분야에 대해서도 다양한 이해가 요구된다. 기존의 프로그래밍 학습은 프로그래밍 언어의 문법에 대한 기계적 암기나 사용법을 익히는 것에 치중하여 논리적인 사고를 키우는데 적합하지 못했다. 이에 본 논문에서는 프로그래밍에 대한 기본적인 통찰력을 기를 수 있도록 프로그래밍 언어의 기초가 되는 C로 코딩된 게임 프로그램들을 분석.이해한다.

  • PDF

기계학습법을 이용한 서리 발생 구분 추정 연구 (Study on the Estimation of Frost Occurrence Classification Using Machine Learning Methods)

  • 김용석;심교문;정명표;최인태
    • 한국농림기상학회지
    • /
    • 제19권3호
    • /
    • pp.86-92
    • /
    • 2017
  • 본 연구에서는 기상청 예보자료를 이용할 것을 전제로 서리가 발생하는 날과 서리가 발생하지 않는 날을 구분하는 모형을 구축하였다. 서리가 발생한 날과 서리가 발생하지 않은 날을 구분할 수 있는 기상인자로서 최저기온, 평균풍속, 평균상대습도, 평균이슬점온도로 나타났다. 기상인자별로 두 날을 비교한 결과 서리가 발생한 날이 서리가 발생하지 않은 날에 비해 최저기온, 이슬점온도, 평균풍속은 낮게 나타났고 상대습도는 높게 나타났다. 이러한 기상인자로 인공신경망, 랜덤포레스트, 서포트벡터 머신의 기계학습법을 이용한 모형을 연구한 결과 70%이상의 정확도를 나타내어 활용 가능성이 있을 것으로 판단된다.

암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법 (A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis)

  • 최종환;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.397-402
    • /
    • 2019
  • 암 환자에게 적절한 치료계획을 제공하기 위해 암의 진행양상 또는 환자의 생존 기간 등에 해당하는 환자의 예후를 정확히 예측하는 것은 생물정보학 분야에서 다루는 중요한 도전 과제 중 하나이다. 많은 연구에서 암 환자의 유전자 발현량 데이터를 이용하여 환자의 예후를 예측하는 기계학습 모델들이 많이 제안되어 오고 있다. 유전자 발현량 데이터는 약 17,000개의 유전자에 대한 수치값을 갖는 고차원의 수치형 자료이기에, 기존의 연구들은 특징 선택 또는 차원 축소 전략을 이용하여 예측 모델의 성능 향상을 도모하였다. 그러나 이러한 접근법은 특징 선택과 예측 모델의 훈련이 분리되어 있어서, 기계학습 모델은 선별된 유전자들이 생물학적으로 어떤 관계가 있는지 알기가 어렵다. 본 연구에서는 유전자 발현량 데이터를 이미지 형태로 변환하여 예후 예측이 효과적으로 특징 선택 및 예후 예측을 수행할 수 있는 기법을 제안한다. 유전자들 사이의 생물학적 상호작용 관계를 유전자 발현량 데이터에 통합하기 위해 Node2Vec을 활용하였으며, 2차원 이미지로 표현된 발현량 데이터를 효과적으로 학습할 수 있도록 합성곱 신경망 모델을 사용하였다. 제안하는 모델의 성능은 이중 교차검증을 통해 평가되었고, 유전자 발현량 데이터를 그대로 이용하는 기계학습모델보다 우월한 예후 예측 정확도를 가지는 것이 확인되었다. Node2Vec을 이용한 유전자 발현량의 새로운 이미지 표현법은 특징 선택으로 인한 정보의 손실이 없어 예측 모델의 성능을 높일 수 있으며, 이러한 접근법이 개인 맞춤형 의학의 발전에 이바지할 것으로 기대한다.

개념학습을 위한 DNA 컴퓨팅 기반 커널의 설계 (Design of Kernels Based on DNA Computing for Concept Learning)

  • 노영균;김청택;장병탁
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.177-181
    • /
    • 2005
  • 기계학습에서 커널을 이용한 방법은 그 응용범위가 기계학습의 전반에 걸쳐 다양하게 이용되고 있으며, 그 성능 또한 기존의 방법들을 앞지르고 있다. 이는 기존의 비선형적 접근을 커널을 이용한 고차원 공간에서의 선형적 접근법으로 바꿈으로써 가능하게 되는 것이다. 다양한 분야에 적용되는 많은 커널들이 존재하며 각 커널들은 특별한 분야에 적용되기 쉽도록 다른 형태를 띠고 있기도 하지만, 커널로서 작용하기 위해 양한정 조건(positive definiteness)을 만족해야 한다. 본 연구에서는 DNA 문제에 직접 적용시킬 수 있는 방법으로서의 새로운 커널을 제시한다. 또한 매트로폴리스(Metropolis) 알고리즘을 이용하여 DNA의 hybridization과정을 모사함으로써 새로운 종류의 커널이 양한정(positive definite) 조건을 만족시킬 수 있는 방법을 제시한다. 새로 만들어진 커널이 행렬값을 형성해 나가는 과정을 살펴보면 인간이 예(instance)로부터 개념을 형성해 나가는 과정과 흡사한 양상을 보이는 것을 알 수 있다. 개념을 나타내는 좋은 예로서의 표본(prototype)으로부터 개념이 형성되어 가는 과정은 표본(prototype)이 아닌 예로부터 개념이 형성되는 과정과 다른 양상을 띠는 것과 같은 모양을 보인다.

  • PDF

비선형 구동기의 변수추정을 통한 학습입력성형제어기 (Learning Input Shaping Control with Parameter Estimation for Nonlinear Actuators)

  • 김득현;성윤경;장완식
    • 대한기계학회논문집A
    • /
    • 제35권11호
    • /
    • pp.1423-1428
    • /
    • 2011
  • 본 논문은 비선형 구동기를 포함한 유연시스템의 잔류변위저감을 위한 학습입력성형제어기를 제시한다. 제시되는 제어기는 비선형 구동기에 대한 입력성형제어기, 반복최소자승법 및 설계변수 updating rule 을 통합하여 개발된다. 비선형 구동기에 대응한 입력성형제어기 설계변수의 updating mechanism 을 개선하기 위한 잔류변위 측정함수가 제시된다. 제시된 제어방법을 pendulum system 에 적용하여 변수추정의 수렴성과 변위저감제어성능의 평가를 통해 수치해석적으로 실용성이 검증된다.

균형 표본 유전 알고리즘과 극한 기계학습에 기반한 바이오표지자 검출기와 파킨슨 병 진단 접근법 (Bio-marker Detector and Parkinson's disease diagnosis Approach based on Samples Balanced Genetic Algorithm and Extreme Learning Machine)

  • ;;최용수
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권6호
    • /
    • pp.509-521
    • /
    • 2016
  • 본 논문에서는 파킨슨 병 진단 및 바이오 표지자 검출을 위한 극한 기계학습을 결합하는 새로운 균형 표본 유전 알고리즘(SBGA-ELM)을 제안하였다. 접근법은 정확한 파킨슨 병 진단 및 바이오 표지자 검출을 위해 공개 파킨슨 병 데이터베이스로부터 22,283개의 유전자의 발현 데이터를 사용하며 다음의 두 가지 주요 단계를 포함하였다 : 1. 특징(유전자) 선택과 2. 분류단계이다. 특징 선택 단계에서는 제안된 균형 표본 유전 알고리즘에 기반하고 파킨스병 데이터베이스(ParkDB)의 유전자 발현 데이터를 위해 고안되었다. 제안된 제안 된 SBGA는 추가적 분석을 위해 ParkDB에서 활용 가능한 22,283개의 유전자 중에서 강인한 서브셋을 찾는다. 특징분류 단계에서는 정확한 파킨슨 병 진단을 위해 선택된 유전자 세트가 극한 기계학습의 훈련에 사용된다. 발견 된 강인한 유전자 서브세트는 안정된 일반화 성능으로 파킨슨 병 진단을 할 수 있는 ELM 분류기를 생성하게 된다. 제안된 연구에서 강인한 유전자 서브셋은 파킨슨병을 관장할 것으로 예측되는 24개의 바이오 표지자를 발견하는 데도 사용된다. 논문을 통해 발견된 강인 유전자 하위 집합은 SVM이나 PBL-McRBFN과 같은 기존의 파킨슨 병 진단 방법들을 통해 검증되었다. 실시된 두 가지 방법(SVM과 PBL-McRBFN)에 대해 모두 최대 일반화 성능을 나타내었다.