• 제목/요약/키워드: 기계학습 알고리즘

검색결과 774건 처리시간 0.031초

베이지안 부스팅학습에 의한 문서 분류 (Text Classification By Boosting Nave Bayes)

  • 김유환;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.256-258
    • /
    • 2000
  • 최근 들어, 여러 기계학습 알고리즘이 문서 분류와 여과에 사용되고 있다. 특히 AdaBoost와 같은 부스팅 알고리즘은 실세계의 문서 데이터에 사용되었을 때 비교적 좋은 성능을 보이는 것으로 알려져 있다. 그러나 지금까지의 부스팅 알고리즘은 모두 단어의 존재 여부만을 가지고 판단하는 분류자를 기반으로 하고 있기 때문에 가중치 정보를 충분히 사용할 수 없다는 단점이 있다. 이 논문에서는 나이브 베이스를 사용한 부스팅 알고리즘은 단어의 가중치 정보를 효율적으로 사용할 수 있을 뿐 아니라. 확률적으로도 의미있는 신뢰도(confidence ratio)를 생성 할 수 있기 때문이다. TREC-7과 TREC-8의 정보 여과 트랙(filtering track)에 대해서 실험한 결과 좋은 성능을 보여주었다.

  • PDF

분류 알고리즘에 대한 경험적 비교연구

  • 전홍석;이주영
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2000년도 춘계학술대회
    • /
    • pp.411-422
    • /
    • 2000
  • 본 연구에서는 결정트리 분야에서 각 분류알고리즘을 살펴보고 통계학의 판별분석과 기계학습(Machine Learning)분야에서 분류알고리즘을 비교하고, 자료에 따라 오분류율을 분석 하였다.

  • PDF

기계학습 기반의 클라우드를 위한 센서 데이터 수집 및 정제 시스템 (Sensor Data Collection & Refining System for Machine Learning-Based Cloud)

  • 황치곤;윤창표
    • 한국정보통신학회논문지
    • /
    • 제25권2호
    • /
    • pp.165-170
    • /
    • 2021
  • 기계학습은 최근 대부분의 분야에서 적용하여 연구를 하고 있다. 이것은 기계학습의 결과가 결정된 것이 아니라 입력데이터의 학습으로 목적함수를 생성하고, 이를 통해 통하여 새로운 데이터에 대한 판단이 가능하기 때문이다. 또한, 축적된 데이터의 증가는 기계학습 결과의 정확도에 영향을 미친다. 이에 수집된 데이터는 기계학습에 중요한 요인이다. 제안하는 본 시스템은 서비스 제공을 위한 클라우드 시스템과 지역의 포그 시스템의 융합 시스템이다. 이에 클라우드 시스템은 서비스를 위한 머신러닝과 기반 구조를 제공하고, 포그 시스템은 클라우드와 사용자의 중간에 위치하여 데이터 수집 및 정제를 수행한다. 이를 적용하기 위한 데이터는 스마트기기에서 발생하는 센세 데이터로 한다. 이에 적용된 기계학습 기법은 분류를 위한 SVM알고리즘, 상태 인지를 위한 RNN 알고리즘을 이용한다.

u -Office 서비스 추론 기술을 위한 기계학습 기반 알고리즘

  • 김승혜;홍은재;박병철;박형곤
    • 정보와 통신
    • /
    • 제32권4호
    • /
    • pp.10-15
    • /
    • 2015
  • 본고에서는 u-Office 서비스를 실현하기 위하여 이동 단말 기기로부터 수신한 사용자의 시간 및 위치 이동 정보를 이용해서 사용자에게 유용한 서비스를 제공하는 데 필요한 사용자 맞춤형 서비스 제공 통합 프레임워크 및 추론 기술 알고리즘에 대해 기술하고자 한다. 사용자 맞춤형 서비스제공 통합 프레임워크는 사용자 이동단말기 및 시간 및 이동 데이터를 저장하는 AP, AP의 데이터를 수집하는 데이터베이스, 사용자 이동 단말 어플리케이션 등으로 구성되어있으며, 사용자의 시간 및 위치 정보를 학습하여 이동 경로를 예측하고 유용한 서비스를 제공하기 위해 사용된 기계학습 기반 추론 알고리즘에 대하여 알아본다. u-Office 서비스를 실현하기 위하여 실제로 캠퍼스 및 교실범위로 구현한 사용자 패턴기반 맞춤형 서비스 프레임워크에 대해 알아보고 제공 가능한 서비스에 대하여 논의한다.

지능형 에이전트의 환경 적응성 및 확장성에 대한 연구 (The study on environmental adaptation and expansion of the intelligent agent)

  • 백혜정;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2003
  • 로봇이나 가상 캐릭터와 같은 지능형 에이전트가 자율적으로 살아가기 위해서는 주어진 환경을 인식하고, 그에 맞는 최적의 행동을 선택하는 능력을 가지고 있어야 한다. 본 논문은 이러한 지능형 에이전트를 구현하기 위하여, 외부 환경에 적응하면서 최적의 행동을 배우고 선택하는 방법을 연구하였다. 본 논문에서 제안한 방식은 강화 학습을 이용한 행동기반 학습 방법과 기호 학습을 이용한 인지 학습 방법을 통합한 방식으로 다음과 같은 특징을 가진다. 첫째, 외부 환경의 적응성을 수행하기 위하여 강화 학습을 이용하였으며. 이는 지능형 에이전트가 변화하는 환경에 대한 유연성을 가지도록 하였다. 둘째. 경험들에서 귀납적 기계학습과 연관 규칙을 이용하여 규칙을 추출하여 에이전트의 목적에 맞는 환경 요인을 학습함으로 주어진 환경에서 보다 빠르게, 확장된 환경에서 보다 효율적으로 행동을 선택을 하도록 하였다. 제안한 통합방식은 기존의 강화 학습만을 고려한 학습 알고리즘에 비하여 학습 속도를 향상 시킬수 있으며, 기호 학습만을 고려한 학습 알고리즘에 비하여 환경에 유연성을 가지고 행동을 적용할 수 있는 장점을 가진다.

  • PDF

Azure 클라우드 플랫폼의 가상서버 호스팅을 이용한 데이터 수집환경 및 분석에 관한 연구 (A study on data collection environment and analysis using virtual server hosting of Azure cloud platform)

  • 이재규;조인표;이상엽
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.329-330
    • /
    • 2020
  • 본 논문에서는 Azure 클라우드 플랫폼의 가상서버 호스팅을 이용해 데이터 수집 환경을 구축하고, Azure에서 제공하는 자동화된 기계학습(Automated Machine Learning, AutoML)을 기반으로 데이터 분석 방법에 관한 연구를 수행했다. 가상 서버 호스팅 환경에 LAMP(Linux, Apache, MySQL, PHP)를 설치하여 데이터 수집환경을 구축했으며, 수집된 데이터를 Azure AutoML에 적용하여 자동화된 기계학습을 수행했다. Azure AutoML은 소모적이고 반복적인 기계학습 모델 개발을 자동화하는 프로세스로써 기계학습 솔루션 구현하는데 시간과 자원(Resource)를 절약할 수 있다. 특히, AutoML은 수집된 데이터를 분류와 회귀 및 예측하는데 있어서 학습점수(Training Score)를 기반으로 보유한 데이터에 가장 적합한 기계학습 모델의 순위를 제공한다. 이는 데이터 분석에 필요한 기계학습 모델을 개발하는데 있어서 개발 초기 단계부터 코드를 설계하지 않아도 되며, 전체 기계학습 시스템을 개발 및 구현하기 전에 모델의 구성과 시스템을 설계해볼 수 있기 때문에 매우 효율적으로 활용될 수 있다. 본 논문에서는 NPU(Neural Processing Unit) 학습에 필요한 데이터 수집 환경에 관한 연구를 수행했으며, Azure AutoML을 기반으로 데이터 분류와 회귀 등 가장 효율적인 알고리즘 선정에 관한 연구를 수행했다.

  • PDF

문학 텍스트를 활용한 머신러닝 언어모델 구현 (Machine Learning Language Model Implementation Using Literary Texts)

  • 전현구;정기철;권경아;이인성
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.427-436
    • /
    • 2021
  • 본 연구의 목적은 문학 텍스트를 학습한 머신 러닝 언어 모델을 구현하는데 있다. 문학 텍스트는 일상 대화문처럼 질문에 대한 답변이 분명하게 구분되지 않을 때가 많고 대명사와 비유적 표현, 지문, 독백 등으로 다양하게 구성되어 있다는 특징이 있다. 이런 점들이 알고리즘의 학습을 용이하지 않게 하여 문학 텍스트를 활용하는 기계 학습의 필요성을 저해시킨다. 문학 텍스트를 학습한 알고리즘이 일반 문장을 학습한 알고리즘에 비해 좀 더 인간 친화적인 상호작용을 보일 가능성이 높다. 본 논문은 '문학 텍스트를 학습한 머신 러닝 언어 모델 구현'에 관한 연구로서, 대화형 기계 학습에 문학 텍스트를 활용하는 연구에서 필수적으로 선행되어야 할 세 가지 텍스트 보정 작업을 제안한다: 대명사 처리, 대화쌍 늘리기, 데이터 증폭 등에 대한 내용으로 기계 학습이 용이하고 그 효과도 높다고 판단됩니다. 인공지능을 위한 학습용 데이터는 그 의미가 명료해야 기계 학습이 용이하고 그 효과도 높게 나타난다. 문학과 같은 특수한 장르의 텍스트를 자연어 처리 연구에 도입하는 것은 새로운 언어 학습 방식의 제안과 함께 머신 러닝의 학습 영역도 확장시켜 줄 것이다.

기계학습을 활용한 5G통신 동향 (Research Trends on 5G Communications using Machine Learning)

  • 김근영;김용선;남준영;이우용;서지훈;홍승은
    • 전자통신동향분석
    • /
    • 제31권5호
    • /
    • pp.1-10
    • /
    • 2016
  • 빅데이터를 통한 학습, GPU를 활용한 고속 컴퓨팅 및 다양한 알고리즘 개발과 더불어 기계학습은 다양한 분야에서 종래에 이루어내지 못한 뛰어난 성과를 달성하고 있다. 그동안 상용화된 통신 시스템에서 기계학습이 활성화되지 못했지만, 전례없는 다양한 서비스와 단말을 아우르는 5G 통신에서는 더욱 적극적으로 활용될 것으로 예상된다. 기계학습은 링크 적응 등 무선접속기술, 다양한 망이 혼재된 이종망 기술, 트래픽 분류 등을 위한 네트워크 기술, 침입 탐지를 위한 보안 기술 등 다양한 통신기술에서 연구됐다. 또한, 최근에는 유럽의 Public Private Partnership(5G PPP) 프로젝트를 비롯하여 다양한 그룹에서 활발히 연구되고 있으며, 컬컴/노키아/에릭슨 등 통신 관련 기업들도 적극적인 투자를 하고 있다. 본고에서는 기계학습 관련 통신기술, 연구그룹 및 기업 동향을 소개하고, 이를 통해 5G 통신 적용 가능성을 짚어본다.

  • PDF

Deep Learning: 기계학습의 새로운 트랜드

  • 김인중
    • 정보와 통신
    • /
    • 제31권11호
    • /
    • pp.52-57
    • /
    • 2014
  • Deep learning은 많은 수의 계층으로 이루어진 깊은 신경망을 학습하기 위한 연구 분야이다. 지난 수 년 동안 deep learning은 다양한 분야에 적용되어 기존 방법들을 능가하는 높은 성능을 보였으며, 그 결과 기계학습 및 패턴인식 분야에서 가장 중요한 기술적 트랜드가 되어가고 있다. 깊은 신경망의 장점과 그 동안 깊은 신경망의 학습이 어려웠던 이유를 설명하고 이러한 어려움을 극복한 새로운 알고리즘들을 소개한다. 마지막으로 deep learning의 성공적 응용 사례에 대해 소개한다.

실시간 침입탐지 시스템에 관한 연구 (A Study on Realtime Intrusion Detection System)

  • 김병주
    • 한국정보통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.40-44
    • /
    • 2005
  • 인공지능, 기계학습 및 데이터마이닝 기법들을 침입탐지 시스템에 적용하는 연구가 활발히 진행되고 있다. 그러나 많은 연구가 공격패턴의 분류를 위한 분류기(classifier)의 학습 알고리즘 성능 개선에 목적을 두고 있다. 그리고 이러한 학습 알고리즘은 대부분 일괄처리(batch) 방식으로 동작하여 실시간 침입탐지 시스템의 적용에는 적합하지 못하다. 본 논문에서는 실시간 침입탐지 시스템을 위한 점증적 특징 추출 기법과 분류가 가능한 실시간 침입탐지 시스템을 제안한다. 제안된 방법을 KDD CUP 99 자료에 적용한 결과 실시간 기법임에도 불구하고 일괄처리 방식과 비슷한 결과를 나타내었다.