• 제목/요약/키워드: 일괄 학습 방법

검색결과 25건 처리시간 0.023초

사이버 ISR에서의 점진적 학습 방법과 일괄 학습 방법 비교 (Comparison of incremental learning method and batch learning method in Cyber ISR)

  • 신경일;윤호상;신동일;신동규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.861-864
    • /
    • 2017
  • 사이버 ISR을 통하여 정보를 획득하는 과정에서 데이터를 추출하고 이를 스스로 가공하여 의사결정에 도움을 줄 수 있는 에이전트를 연구하는 과정에서 폐쇄망에 침투했을 경우 이를 효과적으로 감시 정찰할 수 있는 방법을 논의한다. 폐쇄망으로 인하여 침투한 컴퓨터에 심어진 에이전트는 C&C서버와 원활한 교류가 불가능하게 되는데, 이때 스스로 살아남아 지속적으로 데이터를 수집하며, 분석을 하기 위해서는 한정된 자원과 시간을 활용하여야 발각되지 않고 계속하여 임무를 수행할 수 있다. 특히 분석하는 과정에서 많은 자원과 시간을 활용하는 때 이를 해결하기 위해 본인은 점진적 학습방법을 이용하는 것을 제안하며, 일괄학습 방법과 함께 비교하는 실험을 해보았다.

사이버 감시정찰의 정보 분석에 적용되는 점진적 학습 방법과 일괄 학습 방법의 성능 비교 (Comparison of Performance Between Incremental and Batch Learning Method for Information Analysis of Cyber Surveillance and Reconnaissance)

  • 신경일;윤호상;신동일;신동규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.99-106
    • /
    • 2018
  • 사이버 감시정찰은 공개된 인터넷, 아군 및 적군 네트워크에서 정보를 획득한다. 사이버 ISR에서 에이전트를 활용하여 데이터를 수집하고, 수집한 데이터를 C&C 서버에 전송하여 수집한 데이터를 분석 한 후 해당 분석 결과를 이용하여 의사결정에 도움을 줄 수 있다. 하지만 네트워크 구성에 따라 침투한 컴퓨터에 심어진 에이전트와 외부 네트워크에 존재하는 C&C 서버 간 정기적인 통신이 불가능하게 되는 경우가 존재한다. 이때 에이전트는 C&C 서버와 통신이 재개되는 짧은 순간에 데이터를 C&C 서버에 전달하고, 이를 받은 C&C 서버는 수집한 데이터를 분석한 후 다시 에이전트에게 명령을 내려야한다. 따라서 해당 문제를 해결하기 위해서는 짧은 시간 내에 빠르게 학습이 가능하며, 학습 과정에서 많은 자원을 소모하지 않고도 학습할 수 있어야한다. 본 연구에서는 점진적 학습 방법을 일괄 학습 방법과 비교하는 실험을 통해 우수성을 보여주고 있다. 점진적 학습 방법을 사용한 실험에서는 500M 이하의 메모리 리소스로 제한된 환경에서 학습소요시간을 10배 이상 단축시키는 결과를 보여 주었으나, 잘못 분류된 데이터를 재사용하여 학습 모델을 개선하는 실험에서는 재학습에 소요되는 시간이 200% 이상 증가하는 문제점이 발견되었다.

실시간 침입탐지 시스템에 관한 연구 (A Study on Realtime Intrusion Detection System)

  • 김병주
    • 한국정보통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.40-44
    • /
    • 2005
  • 인공지능, 기계학습 및 데이터마이닝 기법들을 침입탐지 시스템에 적용하는 연구가 활발히 진행되고 있다. 그러나 많은 연구가 공격패턴의 분류를 위한 분류기(classifier)의 학습 알고리즘 성능 개선에 목적을 두고 있다. 그리고 이러한 학습 알고리즘은 대부분 일괄처리(batch) 방식으로 동작하여 실시간 침입탐지 시스템의 적용에는 적합하지 못하다. 본 논문에서는 실시간 침입탐지 시스템을 위한 점증적 특징 추출 기법과 분류가 가능한 실시간 침입탐지 시스템을 제안한다. 제안된 방법을 KDD CUP 99 자료에 적용한 결과 실시간 기법임에도 불구하고 일괄처리 방식과 비슷한 결과를 나타내었다.

수정된 커널 주성분 분석 기법의 분류 문제에의 적용 (Modified Kernel PCA Applied To Classification Problem)

  • 김병주;심주용;황창하;김일곤
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.243-248
    • /
    • 2003
  • 본 논문에서는 학습 자료로부터 비선형 특징추출과 분류를 위한 점진적인 커널 주성분 분석 방법(IKPCA)을 제안한다. 일괄처리 방식의 커널 주성분 분석 방법은 학습 자료의 크기가 클 경우 과도한 계산량이 문제가 된다. 또한 새로 추가 되는 학습 자료가 있을 경우 고유벡터를 계산하기 위해 고유공간 전체를 다시 계산해야 하는 문제점이 있다. IKPCA는 이러한 문제점들을 고유공간 모델의 점진적인 계산과 경험 커널사상에 의해 해결하였다. IKPCA는 일괄처리방식의 커널 주성분 분석에 비해 기억공간 요구량에 있어 효율적이며 학습 자료의 재학습에 의해 성능을 쉽게 향상시킬 수 있다. 비선형 자료에 대한 실험을 통해 IKPCA는 일괄처리방식의 커널 주성분 분석 방법에 비해 특징추출과 분류 문제의 성능에 있어 유사한 결과를 나타내었다.

HMM을 이용한 연속음성인식 시스템의 화자적응화에 관한 연구 (A Study on Speaker Adaptation of HMM in a Continous Speech Recognition System)

  • 김상범
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.100-104
    • /
    • 1995
  • 일반적으로 화자적응화는 이미 학습되어 있는 불특정 화자 모델을 표준모델로 하고 소량의 적응화용 발화로 추가적인 학습을 실시하여 특정화자 모델의 성능에 가깝게 하는 기술로서 연속음성 인식에 있어서 매우 중요하다. ML 추정법을 이용한 화자적응화는 카테고리마다 모델의 학습패턴들을 다수개 준비한 후 학습시에 일괄적으로 적용시켜 모델 파라메터를 추정 갱신하므로 추가되는 화자데이터에 대해 데이터를 모두 공급하여야 한다. 본 연구에서는 문발화 데이터의 음절단위를 자동추출한 후 추가되는 화자데이터가 주어질 때 마다 적응화할 수 있는 화자적응화 방법을 검토하였다. 이 방법은 문발화 데이터를 잘라내지 않고 음절 단위를 자동추출시켜 추가 데이터마다 최대 사후확률 추정법을 이용하여 적응화 시키는 것으로 수소의 데이터로서도 적응화를 가능하게 하는 것이다. 본 연구에서 사용되는 음성데이터는 신문사설에서 발췌한 연속음성 10문장을 사용하고, 이 음성 데이터중 6명분은 HMM 학습용으로 하고 나머지 3명분은 적응화용 및 평가용 데이터로 사용하였다. 6명의 화자를 DDCHMM으로 학습하고 나머지 3명분을 MAP법으로 적응화시켰다. 그 결과 적응전과 비교해 볼 때 약 32%의 인식율 향상을 얻을 수 있었다.

  • PDF

Simulated Annealing 방법을 이용한 온라인 벡터 양자화기 설계 (On-line Vector Quantizer Design Using Simulated Annealing Method)

  • 송근배;이행세
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.343-350
    • /
    • 2001
  • 백터 양자화기 설계는 다차원의 목적함수를 최소화하는 학습 알고리즘을 필요로 한다. 일반화된 Lloyd 방법(GLA)은 벡터 양자화기 설계를 위해 오늘날 가장 널리 사용되는 알고리즘이다. GLA 는 일괄처리(batch) 방식으로 코드북을 생성하며 목적함수를 단조 감소시키는 강하법(descent algorithm)의 일종이다. 한편 Kohonen 학습법(KLA)은 학습벡터가 입력되는 동안 코드북이 갱신되는 온라인 벡터 양자화기 설계 알고리즘 이다. KLA는 원래 신경망 학습을 위해 Kohonen에 의해 제안되었다. KLA 역시 GLA와 마찬가지로 강하법의 일종이라 할 수 있다. 따라서 이들 두 알고리즘은, 비록 사용하기 편리하고 안정적으로 동작을 하지만, 극소(local minimum) 점으로 수렴하는 문제를 안고 있다. 우리는 이 문제와 관련하여 simulated annealing(SA) 방법의 응용을 논하고자 한다. SA는 현재까지 극소에 빠지지 않고 최소(global minimum)로 수렴하면서, 해의 수렴이 (통계적으로) 보장되는 유일한 방법이라 할 수 있다. 우리는 먼저 GLA에 SA를 응용한 그 동안의 연구를 개괄한다. 다음으로 온라인 방식의 벡터 양자화가 설계에 SA 방법을 응용함으로써 SA 방법에 기초한 새로운 온라인 학습 알고리즘을 제안한다. 우리는 이 알고리즘을 OLVQ-SA 알고리즘이라 부르기로 한다. 가우스-마코프 소스와 음성데이터에 대한 벡터양자화 실험 결과 제안된 방법이 KLA 보다 일관되게 우수한 코드북을 생성함을 보인다.

  • PDF

학습자 요구 분석에 따른 스마트폰 어휘 학습용 어플리케이션의 구현 (Implementation of Application for Vocabulary Learning through Analysis of Users Needs Using Smart Phone)

  • 이지선;최재혁
    • 컴퓨터교육학회논문지
    • /
    • 제15권1호
    • /
    • pp.43-53
    • /
    • 2012
  • 스마트폰의 보급으로 많은 교육용 어플리케이션이 개발되고 있다. 그러나 기존의 교육용 어플리케이션은 단순하고 일괄적인 학습 방법으로 인해 학습자들의 요구가 반영되지 않았고 학습 후에 주어지는 피드백 제시 방법에 문제점이 있다. 이에 본 논문에서는 어휘 학습용 어플리케이션을 구현하기 위해 기존 어플리케이션을 이용하여 학습자들의 요구를 설문 분석하고, 분석 결과를 반영하여 학습자들의 동기를 지속시킬 수 있도록 학습자 스스로 세운 학습 목표에 따라 학습 단계에 맞춘 학습 스케줄을 설정하고 체계적인 피드백이 이루어지는 어휘 학습용 어플리케이션을 설계하고 구현하였다.

  • PDF

삼각 부등식을 이용한 온라인 VQ 코드북 생성 방법 (Online VQ Codebook Generation using a Triangle Inequality)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권3호
    • /
    • pp.373-379
    • /
    • 2015
  • 본 논문에서는 실시간으로, 문서, 웹 페이지, 블로그, tweet 등 텍스트 정보와 센서, 머신데이터등 IoT의 데이터가 생성되는 상황에서 새로 추가되는 데이터들을 기존에 만들어진 VQ 코드북에 추가시키면서, 기존 VQ 코드북 모델을 실시간으로 갱신하기 위한 온라인 VQ 코드북 생성 방법을 제안한다. 기존에 일괄 작업으로 만들어진 VQ 코드북의 성능을 저하시키지 않으면서, 새로 추가된 데이터를 활용하여 VQ 코드북을 점진적으로 수정하는 방식으로 삼각 부등식을 활용하여 높은 정확도와 속도를 보일 수 있었다. 테스트 데이터에 적용한 결과 일괄 작업과 유사한 성능을 보이면서, 다른 온라인 K-Means 보다 빠른 속도를 보였다.

스마트폰을 활용한 인터넷윤리 교육 방법 (An Internet Ethics Training Method by exploiting Smartphone)

  • 김인환;배지혜;이현;박정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1359-1361
    • /
    • 2012
  • 현실세계의 기본이 되는 사회규범 및 윤리교육이 있듯이 인터넷 기반의 사이버 세계에서도 윤리교육을 필요로 하는데, 이에 대한 교육 및 대처가 많이 부족하다. 특히, 국내외의 경우, 반복적인 학습이나 다양한 매체를 통해 일괄적으로 제시하는 방법을 통해 인터넷윤리교육을 진행하고 있으나, 체계적인 방법론을 제시하고 있지 못하고 있다. 따라서 본 논문에서는 스마트폰 기반의 스토리텔링 기법을 통한 새로운 인터넷윤리 교육방법을 제시하고자 한다. 특히, 기존 방법과 달리 새로운 인증프로그램, 수준별 맞춤 교육기법, 양방향 커뮤니케이션 기법, 유해정보 인증 방법 등 M-learning 기반으로 적용하여 효율적이고 구체적인 교육방법을 제시하였다.

빅 데이터 분석을 위한 지지벡터기계 (Support vector machines for big data analysis)

  • 최호식;박혜원;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.989-998
    • /
    • 2013
  • 최근 산/학계에서 주목받고 있는 빅 데이터는 정의상 한꺼번에 자료를 메모리에 올려 분석할 수 없기 때문에 기존의 데이터마이닝 시대에 개발된 일괄처리 (batch processing) 방식의 알고리즘을 적용할 수 없게 된다. 따라서 가장 시급히 해결해야 하는 문제는 기존의 여러 가지 기계학습방법을 빅 데이터에 적용할 수 있도록 분산처리 (distributed processing)를 수행하는 적절한 알고리즘을 개발하는 것이라 볼 수 있다. 본 논문에서는 분류문제에서 각광받는 지지벡터기계 (support vector machines)의 여러 알고리즘을 살펴보고자 한다. 특히 빅 데이터 분류문제에 유용할 것으로 예상되는 온라인 타입 알고리즘과 병렬처리 알고리즘에 대하여 소개하고, 이러한 알고리즘들의 성능 및 장단점을 선형분류에 대한 모의실험을 통해서 살펴본다.