• 제목/요약/키워드: 패턴셋

검색결과 113건 처리시간 0.025초

패턴인식 기반 침입탐지를 위한 데이터셋 구성 기법에 대한 연구 (A Study on Dataset Construction Technique for Intrusion Detection based on Pattern Recognition)

  • 공성현;조민정;조재익;이창훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.343-345
    • /
    • 2017
  • 통신 기술이 발달하고, 네트워크 환경 또한 다양해짐에 따라 통신 사용자들에 대한 사이버 위협 또한 다양해졌다. 패턴인식 기술과 기계학습에 기반한 침입탐지 기술은 새롭게 보고되는 수많은 사이버 공격들에 대응하기 위해 등장하였다. 기계학습 기반의 IDS는 낮은 오탐률과 높은 효율성을 요구하며, 이러한 특징은 데이터셋을 구성하는 방법론에 큰 영향을 받는다. 본 논문에서는 패턴인식 기반 트래픽 분석을 수행하기 위한 데이터셋을 구성할 때 고려해야할 주안점에 대해 논하며, 현실의 사이버 위협 상황을 잘 반영할 수 있는 데이터셋을 도출하는 방법을 모색한다.

ART2 알고리즘에서의 경계 변수 설정 방법 (Setting Method of Vigilance Parameter of ART2 Algorithm)

  • 박성열;김성훈;김광백
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.31-34
    • /
    • 2009
  • ART2 알고리즘은 신경 회로망 모델로서 실시간 학습이 가능하여 저속 및 고속을 지원할 뿐만 아니라 지역 최소화(local minima) 문제가 발생하지 않는 장점을 갖는다. 그러나 ART2 알고리즘은 경계 변수 설정에 따라 클러스터의 수가 달라지며, 이러한 경계 변수 설정은 패턴의 분류와 인식 성능을 좌우한다. 따라서 본 논문에서는 ART2 알고리즘에서 효율적으로 경계 변수를 설정하기 위해 패턴셋 설정을 통한 경계 변수 설정 방법을 제안한다. 제안된 경계 변수 설정 방법의 성능을 평가하기 위해 숫자 및 영문 패턴을 대상으로 실험한 결과, 패턴 분류의 성능이 기존의 방식 보다 개선된 것을 확인하였다.

  • PDF

데이터 증강을 통한 기계학습 능력 개선 방법 연구 (Study on the Improvement of Machine Learning Ability through Data Augmentation)

  • 김태우;신광성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.346-347
    • /
    • 2021
  • 기계학습을 위한 패턴인식을 위해서는 학습데이터의 양이 많을수록 그 성능이 향상된다. 하지만 일상에서 검출해내야하는 패턴의 종류 및 정보가 항상 많은 양의 학습데이터를 확보할 수는 없다. 따라서 일반적인 기계학습을 위해 적은데이터셋을 의미있게 부풀릴 필요가 있다. 본 연구에서는 기계학습을 수행할 수 있도록 데이터를 증강시키는 기법에 관해 연구한다. 적은데이터셋을 이용하여 기계학습을 수행하는 대표적인 방법이 전이학습(transfer learning) 기법이다. 전이학습은 범용데이터셋으로 기본적인 학습을 수행한 후 목표데이터셋을 최종 단계에 대입함으로써 결과를 얻어내는 방법이다. 본 연구에서는 ImageNet과 같은 범용데이터셋으로 학습시킨 학습모델을 증강된 데이터를 이용하여 특징추출셋으로 사용하여 원하는 패턴에 대한 검출을 수행한다.

  • PDF

<사용자 참여를 통한 미래 사용자 사용패턴 예측 방법론 제안> 블루투스 핸즈프리 헤드셋의 UI 디자인 개발 사례를 중심으로 ( based on Bluetooth Handsfree Headset UI Design Project)

  • 조현재;김선아;이현주
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.524-529
    • /
    • 2006
  • 짧은 기간에 비약적으로 기술이 발전하는 시대에는 사용자의 미래환경과 그에 따른 사용자의 행태를 미리 분석할 수 있는 방법이 절실히 요구된다. 본 연구에서는 블루투스 핸즈프리 헤드셋의 UI 디자인 개발을 위해 사용된 사용자의 제품 사용행태 예측 과정을 통해 그 방법론을 제시하고자 한다. 1 차로 블루투스 핸즈프리 헤드셋 사용자가 그것을 사용하는 사용행태를 조사 분석하였으며, 조사의 결과를 인터랙티브 스토리텔링의 방법으로 구성하여 아이디어개발을 위한 보조도구로 개발하였다. 조사의 대상은 블루투스 헤드셋의 주요 사용자 층인 10 대 후반에서 20 대 중반에 속하는 사용자 그룹이며 블루투스 헤드셋으로 변용 가능한 패션 액세서리를 선정하고 선정한 액세서리를 블루투스 핸즈프리 헤드셋으로 가정하여 사용시의 그들의 사용 포즈를 분석하는 방법을 통해 주사용자 층의 사용행태를 예측하고자 하였다. 이 연구의 결과는 블루투스 헤드셋 개발팀내의 기획자, 기술자, 디자이너들이 제품의 개발 방향에 대한 아이디어 공유를 위하여 Macromedia Flash 를 사용하여 인터랙티브 스토리텔링으로 제작하여 디자인을 위한 보조 툴로 제안하였다. 본 연구는 블루투스 핸즈프리 헤드셋과 같이 사용자의 새로운 요구와 사용성이 기대되는 제품 UI 디자인을 위해서는 사용자의 미래 요구사항을 예측 할 수 있는 방법이 필요하다는 배경에서 시작되었으며, 블루투스 핸즈프리 헤드셋의 사용자의 요구 파악 및 예측을 위한 방법으로 제품과 사용자의 사용 포즈를 연계하여 분석하는 방법을 제안하였다.

  • PDF

효율적인 순차 패턴 갱신 알고리즘 (Efficient Update Algorithm of Sequential Pattern)

  • 김학자;김형근;황환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.178-180
    • /
    • 2003
  • 본 논문은 순차 패턴을 갱신하는 알고리즘을 제안한다. 갱신된 데이터베이스에서 새로운 순차 패턴을 찾는 비용을 줄이기 위해 갱신 전 데이터베이스에서 발견한 순차 패턴에 대한 정보와 추가되는 데이터베이스의 정보만으로 새로운 순차 패턴의 후보를 줄이는 방법으로, 갱신된 전체 데이터베이스를 대상으로 순차 패턴 마이닝 알고리즘을 재실행하는 방법에 비해 후보 셋이 줄어들고 이로 인해 연산 비용을 줄일 수 있는 장점이 있다.

  • PDF

시계열 데이터 특성 기반 품질 관리 방법 연구 (Data Quality Management Method base on Seasonality from Time series Data)

  • 이지훈;문재원;황지수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.93-96
    • /
    • 2022
  • IoT 기기의 보급 및 확산으로 많은 산업군에서 이를 바탕으로 시계열 데이터를 획득하고 분석하려는 시도가 확대되고 있다. 시간의 흐름에 따라 저장된 데이터들은 주기에 따라 특정 패턴을 갖는 경우가 많으며 이러한 패턴을 파악한다면 주요 산업군의 의사 결정에 도움이 된다. 그러나 IoT 기기의 수집 오류 및 네트워크 환경에 의해 대부분의 시계열 데이터들은 누락 데이터, 이상 데이터를 갖고 있으며 이를 처리하지 않고 분석할 경우 오히려 잘못된 결과를 초래한다. 본 논문에서는 패턴 파악을 위해 '시간, 일, 주, 월, 년' 등 시간의 주기를 기준으로 데이터를 분할하며 이에 기반하여 데이터셋을 재구성하고 활용 가능한 데이터와 불가능한 데이터로 구분한다. 선별된 데이터셋은 클러스터링에 적용하였으며, 제안하는 방법을 적용할 경우 주기를 갖는 시계열 데이터를 활용하는 분석 및 학습에서 더 나은 결과를 보임을 확인하였다.

  • PDF

클라우드 모니터링 시스템의 성능 향상을 위한 딥러닝을 이용한 시계열 데이터 예측 연구 (Deep Learning-based Time Series Data Prediction Research for Performance Enhancement in Cloud Monitoring Systems)

  • 김동완;홍두표;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.342-344
    • /
    • 2023
  • 클라우드 시장의 성장과 마이크로 서비스 접근식이 제기됨에 따라 IT인프라를 관리하기 위한 연구가 최근 활발히 이루어지고 있다. 하지만 고도화 및 분산된 환경에서 관찰 가능성 응용을 확보하기 어렵다는 문제점을 가지고 있다. 따라서 본 연구에서는 모니터링 시스템을 통한 데이터 분석 중 수집한 데이터의 분석이 난해하다는 문제를 해결하기 위한 방법을 제안한다. 제안된 방법은 NAB 데이터셋을 대상으로 STUMPY를 이용하여 데이터를 시각화하고, CNN을 이용하여 분류 작업을 수행한다. 분류를 수행한 데이터셋은 이상치 데이터와 이상 전조 데이터, 정상 데이터셋으로 분류하여 데이터셋을 구성한다. 구성한 학습 데이터셋에 대해 훈련을 마친 딥러닝 모델은 부하 테스트 환경에서 수집한 데이터에 대한 그래프 패턴을 분석하여 이상치 데이터와 이상 전조 데이터를 탐지한다.

경성 실시간 태스크를 위한 확장된 스케줄 가능성 검사를 갖는 비율단조 스케줄러 (Rate-Monotonic Scheduler with Extended Schedulability Inspection for Hard Real-Time Tesk)

  • 신동헌;조수현;김영학;김태형
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.50-60
    • /
    • 2004
  • 오늘날 대부분의 내장형 시스템은 목적상 많은 기능뿐만 아니라 실시간성도 함께 요구하고 있다. 특히, 경성 실시간 시스템에서는 주기 태스크들의 엄격한 마감시간 보장이 시스템의 성능을 좌우한다. 본 논문에서는 CPU 이용률이 놓아 비율단조 기법으로는 마감시간을 보장 할 수 없는 주기 태스크 셋을 위한 비율단조 기반의 스케줄러를 설계하고 구현한다. 이 스케줄러는 확장된 스케줄 가능성 검사를 실시하여, 태스크 셋의 수행 전태스크들의 공통주기를 찾아 마감시간 우선 기법을 기반으로 마감시간 보장 수행패턴을 생성한다. 이렇게 생성된 수행패턴을 참조하여 결정된 우선순위에 따라 태스크 셋을 실행하게 된다. 마감시간 우선 기법을 기반으로 생성된 패턴은 그 특성에 따라 CPU 이용률을 100% 까지 가능하게 하며, 수행패턴을 참조하여 수행함으로써 동적 우선순위 할당 기법의 단점인 실행시간 스케줄링 오버헤드를 없앨 수 있다.

  • PDF

시간 단위 그룹핑을 이용한 빈발 아이템셋 마이닝 (Mining Frequent Itemsets using Time Unit Grouping)

  • 황정희
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.647-653
    • /
    • 2022
  • 데이터 마이닝은 데이터를 탐색하고 분석하여 데이터 사이의 관계나 패턴 등의 지식을 탐사하는 기법이다. 실세계에서 발생하는 데이터는 시간 속성을 포함한다. 시간 속성을 포함하는 데이터에서 유용한 지식을 찾아내기 위한 시간 데이터마이닝 연구는 미래를 예측할 수 있는 예측 판단에 효율적으로 활용될 수 있다. 본 논문은 데이터베이스를 일정한 시간 간격 단위로 구분하고, 시간 단위에서 빈발한 패턴 아이템셋을 발견하기 위한 시간 단위 그룹핑을 이용하는 알고리즘을 제안한다. 제안하는 알고리즘은 시간 단위에 포함된 트랜잭션과 아이템 정보를 매트릭스로 구성하고, 그룹핑을 통한 시간 단위에서의 빈발한 아이템셋을 발견한다. 성능평가의 실험 결과에서 수행시간은 기존의 알고리즘보다 1.2배 소요되지만, 2배 이상의 빈발 아이템셋이 탐사되었다.

GA와 SVM에 근거한 Fusion Method을 이용한 암 진단시스템에 관한 연구 (A Study on Cancer Diagnostic System Using a Fusion Method based on Genetic Algorithm and Support Vector Machine)

  • 응우옌하남;최규석
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권1호
    • /
    • pp.47-56
    • /
    • 2006
  • 혈액에서 추출된 프로테옴 패턴(단백질 DNA 정보)는 인간 신체 기관의 병리학적 상태를 잠재적으로 반영하고 있다. 신체기관의 질병이나 이상은 이러한 프로테옴 패턴의 분석에 의해 식별될 수 있다고 알려져 있으며 프로테옴 패턴 정보를 분석하는 여러 가지 방법들이 현재 존재하고 있다. 본 논문에서는 SVM(Support Vector Machine)과 GA(Genetic Algoritm)의 융합에 근거하여 암 진단을 위한 디시전 모델의 효과적 학습(learning) 방법을 제안한다. <중략> 그 결과로서 개별적 kernel function 들보다 더 우수한 분류성능을 갖는 최적의 디시전 모델이 얻어졌다. 위암 데이터 셋 과 두 개의 일반 데이터 셋(대장암, 백혈병)을 사용한 컴퓨터 실험에서 제안된 방법이 다른 Kernel function 들에 비해 더 우수한 분류 성능을 보여주었다.

  • PDF