• Title/Summary/Keyword: 코드 클러스터링

검색결과 41건 처리시간 0.021초

대용량 온라인 한자 인식을 위한 클러스터링 거리계산 척도 (Distance Measures in HMM Clustering for Large-scale On-line Chinese Character Recognition)

  • 김광섭;하진영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.683-690
    • /
    • 2009
  • 은닉 마코프 모델(Hidden Markov Model: HMM)에 기반을 둔 온라인 한자 인식에서 클래스의 수가 대용량일 경우에는 인식에 걸리는 시간 증가가 좋은 인식 시스템을 구현하는데 있어서의 걸림돌이 된다. 본 논문에서는 이러한 인식 속도 문제를 해결하고자 HMM을 클러스터링하여 인식 속도를 개선하는 방법과 이에 적합한 효율적인 HMM 간의 거리계산법을 제안한다. 유니코드 한 중 일 통합한자로 정의된 총 20,902개의 한자에 대한 온라인 한자 인식 시스템을 구축하는 실험에서 약 2배 정도로 인식속도가 향상됨을 확인할 수 있었고 클러스터링을 하지 않았을 때보다 0.9%의 인식률만 하락한 95.37%의 10순위 인식률을 달성했다.

윈도우 악성코드 분류 시스템에 관한 연구 (A Study on Windows Malicious Code Classification System)

  • 서희석;최중섭;주필환
    • 한국시뮬레이션학회논문지
    • /
    • 제18권1호
    • /
    • pp.63-70
    • /
    • 2009
  • 본 과제의 목표는 윈도우 환경에서 동작하는 악성코드를 분류하기 위한 방법론을 제시하고, 시험용 분류 시스템을 개발하는 데 있다. 악성코드를 크게 9개의 그룹으로 분류하고, 이를 다시 그룹의 특성이 맞는 여러 개의 클러스터로 구분하였다. 해당 클러스터에 속하는 악성코드는 최소한 클러스터의 기본 속성은 만족시킨다. 또한 악성코드가 소속되는 각각의 클러스터에서는 기준점을 기반으로 악성코드의 유사도가 계산되며, 이 유사도에 의해서 악성코드 분석가들은 기존의 악성코드와 새로운 악성코드의 유형 및 관련 정도를 파악하게 된다. 악성코드 분류 시스템은 정량적 분석과 정성적인 분석에 대한 결과를 보여주며, 챠트를 통하여 보기 쉽게 내용을 파악할 수 있다. 매일 수천 건의 악성코드가 발견되는 상황에서 악성코드 분석가들에게 기존 악성코드와의 유사도를 제공함으로써 분석의 시간과 노력을 줄여 줄 수 있다. 본 연구의 성과물은 향후 악성코드 예측 시스템의 초석으로 활용될 수 있을 것이다.

스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석 (Clustering Performance Analysis of Autoencoder with Skip Connection)

  • 조인수;강윤희;최동빈;박용범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.403-410
    • /
    • 2020
  • 오토인코더의 데이터 복원(Output result) 기능을 이용한 노이즈 제거 및 초해상도와 같은 연구가 진행되는 가운데 오토인코더의 차원 축소 기능을 이용한 클러스터링의 성능 향상에 대한 연구도 활발히 진행되고 있다. 오토인코더를 이용한 클러스터링 기능과 데이터 복원 기능은 모두 동일한 학습을 통해 성능을 향상시킨다는 공통점이 있다. 본 논문은 이런 특징을 토대로, 데이터 복원 성능이 뛰어나도록 설계된 오토인코더 모델이 클러스터링 성능 또한 뛰어난지 알아보기 위한 실험을 진행했다. 데이터 복원 성능이 뛰어난 오토인코더를 설계하기 위해서 스킵연결(Skip connection) 기법을 사용했다. 스킵연결 기법은 기울기 소실(Vanishing gradient)현상을 해소해주고 모델의 학습 효율을 높인다는 장점을 가지고 있을 뿐만 아니라, 데이터 복원 시 손실된 정보를 보완해 줌으로써 데이터 복원 성능을 높이는 효과도 가지고 있다. 스킵연결이 적용된 오토인코더 모델과 적용되지 않은 모델의 데이터 복원 성능과 클러스터링 성능을 그래프와 시각적 추출물을 통해 결과를 비교해 보니, 데이터 복원 성능은 올랐지만 클러스터링 성능은 떨어지는 결과를 확인했다. 이 결과는 오토인코더와 같은 신경망 모델이 출력된 결과 성능이 좋다고 해서 각 레이어들이 데이터의 특징을 모두 잘 학습했다고 확신할 수 없음을 알려준다. 마지막으로 클러스터링의 성능을 좌우하는 잠재변수(latent code)와 스킵연결의 관계를 분석하여 실험 결과의 원인에 대해 파악하였고, 파악한 결과를 통해 잠재변수와 스킵연결의 특징정보를 이용해 클러스터링의 성능저하 현상을 보완할 수 있다는 사실을 보였다. 이 연구는 한자 유니코드 문제를 클러스터링 기법을 이용해 해결하고자 클러스터링 성능 향상을 위한 선행연구이다.

피아노 코드 연습 데이터를 활용한 맞춤형 학습 지원 (A technique to support the personalized learning based on the log data of piano chords practicing)

  • 정우성;이은주;최수아
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.191-201
    • /
    • 2023
  • IT기술을 교육 서비스에 접목시키는 에듀테크 시대가 도래함에 따라, 음악 교육에서도 다양한 시도들이 행해지고 있다. 교수자 중심에서 학습자 중심으로 옮아가면서 학습자 맞춤형 학습에 대해 관심이 높아졌으며, 이를 위해서 학습자의 숙련도를 파악하는 것이 필요하다. 피아노 학습에서 코드 운지법은 반주자가 필수적으로 익혀야 할 기법이다. 본 논문에서는 맞춤형 코드 운지법 학습 도구를 제안하고 코드 운지법 패턴 분석을 통한 활용 방안을 보였다. 구체적으로는, 학습자의 축적된 코드 연습 데이터를 활용하여 코드의 난이도나 학습자의 숙련도를 파악하고, 코드 사이의 유사도에 기반한 계층적 클러스터링을 수행하여 코드 클러스터들을 통하여 보다 향상된 코드 연습에 대한 활용방안을 제시하였다. 본 연구의 의의는 연습 데이터로부터 의미 있는 정보를 획득하여 맞춤형으로 코드 학습을 할 수 있다는 데 있다. 또한 테스트와 같은 부가적인 노력 없이, 연습 시에 저장되는 데이터들을 이용하여 숙련도와 코드 학습 난이도가 산정되므로 학습자 입장에서의 부담을 경감시킬 수 있다.

Diagnosis of Pet by Using FCM Clustering

  • Kim, Kwang-Baek
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권2호
    • /
    • pp.39-44
    • /
    • 2021
  • 본 논문에서는 가정에서 많이 기르는 반려견을 바탕으로 반려견 질병에 대한 전문적인 수의학 지식이 부족한 일반인들을 대상으로 자신의 반련견의 건강 상태를 파악할 수 있는 진단 시스템을 제안한다. 제안된 진단 시스템은 50가지 질병과 각 질병의 증상을 데이터베이스에 구축하여 입력된 증상을 통해서 반려견의 질병을 도출한다. 각 질병 데이터베이스에는 질병에 해당하는 증상 코드들을 가지고 있으며, 이러한 질병에 대한 데이터베이스를 이용하여 군집화 기법인 FCM 클러스터링 기법을 적용하여 질병을 클러스터링하고 그 결과 값인 소속도를 바탕으로 입력된 증상과 가까운 질병들을 도출하여 반려견의 진단 결과를 제공한다. 제안된 반려견 진단의 구현 결과에서는 선택한 증상들의 개수와 선택된 증상들이 포함된 질병들의 가능성 값을 구하여 내림차순으로 정렬하여 반려견의 증상과 가장 가까운 질병 상위 3가지를 도출하였다.

소프트웨어 제어 온칩 메모리 서브시스템에서 불규칙 데이터 접근 패턴 최적화 기법 (An Optimization Technique for Irregular Data Access Patterns on Software Controlled On-Chip Memory SubSystems)

  • 조두산;조중석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.212-214
    • /
    • 2012
  • 데이터 집약적인 대부분의 애플리케이션들은 규칙적인 메모리 접근 패턴과 동시에 불규칙적인 접근 패턴을 커널 코드에 포함하고 있다. 그 동안 대부분의 메모리 접근 패턴 최적화 기법은 규칙적인 패턴에 집중되어 있었다. 하지만 암호화/통신 관련 애플리케이션에서는 불규칙한 패턴으로 메모리 접근의 대부분을 구성하는 경우가 많다. 이러한 불규칙한 메모리 접근 패턴을 대상으로 온칩메모리를 효율적으로 사용하도록 최적화 기법을 일반화하여 설계하는 일은 어려운 작업이기 때문에 관련 연구분야에 큰 진전이 없는 실정이다. 우리는 불규칙 메모리 접근 패턴 최적화 문제를 해결하기 위하여 데이터 클러스터링 기법을 제안하였다. 클러스터링은 접근되는 데이터의 시공간 지역성을 계산하여 이득이 큰 데이터들을 하나의 블록으로 구성하여 온칩메모리에 상주시키는 기본단위로 사용하는 기법이다. 본 기법을 이용하면 기존의 캐시메모리에 비하여 약 19% 에너지 소모를 절감할 수 있다.

차영상과 ART2 클러스터링을 이용한 스마트폰 기반의 FND 인식 기법 (Smartphone Based FND Recognition Method using sequential difference images and ART-II Clustering)

  • 구경모;차의영
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1377-1382
    • /
    • 2012
  • 본 논문에서는 가전기기에 탑재 된 FND에 표시되는 부호화 된 코드를 스마트폰으로 촬영하여 이로부터 원문데이터를 추출하는 인식기법에 대해 제안한다. 제안하는 스마트폰 기반의 FND 인식 기법은 먼저 차영상을 이용하여 입력되는 영상에서 FND의 위치를 추정한 뒤 RGB값 클러스터링을 통해 Segment를 추출한다. 다음으로 기울어진 Segment에 대한 정규화 과정을 거친 뒤 상대적인 거리를 이용하여 각각의 Segment를 인식한다. 실험을 통해 실제 스마트폰에서 사용 시 속도와 인식률이 모두 양호함을 확인하였다.

클라우드 환경에서 제우스 Botnet 공격 유형 분석을 위한 클러스터링 방안 연구 (A Study on the Clustering method for Analysis of Zeus Botnet Attack Types in the Cloud Environment)

  • 배원일;최석준;김성진;김형천;곽진
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.11-20
    • /
    • 2017
  • 최근 클라우드 컴퓨팅 기술의 발전으로 인해 다양한 분야에서 클라우드 컴퓨팅 기술이 활용되고 있다. 클라우드 서비스의 수요가 증가하는 반면에 클라우드 환경에서의 보안 위협은 증가하고 있으며 특히, 악성코드에 의한 공격을 통해 클라우드 환경 내 상호 연결되어 있는 호스트들이 감염 전파될 경우 다른 호스트의 리소스에도 영향을 끼쳐 개인정보 및 데이터의 삭제 등의 보안위협이 확산될 수 있다. 따라서 이러한 보안 위협에 대응하기 위한 악성코드 분석 연구가 활발히 진행되고 있다. 이에 따라, 본 논문은 클라우드 환경에서 발생하는 악성코드 분석을 위해 k-means 클러스터링 알고리즘을 이용한 제우스 봇넷의 공격 유형별 군집화 방안을 제안한다. 이는 클라우드 환경 내 발생되는 제우스 봇넷에 대하여 악성행위를 유형별로 군집화 함으로써 악성 유무를 판별할 수 있으며, 추후 클라우드 환경에서 발생할 수 있는 새로운 유형의 제우스 봇넷 공격 대응을 목표로 한다.

k-평균 클러스터링 알고리즘 기반의 영상 분할을 이용한 칼라코드 검출 및 인식 (Color Code Detection and Recognition Using Image Segmentation Based on k-Means Clustering Algorithm)

  • 김태우;유현중
    • 한국산학기술학회논문지
    • /
    • 제7권6호
    • /
    • pp.1100-1105
    • /
    • 2006
  • 칼라코드는 획득된 영상에서 칼라의 심각한 왜곡 때문에 그 응용 확장에 어려움이 있었다. 칼라 인식에서 칼라 왜곡의 영향을 줄이기 위해서는 규칙적으로 샘플링된 몇 개의 화소들을 이용하기 보다는 가능한한 각 칼라 영역에서 많은 화소들을 통계적으로 처리하는 것이 더 바람직하다. 이를 위해서는 일반적으로 에지 검출이 필요한 분할이 필요하다. 그러나, 칼라코드에서 에지들은 분할을 불완전하게 만드는 지퍼 효과나 반사와 같은 다양한 왜곡에 의해 끊어질 수 있고, 에지 연결 또한 어려운 처리 과정이다. 본 논문에서는 칼라 인식에서 칼라 왜곡의 영향을 줄이기 위한 좀 더 효과적인 방법은 분할을 위한 정확한 에지 검출을 배제하는 방법으로 k-평균 클러스트링 알고리즘을 적용하였다. 또한, 칼라코드 검출에서 6개의 안전한 칼라와 그레이 성질 모두 이용하였다. 실험은 4M-화소 크기의 야외영상 144장에 대해 수행되었다. 제안한 방법은 테스트 영상에 대해서 100%의 칼라코드 검출율을 나타내었고, 검출된 코드에 대해서는 99% 이상의 평균 칼라 인식 정확도를 보였다. 여기서 가장 높은 정확도를 보인 캐니 에지 검출법을 사용한 경우 91.28%로 나타났다.

  • PDF

악성코드 분석의 Ground-Truth 향상을 위한 Unified Labeling과 Fine-Grained 검증 (Unified Labeling and Fine-Grained Verification for Improving Ground-Truth of Malware Analysis)

  • 오상진;박래현;권태경
    • 정보보호학회논문지
    • /
    • 제29권3호
    • /
    • pp.549-555
    • /
    • 2019
  • 최근 AV 벤더들의 악성코드 동향 보고서에 따르면 신종, 변종 악성코드의 출현 개수가 기하급수적으로 증가하고 있다. 이에 따라 분석 속도가 떨어지는 수동적 분석방법을 대체하고자 기계학습을 적용하는 악성코드 분석 연구가 활발히 연구되고 있다. 하지만 지도학습기반의 기계학습을 이용할 때 많은 연구에서 AV 벤더가 제공하는 신뢰성이 낮은 악성코드 패밀리명을 레이블로 사용하고 있다. 이와 같이 악성코드 레이블의 낮은 신뢰성 문제를 해결하기 위해 본 논문에서는 새로운 레이블링 기법인 "Unified Labeling"을 소개하고 나아가 Fine-grained 방식의 특징 분석을 통해 악성 행위 유사성을 검증한다. 본 연구의 검증을 위해 다양한 기반의 클러스터링 알고리즘을 이용하여 기존의 레이블링 기법과 비교하였다.