• 제목/요약/키워드: Feature statistics

검색결과 256건 처리시간 0.021초

특징 선택을 위한 문제 공간과 알고리즘 동작 분석 (Analysis of Problem Spaces and Algorithm Behaviors for Feature Selection)

  • 이진선;오일석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권6호
    • /
    • pp.574-579
    • /
    • 2006
  • 특징 선택 알고리즘들은 좋은 해를 찾기 위해 거대한 문제 공간을 폭넓게 효율적으로 탐색하여야 한다. 이 논문에서는 문제 공간의 적합도 지형을 통찰해보고자 하였으며, 알고리즘들의 탐색 능력을 개선하였다. 지역 최고값과 최저값에 대한 통계에 의해 해 공간을 조사한다. 또한 기존 알고리즘들의 동작을 분석하고 이들의 해를 개선하였다.

다차원 데이터 평가가 가능한 개선된 FSDD 연구 (An Improvement of FSDD for Evaluating Multi-Dimensional Data)

  • 오세종
    • 디지털융복합연구
    • /
    • 제15권1호
    • /
    • pp.247-253
    • /
    • 2017
  • 피처선택, 혹은 변수 선택은 피처의 수가 매우 많은 고차원 데이터에서 주어진 주제와 연관성이 높은 피처를 선별하는 과정으로서, 데이터의 차원수를 낮추어 군집분석이나 분류 분석 등을 용이하게 하는데 중요한 기법이다. 많은 수의 피처들 중에서 일부의 피처를 선별하기 위해서는 피처들을 평가하기 위한 도구가 필요하다. 현재까지 제안된 도구들은 대부분 확률이론이나 정보이론에 기초하여 만들어졌기 때문에 하나의 피처, 즉 1차원 데이터만을 평가할 수 있다. 그러나 피처들 간에는 상호작용이 있기 때문에 하나의 피처를 평가하기 보다는 여러 피처들의 집합, 즉 다차원 데이터를 평가할 수 있어야 효과적인 피처 선택이 가능하다. 본 연구에서는 확장된 거리 함수를 이용하여 1차원 데이터 평가용으로 제안된 FSDD 평가 함수를 다차원 데이터에 대한 평가가 가능하도록 개선하는 방법에 대해 제안하였다. 본 연구에서 제안한 접근법은 다른 1차원 데이터 평가함수에도 적용이 될 수 있을 것으로 기대된다.

오디오 e-Book 스트리밍을 지원하는 스테가노그래피 모델 (Secure Steganographic Model for Audio e-Book Streaming Service)

  • 이윤정;이봉규;김철수
    • 한국산학기술학회논문지
    • /
    • 제12권12호
    • /
    • pp.5878-5884
    • /
    • 2011
  • 본 논문은 오디오 e-Book 스트리밍 콘텐츠에 저작권과 인증과 관련되는 비밀 데이터를 인코딩하고 추출할 수 있도록, 스트리밍 서비스 특성에 적합한 스테가노그래피 서비스 모델과 알고리즘을 제안한다. 은닉 데이터는 송신측과 수신측에서 공유하는 비밀키 k를 사용하여 생성한 의사난수로 암호화하여 안전도를 높였다. 또한 은닉데이터가 커버데이터의 초반 일정구간 안에 랜덤하게 고루 분포하도록 하였고, 스트리밍의 상황을 고려하여 기타의 연산을 단순화하여 처리율을 높였다.

A Classification Method Using Data Reduction

  • Uhm, Daiho;Jun, Sung-Hae;Lee, Seung-Joo
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권1호
    • /
    • pp.1-5
    • /
    • 2012
  • Data reduction has been used widely in data mining for convenient analysis. Principal component analysis (PCA) and factor analysis (FA) methods are popular techniques. The PCA and FA reduce the number of variables to avoid the curse of dimensionality. The curse of dimensionality is to increase the computing time exponentially in proportion to the number of variables. So, many methods have been published for dimension reduction. Also, data augmentation is another approach to analyze data efficiently. Support vector machine (SVM) algorithm is a representative technique for dimension augmentation. The SVM maps original data to a feature space with high dimension to get the optimal decision plane. Both data reduction and augmentation have been used to solve diverse problems in data analysis. In this paper, we compare the strengths and weaknesses of dimension reduction and augmentation for classification and propose a classification method using data reduction for classification. We will carry out experiments for comparative studies to verify the performance of this research.

지지벡터기계와 카이제곱 통계량을 이용한 스팸 블로그(Splog) 판별 시스템 (A Splog Detection System Using Support Vector Machines and $x^2$ Statistics)

  • 이성욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.905-908
    • /
    • 2010
  • 본 연구의 목적은 웹 환경에서 스팸 블로그(Splog)를 자동으로 판별하는 시스템을 개발하는 것이다. 먼저 블로그의 HTML을 제거한 후 품사를 부착하였다. 어휘/품사 쌍을 자질로 사용하였으며 카이제곱 통계량을 이용하여 유용한 자질을 선택하였다. 선택된 자질의 가중치를 벡터로 표현한 후, 지지벡터 기계(Support Vector Machines)를 학습하여 자동으로 스팸 블로그를 판별하는 시스템을 제안하였으며, SPLOG 데이터 집합으로 실험한 결과 F1척도로 90.5%의 정확률을 얻었다.

  • PDF

숨은마코프모형을 이용하는 음성구간 추출을 위한 특징벡터 (A New Feature for Speech Segments Extraction with Hidden Markov Models)

  • 홍정우;오창혁
    • Communications for Statistical Applications and Methods
    • /
    • 제15권2호
    • /
    • pp.293-302
    • /
    • 2008
  • 본 논문에서는 숨은마코프모형을 사용하여 음성구간을 추출하는 경우에 사용되는 새로운 특징벡터인 평균파워를 제안하고, 이를 멜주파수 켑스트럴 계수(met frequency cepstral coefficients, MFCC)와 파워계수와 비교한다. 이들 세 가지 특징벡터의 수행력을 비교하기 위하여 일반적으로 추출이 상대적으로 어렵다고 알려진 파열음을 가진 단어에 대한 음성 데이터를 수집하여 실험한다. 다양한 수준의 잡음이 있는 환경에서 음성구간을 추출하는 경우 MFCC나 파워계수에 비해 평균파워가 더 정확하고 효율적임을 실험을 통해 보인다.

내용기반 음악 검색 시스템에서의 검색 속도 향상에 관한 연구 (A Study on the Retrieval Speed Improvement from Content-Based Music Information Retrieval System)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.85-90
    • /
    • 2006
  • 본 논문에서는 빠르고 안정적이면서도 높은 검색 성공률을 보장하는 내용기반 음악 정보 검색 시스템을 구축하였다. 시스템 질의 구간이나 질의 길이에 따른 시스템 불안정성 문제를 해결할 수 있는 DB 구축 방법인 MFC기법과 각 Superclass별로 특징 벡터의 차수를 차등 적용하여 시스템의 검색 속도를 향상시킬 수 있는 기법을 적용하였다. Superclass를 적용한 시스템은 SuperClass를 적용하지 않은 시스템과의 검색 성공률, 검색 속도 그리고 검색 Precision 비교 실험에서 대등한 성능을 유지하면서 검색 속도를 $20\%\~40\%$ 향상시켰다.

잡음에 강인한 내용기반 음악 검색 시스템에 대한 연구 (A Study of Noise Robust Content-Based Music Retrieval System)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.148-155
    • /
    • 2008
  • 본 논문에서는 모바일 환경에서 적용 가능한 잡음에 강인한 내용기반 음악 검색 시스템을 구축하였다. 제안된 시스템은 기존의 음성인식 분야에서 잡음에 강인한 특성을 가진 것으로 알려진 ZCPA 특징을 내용기반 음악 검색 시스템에 적용시켜 그 성능을 검증하였다. 또한 본 논문에서는 대용량 음악 DB 검색에서 기존의 전수(Exhaustive) 검색에 비해 검색 속도를 99% 가까이 개선할 수 있는 새로운 인덱싱 방법과 고속 검색 알고리즘을 제안하였다. 신호대 잡음비가 15dB - 0dB인 잡음 환경에서의 모의실험 결과, 제안 시스템은 기존의 MFCC와 필터뱅크 에너지 특징에 비해 약 5% - 30% 정도의 우수한 성능을 나타냄을 확인하였다.

기계학습을 통한 디스크립터 자동부여에 관한 연구 (A Study on automatic assignment of descriptors using machine learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.279-299
    • /
    • 2006
  • 학술지 논문에 디스크립터를 자동부여하기 위하여 기계학습 기반의 접근법을 적용하였다. 정보학 분야의 핵심 학술지를 선정하여 지난 11년간 수록된 논문들을 대상으로 문헌집단을 구성하였고, 자질 선정과 학습집합의 크기에 따른 성능을 살펴보았다. 그 결과, 자질 선정에서는 카이제곱 통계량(CHI)과 고빈도 선호 자질 선정 기준들(COS, GSS, JAC)을 사용하여 자질을 축소한 다음, 지지벡터기계(SVM)로 학습한 결과가 가장 좋은 성능을 보였다. 학습집합의 크기에서는 지지벡터기계(SVM)와 투표형 퍼셉트론(VPT)의 경우에는 상당한 영향을 받지만 나이브 베이즈(NB)의 경우에는 거의 영향을 받지 않는 것으로 나타났다.

영상에 포함된 특징의 방향성을 적용한 시그마 필터의 잡음제거 (Noise reduction by sigma filter applying orientations of feature in image)

  • 김영화;박영호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1127-1139
    • /
    • 2013
  • 다양한 영상장비로 획득된 영상을 구현할 때, 원영상에 여러 가지 원인으로 인한 잡음이 추가되는 것이 일반적인 현상이며 이러한 잡음을 완벽하게 막는 것은 매우 어려운 것이 사실이다. 이러한 이유로 추가된 잡음을 탐지하여 제거하거나 가능한 줄이는 것이 영상처리의 중요한 기본목적이다. 본 연구에서는 영상의 특징에 대한 방향을 탐지하고, 영상을 오염시키고 있는 잡음의 상대적인 크기를 측정하여 잡음에 대한 분산의 수준을 추정하였다. 또한 추정된 분산을 영상처리 분야에서 자주 사용되는 잡음제거 기법인 시그마 필터에 적용하고, 특징의 방향을 가중치로 사용하여 잡음을 효과적으로 제거하는 알고리즘을 제시하였다. 결론적으로, 본 연구에서 제안한 잡음제거 방법을 통해 기존의 시그마 필터보다 개선된 잡음제거 결과를 얻을 수 있었으며, 추정된 잡음의 분산에 민감하지 않은 잡음제거 성능을 확인하였다.