• 제목/요약/키워드: 특징 변수 추출

검색결과 175건 처리시간 0.059초

음향 방출 신호와 히스토그램 모델링을 이용한 유도전동기의 베어링 결함 검출 (Bearing Faults Identification of an Induction Motor using Acoustic Emission Signals and Histogram Modeling)

  • 장원철;서준상;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 저속으로 회전하는 유도 전동기의 베어링 결함을 검출하기 위해 음향 방출 신호와 히스토그램 모델링을 이용하는 방법을 제안한다. 제안한 방법은 정규화된 결함 신호가 구성하는 히스토그램의 포락선을 모델링하여, 부분 상관 계수와 DET(Distance Evaluation Technique) 기법을 이용하여 결함 유형별 고유한 특징을 추출 및 선택한다. 추출된 특징을 SVR(Support Vector Regression) 분류기의 입력으로 사용하여 베어링의 내륜, 외륜 및 롤러 결함을 분류한다. 최적의 분류 성능을 위해 SVR 커널함수의 매개변수를 0.01에서 1.0까지 변화시키고, 특징 개수는 2에서 150까지 변화시키면서 실험한 결과, 0.64-0.65의 매개변수와 75개의 특징 개수에서 제안한 방법은 약 91%의 분류 성능을 보였고, 또한 기존의 결함 분류 알고리즘보다 높은 분류 성능을 보였다.

지역 군집화를 위한 CNN-GRU 기반 다변량 시계열 데이터의 특성 추출 (Feature Extraction of CNN-GRU based Multivariate Time Series Data for Regional Clustering)

  • 김진아;이지훈;최동욱;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.950-951
    • /
    • 2019
  • 시계열 데이터에 대한 군집화 관련 연구는 주로 통계 분석을 통해 이뤄지기 때문에 데이터가 갖는 특성을 완전히 반영하는 데 한계를 갖는다. 본 논문에서는 다변량 데이터에서의 군집화를 위하여 변수별로 시간에 따른 변화와 특징을 추출하기 위한 CNN-GRU(Convolutional Neural Network - Gated Recurrent Unit) 기반의 신경망 모델을 제안한다. CNN을 활용하여 변수별로 갖는 특성을 파악하고자 하였으며, GRU을 통해 전체 시간에 따른 소비 추세를 도출하고자 하였다. 지역별로 업종에 따라 사용된 2년 치의 실제 카드 데이터를 활용하였으며, 유사한 소비 추세를 보이는 지역을 군집화하는데 이를 적용하였다. 결과적으로, 다변량 시계열 데이터를 통해 전체적인 흐름을 반영하여 패턴화했다는 점에서 의의를 갖는다.

한국어 음성인식 시스템에서 음소 경계 검출을 위한 Branch 알고리즘 (Branch Algorithm for Phoneme Segmentation in Korean Speech Recognition System)

  • 서영완;한승진;장흥종;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.357-359
    • /
    • 2000
  • 음소 단위로 구축된 음성 데이터는 음성인식, 합성 및 분석 등의 분야에서 매우 중요하다. 일반적으로 음소는 유성음과 무성음으로 구분되어 진다. 이러한 유성음과 무성음은 많은 특징적 차이가 있지만, 기존의 음소 경계추출 알고리즘은 이를 고려하지 않고 시간 축을 기준으로 이전 프레임과 매개변수 (스펙트럼) 비교만을 통하여 음소의 경계를 결정한다. 본 논문에서는 음소 경계 추출을 위하여 유성음과 무성음의 특징적 차이를 고려한 블록기반의 Branch 알고리즘을 설계하였다. Branch 알고리즘을 사용하기 위한 스펙트럼 비교 방법은 MFCC(Mel-Frequency Cepstrum Coefficient)를 기반으로 한 거리 측정법을 사용하였고, 유성음과 무성음의 구분은 포만트 주파수를 이용하였다. 실험 결과 3~4음절 고립단어를 대상으로 약 78%의 정확도를 얻을수 있었다.

  • PDF

산술 연산자 기반 유전자 프로그래밍을 이용한 효과적인 암 분류 (Effective Cancer Classification Using Genetic Programming based on Arithmetic Operators)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.1-3
    • /
    • 2003
  • 최근 생물정보 기술이 암 진단의 새로운 방법으로 관심을 모으고 있다. 다양한 기계학습 기법을 적용하여 우수한 결과를 얻고 있지만, 의학 분양에서는 정확률이 높은 분류기의 획득과 동시에 획득된 분류규칙을 분석하고 이해할 수 있어야 한다. 생물정보 기술에서 많이 사용되는 유전발현 데이터는 데이터내에 수천 내지 수만의 변수가 존재하여 직접 이들 사이의 복잡한 관계를 표현하고 이해하는 것은 매우 어렵다. 본 논문에서는 이러한 어려움을 극복하기 위해 유전발현 데이터에서 분류에 유용한 특징들을 추출하고 유전자 프로그래밍으로 추출된 특징들을 이용한 암 분류규칙을 생성한다. 림프종 유전발현 데이터에 대하여 실험해본 결과, 90% 수준의 인식 성능을 보였고, 또한 모든 샘플을 완벽하게 분류하는 산술 분류규칙을 발견하였다.

  • PDF

Aspect model 기반의 차원 축소를 이용한 유전자 발현데이터 분석 (Gene Expression Pattern Analysis Using Aspect Model-based Dimensionality Reduction)

  • 장정호;엄재홍;김유섭;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.247-249
    • /
    • 2004
  • 본 논문에서는 aspect model을 이용한 차원 축소 기반의 유전자 발현 데이터 분석을 제시한다. Aspect model은 은닉변수모델의 하나로서, 이를 이용하여 유전자 발현 데이터에 대한 확률적 학습 과정을 통해 특징적 발현 패턴을 추출할 수 있다. 또한 모델로부터 커널함수를 유도함으로써 발현패턴에 기반한 유전자간의 유사도를 자연스럽게 측정할 수 있다. 모델에 의해 정의되는 은닉공간 차원 수는 데이터 permutation 기반의 검증을 통해 결정한다. 효모 (yeast)의 세포 주기(cell cycle) 관련 발현데이터네 대한 실험에서, 주기별 특징 발현 패턴을 추출할 수 있었다. 또한 aspect model로부터 유도된 커널 기반의 유사도 척도를 이용함으로써, 동일 기능 또는 동일 complex 범주에 속하는 유전자 쌍 예측에서 기본적인 상관계수에 의한 방법에 비해 보다 향상된 성능을 얻을 수 있었다.

  • PDF

DTED와 1:50,000 수치지형도에 의한 격자 DEM의 지형 매개변수 비교 (Comparison of Topographical Parameter for DTED and Grid DEM from 1:50,000 Digital Map)

  • 김연준;신계종
    • 한국지리정보학회지
    • /
    • 제5권3호
    • /
    • pp.19-32
    • /
    • 2002
  • 지형 정보는 표고 자료가 요구되는 응용에서 반드시 필요한 중요한 자료이다. 이러한 응용에는 배수 유역, 하천망의 추출, 가시권 분석, 지형학적 특징의 분석, 지형에 관련된 산사태 유형의 양적인 분석 및 산사태 발생지역에서 민감도 분석을 위한 지형 위치의 검증 등이 있다. 그러므로 DEM으로부터 추출된 지형 매개변수 자료의 정확도를 연구해야 한다. 본 연구에서는 표고 격자 DEM을 이용하여 자료원과 격자크기가 지형 매개변수에 미치는 영향을 분석하고자 하였다. 지형매개변수 분석은 수치지형도로 구축된 것과 DTED DEM을 이용하여 배수유역, 유역경사, 하천망을 추출하여 비교하였다. 특히, 격자 DEM으로부터 하천망을 추출하는 경우 DEM 격자크기에 관계없이 흐름누적 임계값에 따라 많은 영향을 받았다. 따라서 본 연구에서는 두 자료원에 동일한 흐름누적 임계값을 적용하여 하천망을 비교 분석하였다.

  • PDF

거시경제변수(巨視經濟變數)와 주가(株價) - 한국주식시장(韓國株式市場)에서의 실증분석 -

  • 정기웅
    • 재무관리연구
    • /
    • 제8권2호
    • /
    • pp.111-129
    • /
    • 1991
  • 본 논문에서는 재정가격결정모형(裁定價格決定模型)(Arbitrage Pricing Model)을 기초로 우리나라 주식시장에 영향을 주는 거시경제변수가 무엇인가를 찾고자 하였다. 방법론면에서는 과거변수(過去變數)(lagged variables)에 의해서만 기대치를 형성시키는 AIRMA(Autoregressike Integrated with Moving Average) 방법을 이용하기보다는 마코프속성(屬性)(Markov Property)을 갖는 상태공간모형(狀態空間模型) (State Space Model)을 이용하여 보다 합리적인 거시경제 요인의 이노베이션을 하였다. 또한 단순한 요인분석(要因分析)(factor analysis)에 의한 요인추출은 요인의 표본의존성(標本依存性)(Sample dependency)이 심하므로 그룹간 요인분석(inter-battery factor analysis)을 행하여 추정(推定)된 요인(要因)(요인값 : factor score)과 요인수를 결정하여 관련 거시경제변수를 선택한다. 그룹간 요인분석을 위한 그룹을 형성할 때 그룹내에서는 동질성을 그룹간에는 이질성을 최대한 살리는 것이 필요한데, 이를 위해 군집분석(群集分析)(Cluster Analysis)을 사용한 것이 특징이다. 결론적으로 우리나라 주식시장에 영향을 미치는 거시경제요인(巨視經濟要因)으로 단위노동비율, 제조업제품재고지수, 채권프리미엄, 수출물가지수, 정부부문 통화공급, 회사채수익률, 종합주가지수 등 7가지가 있는 것으로 분석되고 있다.

  • PDF

신경회로망을 이용한 화자식별 시스템의 특징 파라미터에 따른 성능비교 (Performance Comparison by Characteristic Parameter of Speaker Identification System using Neural Networks)

  • 정재룡;유재훈;배현;전병희;김성신
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.345-348
    • /
    • 2002
  • 음성인식 기술은 크게 음성인식과 화자인식 기술의 두 가지로 분류된다. 현재는 음성인식 기술이 널리 연구되고 있지만 점차 화자인식 기술의 중요성이 대두되고 있다. 본 논문에서는 화자인식 기술의 한 가지 분류로 임의 화자를 식별하기 위한 화자식별 기술을 연구 대상으로 하고 있으며, 신경회로망을 이용한 화자식별 시스템의 특징 추출 방법을 제시하고 그에 따른 성능을 비교하고 있다. 식별 단계에서 26명의 78개의 음성 샘플을 신경회로망의 역전파 알고리듬을 이용하여 학습하고, 테스트용으로 한 화자의 음성샘플이 사용되어 식별된다. 신경회로망의 입력 변수는 특징 파라미터로 선형예측계수, Mel-주파수 켑스트럼계수와 웨이블릿을 이용한 켑스트럼 계수를 사용하였다. 그 결과로써 화자식별 시스템의 신경회로망 모델2의 입력으로 혼합된 특징 파라미터를 사용한 경우가 다른 파라미터들을 사용한 경우와 비교하여 8.46~21.53%의 차를 가지고 가장 좋은 성능을 나타내었다.

명암도 변화 및 HSI 정보와 개선된 ART2 알고리즘을 이용한 차량 번호판 인식 (Recognition of Car Plate using Gray Brightness Variation, HSI Information and Enhanced ART2 Algorithm)

  • 김광백;김영주
    • 한국지능시스템학회논문지
    • /
    • 제11권5호
    • /
    • pp.379-387
    • /
    • 2001
  • 본 논문은 그레이 명암도 변화와 HSl 컬러 모형의 Hue 정보를 함께 이용한 번호판 영역 추출 방법을 제안한다. 차량 이미지에서 차량 번호판 추출은 명암도 변화를 이용하여 번호판 후보 영역을 추출하고 후보 영역에 대해 HSI 컬러 모형의 Hue 정보를 이용하여 실제 번호판 영역을 결정한다. 추출된 번호판 영역으로부터 문자를 포함하는 특징 영역 추출은 각 문자들에 대한 히스토그램을 이용하여 추출한다. 그리고 Yager의 합접속 연산자를 이용하여 경계 변수 값을 동적으로 변화시키는 개선된 ART2 알고리즘을 제안하고 번호판의 개별 문자 인식에 적용한다. 또한 개선된 ART2와 지도 학습 방법을 통합한 SOSL 알고리즘을 제안한다. 100개의 실제 차량 이미지를 이용한 실험 결과를 통해 제안된 번호판 영역 추출 방법이 단일 컬러 모형을 적용한 기존 추출 방법보다 추출률이 향상되었고, 개선된 알고리즘들이 기존의 ART2 알고리즘과 오류 역전파 알고리즘 보다 더 높은 인식률을 보임을 알 수 있었다.

  • PDF

희소주성분분석을 이용한 텍스트데이터의 단어선택 (Feature selection for text data via sparse principal component analysis)

  • 손원
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.501-514
    • /
    • 2023
  • 텍스트데이터는 일반적으로 많은 단어로 이루어져 있다. 텍스트데이터와 같이 많은 변수로 구성된 데이터의 경우 과적합 등의 문제로 분석에 있어서의 정확성이 떨어지고, 계산과정에서의 효율성에도 문제가 발생하는 경우를 흔히 볼 수 있다. 이렇게 변수가 많은 데이터를 분석하기 위해 특징선택, 특징추출 등의 차원 축소 기법이 자주 사용되고 있다. 희소주성분분석은 벌점이 부여된 최소제곱법 중 하나로 엘라스틱넷 형태의 목적함수를 사용하여 유용하지 않은 주성분을 제거하고 각 주성분에서도 중요도가 큰 변수만 식별해내기 위해 활용되고 있다. 이 연구에서는 희소주성분분석을 이용하여 많은 변수를 가진 텍스트데이터를 소수의 변수만으로 요약하는 절차를 제안한다. 이러한 절차를 실제 데이터에 적용한 결과, 희소주성분분석을 이용하여 단어를 선택하는 과정을 통해 목표변수에 대한 정보를 이용하지 않고도 유용성이 낮은 단어를 제거하여 텍스트데이터의 분류 정확성은 유지하면서 데이터의 차원을 축소할 수 있음을 확인하였다. 특히 차원축소를 통해 고차원 데이터 분석에서 분류 정확도가 저하되는 KNN 분류기 등의 분류 성능을 개선할 수 있음을 알 수 있었다.