• 제목/요약/키워드: 부대역 특징 추출

검색결과 12건 처리시간 0.043초

음성인식을 위한 주파수 부대역별 효과적인 특징추출 (Effective Feature Extraction in the Individual frequency Sub-bands for Speech Recognition)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.598-603
    • /
    • 2003
  • 본 논문에서는 주파수 부대역마다 최적의 특징추출을 위해서, 음성인식률을 기준으로 최적의 방법을 선택한다. 다중대역 음성인식 접근을 사용하여 각기 다른 주파수 영역에서 특징벡터를 독립적으로 추출함으로써 부대역별로 다른 특징추출 방법을 적용할 수 있었다. 저주파 대역의 음성은 비교적 스펙트럼의 구조가 명확하므로 전극모델을 사용하는 것이 효과적이었고, 고주파 대역에서는 비모수적인 변환방법인 이산 코사인 변환을 사용한 켑스트럼이 효과적이었다. 부대역별로 효과적인 특징추출 방법을 사용함으로써, 각 주파수 부대역에 포함된 음성인식을 위한 언어정보를 보다 효과적으로 추출할 수 있었다. 음성인식 실험결과, 제안한 방법은 전대역 특징추출보다 우수한 성능을 나타내었다.

주파수 부대역의 켑스트럼 해상도 최적화에 의한 특징추출 (Feature Extraction by Optimizing the Cepstral Resolution of Frequency Sub-bands)

  • 지상문;조훈영;오영환
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.35-41
    • /
    • 2003
  • 일반적인 음성인식 방법에서는 주파수 전대역에서 추출한 특징벡터를 사용하므로, 각 주파수 부대역은 최종인식 결과에 동등하게 기여한다. 본 논문에서는 주파수 부대역별로 독립적인 특징을 추출하고, 음성인식에 효과적이 되도록 부대역의 켑스트럼 해상도를 조절하는 방법을 제안한다. 주파수 부대역별로 독립적인 특징을 추출하는 멀티밴드 음성인식접근을 사용하여 부대역 특징벡터의 차원을 변화시킨다. 최적의 벡터 차원 조합을 찾기 위하여 음성인식률과 군집화 품질을 사용한다. TIDIGITS 연결 숫자음을 사용한 실험결과에서, 제안한 방법은 전대역 특징추출에 비해 적은 계산량으로도 숫자열 인식률은 99.12%, 백분율 정확도 (percent correct)는 99.775%, 백분율 정밀도 (percent accuracy)는 99.705%를 얻었으며, 이는 전대역 특징벡터에 비해 상대적 오류율을 각각 38%, 32%, 37% 감소시킨 결과이다.

잡음 환경에서 화자 확인을 위한 다중대역에 기반한 공분산 방법 (Covariance Model Based on Multi-Band for Speaker Verification in Noise)

  • 최민정;이기용
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.127-130
    • /
    • 2004
  • 기존의 전대역(Full-Band)에서 특징 파라미터를 추출하는 화자 확인(Speaker Verification) 시스템은 저대역이나 고대역에서 화자 정보의 특징이 제거되기 쉽다. 또한, 주파수 스펙트럼에 부분적으로 오염이 되는 경우, 특징 파라미터를 왜곡시켜 화자 확인 시스템의 성능을 저하시킨다. 본 논문에서는 이러한 문제점을 해결하기 위해 다중대역 공분산 모델(Covariance Model)을 제안한다. 제안한 방법은 주파수 영역에서 전대역을 여러 개의 부대역(Sub-Band)으로 분할하고, 부대역별로 독립적으로 특징 파라미터를 추출하여 공분산 모델을 구한다. 제안된 방법의 성능 확인을 위하여 공분산 모델 간의 거리를 측정하는 화자 확인 실험을 하였다. 잡음 환경에서 기존의 방법인 전대역에 기반한 공분산 모델과 제안한 방법을 비교 분석한 결과, 제안한 방법이 기존 방법보다 $2\%$정도 성능이 향상되었다. 또한, 제안된 방법은 전대역에 기반한 파라미터 차원 수를 다중대역의 개수로 분할하여 사용하므로 계산량의 감소와 저장 공간면에서 효율적이다.

  • PDF

주파수 부대역별 병렬 신경망 분석에 의한 화산 분출 초저음파의 식별기법 연구 (Frequency Sub-bands Parallel Neural Network Classification of Infrasonic Signals Associated with Volcanic Eruptions)

  • 이진구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.785-787
    • /
    • 2014
  • 본 논문에서는 화산 분출 초저음파의 식별을 위해서 FSPNNC(Frequency Sub-bands Parallel Neural NetworkClassification)을 선택한다. FSPNNC 는 각기 다른 주파수 영역에서 독립적으로 추출한 특징벡터를 병렬 구조의 신경망에 학습하는 구조를 가지며 하나의 신경망은 하나의 분류 및 하나의 주파수 부대역만을 학습하고 다른 신경망들은 해당 특징벡터를 분류하지 않도록 학습된다. 실험은 단일 신경망 및 PNNCB(Parallel Neural Network Classifier Bank)와의 비교실험을 통하여 식별 성능을 제시한다.

웨이블릿 부대역의 히스토그램 특성과 통계적 모멘트를 이용한 스테그분석 (Steganalysis Using Histogram Characteristic and Statistical Moments of Wavelet Subbands)

  • 현승화;박태희;김영인;김유신;엄일규
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.57-65
    • /
    • 2010
  • 본 논문은 스테가노그래피 알고리즘에 대한 블라인드 스테그분석 기법을 제안한다. 제안하는 스테그분석기법은 두 가지 형태의 특징 벡터를 추출한다. 첫 번째로, 영상에 정보를 은닉한 후 웨이블릿 부대역의 히스토그램 특성이 변한다는 것을 관찰하고 히스토그램의 위치 변화를 특징으로 이용한다. 두 번째로, 웨이블릿 특성 함수의 통계적 모멘트를 특징으로 이용한다. 첫번째 형태의 특징은 영상을 3-레벨 웨이블릿 변환하여 9개의 고주파 부대역에서 각각 하나의 특징을 추출하여 총 9개의 특징 벡터 얻는다. 두 번째 형태의 특징은 각 부대역별로 3차 모멘트까지 추출하여 39개의 특징 벡터를 얻는다. 총 48개의 특징 벡터를 교사학습을 이용하여 학습한 후 스테고 영상과 커버 영상을 분류한다. 다층 퍼셉트론 신경망 분류기를 이용하여 두 가지 형태의 특징을 입력으로 하여 삽입 데이터의 존재유무를 판별한다. 제안 방법의 성능을 평가하기 위하여 CorelDraw 데이터베이스 영상이 사용되었고 LSB 방법과 SS방법, blind SS방법, F5방법으로 다양한 삽입률의 스테고 영상을 생성하여 실험한다. 민감도와 특이도, 에러율, ROC 커브 면적 등을 이용하여 제안 방법이 기존의 스테그분석 방법보다 삽입 정보 유무를 검출하는데 효과적임을 보여준다.

웨이브릿 변환 영상에서 객체 영역 인식 (A Object Region Recognition on the Wavelet Transform Image)

  • 류권열;강경원;이경환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1046-1051
    • /
    • 2002
  • 본 논문에서는 웨이브릿 변환 영상에서 객체 영역을 인식하는 새로운 필터링 방법을 제안하고, 제안한 방법을 이용하여 객체 기반 영상검색 방법을 비교 분석한다. 기존의 방법은 특징벡터를 웨이브릿 변환 영상의 부대역 전체에서 추출하기 때문에 불필요한 배경정보가 포함됨으로써 검색효율이 감소하였다. 그러나 제안한 방법은 객체영역에서 특징벡터를 추출하므로 더욱 정확한 정보가 추출될 뿐 아니라, 불필요한 배경정보를 제거함으로써 검색효율을 향상시키며, 객체의 위치나 크기에 상관없이 검색효율을 일정하게 유지한다.

  • PDF

웨이브릿 변환과 공간 히스토그램을 이용한 초음파 영상 내용기반 검색 (The content-based ultrasound image retrieval by wavelet transform and spatial histogram)

  • 김범수;곽동민;원종운;김남철;박길흠
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2085-2093
    • /
    • 2000
  • 본 논문에서는 초음파 영상의 대한 내용기반 검색을 위한 초음파 영상의 특징 추출방법과 추출된 특징들을 이용한 검색 방법에 대해 제안한다. 내용기반 초음파 영상 검색을 위한 특징들로 공간영역에서 히스토그램과 웨이브릿 변환후 각 부대역에서 통계적 특성을 추출한다. 웨이브릿 변환 영역에서 추출된 특성은 질의 영상과 유사한 영상의 특성 벡터 거리가 평균 특성 벡터 거리보다 작다는 특성을 가진다. 이러한 특성을 이용하여 일차 검색을 수행하여 그 결과를 공간영역의 히스토그램을 이용한 이차 검색을 위한 후보로 사용함으로써 이차 검색의 대상이 줄어들게 된다. 히스토그램을 이용한 검색은 대상이 많을수록 오류를 범할 가능성이 높아짐으로 검색대상을 줄인다는 것은 매우 중요한 일이다. 또한 히스토그램을 사용함으로써 영상내 의학적 객체의 이동이나 회전에 무관하게 검색을 수행할 수 있다.

  • PDF

양방향 반올림 필터를 이용한 객체 영역 기반 고속 영상 검색 (Fast Image Retrieval Based on Object Regions Using Bidirectional Round Filter)

  • 류권열;강경원
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.240-246
    • /
    • 2003
  • 본 논문에서는 웨이브릿 변환 영역에서 양방향 반올림 필터를 이용한 객체 영역 기반 고속 영상 검색 방법을 제안한다. 기존의 방법은 웨이브릿 변환 영역의 부대역 전체에서 특징 벡터를 추출하기 때문에 불필요한 배경 정보가 포함됨으로써 검색 효율이 감소하였다. 제안한 방법은 양방향 반올림 필터를 이용하여 객체 영역에서만 특징 벡터를 추출함으로써 불필요한 배경 정보를 제거하여 검색 효율을 향상시킨다. 그리고, 색상 정보에 관한 특징 벡터 수를 감소하여도 일정한 검색 효율을 유지한다. 결론적으로, 영상의 특성에 따라 다소 차이는 있으나 2.5%∼5.3%의 검색 효율이 향상됨을 알 수 있었다.

  • PDF

움직임 각도의 주파수 분석을 통한 활동성 분석 (Fish's Activity Analysis through Frequency Analysis of Angle Information)

  • 김철기
    • 한국콘텐츠학회논문지
    • /
    • 제7권5호
    • /
    • pp.10-15
    • /
    • 2007
  • 본 논문에서는 기존의 컴퓨터비전 기술을 이용한 생물체의 자동 추적 시스템을 통하여 얻어진 움직임 데이터를 이용하여 일반적인 움직임의 범위를 벗어나는 비정상적인 움직임 제적을 탐지하여 주는 방법을 제안하고 있다. 또한 웨이블릿 변환을 통한 부대역간 주파수 성분의 특성을 이용하여 움직임 궤적의 분석에 적용하는 방법을 제시하고 있다. 실험 결과를 통하여 인위적인 약물 처리 전 후에 탐지되는 활동성을 표현하는 특징점의 수가 통계학적으로 유의함을 확인하였다.

대역별 웨이블릿 계수특성을 이용한 장면전환점 검출기법 (Cut Detection Algorithm Using the Characteristic Of Wavelet Coefficients in Each Subband)

  • 문영호;노정진;유지상
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1414-1424
    • /
    • 2004
  • 본 논문에서는 동영상의 장면전환점 중 급진적인 장면전환점인 컷(cut)과 점진적인 장면전환점인 페이드(fade)와 디졸브(dissolve) 구간을 웨이블릿 변환영역에서 검출하는 알고리즘을 제안한다. 웨이블렷 변환을 이용한 기존의 연구들은 공간영역과 변환영역 각각의 특징을 이용하여 장면전환점을 검출한다. 그러나 본 논문은 입력된 컬러영상을 먼저 YW 공간으로 변환하고, Y 성분에 대해 리프팅기법을 적용하여 2 레벨 웨이블릿 변환 후, 변환영역에서 공간영역의 특징이 유지되는 저주파 부대역을 히스토그램 비교하고, 나머지 고주파 부대역에서 추출된 에지 정보를 전체(global), 부분(semi-global), 국부(local) 영역으로 정의하여 웨이블릿 에지 히스토그램 비교를 한다. 모의실험 결과 기존의 방법보다 recall에서는 약 17%, precision에서는 약 18%의 성능향상을 보였으며 점진적인 장면 전환점인 페이드와 디졸브 구간 검출에도 좋은 성능을 나타내었다.