• 제목/요약/키워드: 음향 식별

검색결과 177건 처리시간 0.02초

허프 변환과 convolutional neural network 모델 기반 선박 소음의 로파그램 분석 및 식별 (Lofargram analysis and identification of ship noise based on Hough transform and convolutional neural network model)

  • 조준범;하용훈
    • 한국음향학회지
    • /
    • 제43권1호
    • /
    • pp.19-28
    • /
    • 2024
  • 본 논문은 Convolutional Neural Network(CNN) 모델을 이용하여 선박 소음의 로파그램 분석을 통한 선박 식별 시 허프 변환을 적용함으로써 성능을 향상시키는 방안을 제안한다. 수동소나에 수신된 신호를 처리하면 시간-주파수 영역인 로파그램이 생성된다. 로파그램에는 선박이 방사하는 기계류 소음이 토널 신호로 나타나고 이를 분석하면 선박의 클래스를 특정할 수 있다. 그러나 로파그램의 분석은 숙달된 인원에 의해 진행되는 전문적이고 오랜 시간이 소요되는 작업이다. 또한, 로파그램에는 수중환경 특성 상 다양한 배경소음이 같이 전시되기 때문에 표적 식별을 위한 분석이 매우 어렵다. 이 문제를 해결하기 위해 로파그램에 허프 변환을 적용하여 선을 추가함으로써 토널 신호를 강조하였다. 원본 로파그램과 허프 변환을 적용한 로파그램에 대해 CNN 모델을 이용해 식별을 시도한 결과, CNN 모델의 정확도와 매크로 F1 점수를 통해 허프 변환을 적용한 것이 로파그램 식별 성능을 향상시켰음을 보여주었다.

화자식별 시스템의 계산량 감소를 위한 화자 프루닝 방법 (A Speaker Pruning Method for Reducing Calculation Costs of Speaker Identification System)

  • 김민정;오세진;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.457-462
    • /
    • 2003
  • 본 논문에서는 GMM (Gaussian Mixture Model)에 기반한 문맥독립 화자식별 시스템의 식별성능 향상과 실시간 처리를 위한 계산량 감소를 위하여 화자 프루닝 (Speaker Pruning) 방법을 제안한다. 기존의 화자식별 방법인 최대유사도(Maximum Likelihood) 방법과 가중모델순위 (Weighting Model Rank) 방법, 수정된 가중모델순위 (Modified WMR) 방법 등은 입력 음성 전체와 모든 화자모델들과의 유사도를 프레임 단위로 계산하여 가장 큰 누적 유사도를 가지는 화자를 식별화자로 결정하는 방법으로써, 입력 프레임 및 등록 화자수가 늘어남에 따라 계산량 및 식별시간이 늘어나는 단점이 있었다. 이러한 단점을 해결하기 위하여, 제안방법은 입력음성 프레임의 일부분만을 이용하여 화자모델들과의 프레임 유사도를 계산한 후 계산된 유사도를 이용하여 등록화자의 상위 일부분의 화자만을 선택하고, 선택된 화자들에서만 유사도 계산을 수행함으로서 계산량 및 식별시간을 줄이는 방법이다. 또한, 화자 프루닝을 적용할 경우 화자수가 가변 되더라도 수정된 가중모델 순위방법을 적용할 수 있어 식별성능을 높일 수 있다. 식별실험결과, 제안방법을 적용한 경우 기존의 최대 유사도 방법이나 가중모델순위 방법보다 최대 65%의 계산량 및 식별시간을 감소시킬 수 있었으며, 약 2%의 향상된 식별결과를 나타내어, 본 논문에서 제안한 방법의 유효성을 확인할 수 있었다.

경계 차감 클러스터링에 기반한 클러스터 개수 추정 화자식별 (Speaker Identification with Estimating the Number of Cluster Based on Boundary Subtractive Clustering)

  • 이윤정;최민정;서창우;한헌수
    • 한국음향학회지
    • /
    • 제26권5호
    • /
    • pp.199-206
    • /
    • 2007
  • 본 논문에서는 화자식별을 위한 특징벡터의 새로운 클러스터링 방법을 제안한다. 제안된 방법은 클러스터 센터에 대한 초기값 설정과 클러스터 개수에 대한 사전 정보 없이 클러스터링이 가능하다. 각 클러스터 센터는 경계 차감 클러스터링 알고리즘으로 한 번에 한 개의 클러스터 센터가 추가됨으로써 순차적으로 구해지며, 클러스터 개수는 클러스터간의 상호관계를 조사하여 결정된다. 인공 생성 데이터 및 TIMIT 음성을 이용하여 실험한 결과로부터 제안된 방법이 기존의 방법보다 우수함을 확인하였다.

독립성분분석을 이용한 강인한 화자인식 (Robust Speaker Recognition using Independent Component Analysis)

  • 장길진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

동적 시간 신축 알고리즘을 이용한 화자 식별 (Speaker Identification Using Dynamic Time Warping Algorithm)

  • 정승도
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2402-2409
    • /
    • 2011
  • 음성에는 전달하고자 하는 정보 이외에 화자 고유의 음향적 특징을 담고 있다. 화자간의 음향적 차이를 이용하여 말하고 있는 사람이 누구인지 판단하는 방법이 화자 인식이다. 화자 인식에는 화자 확인과 화자 식별로 구분되는데 화자 확인은 1명의 음성을 대상으로 본인인지 아닌지를 검증하는 방법이다. 반면, 화자 식별은 미리 등록된 다수의 종속 문장으로부터 가장 유사한 모델을 찾아 대상 의뢰인이 누군지 식별하는 방법이다. 본 논문에서는 MFCC(Mel Frequency Cepstral Coefficient) 계수를 추출하여 특징 벡터를 구성하였고, 특징 간 유사도 비교는 동적 시간 신축(Dynamic Time Warping) 알고리즘을 이용한다. 각 화자마다 두 개의 종속 문장을 훈련 데이터로 사용하여 음운성에 기반을 둔 공통적 특징을 기술하였고, 이를 통해 데이터베이스에 저장되어 있지 않은 단어를 사용하더라도 동일 화자임을 식별할 수 있도록 하였다.

양상태 소나에서의 자세각과 양상태각에 따른 표적 식별 정확도 비교 (Comparison of target classification accuracy according to the aspect angle and the bistatic angle in bistatic sonar)

  • 추연성;변성훈;추영민;최기융
    • 한국음향학회지
    • /
    • 제40권4호
    • /
    • pp.330-336
    • /
    • 2021
  • 양상태 능동 소나에서 수중 표적의 산란 강도는 사용된 신호의 주파수, 표적과 음원사이의 각도를 의미하는 자세각, 표적과 수신기 사이의 각도를 나타내는 양상태각 등의 운용 변수에 따라 다르게 나타난다. 따라서 양상태 소나의 표적 탐지 및 식별 성능은 소나 운용 과정에서 표적, 음원, 그리고 수신기의 위치를 어떻게 변화시키느냐에 따라 그 성능이 달라질 수 있다. 본 연구에서는 양상태 소나 운용 시 자세각을 변화시키는 경우와 양상태각을 변화시키는 경우의 표적 식별 성능을 비교하여 어떤 변수를 변화시키는 것이 유리한지 평가하였다. 속이 비어있는 구와 실린더를 식별하는 시나리오를 가정하였으며, 유한요소법 기반의 음향 산란 시뮬레이션을 이용하여, 서포트 벡터 머신으로 두 표적을 분류하고 정확도를 비교하는 방법으로 성능을 비교하였다. 표적의 산란 신호만을 고려하기 위하여, 해저면 잔향의 효과는 고려하지 않았다. 비교 결과, 자세각을 고정한 상태에서 주파수와 양상태각으로 정의되는 산란 강도를 이용하는 것이 우수한 평균 분류 정확도를 보여주었으며, 이는 양상태 소나를 이용하여 구와 실린더를 식별하고자 하는 경우, 음원의 위치를 고정시킨 상태에서 수신기를 이동하여 양상태각을 변화시키는 것이 표적 식별에 더 효과적임을 보여준다.

Convolutional neural network 기법을 이용한 턱수염물범 신호 판별 (Classification of bearded seals signal based on convolutional neural network)

  • 김지섭;윤영글;한동균;나형술;최지웅
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.235-241
    • /
    • 2022
  • 수동 음향 관측을 통해 수집된 방대한 양의 데이터에서 해양포유류의 소리를 탐지하고 식별하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)을 활용한 연구가 많이 수행되고 있다. 본 연구는 2017년 8월부터 2018년 8월까지 동시베리아 해에서 수집된 수중음향 스펙트럼 이미지를 기반으로 CNN을 활용하여 턱수염물범 소리의 분류 자동화 가능성을 확인해 보았다. 학습 데이터로서 다른 소음이 거의 포함되지 않은 뚜렷한 턱수염물범 소리를 사용하였을 때, 암기로 인한 과적합이 발생하였다. 일부 데이터를 소음이 포함된 데이터로 교체하여 학습시켜 수집된 전체 데이터로 평가한 결과 정확도(0.9743), 정밀도(0.9783), 재현율(0.9520)으로 모델이 이전보다 일반화되어 과적합이 방지되는 것을 확인하였다. 본 연구를 통해 물범신호 분류는 학습 데이터에 소음이 포함되었을 때 성능이 증가하는 것으로 나타났다.

시간축 스케일링에 의한 화자 식별 개선에 관한 연구 (A Study on Improvement of Speaker Identification with Time axis Scaling)

  • 정형교
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.123-126
    • /
    • 1998
  • 기존의 DTW를 이용한 화자 인식 시스템은 DTW의 단점이라 할 수 있는 과다한 계산량을 갖는다는 문제점을 갖고 있다. 따라서 본 논문은 텍스트 종속 화자 인식 시스템에서 피치 분포도를 갖는 개별 화자의 lDTW를 수행하기 전에 시간축 스케일링을 이용한 전처리로 인식시의 계산량을 감소시키는 과정을 미리 수행할 후 감소된 기준패턴들의 입력신호에 대해서만 DTW를 수행하는 방법을 제안하고자 한다. 제안한 방법을 실험하였을 경우 87.5%의 평균 처리 시간이 감소하였고, 더불어 인식률 감소는 거의 없었다.

  • PDF

미지표적의 식별과 시간지연 차의 추적연구 (Detection and Time Delay Estimation of Unknown Target)

  • 염석원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.499-502
    • /
    • 1998
  • 본 논문에서는 한 쌍의 수동소나를 이용하여 미지의 잠항물체의 존재 유무를 확인하고 각 센서에 도달하는 시간지연의 차를 평가하는 Detection과 Tracking 알고리즘을 연구한다. 이 과정에서 이동하는 표적의 속력에 의한 도플러효과를 보상하는 2차원 확률분포 함수를 적용함으로 보다 정확한 결과를 도출한다. 관측신호의 Cross-Correlation과 Bayesian Method를 이용하여 계산한 시간지연과 도플러효과 비의 이차원 Likelihood 함수로부터 사후확률 (Posterior Probability)을 구하여 발견 평가와 추적을 수행한다.

  • PDF