• 제목/요약/키워드: sound recognition algorithm

검색결과 61건 처리시간 0.023초

A New Methodology for Software Module Characterization

  • Shin, Miyoung;Nam, Yunseok
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.434-437
    • /
    • 1999
  • The primary aim of this paper is to introduce and illustrate a radial basis function (RBF) modeling approach fur software module characterization, as an alternative to current techniques. The RBF model has been known to provide a rich analytical framework fur a broad class of so-called pattern recognition problems. Especially, it features both nonlinearity and linearity which in general are treated separately by its learning algorithm, leading to offer conceptual and computational advantages. Furthermore, our new modeling methodology fer determining model parameters has a sound mathematical basis and showed very interesting results in terms of model consistency as well as performance.

  • PDF

Fuzzy 추론을 이용한 일파식 속기문자의 On-Line 인식에 관한 연구 (A Study on an On-Line Il-Pa Shorthand Character Recognition Using Fuzzy Inference)

  • 김진우;장기흥;김도현
    • 전자공학회논문지B
    • /
    • 제31B권1호
    • /
    • pp.99-106
    • /
    • 1994
  • In this paper, we develop an algorithm which recognizes Ilpa-style shorthand characters by on-line. It discriminates the structure of characters using coordinates which are measured by tablet board, then it outputs the recognized characters using the fuzzy inference rules. Shorthand characters have several forms, in which an initial or a middle sound depends on angle and length while a last sound is treated as a hook. We apply fuzzy inference rules to the discrimination of the length, the angle, the curve, and the straight line. We also built up a set of standard character codes in order to reduce the processing time.

  • PDF

자동차 환경에서 TDOA를 이용한 화자위치추정 방법 (On the speaker's position estimation using TDOA algorithm in vehicle environments)

  • 이상헌;최홍섭
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권2호
    • /
    • pp.71-79
    • /
    • 2016
  • 본 논문에서는 차량 내부 환경에서 음성인식 성능을 향상시켜 안정적인 차량 제어를 위한 방법으로 사용하는 음원 위치추정방법의 성능 비교와 개선 방법을 제안하였다. 일반적으로 음원 위치추정에는 TDOA알고리즘을 사용하는데 여기에는 시간영역에서 상호상관함수를 이용하는 방법과, 주파수 영역에서 계산하는 GCC-PHAT 방법이 있다. 이중 GCC-PHAT 방법은 상호상관함수보다 반향과 잡음에 강한 특성을 보인다고 알려져 있다. 본 연구에서는 반향과 잡음이 많은 차량 환경에서 위 두 방법의 성능을 비교하고 추가로 미디언 필터 사용을 제안하여 음원위치 추정 성능과 시스템의 안정성을 나타내는 지표로 사용하는 분산값이 모두 향상됨을 확인하였다. 실험결과에서 음성을 사용한 실험에서는 두 방법의 성능 차이가 거의 없지만, 노래신호를 사용한 음원위치 추정에서는 GCC-PHAT 방법이 상호상관함수에 비해 인식률이 10% 우수함을 확인하였다. 또한 미디언 필터를 추가한 경우에는 상호상관함수 방법의 인식률을 최고 11%까지 향상시킬 수 있었고 분산값에서도 두 방법 모두 안정적인 성능을 보여주었다.

미소 결함 평가를 위한 지능형 데이터베이스 구축에 관한 연구 (A Study about the Construction of Intelligence Data Base for Micro Defect Evaluation)

  • 김재열
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 2000년도 춘계학술대회논문집 - 한국공작기계학회
    • /
    • pp.585-590
    • /
    • 2000
  • Recently, It is gradually raised necessity that thickness of thin film is measured accuracy and managed in industrial circles and medical world. Ultrasonic Signal processing method is likely to become a very powerful method for NDE method of detection of microdefects and thickness measurement of thin film below the limit of Ultrasonic distance resolution in the opaque materials, provides useful information that cannot be obtained by a conventional measuring system. In the present research, considering a thin film below the limit of ultrasonic distance resolution sandwiched between three substances as acoustical analysis model, demonstrated the usefulness of ultrasonic Signal processing technique using information of ultrasonic frequency for NDE of measurements of thin film thickness, sound velocity, and step height, regardless of interference phenomenon. Numeral information was deduced and quantified effective information from the image. Also, pattern recognition of a defected input image was performed by neural network algorithm. Input pattern of various numeral was composed combinationally, and then, it was studied by neural network. Furthermore, possibility of pattern recognition was confirmed on artifical defected input data formed by simulation. Finally, application on unknown input pattern was also examined.

  • PDF

바이올린과 첼로 연주 데이터를 이용한 분류 알고리즘의 성능 비교 (Performance Comparison of Classification Algorithms in Music Recognition using Violin and Cello Sound Files)

  • 김재천;곽경섭
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.305-312
    • /
    • 2005
  • 음악인식에 주로 사용되는 세 가지 알고리즘의 성능을 비교하였다. 다양한 분류알고리즘을 소개하고 그 중 베이지안법, 최근접이웃법과 k-최근접이웃법을 이용하여 악기를 분류하였다. 악기 샘플파일에서 영교차율, 평균, 분산, 평균피크레벨의 4가지 특성값을 추출하여 분류시스템의 데이터로 사용하였다. 사용된 악기 샘플은 바이올린, 바로크 바이올린, 바로크 첼로이다. 실험결과 최근접이웃 알고리즘이 악기 분류에 있어서 가장 좋은 성능을 보여 주었다. 최근접이웃 알고리즘은 단순하면서도 빠른 계산결과를 보여 악기 분류에 적절한 알고리즘으로 판단되었다.

수중 탐측장비 회수용 원격 이탈제어 시스템의 개발 (A Retrieval system for the underwater surveying instrument)

  • 김영진;정한철;허경무;조영준
    • 전자공학회논문지SC
    • /
    • 제42권3호
    • /
    • pp.33-40
    • /
    • 2005
  • 심해저 자원의 확보를 위해서는 먼저 해양환경을 탐사하고 관측해야하며 이를 위해서 계측장비를 해저에 위치시키고 탐사가 끝난 후 회수하는 방법을 사용하는데 이 경우 계절변화에 따른 염분의 농도 및 온도 변화로 다양한 형태의 외란성 노이즈가 발생하여 제어 안정성과 수중통신에 대한 신뢰성이 떨어지고 있다. 그래서 기존의 제어방법은 수신된 제어정보를 하드웨어적인 방법으로 식별하고 기준 정보와 비교하며 이 과정을 수차례 반복하여 획득한 데이터를 제어정보로 활용하고 있다. 이는 제어의 신뢰성이 중요시 되는 시스템에서는 제어안정성 및 효율성이 떨어지고 있다. 따라서 본 논문에서는 해양환경 변화에 대한 제어안정성 및 동작신뢰성을 향상시킨 수중 탐측장비 회수용 원격 이탈제어 시스템을 제안하고자 한다. 그리고 제어알고리즘 및 원격 이탈제어 시스템의 적합성을 실험을 통하여 확인하였다.

SVM-based Drone Sound Recognition using the Combination of HLA and WPT Techniques in Practical Noisy Environment

  • He, Yujing;Ahmad, Ishtiaq;Shi, Lin;Chang, KyungHi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권10호
    • /
    • pp.5078-5094
    • /
    • 2019
  • In recent years, the development of drone technologies has promoted the widespread commercial application of drones. However, the ability of drone to carry explosives and other destructive materials may bring serious threats to public safety. In order to reduce these threats from illegal drones, acoustic feature extraction and classification technologies are introduced for drone sound identification. In this paper, we introduce the acoustic feature vector extraction method of harmonic line association (HLA), and subband power feature extraction based on wavelet packet transform (WPT). We propose a feature vector extraction method based on combined HLA and WPT to extract more sophisticated characteristics of sound. Moreover, to identify drone sounds, support vector machine (SVM) classification with the optimized parameter by genetic algorithm (GA) is employed based on the extracted feature vector. Four drones' sounds and other kinds of sounds existing in outdoor environment are used to evaluate the performance of the proposed method. The experimental results show that with the proposed method, identification probability can achieve up to 100 % in trials, and robustness against noise is also significantly improved.

잡음 섞인 한국어 인식을 위한 ICA 비교 연구 (Comparison of ICA Methods for the Recognition of Corrupted Korean Speech)

  • 김선일
    • 전자공학회논문지 IE
    • /
    • 제45권3호
    • /
    • pp.20-26
    • /
    • 2008
  • 두 가지 Independent Component Analysis(ICA) 알고리즘을 적용하여 자동차 엔진 소음과 섞인 음성 신호의 인식을 시도하였다. 이를 이용하여 추정한 신호를 HMM을 이용하여 인식하였고 이 신호의 인식률을 소음이 섞이기 전의 음성 신호의 인식률과 비교하였다. 음성 신호를 추정하는데 두 가지 서로 다른 ICA를 사용하였으며 그 중의 하나는 negentropy를 최대화하는 FastICA 알고리즘이며 다른 하나는 출력 신호 사이의 독립성을 최대화하여서 입력과 출력 사이의 mutual information을 최대화하는 information-maximization approach 이다. 남성 앵커가 진행한 한국어 뉴스 문장에 대한 단어 인식률은 87.85%이며 다양한 신호 대 잡음비를 갖도록 소음을 섞어서 추정을 한 후 인식을 시도한 결과 FastICA를 이용해 추정한 음성 신호에 대한 인식률은 1.65%, information-maximization을 이용해 추정한 음성 신호에 대한 인식률은 2.02% 인식률 저하가 나타났다. 따라서 어느 방법을 적용하든지 의미 있는 차이가 없음을 확인하였다.

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

이산 웨이브렛 변환을 이용한 유효 음성 추출에 관한 연구 (A Study on Extracting Valid Speech Sounds by the Discrete Wavelet Transform)

  • 김진옥;황대준;백한욱;정진현
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.231-236
    • /
    • 2002
  • 유효한 무성음이 시스템 노이즈와 합성됐을 경우 유효한 무성음 추출에 많은 어려움이 있으나 본 논문에서는 유효한 무성음 추출에 있어 이산 웨이브렛 변환을 이용한 신호 해석 내용을 기반으로 주파수와 그 위치를 블록별로 머징 규칙으로 유효 여부를 결정하기 때문에 노이즈가 많은 환경에서도 유효한 무성음 추출이 가능하다. 머징 알고리즘은 음성만으로도 처리 매개변수를 결정할 수 있고 시스템 잡음에 대하여서도 독립적이기 때문에 유효한 음성을 추출하는데 매우 효과적이다. 실험 결과를 통하여 유효한 음성 추출 처리 과정에서 보다 향상된 결과를 보이고 있으며 특히 고주파 노이즈에 대한 강한 적응력을 제시하고 시스템 구현에도 용이한 시스템 튜닝을 가능케 한다.