• 제목/요약/키워드: 음향데이터

검색결과 943건 처리시간 0.156초

Hidden Markov Network 음성인식 시스템의 성능평가에 관한 연구 (A Study on Performance Evaluation of Hidden Markov Network Speech Recognition System)

  • 오세진;김광동;노덕규;위석오;송민규;정현열
    • 융합신호처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.30-39
    • /
    • 2003
  • 본 논문에서는 한국어 음성 데이터를 대상으로 HM-Net(Hidden Markov Network) 음성인식 시스템의 성능평가를 수행하였다. 음향모델 작성은 음성인식에서 널리 사용되고 있는 통계적인 모델링 방법인 HMM(Hidden Markov Model)을 개량한 HM-Net을 도입하였다. HM-Net은 기존의 SSS(Successive State Splitting) 알고리즘을 개량한 PDT(Phonetic Decision Tree)-SSS 알고리즘에 의해 문맥방향과 시간방향의 상태분할을 수행하여 생성되는데, 특히 문맥방향 상태분할의 경우 학습 음성데이터에 출현하지 않는 문맥정보를 효과적으로 표현하기 위해 음소결정트리를 채용하고 있으며, 시간방향 상태분할의 경우 학습 음성데이터에서 각 음소별 지속시간 정보를 효과적으로 표현하기 위한 상태분할을 수행하며, 마지막으로 파라미터의 공유를 통해 triphone 형태의 최적인 모델 네트워크를 작성하게 된다. 인식에 사용된 알고리즘은 음소 및 단어인식의 경우에는 One-Pass Viterbi 빔 탐색을 사용하며 트리 구조 형태의 사전과 phone/word-pair 문법을 채용하고 있다. 연속음성인식의 경우에는 단어 bigram과 단어 trigram 언어모델과 목구조 형태의 사전을 채용한 Multi-Pass 빔 탐색을 사용하고 있다. 전체적으로 본 논문에서는 다양한 조건에서 HM-Net 음성인식 시스템의 성능평가를 수행하였으며, 지금까지 소개된 음성인식 시스템과 비교하여 매우 우수한 인식성능을 보임을 실험을 통해 확인할 수 있었다.

  • PDF

풍력발전기 운전환경에 따른 진동신호 분포 (Distribution of vibration signals according to operating conditions of wind turbine)

  • 신성환;김상렬;서윤호
    • 한국음향학회지
    • /
    • 제35권3호
    • /
    • pp.192-201
    • /
    • 2016
  • 풍력발전설비는 접근성의 문제로 주기적인 구조건전성 검사를 수행하기 어렵고, 기상상태를 포함한 주위 환경변화 때문에 예기치 못한 고장발생 가능성이 높아 이에 대한 보완책으로 상태감시시스템(Condition Monitoring System, CMS)을 운영하고 있다. 본 연구에서는 CMS의 이상감시 성능 향상을 위하여 풍력발전기 주요 기계시스템에서 장기간 측정된 진동신호 분포를 통계적으로 분석하고, 운전 조건에 따른 진동 변화 경향을 파악한다. 이를 위하여, 풍력발전기 동력전달 및 전력생성부의 진동, 풍속, 주축회전수 등을 약 2년동안 측정한 데이터를 기반으로 운전 환경 및 조건에 따른 각 신호의 경향분석을 수행하고, 기계시스템 구조에 따른 신호별 상호연관성을 분석하였다. 결과적으로 풍력발전기 기계시스템별 진동은 주축회전수, 발전여부에 영향을 받고, 특정 주축회전수에서는 베이불(Weibull) 분포에 해당하는 진동분포가 나타남을 확인하였다. 이런 결과는 풍력발전기 CMS 시스템에서 기계적 이상발생 여부를 조기에 판단하는 기준을 제시할 수 있다.

박동 혈액 순환 모의 시스템에서 시간 동기화된 혈압 및 혈액의 초음파 영상 측정 및 주기적 분석 (Time-synchronized measurement and cyclic analysis of ultrasound imaging from blood with blood pressure in the mock pulsatile blood circulation system)

  • 민수홍;김창수;팽동국
    • 한국음향학회지
    • /
    • 제36권5호
    • /
    • pp.361-369
    • /
    • 2017
  • 뇌혈관 질환의 발생 및 진행 기작을 이해하고 그 질환의 조기진단과 진행예측을 위해서는 경동맥 분지에서의 혈류역학 정보가 매우 중요하다. 본 논문에서는 정상인 경동맥 분지 탄성 모형 혈관과 생체 외 돼지혈액을 이용하여 모의박동 혈액 순환 시스템을 구축하여 혈류를 조절하면서 혈관과 혈액의 초음파 영상을 내부 압력과 시간 동기화하여 측정하였다. 박동 펌프의 박동률이 분당 20회, 40회, 60회(r/min)일 때의 초음파 영상의 에코 값, 혈류속도, 혈관 벽의 움직임, 혈압을 펌프의 5주기 동안 평균하여 한 주기의 데이터를 추출하였다. 결과로 박동률이 20 r/min, 40 r/min, 60 r/min일때 수축기 최고 혈류 속도는 각각 20 cm/s, 25 cm/s, 40 cm/s, 혈압 차는 각각 30 mmHg, 70 mmHg, 85 mmHg, 동맥벽은 각각 0.05 mm, 0.15 mm, 0.25 mm로 확장 하였다. 에코의 주기적 변화는 혈류속도와 압력과는 시간 지연이 있었으며 20 r/min에서는 변화량이 최소였다. 이러한 시간 동기화된 인자들의 주기적 변화는 전산혈류역학 실험의 정확한 입력정보와 검증을 위한 중요한 정보이며 경동맥 협착 질환의 발생 및 진행 기작을 밝히는데도 유용한 정보를 제공할 것이다.

시간영역 및 주파수영역 블럭적응 여파기에 관한 연구 : 제1부- 구현방법 (Time- and Frequency-Domain Block LMS Adaptive Digital Filters: Part Ⅰ- Realization Structures)

  • 이재천;은종관
    • 한국음향학회지
    • /
    • 제7권4호
    • /
    • pp.31-53
    • /
    • 1988
  • 블럭적응 여파기는 구현시에 고속푸리에변환 기법을 이용하면 계산량을 대폭 줄일 수 있음이 밝혀져서 연구자들의 관심을 끌어 왔다. 본 논문은 2편으로 구성되어 있는데, 제 1 부에서는 블럭적응 여파기의 여러가지 구현방법을 연구하고 제 2 부에서는 성능분석의 결과들을 논의하고 있다. 블럭적응 여파기의 계수가 최적해를 추적하도록 하는 적응알고리즘은 시간영역 또는 주파수영역에서 동작하게 할 수 있는데 이를 각각 시간영역 및 주파수영역 블럭적응 여파기로 부른다. 특히 제 1 부에서는 이들 두 구조 사이의 공통점 및 대비 관계를 명확하게 할 것이다. 구체적으로 제 1 부에서는 먼저 overlap-add 방식에 의한 고속 구현방법과 정수론적 변환 기법에 의한 효율적인 구현방법에 관한 새로운 결과들을 발표한다. 그리고 나서 계수 설계시에 주파수영역의 정보를 주파수대역마다 차등으로 적용하는 방법과 여파기 계수의 최적해 추정에 있어서 수렴시간 단축을 위한 self-orthogonalization방법을 주파수영역은 물론 시간영역 블럭적응 여파기들에도 적응할 수 있음을 보인다. 다음으로 계수의 블럭적응을 위한 입출력데이터 블럭분할 방법의 특질에 근거해서 고속푸리에변환 연산을 (부분적으로) 생략할 수 있는 비제약 주파수영역 블럭적응 여파기에 관해서 논의한다. 제 1 부의 마지막으로 여러가지 여파기 상수값들과 서로 다른 알고리즘들이 여파기 수렴특성에 미치는 영향을 컴퓨터 시뮬레이션을 통해서 조사한 결과를 발표한다.

  • PDF

분산산술연산방식을 이용한 MPEG-1 오디오 계층 3 합성필터의 FPGA 군현 (An FPGA Implementation of the Synthesis Filter for MPEG-1 Audio Layer III by a Distributed Arithmetic Lookup Table)

  • 고성식;최현용;김종빈;구대성
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.554-561
    • /
    • 2004
  • 반도체 기술과 멀티미디어 통신기술이 발달하면서 고품위 영상과 다중 채널의 오디오에 관심을 갖게 되었다. MPEG 오디오 계층 3 디코더는 표준안에 기반을 둔 프로세서로써 기존에 많이 구현되어 있다. MPBG-1오디오 계층3 디코더의 합성필터는 디코더 전체에서 가장 많은 연산을 필요로 하기 때문에 고속 프로세서를 설계하기 위해서는 연산량을 줄일 수 있는 새로운 방식의 합성필터를 필요로 한다. 따라서 본 논문에서는 MPEG-1 오디오 계층 3의 핵심부분인 합성필터 부분을 DALUT (distributed arithmetic look-up table)방식을 이용하여 FPGA (Field Programmable Gate Array)에 구현하였다. 고속 필터를 설계하기 위해서 승산기 대신에 DALUT방식을 사용하였고, 파이프라인 구조를 사용하였으며, 데이터를 코사인 함수와 곱셈한 결과를 테이블로 만듦으로써 곱셈기를 제거하여 30%의 성능향상을 얻었다. 본 논문에서의 하드웨어 설계는 모두 VHDL (VHSIC Hardware Description Language)로 기술하였다. VHDL 시뮬레이션은 ALDEC사의 Active-HDL 6.1과 Model-sim 및 합성은 Synplify Pro 7.2v을 사용하였다. 대상 라이브러리는 XILINX사의 XC4010E, XC4020BX, XC4052 XL, P&R 툴은 XACT Ml.4를 사용하여 구현하였다. 구현된 프로세서는 20MHz∼70MHz사이에서 동작한다.

DS/CDMA 저궤도 이동 위성 시스템에서 가변 스텝사이즈 조절 방식 폐루프 전력제어의 성능분석 (Performance of a Closed-Loop Power Control Using a Variable Step-size Control Scheme in a DS/CDMA LEO Mobile Satellite System)

  • 전동근;이연우;홍선표
    • 한국음향학회지
    • /
    • 제19권1호
    • /
    • pp.16-24
    • /
    • 2000
  • 본 논문에서는 긴 왕복 지연시간(round trip delay)이 시스템 성능의 주요 제한 요소로 작용하는 DS/CDMA 기반의 저궤도 이동 위성 시스템에서 가변 스텝사이즈(step size) 방식을 적용한 폐루프(closed loop) 전력제어방식의 성능분석을 수행하였다. 저궤도 위성 통신 채널은 지상의 이동통신 채널과는 근본적으로 다른 긴 왕복 지연 시간이나 앙각(elevation angle)과 같은 고유의 페이딩 효과를 반영하여야 하므로 ESA(Europe Space Agency)의 실측 된 데이터를 기반으로 하여 저궤도 이동통신 채널모델을 구현하였다. 통상적으로 저궤도 위성 시스템에서 위성을 통한 이동 단말기와 관문국사이의 왕복 지연시간은 10∼20ms이므로, 지상에서 사용되는 폐루프 전력제어의 효과는 극히 제한적이고 미미하므로 긴 왕복시간 이나 앙각에 따른 페이딩을 효과적으로 극복하기 위해서는 가변 스텝사이즈 조절방식을 적용한 적응적인 전력제어 방식이 요구된다. 본 논문에서는 이러한 가변 스텝사이즈 조절 방식을 적용한 폐루프 전력제어 방식의 성능을 평가한 결과, 고정 스텝사이즈를 갖는 기존의 폐루프 전력제어 방식보다 왕복 지연시간과 앙각에 따른 신호 대 간섭비(signal to interference ratio; SIR)의 편차값이 현저히 감소됨을 확인하였다. 특히, 전력제어 명령을 측정하는 구간이 왕복 지연시간의 두 배정도가 가장 최적이라는 결론을 얻었다.

  • PDF

모수적 궤적 기반의 분절 HMM을 이용한 연속 음성 인식 (Continuous Speech Recognition based on Parmetric Trajectory Segmental HMM)

  • 윤영선;오영환
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.35-44
    • /
    • 2000
  • 본 논문에서는 음성 패턴을 효율적으로 모델링하고자 분절 특징(segmental feature)을 이 용하여 은닉 마코프 모델(hidden markov model)의 일반적인 형식에 기반한 새로운 모수적 궤적 모델 (parametric trajectory model)을 제안한다. 일반적으로 벡터의 열로써 표현되는 분절은 관측 열의 궤적(trajectory)으로 표현된다. 이 궤적은 연속적인 프레임들의 전이 정보(transitional information)를 표현하는 디자인 행렬을 이용하여 얻어지며, 다항식의 회귀 함수(polynomial regression function)로써 나타낼 수 있다. 이러한 궤적을 HMM에 적용하기 위해서 프레임 특징 대신 분절의 특성 을 표현하는 궤적으로 대치하고 우도(likelihood) 계산에 궤적들의 비교에 의한 확률 값을 반영시켜야 한다. 본 논문에서는 궤적간의 유사도를 측정하는 분절 우도(segment likelihood)와 모델을 구성하는 궤적변수의 추정 알고리즘을 제안한다. 임의의 분절에 대한 관측 확률은 제안된 분절 우도와 궤적의 추정 오차(estimation error of trajectories)의 곱으로써 표현된다. 궤적의 추정 오차는 상태에서 주어진 분절 우도의 가중치로 표현될 수 있으며, 이 가중치는 궤적과 대응되는 분절의 적합도를 표현하는 확률을 나타낸다. 본 논문에서 제 안된 모델은 일반적 인 HMM과 모수적 궤적 모델의 일반화(generalization) 또는 확장(extension) 모델로 생각될 수 있다. 본 모델의 성능을 평가하기 위하여 TIMIT 데이터에 기반한 실험을 한 결과, 분절 길이(segment length)와 회귀 차수(regression order)가 변할수록 일반적인 HMM에 비하여 뚜렷한 성능향상이 있음을 알 수 있었다.

  • PDF

벡터양자화된 부대역 코덱에서 최적필터의 구현 (The Design of Optimal Filters in Vector-Quantized Subband Codecs)

  • 지인호
    • 한국음향학회지
    • /
    • 제19권1호
    • /
    • pp.97-102
    • /
    • 2000
  • 부대역 코딩은 데이터의 압축을 위해 신호의 주파수를 부대역 필터로 통과시켜 서로 상관이 없는 주파수대역으로 분할하여 각 대역의 신호의 에너지에 적합한 비트 할당을 사용하여 인코딩한다. 실제로 부대역 신호의 코딩은 PCM, DPCM이 사용되는 데 고압축의 전송속도를 얻기 위해서 벡터양자기를 사용하였다. 대부분의 연구자들은 부호화기의 오차에만 주안점을 두고 전체 필터대역의 회복오차와 이 오차가 필터대역에 의존되는 것에는 연구가 진행되지 않았다. 본 논문은 벡터양자기를 사용한 부대역 코덱의 분석과 최적구현의 새로운 접근방법을 제공하여 준다. 본 논문에서는 부대역 코덱에서 벡터양자기의 코드 북의 크기와 벡터크기 그리고 대역필터계수에 의존되는 전체 시스템의 회복오차인 Mean Squared reconstruction Error(MSE)를 계산하였다. 본 논문에서는 각 대역의 구조에서 이 MSE로 양자화를 모델링하고 주어진 전송속도, 필터길이, 입력신호 상관모델의 함수인 이 MSE를 최소화하는 최적의 Finite Impulse Response(FIR) 필터를 구현하였다. 최적구현의 예로 2-채널의 paraunitary 필터뱅크의 4-tap 필터계수를 구하였다. 이 paraunitary 최적의 필터 계수들을 Monte Carlo 모의시험을 사용하여 구하였다. 이 논문은 벡터양자기를 사용한 부대역 코덱의 분석방법을 제공하여 주어서 그 활용도가 기대된다.

  • PDF

정준형 상관 분석을 이용한 적응 시간 지연 추정에 관한 연구 (An Adaptive Time Delay Estimation Method Based on Canonical Correlation Analysis)

  • 임준석;홍우영
    • 한국음향학회지
    • /
    • 제32권6호
    • /
    • pp.548-555
    • /
    • 2013
  • 음원 위치 추정은 여러 방면에서 쓰임이 있는 응용 기술이다. 음원의 위치를 추정하기 위한 기본 기법 중에는 시간 지연 추정 기법이 있다. 이 기법에선 음원의 위치를 추정하기 위해서 두 개 또는 그 이상의 수신기에 들어오는 신호간의 상대적 시간 지연을 알아내야 한다. 시간 지연 추정 기법에는 GCC (Generalized Cross-Correlation) 대표적이지만, 최소 고유치에 대응하는 고유 벡터를 이용하는 방법도 많이 쓰인다. 이 방법은 최소 고유치에 해당하는 고유벡터를 이용한다. 최소 고유치에 대응하는 고유 벡터를 이용하는 방법은 낮은 신호 대 잡음비 환경에서나 상관도가 있는 잡음환경에서, 최소 고유치에 해당하는 고유 벡터를 추정하는데 어려움이 있어서, 성능이 떨어진다. 본 논문에서는 정준형 상관 분석 (CCA)를 이용한 새 기법을 제안한다. 이 방법은 일반 고유치 분해 중에서 최대 고유치에 대응하는 고유벡터를 사용한다. 따라서 추정에 사용하는 고유벡터는 시간 지연 추정에 필요한 정보가 충분히 들어있다. 본 논문에서는 여러 서로 다른 신호 대 잡음비 환경 하에서 상관도가 없는 경우와 상관도가 있는 경우의 잡음 에 대해 비교 모의실험을 하였고, 이 비교 실험을 통하여 얻는 데이터를 통해서 제안한 CCA 기반 알고리즘이 기존 최소 고유치에 해당하는 고유벡터를 사용하는 시간 지연 추정법의 성능보다 더 우수하다는 것을 보인다.

구조적 희소성 기반 압축 센싱 알고리즘을 통한 측면주사소나 영상의 비균일 잡음 제거 (Non-homogeneous noise removal for side scan sonar images using a structural sparsity based compressive sensing algorithm)

  • 진영생;구본화;이승호;김성일;고한석
    • 한국음향학회지
    • /
    • 제37권1호
    • /
    • pp.73-81
    • /
    • 2018
  • 측면주사소나 영상의 화질은 소나 운용 주파수의 영향을 받는다. 저주파 측면주사소나 장비로 얻는 영상은 저화질 영상이며, 잡음이 화질 저하의 요소 중 하나가 된다. 균일한 잡음을 가정하는 광학 영상과는 달리. 측면주사소나 데이터의 잡음은 해양 환경(장비 소음, 신호 간섭 등)에 의해 발생한다. 또한 소나 신호의 전달 손실을 보상하고자 시간변환이득(Time-Varied Gain, TVG)을 수행하며, 이로 인해 측면주사소나 영상에 비균일 잡음이 생성된다. 본 논문에서는 측면주사소나 영상에 포함된 비균일 잡음을 제거하는 구조적 희소성에 기반한 압축 센싱 알고리즘 (Structural Sparsity based Compressive Sensing, SSCS)을 제안한다. 영상의 구조적 특징 도메인에서 국부적 및 비국부적 모델링을 동시에 구현하여 계수의 희소성을 보장하면서 비국부적 자가 유사성을 강화한다. 그리고 잡음의 비균일성을 고려하여 비국부적 모델링을 보상한다. 다양한 모의 실험을 통해 제안한 알고리즘의 우수성을 입증한다.