• Title/Summary/Keyword: 음향상

Search Result 502, Processing Time 0.02 seconds

Korean Speech Recognition using the Phoneme (음소를 이용한 한국어의 인식)

  • 김영일;차일환;조문재
    • The Journal of the Acoustical Society of Korea
    • /
    • v.3 no.2
    • /
    • pp.35-45
    • /
    • 1984
  • 본 연구는 한국어의 발음상의 특징과 구조에 의해서 한국어를 음소별로 분리할 수 있음에 착안 하여, 자음과 모음으로 구성된 한국어 단음을 자음의 음소와 모음의 음소로 각각 분리하여 인식하는 새 로운 방법에 관한 연구이다. 특정 화자 2명에 대하여 한국어 단음 84자를 모음의 음소와 자음의 음소로 각각 분리하여 인삭한 실험결과 모음을 인식한 경우에는 선형 예측 계수를 이용하면 인식률이 95.2%이 고, 편자기 상관계수로 92.5%, 폴만트로 97.6%의 인식률을 얻었고, 자음을 인식한 경우에는 선형 예측 계수로 88.7%, 편자기 상관계수로 92.9%의 인식률을 얻었다. 또, 자음의 음소와 모음의 음소를 결합시킨 단음을 인식한 경우에는 선형 예측 계수로 83.9%, 편자기 상관계수로 86.3%의 인식률을 얻었다. 이 때, 각 음소들의 데이터의 수는 256개이고, 선형 예측 계수와 편자기 상관 계수와의 예측차는 15차이다. 이 와 같이 한국어를 자음의 음소와 모음의 음소로 분리하면 작은 데이터 양으로 처리 시간을 단축 시켜 한국어의 모든 단음, 단어, 연속음, 문장 등을 분석하고 인식할 수 있고, 또한 각 음소들을 원칙적으로 결합시켜 모든 한국어의 합성이 가능함을 알 수 있다.

  • PDF

On a Pitch Alteration Technique by Cepstrum Analysis of Flatten Excitation Spectrum (평탄화된 여기 스펙트럼에서 켑스트럼 피치 변경법에 관한 연구)

  • 조왕래;함명규;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.8
    • /
    • pp.82-87
    • /
    • 1998
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류 할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다. 그렇 지만, 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 켑스트럼의 성질을 이용하여 피치를 변경 하는 방법에 대하여 제안하였다. 이 방법은 주파수영역상에서 여기 스펙트럼과 여파기 스펙 트럼을 분리하여 여기 스펙트럼을 여기 켑스트럼으로 변환한 후 영값 삽입이나 삭제에 의해 피치를 변경하고 스펙트럼영역에서 피치 변경된 스펙트럼을 재구성하는 기법을 적용하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.29%이하로 유지되었으며 주관적인 음질도 평균 3.74로 우수하였다.

  • PDF

A Study on Noisy Speech Recognition Using a Bayesian Adaptation Method (Bayesian 적응 방식을 이용한 잡음음성 인식에 관한 연구)

  • 정용주
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.2
    • /
    • pp.21-26
    • /
    • 2001
  • An expectation-maximization (EM) based Bayesian adaptation method for the mean of noise is proposed for noise-robust speech recognition. In the algorithm, the on-line testing utterances are used for the unsupervised Bayesian adaptation and the prior distribution of the noise mean is estimated using the off-line training data. For the noisy speech modeling, the parallel model combination (PMC) method is employed. The proposed method has shown to be effective compared with the conventional PMC method for the speech recognition experiments in a car-noise condition.

  • PDF

Building DB of 3D animation avatar for wearing of sensible inner-wear (감성 Inner-wear 착용을 위한 3D Avata Animation DB 구축)

  • Ahn ChanShik;Jung DongAm;Lee YoungSook;Kim SoonHyob
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.67-70
    • /
    • 2000
  • 본 연구는 현 Inner-Wear매장에서 판매되어지는 제품을 소비자가 선택할 수 있는 한계 즉, 시각적인 연에 국한된다는 것에 착안하여 현실이 아닌 가상공간에서의 구매. 즉 물리적 현실적 제약으로부터 현재 존재하지 않는 미래의 상황을 연출, 미리 볼 수 있도록 가상의 상황을 입체적으로 연출하여 Inner-Wear를 쉽게 착용하고 그 모습을 자유롭게 검색하여 볼 수 있도록 하고자 한다. 자신의 신체를 만들어 보고 자신이 구매하고자 하는 제품을 골라 가상공간에서 자신의 신체에 직접 입혀보며 자신의 신체에 얼마나 잘 맞는지 직접 확인해 보고 구매 할 수 있도록 하는데 있다. 이 시스템은 Web상에서 구동 할 수 있도록 구현되어 일반 소비자들이 어디서나 사이트에 접속하여 구매 할 수 있도록 할 것이다.

  • PDF

Development of a Teaklite DSP-based MEPG-2 AAC decoder (Teaklite DSP에 기초한 MPEG-2 AAC decoder의 최적구현에 관한 연구)

  • Jang Bong-Keun;Jeong Jong-Hoon;Chang Tae-Gyu;Jang Heung-Yeop
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.119-122
    • /
    • 2000
  • 본 논문에서는 MPEG-2 AAC 디코더를 고정소숫점 DSP 프로세서로 구현할 때 연산 구조에 따른 연산량 및 메모리 소요량 등의 측면에서의 최적 구현구조를 도출하고자 하였다. 이를 위하여 본 논문에서는 AAC의 주요 기능블록들인 inverse quantizer, predictor, TNS, IMDCT/Windowing등을 대상으로 연산 비트수 및 데이타 표현 구조에 따른 디코더의 성능 변화를 시뮬레이션 한 후 이를 통해 얻어진 결과를 적용하여 16 비트 Teaklite DSP 프로세서 상에서 AAC 디코더를 구현하였다. 구현한 디코더는 일정수준의 음질을 유지하면서도 경제적인 메모리 소요를 보였으며 실시간으로 동작하는 것을 확인하였다.

  • PDF

Fatigue Crack Propagation of Super Duplex Stainless Steel and Time-Frequency Analysis of Acoustic Emission (수퍼 2상 스테인리스강의 피로균열 진전특성과 음향방출신호의 시간-주파수 해석)

  • Lee, Sang-Kee;Do, Jae-Yoon;Nam, Ki-Woo;Kang, Chang-Yong
    • Proceedings of the KSME Conference
    • /
    • 2000.04a
    • /
    • pp.73-78
    • /
    • 2000
  • On this study, the fatigue crack propagation of super duplex stainless steel is investigated in conditions of various volume fraction of austenite phase by changing heat treatment temperature. And we analysed acoustic emission signals during the fatigue test by time-frequency analysis methods. As the temperature of heat treatment increased, volume fraction of austenite decreased and coarse grain was obtained. The specimen heat treated at $1200^{\circ}C$ had longer fatigue life and slower rate of crack growth. As a result of time-frequency analyze of acoustic emission signals during fatigue test, main frequency was $200{\sim}300kHz$ having no correlation with heat treatment and crack length, and 500kHz was obtained by dimple and separate of inclusion

  • PDF

Clinically translatable photoacoustic imaging of cancer diagnosis (임상적용이 가능한 광음향 암 진단 기술)

  • Kim, Mi-Ji;Park, Yeon-Seong;Yoon, Changhan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.4
    • /
    • pp.476-484
    • /
    • 2019
  • Photoacoustic imaging is a hybrid real-time imaging technique that combines high optical contrast and ultrasonic resolution. It has primarily been utilized in pre-clinical research and has evolved into clinical practice. In this paper, we review photoacosutic imaging for detection of primary canccer and metastatis and its limitation in translation from pre-clinical to clinical application.

Listenable Explanation for Heatmap in Acoustic Scene Classification (음향 장면 분류에서 히트맵 청취 분석)

  • Suh, Sangwon;Park, Sooyoung;Jeong, Youngho;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.727-731
    • /
    • 2020
  • 인공신경망의 예측 결과에 대한 원인을 분석하는 것은 모델을 신뢰하기 위해 필요한 작업이다. 이에 컴퓨터 비전 분야에서는 돌출맵 또는 히트맵의 형태로 모델이 어떤 내용을 근거로 예측했는지 시각화 하는 모델 해석 방법들이 제안되었다. 하지만 오디오 분야에서는 스펙트로그램 상의 시각적 해석이 직관적이지 않으며, 실제 어떤 소리를 근거로 판단했는지 이해하기 어렵다. 따라서 본 연구에서는 히트맵의 청취 분석 시스템을 제안하고, 이를 활용한 음향 장면 분류 모델의 히트맵 청취 분석 실험을 진행하여 인공신경망의 예측 결과에 대해 사람이 이해할 수 있는 설명을 제공할 수 있는지 확인한다.

  • PDF

A High-resolution Seismic Survey on the Abandoned Tidal Flat in Shihwa Lake (시화호내 과거 조간대에서의 고해상 탄성파 탐사)

  • Hong, Jong Guk;Kim, Gi Yeong;Choe, Dong Rim
    • Journal of the Korean Geophysical Society
    • /
    • v.2 no.4
    • /
    • pp.251-258
    • /
    • 1999
  • A high-resolution seismic survey was conducted on the abandoned tidal flat in Shihwa Lake on the west coast of Korea. A portable vibrator was used as a seismic source and 217 shot gathers with 48-channel system were acquired. F-k filtering, residual static corrections and post-stack frequency filtering are found to be useful for signal enhancement. The overburden is divided into two seismic depositional units. Unit I is deposited in tidal environment characterized by parallel and high continuity reflection pattern. This unit comprises a dry layer (Unit Ia) and a wet layer (Unit Ib) having averagely 5 and 15 meters thick, respectively. Unit II unconformably overlain by Unit I exhibits discontinuity and hummocky reflection pattern, indicating complex channel-fill sediments in estuary. The maximum thickness of this unit is approximately 20 meter. Acoustic basement is considered as Precambrian granitic gneiss occurred in the surrounding area.

  • PDF

Geophysical and Geological Exploration of Cobalt-rich Ferromanganese Crusts on a Seamount in the Western Pacific (서태평양 해저산 고코발트 망간각 자원평가를 위한 광역 탐사 방안)

  • Kim, Jonguk;Ko, Young-Tak;Hyeong, Kiseong;Moon, Jai-Woon
    • Economic and Environmental Geology
    • /
    • v.46 no.6
    • /
    • pp.569-580
    • /
    • 2013
  • Co-rich ferromanganese crusts (Fe-Mn crusts) distributed on the seamounts in the western Pacific are potential economic resources for cobalt, nickel, platinum, and other rare metals in the future. Regulations for prospecting and exploration of Fe-Mn crusts in the Area, which enables the process to obtain an exclusive exploration right for blocks of the fixed size, were enacted recently by the International Seabed Authority, which led to public attention on its potential for commercial development. Evaluation and selection of a mining site can be established based on abundance and grade of Fe-Mn crusts in the site as well as topography that should be smooth enough for mining efficiency. Therefore, acquisition of shipboard echo-sounding and acoustic backscatter data are prerequisite to select potential mine sites in addition to visual and sampling operations. Acoustic backscatter data can be used to locate crust-covered areas in a regional scale with the understanding of acoustic properties of crust through its correlation with visual and sampling data. KIOST had collected the topographic and geologic data to assess the resources potential for Fe-Mn crusts in the west Pacific region from 1994 to 2001. However, they could not obtain acoustic backscatter data that is crucial for the selection of prospective mining sites. Therefore, additional exploration surveys are required to carry out side scan sonar mapping combined with seafloor observation and sampling to decide the blocks for application of an exclusive exploration right.