• Title/Summary/Keyword: 음성보존

Search Result 128, Processing Time 0.022 seconds

On a Pitch Point Detection by Preserving the Phase Component of the Autocorrelation Function (자기상관함수에서 위상 성분의 보존에 의한 피치 시점 검출에 관한 연구)

  • 함명규;최성영;박종철;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.799-802
    • /
    • 2000
  • 음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.

  • PDF

A RESULT OF VOICE PRESERVATION FOLLOWING TREATMENT OF LARYNGEAL CANCER (후두암 치료후 음성보존의 성적)

  • 김형태;김형주;김민식;조승호;서병도
    • Proceedings of the KOR-BRONCHOESO Conference
    • /
    • 1991.06a
    • /
    • pp.29-29
    • /
    • 1991
  • 후두암의 치료는 병변의 위치, 크기 등에 따라 치료방법이 다양하고 그 예후 또한 상이하다. 일반적으로 초기 후두암에서는 수술이나 방사선 요법이 비슷한 치료결과를 보이고, 진행된 후두암에서는 수술적 치료가 더 좋은 예후를 나타내는 것으로 알려져 있으나 발성장애를 초래하는 경우가 대부분이다. 저자들은 1986년부터 1990년까지 5년간 강남성모병원에서 후두암치료를 받았던 환자 81명을 대상으로 치료방법에 따른 음성보존 성적을 분석하였다. 1. T1 성대암 환자 18명중 16명 (88.9%)에서 방사선치료 또는 수술로써 음성을 보존할 수 있었다. 2. T2 후두암 환자 11명중 6명은 수술후 음성보존이 가능하였다. 3. 진행암환자 (T3, T4) 50명중 33명에 대해 수술을 시행하였고 이중 16명(48.5%)은 후두부분 또는 근전적출술 및 기관-식도 누공술에 의해 음성기능을 보존할 수 있었다. 4. 진행암환자에서 유도화학요법과 방사선치료의 병용요법만을 받은 17명 모두 6개월 이내에 재발하였고, 수술 혹은 수술과 방사선 치료를 병용한 33명중 27명이 최소한 6개월 이상 평균 2년 이상의 무병상태였다. 5. 후두부분 또는 근전적출술은 총 81명중 28명에서 시행되었고 그중 5명 (17.9%)에서 재발하였다.

  • PDF

A Study on the Compression Method for Restricted DB in High Quality Speech Synthesis (제한된 고음질 음성 합성용 DB 압축법에 관한 연구)

  • 박형빈
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.265-268
    • /
    • 1998
  • 일반적으로 음성 합성용 데이터 베이스에서는 고음질을 유지할 수 있는 파형 부호화법을 주로 사용한다. 그것은 파형 부호화법이 발성자의 개성과 메시지 정보를 보존하기 때문에 음질의 명료성이 우수하기 때문이다. 그러나 기존에는 파형 부호화법을 적용해서 음성 파형 자체의 잉여성분만을 제거한 후 합성용 데이터 베이스로 사용하기 때문에 음성 합성용 데이터 베이스의 크기가 커지는 단점을 가진다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해서 기존의 운율조절법을 통해서 음성 합성용 데이터 베이스를 압축하는 방법을 제안한다. 결과적으로 제안한 방법을 사용함으로써 고음질을 갖는 음성 합성용 데이터 베이스를 가질 수 있었고 데이터 베이스의 크기도 줄일 수 있었다.

  • PDF

Transient Noise Reduction in Speech Signal Utilizing a Long-term Predictor (장구간 예측 필터를 이용한 음성 신호에서의 돌발 잡음 제거)

  • Choi, Min-Seok;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.31 no.1
    • /
    • pp.29-38
    • /
    • 2012
  • This paper presents a transient noise reduction system in a speech signal. The proposed transient noise reduction system utilizes a median filter to reduce the transient noise. Since the median filter can distort speech during the noise reduction, a long-term prediction (LTP) filter is adopted as a pre-processor to minimize speech distortion. The speech information preserved by the LTP filter is re-synthesized after reducing the noise. This paper verifies the weakness of a linear prediction (LP) filter and the superiority of the LTP filter for preserving the speech component in transient noise presence environment. Applying the proposed system, the signal-to-noise ratio (SNR) of output is improved by 8dB in both speech and noise presence region, and PESQ score is increased by 1 point comparing with noisy input.

Effect of Radiation Therapy on Voice Parameters in Early Layngeal Cancer and Normal Larynx (방사선요법이 초기 후두암 및 정상후두의 음성지표에 미치는 영향)

  • 박한종;이인자;박영학;김민식;조승호
    • Proceedings of the KSLP Conference
    • /
    • 1994.06b
    • /
    • pp.88-88
    • /
    • 1994
  • 초기후두암에 대한 방사선요법은 수술적 치료에 비하여 정상 후두기능 즉 발성 기능을 최대 한 보존할 수 있는 장점이 있다. 그러나 방사선 치료법은 병적 혹은 정상 후두조직에 섬유화, 점막부종 혹은 점액선 간소등의 변영을 초래할 수 있기 때문에 어느 정도의 음성장애를 유발하게 된다. 방사선요법이 후두의 발성기능에 미치는 영향을 알아보기 위하여 초기후두암 환자와 두경부암으로 인하여 정상후두에 방사선 조사를 받았던 환자 및 정상대조군 각 20명에 대하여 음향 및 공기역학적 음성검사를 시행하여 음성장애의 특성을 비교, 검토하였다. 초기 후두암 환자들에게 사는 방사선 치료 후 음성지표들이 관찰되었고, 정상후두에는 큰 영향을 미치지 않았다. (중략)

  • PDF

Evaluation of voice parameters following supracricoid laryngectomy

  • 김민식;조승호;박영학;선동일;김형태;유우정
    • Proceedings of the KSLP Conference
    • /
    • 1997.11a
    • /
    • pp.260-260
    • /
    • 1997
  • 상윤상후두부분적출술은 과거 후두전적출술을 실시하던 환자들에서 선택적으로 사용하여 만족할만한 종양학적 결과 및 후두의 생리적인 기능을 보존 할 수 있어 점차 널리 보급되고. 있다. 이 술식후의 기능변화나 보상기전등에 대하여는 잘 알려지지 않았으나 정상인과 비교하여 음성지표들의 변화가 보고되고 있다. 이 수술은 원발병소의 위치에 따라 CHEP, CHP 방범으로 재건할 수 있으며 종양의 범위에 따라 일측의 피열연골과 윤상연골의 앞부분을 제거하는 extended procedure등이 사용되고 있다. (중략)

  • PDF

Analysis of Speech-To-Text (STT) Based Voice Memo Service (STT(Speech-To-Text)를 이용한 음성메모장 서비스 분석)

  • Gi-Hwan Oh;Sung Jin Kim;Young Hyun Yoon;Jai Soon Baek
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.265-266
    • /
    • 2023
  • 본 연구에서는 음성메모 기능을 통해 스마트폰에서 메모를 편리하게 작성할 수 있는 방안을 제안하였다. 이 제안은 취약 계층을 포함한 다양한 사용자들이 스마트폰을 보다 쉽고 효율적으로 활용할 수 있는 기회를 제공한다. 음성메모를 통해 중요한 정보를 빠르게 기록하고, 필요할 때 언제든지 액세스할 수 있으며, 기억력에 의존하지 않고 안정적인 방식으로 정보를 보존할 수 있다. 이러한 기능은 취약 계층을 위해 스마트폰 사용의 장벽을 낮추어 정보 접근과 활용의 평등성을 증진시킬 것으로 기대된다. 또한, 연구 결과는 스마트폰 기술과 사용자 경험 분야에 대한 심층적인 이해를 제고하고, 향후 관련 연구와 개발에 영향을 미칠 것으로 기대된다.

  • PDF

양성 성대질환의 콜라겐 발현 및 분포양상

  • 손영익;고영혜;고석주
    • Proceedings of the KSLP Conference
    • /
    • 1997.11a
    • /
    • pp.263-263
    • /
    • 1997
  • 성대결절, 폴립, 부종 등은 성대의 남용이나 과용등의 성대손상이 그 공통된 주된 원인으로 거론되고 있다. 하지만 음성치료를 비롯한 보존적 치료에 대한 반응이 서로 상이하며, H&E 염색을 이용한 병리조직학적인 감별이 곤란하여 진단에 혼돈이 있으며, 치료의 방침을 결정하거나 예후를 예측함에 있어서도 어려움이 있다. 양성성대질환은 기저막부 위와 세포외 간질에 주된 변화가 발생함이 알려져 있고, collagen type IV의 발현양상이 성대결절과 폴립에서 서로 다름에 대하여는 보고된 바 있으나 기타 점막하층의 골격유지를 주기능으로 하는 대표적 세포외간질인 collagen subtype에 대하여는 아직 보고된 바가 없는 실정이다. Collagen 발현의 차이를 연구하는 것은 상기질환의 병인을 이해하고 질환분류의 guideline을 제시하며 나아가 적절한 치료방범을 제시하는 데에 큰 의미가 있을 것으로 기대된다. Paraffin에 고정되어 있는 5례 이상씩의 성대결절과 성대폴립, 육아 종 및 라인케씨 부종 조직을 collagen type I부터 VII에 대하여 peroxidase kit를 사용하여 염색한 후 각 군간에 collagen 분포양상과 발현정도에 차이가 있는가 비교하였다.

  • PDF

Studies on the Keeping Quality of Ultra-High-Temperature Sterilized Milk (초고온멸균유(超高溫滅菌乳)의 보존성(保存性)에 관한 연구(硏究))

  • Kim, Jong-U
    • Korean Journal of Agricultural Science
    • /
    • v.9 no.2
    • /
    • pp.556-561
    • /
    • 1982
  • These studies were carried out to investigate the freshness and bacterial counts of ultrahigh- temperature sterilized market milk which were treated and distributed in three districts; Cheonan, Pyungtak and Suwon in Korea, and to elucidate theirs keeping qualities when stored in refregerator and at room temperature. And the results were obtained were as follows; 1. The acidities in milk from three plants after stored at $5^{\circ}C$ were retained 0.16% up to 6 weeks and 0.18% up to 10 weeks. And negative reactions were appeared for alcohol and boiling tests also up to 10 weeks. 2. After milk were stored at $25^{\circ}C$, the acidities were 0.18% up to 9 weeks and also negative reaction were appeared for both alcohol and boiling tests up to 9 weeks. 3. When milk were stored at $5^{\circ}C$, no thermoduric and coliform bacteria were detected from all samples. And the total viable number of organisms and the number of psychrophilic bacteria were $<10/m{\ell}$ for 5, 6, 7 and 10 weeks respectively. 4. Also thermoduric and coliform bacteria were not detected after milk were stored at $25^{\circ}C$ for 10 weeks. And the total viable number of organisms and the number of psychrophilic bacteria were $<10/m{\ell}$ after from 2 weeks to 10 weeks.

  • PDF

Target Speaker Speech Restoration via Spectral bases Learning (주파수 특성 기저벡터 학습을 통한 특정화자 음성 복원)

  • Park, Sun-Ho;Yoo, Ji-Ho;Choi, Seung-Jin
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.3
    • /
    • pp.179-186
    • /
    • 2009
  • This paper proposes a target speech extraction which restores speech signal of a target speaker form noisy convolutive mixture of speech and an interference source. We assume that the target speaker is known and his/her utterances are available in the training time. Incorporating the additional information extracted from the training utterances into the separation, we combine convolutive blind source separation(CBSS) and non-negative decomposition techniques, e.g., probabilistic latent variable model. The nonnegative decomposition is used to learn a set of bases from the spectrogram of the training utterances, where the bases represent the spectral information corresponding to the target speaker. Based on the learned spectral bases, our method provides two postprocessing steps for CBSS. Channel selection step finds a desirable output channel from CBSS, which dominantly contains the target speech. Reconstruct step recovers the original spectrogram of the target speech from the selected output channel so that the remained interference source and background noise are suppressed. Experimental results show that our method substantially improves the separation results of CBSS and, as a result, successfully recovers the target speech.