• 제목/요약/키워드: 음질 인식

검색결과 41건 처리시간 0.023초

특정된 주파수 신호를 이용한 오디오 워터마킹 (BLIND AUDIO WATERMARKING TECHNIQUE USING SPECIFIC FREQUENCY SIGNAL)

  • 박성일;한승수;최종욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 하계학술대회 논문집 D
    • /
    • pp.2368-2372
    • /
    • 2002
  • 멀티미디어의 저작권 보호를 위한 기술로서 워터마킹 기술은 현재 멀티미디어의 여러 분야에서 많이 연구되며 사용되고 있다. 이 기술은 컨텐츠가 질적으로 소비자에게 인식되지 않으며, 그리고 컨텐츠자체에 다양한 정보를 은닉하기 때문에 컨텐츠에 항상 포함되어 있다는 장점이 있다. 현재 MP3등과 같은 압축기술이 발달되어 있기 때문에 네트웍에 의한 데이터 전송성능이 향상되었고, 그러므로 디지털 데이터들이 유통이 활성화되었다. 이것으로 인하여 불법적으로 복제된 다양한 컨텐츠의 유통이 생산자의 이익을 해치고 있다. 디지털 오디오 컨텐츠의 소유권을 위하여, 본 논문에서는 압축에 대한 견고성을 제고하기 위하여 청각시스템의 마스킹 효과를 이용하여 시간영역에서 오디오신호에 특정된 주파수를 가진 워터마크 정보를 삽입하였다. 이 특정된 주파수는 반드시 압축에 살아남는 주파수 대역이어야 하며, 음질을 동시에 고려하여야 한다. 그리고 추출할 때는 FFT변환을 하여 주파수 대역에서 추출한다. 저작권 정보를 쉽게 확인하기 위하여 2진 송상을 워터마크 정보로 삽입하였다.

  • PDF

음질향상 기법과 모델보상 방식을 결합한 강인한 음성인식 방식 (A Robust Speech Recognition Method Combining the Model Compensation Method with the Speech Enhancement Algorithm)

  • 김희근;정용주;배건성
    • 음성과학
    • /
    • 제14권2호
    • /
    • pp.115-126
    • /
    • 2007
  • There have been many research efforts to improve the performance of the speech recognizer in noisy conditions. Among them, the model compensation method and the speech enhancement approach have been used widely. In this paper, we propose to combine the two different approaches to further enhance the recognition rates in the noisy speech recognition. For the speech enhancement, the minimum mean square error-short time spectral amplitude (MMSE-STSA) has been adopted and the parallel model combination (PMC) and Jacobian adaptation (JA) have been used as the model compensation approaches. From the experimental results, we could find that the hybrid approach that applies the model compensation methods to the enhanced speech produce better results than just using only one of the two approaches.

  • PDF

A Study on the Perception of Foreign Undergraduates on Online Lecture

  • Kim, Yoon-Hee;Lim, Eun-jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권9호
    • /
    • pp.203-212
    • /
    • 2020
  • 본 연구는 외국인 학습자들이 경험한 비대면 온라인 학부 강의에 대한 인식을 분석하여 온라인 강의의 문제점을 파악하고 개선안을 제안하는 데 목적이 있다. 연구를 위해 A 대학과 B 대학에서 온라인 강의를 수강한 외국인 학부생들을 대상으로 온라인 강의에 대한 인식을 조사하여 분석하였다. 이를 통해 앞으로 한국 대학에서 진행될 온라인 강의의 설계 방향과 보완책, 그리고 나아갈 방향 등을 탐색해 보았다. 본 연구의 결과, E 캠퍼스를 통한 비실시간 강의는 강의를 반복해서 학습할 수 있고 집에서 강의를 들을 수 있는 점을 장점으로 인식하고 있었다. Zoom을 활용한 실시간 강의는 교수-학습자간 소통이 가능함을 장점으로 인식하고 있었다. 두 가지 유형의 강의 모두 과제가 많고 강의가 끝날 때까지 지속적으로 집중하기 어려움을 단점으로 인식하고 있었다. 또한 앞으로의 고려할 점으로 강의 내용의 양과 과제의 양, 그리고 강의 영상의 음질과 상태임을 알수 있었다. 평가 방식으로는 오프라인 평가보다는 온라인 평가를 선호하였으며 절대 평가보다는 상대 평가를 선호하는 것으로 나타났다. 본 연구의 결과가 각 대학의 온라인 강의의 설계 방향과 온라인 콘텐츠 개발에 작은 보탬이 되기를 바란다.

강인한 음성인식을 위한 통계적 특징벡터 추출방법의 개선 (An Improvement of Stochastic Feature Extraction for Robust Speech Recognition)

  • 김회린;고진석
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.180-186
    • /
    • 2004
  • 음성 신호에 존재하는 잡음은 음성 인식기의 성능을 현저하게 감소시킨다. 이것은 잡음이 훈련 조건과 인식 조건 사이의 불일치를 가져오기 때문이다. 본 논문에서는 이러한 불일치를 최소화하기 위해서 통계적 특징벡터의 추출방법을 개선하기 위한 방법을 연구하였다. 밴드 SNR에 따라 잡음 스펙트럼의 차감 레벨을 조절하는 기존의 멀티 밴드 잡음 차감법 (MSS)을 개선하기 위하여 잡음 정규화 상수를 이용하여 잡음 스펙트럼의 차감 레벨을 보다 정확하게 조절하는 방법 (M-MSS)을 제시하였다. 다음으로, 기존의 통계적 특징벡터 추출방법 (SFE)에서 잡음 차감법을 파워 스펙트럼 영역에 적용함으로써 성능을 개선하였다(M-SFE). 마지막으로, 위의 두 가지 방법의 장점을 결합하기 위해서 밴드 SNR에 근거한 통계적 특징벡터 추출방법 (MMSS-MSFE)을 제안하였다. 제안된 방법들은 다양한 잡음 환경 하에서 화자독립 고립 단어 인식으로 성능을 평가하였다. 기본적인 잡음 차감법 (SS)에 비하여 M-MSS, M-SFE와 MMSS-MSFE의 평균 에러율은 각각 18.6%, 15.1%와 33.9% 감소하였다. 위의 결과로부터 제안한 방법이 잡음에 강인한 음성인식을 위해 매우 효과적임을 입증하였다.

자동 음성 인식기를 위한 단채널 음질 향상 알고리즘의 성능 분석 (Performance Analysis of a Class of Single Channel Speech Enhancement Algorithms for Automatic Speech Recognition)

  • 송명석;이창헌;이석필;강홍구
    • The Journal of the Acoustical Society of Korea
    • /
    • 제29권2E호
    • /
    • pp.86-99
    • /
    • 2010
  • This paper analyzes the performance of various single channel speech enhancement algorithms when they are applied to automatic speech recognition (ASR) systems as a preprocessor. The functional modules of speech enhancement systems are first divided into four major modules such as a gain estimator, a noise power spectrum estimator, a priori signal to noise ratio (SNR) estimator, and a speech absence probability (SAP) estimator. We investigate the relationship between speech recognition accuracy and the roles of each module. Simulation results show that the Wiener filter outperforms other gain functions such as minimum mean square error-short time spectral amplitude (MMSE-STSA) and minimum mean square error-log spectral amplitude (MMSE-LSA) estimators when a perfect noise estimator is applied. When the performance of the noise estimator degrades, however, MMSE methods including the decision directed module to estimate a priori SNR and the SAP estimation module helps to improve the performance of the enhancement algorithm for speech recognition systems.

집중치료를 통한 소뇌운동실조증 환자의 말운동개선 가능성 (Possibility of Motor Speech Improvement in People With Spinocerebellar Ataxia via Intensive Speech Treatment)

  • 박영미
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.634-642
    • /
    • 2018
  • 소뇌운동실조증(SCA)은 유전성, 진행성 신경장애로 SCA 환자는 소뇌위축으로 인한 실조형 마비말장애를 보인다. 본 연구는 집중 말운동치료를 통해 SCA환자의 진행성 실조형 마비말장애의 개선의 유무를 확인하고, 개선이 있는 경우, 치료전후의 변화의 정도를 보고하고자 한다. 55세의 SCA 여성 환자를 대상으로 말운동 기능 개선을 위한 SPEAK $OUT!^{(R)}$ 치료프로그램을 시행 후, 큰 효과크기 수준에서 MPT와 과제별 음량의 개선이 관찰되었고, 음도의 경우 적은 효과크기의 변화를 보였다. 그러나 음도의 폭은 큰 효과크기의 변화를 보였다. 음질은 jitter, shimmer, HNR 모두에서 큰 효과크기 수준에서 긍정적 개선을 보였고, 모음면적도 넓어졌는데 이때 F1의 변화가 두드러졌다. 또한 심도 수준의 VHI점수는 치료 후 경도 수준으로 낮아졌다. 집중 말운동치료 프로그램인 SPEAK $OUT!^{(R)}$의 시행을 통해 SCA 환자의 음량, 음도, 음도의 폭, 음질, 모음면적의 증가를 관찰하였고, 음성장애에 관한 주관적 인식의 변화도 긍정적으로 감소하였다. 기초연구로서의 본 결과를 바탕으로 SCA환자의 진행성 실조형 마비말장애 개선을 위한 SPEAK $OUT!^{(R)}$에 대한 좀 더 체계적인 검증을 위한 후속 연구가 필요하다.

개선된 선형예측 잔여를 이용한 음성의 잔향음 제거 (Speech Dereverberation using Improved Linear Prediction Residual)

  • 박찬섭;김기만;강석엽
    • 한국정보통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.1845-1851
    • /
    • 2007
  • 배경 잡음과 실내 잔향음은 음성 인식 시스템 성능 저하의 주요 이유이다. 많은 알고리즘이 음성의 잔향음 제거를 위해 개발되었다. 이 논문에서는 실내 환경에서 수정된 선형 예측 잔여(Linear Prediction Residual)를 이용하여 음질 개선을 위한 잔향음 제거 방법을 제안한다. 제안된 잔향음 제거 방법은 음성에서 성문 경계의 순간에 발생한 성도(聲道)시스템의 중요한 여기에 기반한다. 본 논문에서 제안한 방법은 3개의 센서로부터 수집한 반향신호로 각 센서에서의 시간지연 정보를 사용한다. 새로운 선형 예측 잔여신호는 선형 예측 잔여의 가중치와 힐버트 변환으로 얻은, 개선된 선형 예측 잔여 조합을 사용한다. 코히런트하게 더해진 힐버트 포락선의 특징은 잡음과 반사로 인한 큰 진폭 피크를 가지는 것이다. 깨끗한 음성의 잔여는 개선된 음성을 얻는 시변전극 필터를 일으키는데 사용된다. 본 논문에서는 반향 환경에서 성능 분석을 위해 제안된 알고리즘의 시뮬레이션을 수행하였다. 제안된 알고리즘은 실내 잔향환경에서 기존의 알고리즘에 비해 반사된 음성의 품질 향상의 결과를 보였다.

가우시안의 차를 이용하여 검색속도를 향상한 최소 오디오 핑거프린팅 (Search speed improved minimum audio fingerprinting using the difference of Gaussian)

  • 권진만;고일주;장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권12호
    • /
    • pp.75-87
    • /
    • 2009
  • 본 논문은 오디오 핑거프린트 데이터 생성 방법과 이를 이용한 오디오 데이터 비교 방법에 관한 것으로서, 오디오 데이터의 특징을 이용하여 음악을 식별하는 방법을 제시한다. 일반적으로 영상인식을 위해 많이 사용되는 가우시안의 차(Difference of Gaussian, DoG)를 오디오 데이터에 적용하여 음악이 급진적으로 변하는 부분을 추출하고, 해당 위치를 핑거프린트로 정의하는 방식이다. 이렇게 만들어진 핑거프린트는 음질의 변화에 민감하지 않으며, 음악 데이터의 일정 부분만으로도 원본과 동일 위치의 핑거프린트 추출이 가능하다. 이 시스템은 기존의 주파수 영역을 이용한 시스템 보다 오디오 핑거프린트의 데이터량과 계산량을 줄여줌으로써 검색을 할 때 보다 효율적인 성능을 나타낸다. 이를 응용하여 인터넷에 유통되는 복사된 음악의 저작권 보호, 또는 음악의 메타정보 등을 사용자에게 나타낼 수 있다.

HMM기반 자동음소분할기의 음소분할 오류 유형 분석 (The Error Pattern Analysis of the HMM-Based Automatic Phoneme Segmentation)

  • 김민제;이정철;김종진
    • 한국음향학회지
    • /
    • 제25권5호
    • /
    • pp.213-221
    • /
    • 2006
  • 합성음의 음질을 향상시키기 위하여 분할된 corpora로부터 합성유닛을 선택하여 사용하는 연속음성합성에서 정확한 음소분할은 매우 중요하다. 일반적으로 음소분할은 사람에 의해 수행되지만 많은 작업량으로 인한 시간적 지연, 일관 성 유지 어려움 등 많은 문제가 발생한다. 이에 따라 음성인식에서 도입된 HMM 기반의 자동음소분할이 음성인식, 음성 합성에서 널리 사용되어지고 있지만 음성전문가의 수작업 결과와 비교할 때 HMM 기반 자동음소분할은 오류가 있고, 이는 합성음 품질의 열화의 주요 원인이 되고 있다. 본 논문에서는 HMM 기반의 자동음소분할기를 사용하여 나타난 자동음소분할 결과와 수작업에 의한 음소분할 결과를 비교하고 유형별로 분석함으로써 음성합성의 성능향상을 위해 개선해야 할 문제점들을 제시한다. 실험에서는 ETRI의 표준형 한국어 공통 음성 DB을 사용하였고, 오차의 범위가 20ms를 벗어난 경우를 분절 오류로 간주하였다. 실험 결과 여성화자의 경우 파열음 + 모음, 파찰음 + 모음, 모음 + 유음 음소쌍에서는 각각 약 99%, 99.5%, 99%의 높은 정확률을 보인 반면, 폐쇄음 + 비음, 폐쇄음 + 유음, 비음 + 유음 음소쌍에서는 44.89%, 50%, 55% 의 낮은 정확률을 보였으며, 남성화자에 대한 실험결과에서도 유사한 경향을 보였다.

근·현대 나전도안과 공예품의 수급(需給)형태 - 중요무형문화재 제10호 나전장 송방웅 소장 나전도안을 중심으로 - (Patterns of Mother-of-Pearl Craftwork Sketches and the Way of Supply and Demand of the Works in Modern and Contemporary Times)

  • 이연재
    • 헤리티지:역사와 과학
    • /
    • 제43권3호
    • /
    • pp.334-365
    • /
    • 2010
  • 나전도안은 작품을 완성하는 데 필요한 모든 공정이 들어있는 것으로 기물의 종류와 형태, 크기, 장석과 나전 문양에 대한 내용이 포함되어 있다. 또 일부는 제작시기와 제작자를 비롯하여 작품 제작을 주문한 수요자에 대한 정보가 남아 있다. 본고에서는 송방웅(중요무형문화재 제10호 나전장) 소장 나전도안 도안 1,700여 점을 중심으로 일제강점기부터 현재에 이르는 기간 동안 시대별로 유행했던 문양과 기물, 그리고 수요자와 수급형태에 대해 알아보고자 한다. 도안의 대표적인 문양으로는 화조, 사군자, 문화재, 풍속인물, 수복자, 산수 등이 있다. 문양도안은 시대에 따라 변화하는데 근대를 대표하는 일제강점기에는 일본에 의해 작품제작과 수급이 통제되었던 배경과 맞물려 일본의 취향을 따른 문양 도안이 많다. 수요층도 일본인을 중심으로 일본과 친분이 있는 계층이 주를 이루었던 것으로 보인다. 도안의 중요성에 대한 인식도 시대적인 정황과 관계된 것으로 보이는데, 송주안이 일본에 거주하였던 시기와 남아있는 도안 중 가장 이른 것의 시대가 일치하는 것으로 보아 일찍이 공예 도안연구가 활성화되었던 일본의 영향을 받았던 것으로 추정된다. 그러나 일본과는 소재, 제작방식, 수급체제가 달랐던 만큼 일본과 한국의 도안에는 큰 차이가 있다. 해방 이후 현대로 접어든 1950년대에는 6.25 전쟁 이후 미군이 새로운 수요층으로 출현하여 이들이 선호하였던 소품을 장식하기 위한 한국적인 문양도안이 주를 이루게 된다. 1960년대 후반부터 1970년대까지는 외국산 자개가 수입되고 사용량이 증가하면서 도안의 크기와 내용, 종류가 다양해지며 조각법, 부식법 등의 새로운 기법도 등장하게 된다. 1970년대에는 경제성장과 맞물려 나전공예품에 대한 관심과 인기가 높았기 때문에 수요층이 다양하였다. 나전공예품은 전적으로 주문에 의해 생산되었는데, 수요층은 각종 단체와 가구 중개상, 그리고 개인으로 분류된다. 이 시기의 수요층 가운데 주목되는 것은 도안에 '부산 좌천동'과 '점촌'으로 표기된 가구 중개상과 개인 수요자인 '진범모친'이다. 부산 좌천동은 1970년대 자개골목으로 유명했던 곳으로 이곳의 상인들은 통영으로부터 다양한 종류의 나전공예품을 납품받아 재판매하였으며, 점촌은 문경의 탄광촌으로 이곳의 "김씨"가 광부들을 상대하던 접대부를 상대로 통영에서 만들어진 나전공예품을 조달하였다. 진범모친은 나전공예품을 소유하기 위해 개인들이 모여 만든 계의 대표로서 부산 대신동에 살았으며 통영에 삼층장을 비롯한 각종 나전공예품을 주문하였다. 1980년대에는 아파트 문화의 정착으로 붙박이장과 거실장, 주방기구, 소파 등 새로운 양식의 가구가 사용되면서 자개장의 입지가 크게 좁아졌다. 한때 통영에서는 끊음질이 크게 유행하여 나전공예품 제작이 활성화되는 듯하였으나 1980년대 말 이후, 사회 전반적으로 나전공예에 대한 선호도가 떨어져 수요자가 감소하였고, 이에 따라 나전 작품의 제작도 자연스럽게 줄어들게 되었다. 현재는 몇몇 장인들에 의해 명맥만이 유지되고 있다.