• 제목/요약/키워드: Masking 모델

검색결과 66건 처리시간 0.03초

MPEG-2 AAC Encoder의 심리음향 모델 최적화 (An Optimization on the Psychoacoustic Model for MPEG-2 AAC Encoder)

  • 박종태;문규성;이강현
    • 전자공학회논문지CI
    • /
    • 제38권2호
    • /
    • pp.33-41
    • /
    • 2001
  • 최근 멀티미디어 분야 중에서 가장 중요한 기술 중의 하나가 압축이다. 오디오 파일들은 인터넷을 중심으로 급속히 전파되어가고 있으며, 그 중에서 가장 유명한 것이 MP-3(MPEC-1 Layer3)인데, MP-3는 128Kbps에서 CD음질을 얻을 수 있지만 64Kbps 이하에서는 음질이 급속히 떨어진다. 반면에 MPEG-2 AAC(Advanced Audio Coding)는 MPEG-1과 호환성을 무시하지만 MP 3보다 1.4배의 높은 압축 율을 갖으며, 최대 7.1채널과 96KHz의 샘플 율을 갖는다. 본 논문에서는 MPEG-2 AAC 인코더 부분에서 막대한 연산 량을 갖는 심리음향 모델을 최적화하여 AAC 인코딩 연산 량을 감소시키며 처리속도를 증가하는 알고리즘을 제안한다. 심리음향 모델 최적화 응용 프로그램은 C++언어를 이용하여 구현하였으며, 실험결과 심리음향 모델은 SMR(Signal to Masking Ratio)을 위하여 44.1KHz의 샘플 율을 갖고 2048포인트의 FFT(Fast Fourier Transform)연산을 수행하며, 인코더 블록의 제어를 위하여 서브밴드 필터에 각각의 엔트로피 값들이 입력된다. 제안된 심리음향 모델은 비 예측성 값의 최적화로 인하여 빠른 속도로 수행되었다. 또한 비 예측성 값을 순음지수로 변화 시, 고 주파수 영역의 순음지수 값의 최적화로 연산처리 속도가 증가하였다.

  • PDF

블러링기법 기반의 홍채영역 마스킹 방법 (Iris Region Masking based on Blurring Technique)

  • 이기성;김수형
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.25-30
    • /
    • 2022
  • 최근 스마트폰 또는 사진기, 화상캠 등의 기기 성능이 발달하면서 영상이나 사진에서 사람의 생체정보를 얻는 일이 가능하게 되었다. 실제 독일의 한 해커단체는 고화질의 사진으로부터 사람의 홍채 정보를 획득하여 스마트폰의 홍채 스캐너를 해킹하는 모습을 공개하기도 하였다. 이처럼 고도화된 기기로 화질 좋은 영상이나 사진을 얻을 수 있게 되면서 그에 맞는 보안시스템의 필요성도 대두되고 있다. 따라서 본 논문에서는 openCV의 Haar Cascades와 Blur 모델을 활용하여 영상이나 사진에서 사람의 홍채 정보를 자동으로 마스킹하는 방법을 제안한다. 위 방법은 사람의 얼굴은 인식한 뒤 얼굴 범위 안에서 눈을 검출하여 자동으로 홍채 정보를 마스킹하는 기술이다. 이 기술이 스마트폰, zoom 등의 기기 및 애플리케이션에서 사용된다면 사용자에게 더 보안성이 뛰어난 서비스를 제공할 수 있을 것으로 기대된다.

비국부 층간 결합 모델을 고려한 다중적층 유리의 페리다이나믹 충돌 파괴 해석 (Peridynamic Impact Fracture Analysis of Multilayered Glass with Nonlocal Ghost Interlayer Model)

  • 하윤도;안태식
    • 한국전산구조공학회논문집
    • /
    • 제31권6호
    • /
    • pp.373-380
    • /
    • 2018
  • 본 논문에서는 다중적층 유리의 고속 충돌체에 의한 충돌/침투 파괴 현상을 해석하기 위해 페리다이나믹 동적 해석 기법을 적용한다. 대부분의 다중적층 유리 구조물들은 다수의 주요 유리층들이 상대적으로 매우 얇은 탄성 필름으로 접착되어서 만들어진다. 따라서 다중적층 구조물의 수치해석 모델을 구성하는 것은 까다롭고 비용이 많이 든다. 본 연구에서는 실제 절점을 대신하여 가상의 절점들을 주요층들 사이에 위치시키고 상호작용시키는 비국부 가상 층간구조 모델링을 도입하여 보다 효율적으로 다중적층 구조를 모델링하였다. 또한 고속 충돌체와의 충돌 및 침투 현상을 해석하기 위해 페리다이나믹 비국부 접촉 모델이 고려되었다. 7개의 유리층과 하나의 탄성 백킹층이 폴리비닐부티랄 필름으로 부착된 다중적층 유리의 충돌 파괴 해석을 통해 제안된 해석 모델의 손상 파괴 적용 가능성을 확인하였다.

딥러닝 텍스트 요약 모델의 데이터 편향 문제 해결을 위한 학습 기법 (Training Techniques for Data Bias Problem on Deep Learning Text Summarization)

  • 조준희;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권7호
    • /
    • pp.949-955
    • /
    • 2022
  • 일반적인 딥러닝 기반의 텍스트 요약 모델은 데이터셋으로부터 자유롭지 않다. 예를 들어 뉴스 데이터셋으로 학습한 요약 모델은 커뮤니티 글, 논문 등의 종류가 다른 글에서 핵심을 제대로 요약해내지 못한다. 본 연구는 이러한 현상을 '데이터 편향 문제'라 정의하고 이를 해결할 수 있는 두 가지 학습 기법을 제안한다. 첫 번째는 고유명사를 마스킹하는 '고유명사 마스킹'이고 두 번째는 텍스트의 길이를 임의로 늘이거나 줄이는 '길이 변화'이다. 또한, 실제 실험을 진행하여 제안 기법이 데이터 편향 문제 해결에 효과적임을 확인하며 향후 발전 방향을 제시한다. 본 연구의 기여는 다음과 같다. 1) 데이터 편향 문제를 정의하고 수치화했다. 2) 요약 데이터의 특징을 바탕으로 학습 기법을 제안하고 실제 실험을 진행했다. 3) 제안 기법은 모든 요약 모델에 적용할 수 있고 구현이 어렵지 않아 실용성이 뛰어나다.

심리음향모델에 근거한 음성개선 (Speech Enhancement Based on Psychoacoustic Model)

  • 이진걸
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.337-338
    • /
    • 2000
  • The perceptual filter for speech enhancement was analytically derived where the frequency content of the input noisy signal was made the same as that of the estimated clean signal in auditory domain. However, the analytical derivation should rely on the deconvolution associated with the spreading function in the psychoacoustic model, which results in an ill-conditioned problem. In order to cope with the problem associated with the deconvolution, we propose a novel psychoacoustic model based speech enhancement filter whose principle is the same as the perceptual filter, however the filter is derived by a constrained optimization which provides solutions to the ill-conditioned problem.

  • PDF

사이코어쿠스틱스 모델을 이용한 음성 향상 (Speech enhancement using psychoacoustics model)

  • 권철현;신대규;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 추계학술대회 논문집 학회본부 B
    • /
    • pp.748-750
    • /
    • 1999
  • In this study, a speech enhancement is presented based on the utilization of well-known auditory mechanism, noise masking. The speech enhancement approach adopted here is to derive an modifier that achieves audible noise suppression. This modification selectively affects the perceptually significant spectral values, and is therefore less prone to introduction of unwanted distortions than methods that affect the complete STSA and produces more enhanced results at low SNR as well as at high SNR. The speech enhancement method adopted here needs exact estimation of the minimum specteal value per critical band because it uses only the minimum spectral value per critical band. For this, the method adopted here uses the modified spectral subtraction that is more flexible than power spectral subtraction. So, the result in experiment represented better SNR than before.

  • PDF

잡음마스킹을 이용한 환경보상기법 (Feature Compensation with Model-based Estimation for Noise Masking)

  • 김영준;김남수;이윤근
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.7-10
    • /
    • 2006
  • 본 논문에서는 음성의 모델을 이용하여 확률적인 기반으로 잡음의 마스킹 정도를 측정하는 방법에 대해서 제시한다. 잡음의 마스킹 정도를 측정하는 기준으로서 '잡음 마스킹 확률'을 구하는 방법에 대해서 설명하고 이의 특성에 대해서 알아본다. 그리고 잡음에 대한 '잡음 마스킹 확률'을 이용하여 잡음 환경에서의 음성인식 특징벡터의 성능 향상에 대해 적용해 보았다. 제안된 방법은 ETSI 에서 음성인식 표준실험으로 제시한 Aurora2 데이터베이스 상에서 실험해 보았다. 그 결과 기존의 알고리즘에 비해 16.58%의 성능 향상을 이루어 낼 수 있었다.

  • PDF

심리음향 모델과 웨이블릿 패킷 변환을 이용한 잡음제거기 (Noise suppressor Using Psychoacoustic Model and Wavelet Packet Transform)

  • 김미선;김영주;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.345-346
    • /
    • 2006
  • In this paper, we propose the noise suppressor with the psychoacoustic model and wavelet packet transform. The objective of the scheme is to enhance speech corrupted by colored or non-stationary noise. If corrupted noise is colored, subband approach would be more efficient than whole band one. To avoid serious residual noise and speech distortion, we must adjust the Wavelet Coefficient threshold. In this paper, the subband is designed matching with the critical band. And WCT is adapted by noise masking threshold(NMT) and segmental signal to noise ratio(seg_SNR). Consequently this work improve the PESQ-MOS about 0.23 in the case of coded speech.

  • PDF

효율적 다중경로 전파 예측을 위한 Ray-Tracing의 개선된 벡터 표현법 (An efficient multipath propagation prediction using improved vector representation)

  • 이상호;강선미;고한석
    • 한국통신학회논문지
    • /
    • 제24권12A호
    • /
    • pp.1974-1984
    • /
    • 1999
  • 본 논문은 정확한 전파 모델과 신속한 전파 예측 모델을 필요로 하는 다중 경로 현상을 효과적으로 획득하기 위해 효율적인 데이터 표현 구조를 제안한다. 본 논문은 ray tracing에서 사용되고 있는 VR(Vector Representation)을 향상시키기 위한 데이터 표현 구조로서, 빌딩과 같은 오브젝트를 표현하기 위해 CR(Circular Representation)을 이용하는 오브젝트 표현 방법을 제안한다. 제안된 CR은 건물의 중심에서 건물을 둘러싸도록 원을 그리는 형태이다. 본 구성에서 CR은 기하학적 구조를 위한 기본 빌딩 구조로서의 기능을 가지며, VR이 단독으로 사용되어 졌을 때 보다 더 많은 효율성을 증진시킨다. VR은 건물을 표현하기 위해 여러 개의 벽면 벡터를 필요로 하는 반면, CR은 하나의 원으로 표현된다. 결과적으로 제안된 방법에 의해 ray tracing에서 상당한 양의 계산 비용을 줄일 수 있다. 본 논문의 목표는 효율적인 ray tracing 예측 모델을 위해 데이터 구조화 시에 효율성을 얻기 위한 해결책으로서 CR을 제안하는 것이다. 본 논문은 제안된 방법에 의해 계산 부하량이 현저하게 줄어듬을 보인다. 또한 deterministic ray tracing 모델에서 CR의 계층? 구조의 수반 가능한 사용을 보인다. 시뮬레이션 결과는 계층적 octree 구조가 약 50% 계산 부하를 감소시키고 있는 반면 본 논문에서 제안된 CR은 분산된 물체의 수에 비례하여 계산 부하량을 현저하게 감소시킨다는 것을 나타낸다.

  • PDF

Node2vec 그래프 임베딩과 Light GBM 링크 예측을 활용한 식음료 산업의 수출 후보국가 탐색 연구 (A Study on Searching for Export Candidate Countries of the Korean Food and Beverage Industry Using Node2vec Graph Embedding and Light GBM Link Prediction)

  • 이재성;전승표;서진이
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.73-95
    • /
    • 2021
  • 본 연구는 Node2vec 그래프 임베딩 방법과 Light GBM 링크 예측을 활용해 우리나라 식음료 산업의 미개척 수출 후보국가를 탐색한다. Node2vec은 네트워크의 공통 이웃 개수 등을 기반으로 하는 기존의 링크 예측 방법에 비해 상대적으로 취약하다고 알려져 있던 네트워크의 구조적 등위성 표현의 한계를 개선한 방법이다. 따라서 해당 방법은 네트워크의 커뮤니티 탐지와 구조적 등위성 모두에서 우수한 성능을 나타내는 것으로 알려져 있다. 이에 본 연구는 이상의 방법을 우리나라 식음료 산업의 국제 무역거래 정보에 적용했다. 이를 통해 해당 산업의 글로벌 가치사슬 관계에서 우리나라의 광범위한 마진 다각화 효과를 창출하는데 기여하고자 한다. 본 연구의 결과를 통해 도출된 최적의 예측 모델은 0.95의 정밀도와 0.79의 재현율을 기록하며 0.86의 F1 score를 기록해 우수한 성능을 나타냈다. 이상의 모델을 통해 도출한 우리나라의 잠재적 수출 후보국가들의 결과는 추가 조사를 통해 대부분 적절하게 나타난 것을 알 수 있었다. 이상의 내용을 종합하여 본 연구는 Node2vec과 Light GBM을 응용한 링크 예측 방법의 실무적 활용성에 대해 시사할 수 있었다. 그리고 모델을 학습하며 링크 예측을 보다 잘 수행할 수 있는 가중치 업데이트 전략에 대해서도 유용한 시사점을 도출할 수 있었다. 한편, 본 연구는 그래프 임베딩 기반의 링크 예측 관련 연구에서 아직까지 많이 수행된 적 없는 무역거래에 이를 적용했기에 정책적 활용성도 갖고 있다. 본 연구의 결과는 최근 미중 무역갈등이나 일본 수출 규제 등과 같은 글로벌 가치사슬의 변화에 대한 빠른 대응을 지원하며 정책적 의사결정을 위한 도구로써 충분한 유용성이 있다고 생각한다.