통합 검색 | Korea Science

단시간 스펙트럼에 기초한 주파수특성을 고려한 잡음차감 기법

최재승
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2015년도 추계학술대회
- /
- pp.824-826
- /
- 2015
최근 음성인식 시스템의 성능 향상은 많이 개선되었지만 아직도 잡음과 같은 문제로 인하여 문제점이 나타나고 있다. 음성인식 시스템에 있어서의 잡음 문제를 해결함으로써 인식 성능을 향상할 목적으로 본 논문에서는 단시간 스펙트럼에 기초한 주파수특성을 고려한 위너필터를 사용한 잡음 차감 알고리즘을 제안한다. 제안한 알고리즘은 먼저 각 프레임에서 문턱값을 검출한 후에 비묵음 구간과 묵음 구간을 식별한다. 각 프레임에 대해서 비묵음 구간에서는 위너필터법에 의한 잡음 차감법을 실시하며, 묵음 구간에 대해서는 일반적인 잡음 차감법을 적용한다.
PDF

차감 동작 기법 기반의 효율적인 R파 검출 (Efficient R Wave Detection based on Subtractive Operation Method)

조익성;권혁숭
- 한국정보통신학회논문지
- /
- 제17권4호
- /
- pp.945-952
- /
- 2013
QRS 영역 중 R파는 ECG 신호 중 가장 큰 대표 신호라 할 수 있으며, 이 점을 기준으로 다양한 특징점을 검출하기 때문에 R파의 검출성능을 높이기 위해 많은 노력을 기울여 왔다. 하지만 R파 검출은 여러 종류의 잡음성분들로 인하여 이를 분석하는데 어려움을 준다. 또한 QRS 영역의 진폭과 유사한 T파나 P파를 R파로 오인함으로써 검출의 어려움이 발생한다. ECG 신호처리는 하드웨어 및 소프트웨어 자원에 대한 효율성을 고려해야 하며, 소형화 및 저 전력을 위해 단순해야 한다. 즉, 최소한의 연산량으로 정확한 R파를 검출함으로써 다양한 부정맥을 분류할 수 있는 적합한 알고리즘의 설계가 필요하다. 따라서 본 연구에서는 차감 동작 기법(Subtractive Operation Method, 이하 SOM) 기반의 심전도 신호의 R파 검출 방법을 제안한다. 이를 위해 형태 연산을 통한 전처리 과정과 경험적 문턱값과 차감신호를 통해 R파를 검출하였으며, 검출의 효율성을 위하여 RR 간격을 이용한 동적 역탐색 기법을 적용하였다. 제안한 알고리즘의 R파 검출 성능을 평가하기 위해서 MIT-BIH 부정맥 데이터베이스를 사용하였다. 성능평가 결과, R파는 평균 99.41%의 검출결과가 나타났다.
https://doi.org/10.6109/jkiice.2013.17.4.945 인용 PDF KSCI

가도세틱산-조영증강 MRI에서 간세포암 피막 발견에 대한 영상차감기법의 진단적 가치 (Value of Image Subtraction for the Identification of Hepatocellular Carcinoma Capsule on Gadoxetic Acid-Enhanced MRI)

김현중;안지현;문진실;차승환
- 대한영상의학회지
- /
- 제79권6호
- /
- pp.340-347
- /
- 2018
목적: 가도세틱산-조영증강 MRI에서 간세포암 피막 발견에 대한 영상차감기법의 진단적 가치를 알아보고자 하였다. 대상과 방법: 2015년 5월부터 2017년 2월까지 가도세틱산-조영증강 MRI를 시행 받고 수술을 시행한 hepatocellular carcinoma (이하 HCC) 고위험군 108명을 대상으로 하였다. 차감영상의 질 및 간문맥기와 이행기의 일반영상과 차감영상에서 피막 여부에 대해 평가하였고, 차감영상에서의 피막 여부가 Liver Imaging Reporting and Data System에 따른 간세포암 진단에 미치는 영향을 평가하였다. 결과: 수술 전 경동맥화학색전술을 시행 받았거나 차감영상의 질이 불만족스러운 34명의 환자를 제외한 74명의 환자에서 82개의 간 병변(간세포암 73개, 그 외 악성종양 5개, 양성종양 4개)에 대해 분석하였다. 피막의 발견에 대한 차감영상의 민감도, 정확도, 그리고 곡선하면적은 일반영상과 비교하여 통계적으로 유의하게 높았고(각 95.4%, 89.0%, 0.80; p < 0.001), 특이도는 동일하였다(64.7%). HCC의 진단에 대해서도 차감영상이 일반영상과 비교하여 민감도, 정확도, 그리고 곡선하면적이 통계적으로 유의하게 높았으며(각 82.2%, 79.3%, 0.69; p = 0.011), 특이도는 동일하였다(55.6%). 결론: 가도세틱산-조영증강 MRI에서 간문맥기 또는 이행기로부터의 차감영상은 간세포암 피막의 발견에 도움이 된다.
https://doi.org/10.3348/jksr.2018.79.6.340 인용

ECG 신호의 가변적인 전력선 잡음 제거를 위한 적응형 차감기법 (Adaptive Subtraction Method for Removing Variable Powerline Interference of ECG)

전홍규;조익성;권혁숭
- 한국정보통신학회논문지
- /
- 제15권2호
- /
- pp.447-454
- /
- 2011
전력선 잡음은 ECG 신호 분석에 있어 특정 구간의 왜곡을 발생시킬 수 있다. 특히 P와 R파와 같이 부정맥 진단에 중요한 요소가 되는 구간은 전력선 주파수가 샘플링 주파수의 배수(multiple)일 경우와 그렇지 않을 경우에 각각 다른 형태의 잡음으로 나타나며, 잡음의 특성 또한 선형과 비선형으로 나누어진다. 본 논문에서는 ECG 신호의 가변적인 전력선 잡음 제거를 위한 적응형 차감 기법을 제안한다. 제안한 방법은 먼저 전력선 주파수와 샘플링 주파수와의 배수 관계를 multiple과 non-multiple로 구분한 후 각 구간에 대한 선형성 여부를 판단한다. 이후 선형 구간은 이동평균 필터를 이용하여 잡음성분을 추출하고, 비선형 구간 잡음은 선형구간에서 추출되어 임시버퍼에 저장된 잡음 성분을 이용하여 추출한다. 제안한 기법의 P파와 R파 검출성능을 평가하기 위해 MIT-BIH 데이터베이스의 119번 레코드를 사용하였다. 실험 결과 기존 노치 필터의 경우 P파 97.91%, R파 96.66%, 제안한 차감기법의 경우 P파 99.01%, R파 97.93%의 검출결과를 나타내었다.
https://doi.org/10.6109/jkiice.2011.15.2.447 인용 PDF KSCI

차량에서의 음성인식율 향상을 위한 전처리 기법 (Preprocessing Technique for Improvement of Speech Recognition in a Car)

김현태;박장식
- 한국콘텐츠학회논문지
- /
- 제9권1호
- /
- pp.139-146
- /
- 2009
본 논문에서는 차량에서의 자동 음성인식 시스템과 같이 신호대잡음비가 낮은 잡음 환경에서의 음성인식에 적합한 변형된 스펙트럼 차감법을 제안한다. 기존의 스펙트럼 차감법은 스펙트럼에서 낮은 신호대 잡음비(SNR)를 갖는 부분은 감쇄되고, 신호대잡음비가 높은 부분은 강조되는 신호대잡음비에 의존한다. 그러나 이러한 구성은 높은 신호대잡음비를 갖는 환경에서는 적절하나 차량 환경과 같이 낮은 신호대잡음비를 나타내는 환경에서는 매우 부적절하다. 제안하는 방법은 낮은 신호대잡음비를 갖는 잡음 환경을 위해 음성우세영역을 강조하여 불필요하게 음성영역이 과차감되지 않도록 방지한다. 차량용 음성명령어 어휘를 대상으로 한 실험 결과에서 제안하는 방법이 기존의 방법에 비해 우수한 것을 확인하였다.
https://doi.org/10.5392/JKCA.2009.9.1.139 인용 PDF

히스토그램 학습 기반 태양광발전소 고장 판독 시스템 (Histogram Learning-based Solar Power Plant Failure Reading System)

염성관;신광성
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2021년도 추계학술대회
- /
- pp.572-573
- /
- 2021
지능형 경로 이동 기능을 갖춘 드론을 이용하여, IoT형 열화상 기반 태양광 고장 검출 장비의 개발 및 드론과의 연동을 최적화하여 취득된 이미지 데이터의 실시간 분석을 통해 태양광 발전소의 고장 판독을 용이하게 함으로써, 태양광발전소의 발전율 향상과 효율적인 유지관리 모델을 만들 수 있는 기반 기술의 제시와 이미지 차감 분석기법을 이용하여 태양광 패널의 고장을 판독할 수 있는 시스템을 설계한다.
PDF

CT 혈관 조영 영상에서 뼈 소거법 기반의 하지 혈관 자동 추출 (Automatic Lower Extremity Vessel Extraction based on Bone Elimination Technique in CT Angiography Images)

김수경;홍헬렌
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제36권12호
- /
- pp.967-976
- /
- 2009
본 논문에서는 CT 및 CT 혈관 조영 영상에서 강체 정합 및 뼈 소거법을 이용한 하지 혈관 자동 추출 방법을 제안한다. 첫째, 뼈의 부분적인 움직임을 반영하기 위하여 해부학 정보를 바탕으로 하지를 자동 구역화하고, 둘째, CT와 CTA 영상간 움직임을 산정하기 위하여 거리지도 기반의 강체 정합을 수행한다. 셋째, CTA 영상에서 복잡한 구조를 갖는 뼈를 제거하고 뼈에 인접한 혈관이 깎이는 것을 방지하기 위하여 뼈 소거법과 혈관 마스킹 기법을 제안한다. 넷째, 정합오차 및 연골 등의 잡음을 줄이기 위하여 혈관 추적 기반의 후 처리 과정을 통하여 보정한다. 제안 방법의 평가를 위해 육안 평가와 정확성 평가 그리고 수행시간을 측정하였다. 육안 평가를 위해 차감 기법, 정합 후 차감 기법, 제안 방법을 적용한 결과를 볼륨렌더링과 최대 강도 투영영상을 사용하여 비교하였다. 정확성 평가를 위해 CTA 영상과 차감 기반 기법 및 제안 방법을 적용한 결과의 밝기값 분포도를 분석하였다. 실험 결과 뼈는 제거되고 가는 혈관 및 다른 조직의 손실 없이 혈관이 정확하게 추출되었음을 볼 수 있었고, 13명의 환자 데이터 전채에 대한 전체 수행시간은 약 40포 정도로 측정되었다.
PDF KSCI

자동차 환경에서의 단독 숫자음 및 명령어 인식 (Isolated Digit and Command Recognition in Car Environment)

양태영;신원호;김지성;안동순;이충용;윤대희;차일환
- 한국음향학회지
- /
- 제18권2호
- /
- pp.11-17
- /
- 1999
본 논문에서는 DHMM(Discrete Hidden Markov Model) 기반의 음성 인식 시스템에서 소음에 강인한 인식 성능을 얻기 위하여, 관찰 확률 스무딩(observation probability smoothing) 방법을 제안하고, 자동차 소음하에서의 음성 인식에 적합한 소음처리 기법을 실험을 통해 제시한다. 제안된 관찰 확률 스무딩 방법은 입력되는 음성의 특징벡터가 소음에 오염되어 양자화(vector quantization) 과정에서 적절한 코드워드(codeword)가 아닌 다른 코드워드로 양자화됨으로써 발생하는 인식성능 저하를 막기 위하여, 각각의 코드워드와 거리가 가까운 코드워드들의 관찰 확률값을 높여주는 방법이다. 이 밖에 자동차 소음에 대한 대처 방안으로 특징 벡터의 거리 측정시의 리프터(lifter) 사용, 고역 통과 필터(high pass filter) 사용, 스펙트럴 차감법(spectral subtraction) 사용 등의 성능을 평가한다. 인식 실험은 자동차 정지 중과 주행 중의 두 가지 상황에서 녹음된 한국어 단독 숫자음과 명령어 14단어에 대해 수행하였으며, 정지 중 97.4%와 주행 중 59.1%의 인식률로부터, 제안된 관찰 확률 스무딩 방법과 리프터, 고역 통과 필터, 스팩트럴 차감법의 소음 처리 기법을 추가한 결과, 정지 중 98.3%와 주행 중 88.6%의 인식률을 얻을 수 있었다.
PDF

뇌혈관 추출과 대화형 가시화를 위한 다중 GPU기반 영상정합 (Multi GPU Based Image Registration for Cerebrovascular Extraction and Interactive Visualization)

박성진;신영길
- 한국정보과학회논문지:컴퓨팅의 실제 및 레터
- /
- 제15권6호
- /
- pp.445-449
- /
- 2009
본 논문에서는 조영전 CT 와 조영후 CTA 영상 의 움직임을 보정하기 위하여 연산에 효율적인 다중 GPU 기반 영상정합 기법을 제안한다. 제안방법은 크게 다중 GPU 기반 정합과 뇌혈관 가시화의 두 단계로 구성된다. 우선, 복셀기반정합을 수행하기 위하여 GPU 내부의 병렬성뿐 아니라 GPU 간 병렬성도 고려함으로써 유사도값을 계산한다. 그리고 나서 CTA 영상데이터에서 최적변환행렬에 의하여 변환된 CT 영상데이터를 다중 GPU를 이용하여 차감하고, 차감된 결과를 GPU 기반 볼륨렌더링기법을 이용하여 가시화한다. 본 논문에서 제안한 방법을 화질과 수행시간측면에서 기존방법에 대한 우수성을 나타내기 위하여 5쌍의 조영전 뇌 CT 영상과 조영후 뇌 CTA 영상데이터를 사용하여 비교하였다. 실험결과 제안방법은 뇌혈관이 잘 가시화되어 혈관질환을 정확히 진단할 수 있었다. 다중 GPU 기반 방법은 CPU 기반 방법에 비하여 11.6배, 단일 GPU 기반 방법에 비하여 1.4배 빠른 결과를 보여주었다.
PDF KSCI

드론 소음 환경에서 심층 신경망 기반 음성 향상 기법 적용에 관한 연구 (A study on deep neural speech enhancement in drone noise environment)

김지민;정재희;여찬은;김우일
- 한국음향학회지
- /
- 제41권3호
- /
- pp.342-350
- /
- 2022
본 논문에서는 재난 환경과 같은 환경에서의 음성 처리를 위해 실제 드론 소음 데이터를 수집하여 오염 음성 데이터베이스를 구축하고 음성 향상 기법인 스펙트럼 차감법과 심층 신경망을 이용한 마스크 기반 음성 향상 기법을 적용하여 성능을 평가한다. 기존의 심층 신경망 기반의 음성 향상 모델인 VoiceFilter(VF)의 성능 향상을 위해 Self-Attention 연산을 적용하고 추정한 잡음 정보를 Attention 모델의 입력으로 이용한다. 기존 VF 모델 기법과 비교하여 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)에 대해 각각 3.77 %, 1.66 %, 0.32 % 향상된 결과를 나타낸다. 인터넷에서 수집한 오염 음성 데이터를 75 % 혼합하여 훈련한 경우, 실제 드론 소음만을 사용한 경우에 비해 상대적인 성능 하락률 평균이 SDR, PESQ, STOI에 대해 각각 3.18 %, 2.79 %, 0.96 %를 나타낸다. 이는 실제 데이터를 취득하기 어려운 환경에서 실제 데이터와 유사한 데이터를 수집하여 음성 향상을 위한 모델 훈련에 효과적으로 활용할 수 있음을 확인해준다.
https://doi.org/10.7776/ASK.2022.41.3.342 인용 PDF KSCI

검색결과 34건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)