통합 검색 | Korea Science

강인한 음성인식을 위한 통계적 특징벡터 추출방법의 개선 (An Improvement of Stochastic Feature Extraction for Robust Speech Recognition)

김회린;고진석
- 한국음향학회지
- /
- 제23권2호
- /
- pp.180-186
- /
- 2004
음성 신호에 존재하는 잡음은 음성 인식기의 성능을 현저하게 감소시킨다. 이것은 잡음이 훈련 조건과 인식 조건 사이의 불일치를 가져오기 때문이다. 본 논문에서는 이러한 불일치를 최소화하기 위해서 통계적 특징벡터의 추출방법을 개선하기 위한 방법을 연구하였다. 밴드 SNR에 따라 잡음 스펙트럼의 차감 레벨을 조절하는 기존의 멀티 밴드 잡음 차감법 (MSS)을 개선하기 위하여 잡음 정규화 상수를 이용하여 잡음 스펙트럼의 차감 레벨을 보다 정확하게 조절하는 방법 (M-MSS)을 제시하였다. 다음으로, 기존의 통계적 특징벡터 추출방법 (SFE)에서 잡음 차감법을 파워 스펙트럼 영역에 적용함으로써 성능을 개선하였다(M-SFE). 마지막으로, 위의 두 가지 방법의 장점을 결합하기 위해서 밴드 SNR에 근거한 통계적 특징벡터 추출방법 (MMSS-MSFE)을 제안하였다. 제안된 방법들은 다양한 잡음 환경 하에서 화자독립 고립 단어 인식으로 성능을 평가하였다. 기본적인 잡음 차감법 (SS)에 비하여 M-MSS, M-SFE와 MMSS-MSFE의 평균 에러율은 각각 18.6%, 15.1%와 33.9% 감소하였다. 위의 결과로부터 제안한 방법이 잡음에 강인한 음성인식을 위해 매우 효과적임을 입증하였다.
PDF KSCI

Investigation of light stimulated mouse brain activation in high magnetic field fMRI using image segmentation methods

Kim, Wook;Woo, Sang-Keun;Kang, Joo Hyun;Lim, Sang Moo
- 한국컴퓨터정보학회논문지
- /
- 제21권12호
- /
- pp.11-18
- /
- 2016
Magnetic resonance image (MRI) is widely used in brain research field and medical image. Especially, non-invasive brain activation acquired image technique, which is functional magnetic resonance image (fMRI) is used in brain study. In this study, we investigate brain activation occurred by LED light stimulation. For investigate of brain activation in experimental small animal, we used high magnetic field 9.4T MRI. Experimental small animal is Balb/c mouse, method of fMRI is using echo planar image (EPI). EPI method spend more less time than any other MRI method. For this reason, however, EPI data has low contrast. Due to the low contrast, image pre-processing is very hard and inaccuracy. In this study, we planned the study protocol, which is called block design in fMRI research field. The block designed has 8 LED light stimulation session and 8 rest session. All block is consist of 6 EPI images and acquired 1 slice of EPI image is 16 second. During the light session, we occurred LED light stimulation for 1 minutes 36 seconds. During the rest session, we do not occurred light stimulation and remain the light off state for 1 minutes 36 seconds. This session repeat the all over the EPI scan time, so the total spend time of EPI scan has almost 26 minutes. After acquired EPI data, we performed the analysis of this image data. In this study, we analysis of EPI data using statistical parametric map (SPM) software and performed image pre-processing such as realignment, co-registration, normalization, smoothing of EPI data. The pre-processing of fMRI data have to segmented using this software. However this method has 3 different method which is Gaussian nonparametric, warped modulate, and tissue probability map. In this study we performed the this 3 different method and compared how they can change the result of fMRI analysis results. The result of this study show that LED light stimulation was activate superior colliculus region in mouse brain. And the most higher activated value of segmentation method was using tissue probability map. this study may help to improve brain activation study using EPI and SPM analysis.
https://doi.org/10.9708/jksci.2016.21.12.011 인용 PDF KSCI

뇌 PET과 MR 영상의 자동화된 3차원적 합성기법 개발 (Development of an Automatic 3D Coregistration Technique of Brain PET and MR Images)

이재성;곽철은;이동수;정준기;이명철;박광석
- 대한핵의학회지
- /
- 제32권5호
- /
- pp.414-424
- /
- 1998
목적: PET과 MR 영상을 체계적으로 합성i분석하여 각각의 영상기법이 갖는 단점을 보완하고 기능을 향상시킴으로써 보다 정확하고 유용한 임상정보를 얻을 수 있다. 두 영상을 공간적으로 합성하기 위해서 머리 표피 경계점들 간의 거리를 최소화하는 알고리즘을 이용할 경우 경계점 추출의 정확성 및 견실성과 거리 계산 속도가 합성 알고리즘의 성능을 결정하는 중요한 요소가 된다. 본 연구에서는 PET 영상의 경계 추출과 거리 계산 방법을 개선하고 이를 이용하여 PET과 MR 영상을 3차원적으로 합성하였다. 대상 및 방법: 공간적인 합성을 위한 영상처리기법의 핵심인 경계점 추출을 위해 PET영상에서는 방출스캔 sinogram의 경계를 강조한 후 재구성한 횡단면으로부터 2 mm 간격으로 머리 표피 경계점들을 추출하였으며 MR 영상에서는 각 횡단면마다 약 2도 간격으로 경계점들을 추출하였다. 두 영상의 모든 경계점들 간의 평균 유클리디안 거리를 최소화하는 3차원 가상공간 상에서의 위치 이동과 회전 각도를 최소자승법을 이용하여 구한 후 PET영상을 역 전환하여 위치 정합을 하였다. 평균 거리의 계산 속도를 향상시키기 위하여 고정된 대상의 각 경계점을 중심으로 하여 주변 공간 정들에서의 거리를 순차적으로 계산하고 이들의 최소값을 취하는 방법으로 거리지도를 구성하였으며 최소자승법에서 경계점들 간의 위치가 변할 때마다 매번 평균거리를 다시 계산하지 않고 거리지도를 참조하여 평균 거리를 산출하는 방법을 사용하였다. 위치 정합된 두 영상의 동시 표현을 위하여 PET 영상의 화소값에 $0.4{\sim}0.7$부터 1사이의 범위로 정규화된 MR 영상의 화소 값으로 가중치를 주는 가중정규화 방법을 사용하였다. 결과: 방출스캔의 sinogram을 이용함으로써 PET영상의 경계를 견실하게 추출할 수 있었으며, 거리지도를 이용하여 거리 계산을 한 결과 계산 속도를 향상시킬 수 있었다. 정상인의 뇌영상에 대해 위치 정합을 실시한 결과 평균 거리 오차는 2mm 이하였다. 가중정규화 방법을 사용하였을 때 합성된 영상의 정성적인 식별 명확도가 향상하였다. 결론: 견실한 PET 영상 경계점 추출과 거리지도를 이용한 계산 속도의 향상을 통해 뇌 PET과 MR 영상 합성기법의 성능을 개선할 수 있었으며 이를 이용하며 개발한 영상정합 프로그램은 임상 환경에서 유용하게 사용될 수 있을 것이다.
PDF

뇌파를 BCI 게임 제어에 활용하기 위한 정규화 방법 (A Normalization Method to Utilize Brain Waves as Brain Computer Interface Game Control)

성연식;조경은;엄기현
- 한국게임학회 논문지
- /
- 제10권6호
- /
- pp.115-124
- /
- 2010
뇌파는 초기에 원숭이가 모터로 팔을 조작하기 위한 방법에 관한 연구로 시작되었다. 최근에는, 측정한 뇌파를 치매 환자의 치매 진행 정도를 늦추거나 집중력결핍 과잉행동장애 아이들의 집중력을 높이기 위한 연구들이 진행되고 있다. 그리고 저가의 뇌파 측정 장치가 출시되면서 게임 인터페이스로도 사용된다. 뇌파로 게임을 제어할 때의 문제점은 사람마다 평균 진폭, 평균 파장 그리고 평균 진동 횟수가 다르다는 것이다. 뇌파 차이는 뇌파로 게임을 제어할 때 형평성 문제를 발생시키기 때문에 뇌파를 정규화해서 사용하는 방법이 필요하다. 이 논문에서는 정규분포를 사용해서 측정한 뇌파를 정규화하고 제어로 사용할 파형을 계산하는 방법을 제안한다. 이를 위해서 뇌파 변환 과정을 7단계로 나누어 처리하는 프레임워크를 제안하고 각 단계에 필요한 계산과정을 기술한다. 실험에서는 BCI 영어단어 학습 프로그램에 제안한 방법을 적용하여 두 피험자 파형을 비교했다. 실험에서는 두 피험자의 파형 유사 정도를 상관계수로 측정했다. 명상 값은 제안한 방법을 적용할 때 약 13%가 증가되었고 집중 값은 약 8%정도 증가되었다. 제안한 정규화 방법은 뇌파에 반영된 개인의 특성을 줄여서 제어에 적합한 파형으로 변환하기 때문에 게임과 같은 응용프로그램에 적합하다.
PDF KSCI

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

권오륜;민경필;전준철
- 인터넷정보학회논문지
- /
- 제8권3호
- /
- pp.19-32
- /
- 2007
본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.
PDF

식품 데이터 정규화를 위한 쌀 음식의 건물중 기반 영양 편차 고찰 (A Study on Dry Weight-Based Nutritional Deviations in Rice Foods for Normalization of Food Data)

김상철;이운용;박우풍;윤기오;김종린
- 스마트미디어저널
- /
- 제11권7호
- /
- pp.76-84
- /
- 2022
동일한 재료를 사용하고, 식품명이나 음식명이 같음에도 불구하고 동일한 중량에서 식품의 영양성분이 편차를 나타내는 경우가 많이 있다. 그 원인은 조리 방법과 조리 공정에 따른 음식의 수분함량과 깊은 관계가 있다. 개인의 건강 맞춤형 식단을 설계하고, 정확한 열량과 양분을 공급하기 위해서는 조리 공정이나 조리 방법에 영향을 받지 않는 음식 데이터의 표시 방법이 필요하다. 이 연구에서는 동일한 식자재나 식품이 함수율의 차이로 인해 다른 식자재나 식품으로 분류됨으로 데이터베이스의 복잡성과 활용측면의 어려움이 증가하는 문제를 개선하기 위해 건물중(乾物重) 기반의 식품 데이터 표시를 제안하고자 하며, 이를 위해 식품재료로서 쌀의 특징과 쌀을 재료로 한 다양한 쌀 가공 식품의 물성에 대하여 수분의 변화에 따른 주요 영양성분의 변화를 고찰하고, 이를 통해 식품 데이터를 정규화 하기 위한 예시로서 쌀의 건물중 기반 영양 표시를 제안하고자 하였다. 동일한 재료로 가공된 32종의 쌀 가공 식품 데이터는 수분 분포에 있어 1.1~95%, 에너지량은 20~415kcal, 단백질은 0.3~9.1g, 지질은 0.1~3.9g, 탄수화물은 4.4~91.0g의 범위로 매우 넓은 영역에 분포하고 있다. 그러나 수분영향을 제거하고 고형물로 환산한 쌀가공 식품의 100g 당 영양성분은 에너지량의 최대값과 최소값의 범위는 376.9~421.1kcal, 단백질의 최대값과 최소값의 범위는 4.3~12.6g, 지질의 최대값과 최소값의 범위는 0.1~4.1g, 탄수화물의 최대값과 최소값의 범위는 80.5~95.1g 로 나타났다. 수분 중량을 포함한 음식의 영양성분 데이터에 비해 최대값과 최소값, 데이터의 표준편차가 90%이상 감소하고, 정규화되는 경향을 나타내었다.
PDF KSCI

반음소 모델링을 이용한 거절기능에 대한 연구 (A Study on the Rejection Capability Based on Anti-phone Modeling)

김우성;구명완
- 한국음향학회지
- /
- 제18권3호
- /
- pp.3-9
- /
- 1999
본 논문에서는 독립단어 음성인식 시스템을 위하여 반음소(anti-phone) 모델링을 이용한 인식 거절(rejection)기능에 대해 기술한다. 음성인식 거절 기능은 음성인식기를 제작할 ？ 정해놓은 인식대상 단어 이외의 단어가 입력되었을 때 그 단어가 인식할 수 없는 단어임을 알려주는 기능이다. 음성인식 거절기능을 구하는 방식은 핵심어 검출(keyword spotting)방식과 발화검증(utterance verification)방식으로 구분된다. 핵심어 검출 방식은 인식 대상 단어 외의 단어를 별도로 모델링하여 하나의 인식대상 단어처럼 사용하는 방식이고, 발화검증 방식은 각 음소마다 그와 유사한 anti-model을 작성한 후 정상적인 음소 모델과 anti-model과의 유사도를 비교하여 결정하는 방식이다. 본 연구에서는 독립단어 음성인식 시스템에 적용될 수 있는 발화 검증 방식에 의해 음성인식 거절 기능을 구현하였다. 특히 유사도를 결정함에 있어서 산술평균, 기하평균, 조화평균을 사용하고 각각을 비교하여, 기하평균을 사용하는 방식이 우수한 성능을 보임을 알 수 있었다. 음성의 신뢰도(confidence score)를 정규화하기 위해서 Sigmoid 함수를 사용하는데 이 함수의 가중치(weight) 상수의 변화에 대해 인식률을 비교함으로써 가장 적절한 가중치 상수값을 결정하였다. 그리고 유사음소집합(cohort set)에 대한 실험에서는 유사음소집합의 크기가 클수록 더 좋은 성능을 보이는 결과를 얻었다. 음성인식 테스트 결과에서는 신뢰도 임계치 값을 구하고 이 값을 사용하여 인식률을 계산하였으며, 거절의 오류까지 포함된 음성인식률은 약 76%였다. 이 연구결과는 현재 한국통신에서 시험 서비스 중인 음성인식 증권정보 안내 시스템에 적용될 예정이다.
PDF

PCA와 개선된 k-Nearest Neighbor를 이용한 모델 기반형 물체 인식 (Model-Based Object Recognition using PCA & Improved k-Nearest Neighbor)

정병수;김병기
- 정보처리학회논문지B
- /
- 제13B권1호
- /
- pp.53-62
- /
- 2006
주성분 분석법을 사용한 물체 인식 기술은 영상의 조명 변화가 있을 때 인식률이 떨어지는 경향이 있다. 본 논문에서는 실험영상이 학습영상에 대해 조명의 차이가 있는 경우에도 데이터 베이스안의 물체인지 가려내는 새로운 PCA 분석방법을 사용한 물체 인식 기술을 제안하는데 그 목적이 있다. 그리고 개선된 k-nearest neighbor를 이용하여 물체 인식률을 향상 시켰다. 본 논문에서 제안된 물체 인식 알고리즘은 히스토그램 이퀄라이제이션과 미디언 필터를 이용하여 영상을 전처리하고 그것을 학습시켜서 물체 공간을 생성한다. 이때 히스토그램 이퀄라이제이션를 사용하여 히스토그램을 펼침으로써 조명 변화에 영향을 감소시키는 결과를 나았고, 이것은 기본적인 주성분 분석방법과 휘도치 정규화를 한 방법 등과 비교해 본 결과 조명 변화의 영향을 최소화하여 좋은 인식률을 유지할 수 있었다. 그리고 모델 영상내의 각각의 물체의 대표 값을 만든다. 그런 후 테스트영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 기존의 방식으로는 거리 계산오차가 많기 때문에 본 논문에서는 개선된 k-Nearest Neighbpr 이용하여 몇 개의 연속적인 입력영상에 대해 각 각의 모델 영상들을 인식의 단위로 이용하였다.
https://doi.org/10.3745/KIPSTB.2006.13B.1.053 인용 PDF KSCI

한반도 남동부에서 부지효과를 고려한 스펙트럼 감쇠상수 χ 추정 및 강지진동의 추계학적 모사 (Estimation of Spectrum Decay Parameter χ and Stochastic Prediction of Strong Ground Motions in Southeastern Korea)

조남대;박창업
- 한국지진공학회논문집
- /
- 제7권6호
- /
- pp.59-70
- /
- 2003
한반도 남동부에서 관측된 지진기록을 이용하여 스펙트럼 감쇠상수 $\chi$와 응력강하상수를 계산하였다. 특히, 스펙트럼 감쇠상수 $\chi$는 관측소별로 부지고유의 특성을 반영하여 새로운 방법으로 계산하였다. 이 방법은 2단계의 계산과정으로 구성된다. 첫 번째 단계에서는 코다(coda)파 정규화법을 이용하여 광역적 상수인 비탄성감쇠 Q를 역산하고, 이로부터 스펙트럼의 거리종속적인 감쇠효과를 일으키는 $\chi$$_{q}$값을 계산한다. 두 번째 단계에서는 앞서 계산된 $\chi$$_{q}$값을 관측소별로 동일하게 적용하여 거리와 무관한 스펙트럼 감쇠효과인 부지고유의 $\chi$$_{s}$값을 추정한다. 관측소에 관계없이 평균적으로 계산된 $\chi$값의 진원거리(R)에 따른 경향은 0.016+0.000157R이다. 응력강하상수는 1999년 경주근방에서 세 차례 발생한 지진의 관측자료를 이용하여 조남대와 박창업 방법으로 계산하였으며, 그 결과는 92-bar이다. 이들 상수를 이용하여 추계학적 모사법으로 한반도 남동부에서 발생 가능한 강지진동의 최대지반운동과 주파수에 따른 특성을 간접적으로 추정하였다. 이러한 추계학적 모사의 결과를 바탕으로 진원거리에 따른 지진동 감쇠공식을 유도하였으며 기존의 국내연구와 비교, 분석하였다.
https://doi.org/10.5000/EESK.2003.7.6.059 인용 PDF KSCI

Detection of Precise Crop Locations under Vinyl Mulch using Non-integral Moving Average Applied to Thermal Distribution

Cho, Yongjin;Yun, Yeji;Lee, Kyou-Seung;Lee, Dong-Hoon
- Journal of Biosystems Engineering
- /
- 제42권2호
- /
- pp.117-125
- /
- 2017
Purpose: Damage to pulse crops by wild birds is a serious problem. The damage is to such an extent that the rate of damage during the period between seeding and cotyledon stages reaches 54.6% on an average. In this study, a crop-position detection method was developed wherein infrared (IR) sensors were used to determine the cotyledon position under a vinyl mulch. Methods: IR sensors that helped measure the temperature were used to locate the cotyledons below the vinyl mulch. A single IR sensor module was installed at three locations of the crops (peanut, red lettuce, and crown daisy) in the cotyledon stage. The representative thermal response of a $16{\times}4$ pixel area was detected using this sensor in the case where the distance from the target was 25 cm. A spatial image was applied to the two-dimensional temperature distribution using a non-integral moving-average method. The collected data were first processed by taking the moving average via interpolation to determine the frame where the variance was the lowest for a resolution unit of 1.02 cm. Results: The temperature distribution was plotted corresponding to a distance of 10 cm between the crops. A clear leaf pattern of the crop was visually confirmed. However, the temperature distribution after the normalization was unclear. The image conversion and frequency-conversion graphs were obtained based on the moving average by averaging the points corresponding to a frequency of 40 Hz for 8 pixels. The most optimized resolutions at locations 1, 2, and 3 were found on 3.4, 4.1, and 5.6 Pixels, respectively. Conclusions: In this study, to solve the problem of damage caused by birds to crops in the cotyledon stage after seeding, the vinyl mulch is punched after seeding. The crops in the cotyledon stage could be accurately located using the proposed method. By conducting the experiments using the single IR sensor and a sliding mechanical device with the help of a non-integral interpolation method, the crops in the cotyledon stage could be precisely located.
https://doi.org/10.5307/JBE.2017.42.2.117 인용 PDF KSCI

검색결과 639건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)