통합 검색 | Korea Science

잡음 환경에서 화자 확인을 위한 다중대역에 기반한 공분산 방법 (Covariance Model Based on Multi-Band for Speaker Verification in Noise)

최민정;이기용
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
- /
- pp.127-130
- /
- 2004
기존의 전대역(Full-Band)에서 특징 파라미터를 추출하는 화자 확인(Speaker Verification) 시스템은 저대역이나 고대역에서 화자 정보의 특징이 제거되기 쉽다. 또한, 주파수 스펙트럼에 부분적으로 오염이 되는 경우, 특징 파라미터를 왜곡시켜 화자 확인 시스템의 성능을 저하시킨다. 본 논문에서는 이러한 문제점을 해결하기 위해 다중대역 공분산 모델(Covariance Model)을 제안한다. 제안한 방법은 주파수 영역에서 전대역을 여러 개의 부대역(Sub-Band)으로 분할하고, 부대역별로 독립적으로 특징 파라미터를 추출하여 공분산 모델을 구한다. 제안된 방법의 성능 확인을 위하여 공분산 모델 간의 거리를 측정하는 화자 확인 실험을 하였다. 잡음 환경에서 기존의 방법인 전대역에 기반한 공분산 모델과 제안한 방법을 비교 분석한 결과, 제안한 방법이 기존 방법보다 $2\%$정도 성능이 향상되었다. 또한, 제안된 방법은 전대역에 기반한 파라미터 차원 수를 다중대역의 개수로 분할하여 사용하므로 계산량의 감소와 저장 공간면에서 효율적이다.
PDF

인체 골격의 정보의 기계학습을 통한 자세 인식 개선 방법

강민주;류수경;김나영;이지은;강제원
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2015년도 하계학술대회
- /
- pp.322-325
- /
- 2015
본 논문에서는 개선된 자세 인식을 위한 학습을 통한 자세 인식 기법을 제안한다. 제안 자세 인식 기법은 영상의 모든 픽셀 값을 사용하지 않으며 인체의 골격의 위치 정보와 자세의 학습을 기반으로 한다. 최근 자세 인식기법에 다양한 기계 학습 기법을 적용하여 제스처 인식률을 높이는 연구가 진행되고 있지만 실시간 프레임에 적용하는데 한계가 있다. 반면 고차원의 특징점을 추출하여 신경망 학습방식을 이용하면 적은 계산량과 손쉬운 실행이 가능하다. 고차원의 특징점은 깊이 정보로부터 사람의 골격 정보를 이용해 추출하여 차원을 감소시키며 신경망 학습 방식에서는 각 자세에 대한 고차원의 특징점을 이용하여 자세의 학습을 진행한다. 신경망학습은 학습 단계에서는 미리 알려진 자세와 예측된 자세의 비교를 통해 오류를 최소화 하는 방향으로 학습을 진행하며, 판별 단계에서는 새로운 자세를 입력하여 고차원 특징점을 이용한 신경망 학습 기반의 제안 기술의 성능을 평가한다. 실험에 의하면 제안 기법은 약 96%의 자세 인식률을 보이고 자세 인식기법을 동작 인식으로 확장 가능성 또한 보인다.
PDF

휴대 단말을 위하여 개선된 Speeded Up Robust Features(SURF) 알고리듬의 성능 측정 및 분석 (Performance Evaluation and Analysis of Modified Speeded Up Robust Features(SURF) for Mobile Phones)

서정진;윤경로
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2011년도 추계학술대회
- /
- pp.276-279
- /
- 2011
최근 스마트폰의 카메라를 이용한 시각 검색(Visual Search) 어플리케이션(Application)을 많은 사람들이 이용하고 있고, 이러한 시각 검색 어플리케이션은 여러 가지 특징 추출 방법을 사용하고 있다. 본 논문에서는 특징 추출 방법 중 하나인 Speeded Up Robust Features (SURF)를 사용하여 모바일 환경에 적합한 특징 추출 및 정합 방법에 대하여 기술한다. 모바일 기기들은 기존의 일반 PC환경에 비해 비교적 낮은 성능의 하드웨어 조건을 가지고 있다. 하지만 SURF 특징점 추출 방법 및 정합 방법은 계산량이 많고 복잡하여 실시간 및 모바일 환경에 사용하기엔 제약이 따른다. 모바일 환경에서 높은 성능을 내기 위해 기술자(Descriptor) 차원 감소와 라플라시안(Laplacian) 부호를 이용한 정합, 그리고 최적의 거리 비율로 정합하는 방법을 제안한다.
PDF

원형 샘플 화소를 이용한 카메라 캘리브레이션 패턴 특징점 검출 (Pattern Feature Detection for Camera Calibration using Circular Sample Pixel)

신동원;호요성
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2015년도 하계학술대회
- /
- pp.433-434
- /
- 2015
카메라 캘리브레이션은 다시점 카메라 시스템에서 내부와 외부 인자로 이루어진 카메라 파라미터를 획득하는 과정을 의미 한다. 이는 3차원으로 표현되는 장면과 카메라간의 구조를 다루기 위해 중요하다. 그러나 카메라 캘리브레이션은 사람이 직접 손으로 각 영상에서 사각형의 네 점을 정확히 찍어 주어야 하는 과정 때문에 카메라의 수와 패턴 영상의 수가 늘어남에 따라 상당히 번거로운 작업이 된다. 본 논문에서는 카메라 캘리브레이션 과정에서 손으로 수행하는 작업을 줄이기 위해 자동으로 패턴 특징점을 탐색하는 알고리즘을 제안한다. 제안하는 방법은 먼저 영상에서 패턴 특징점의 후보를 찾기 위해 해리스 코너 검출 방법을 사용한다. 그리고 후보 주변의 원형 샘플 화소를 이용하여 유효한 패턴 특징점을 추출한다. 실험 결과는 Matlab 캘리브레이션 툴박스를 이용하여 획득한 카메라 파라미터와 비교해 보았을 때 큰 차이가 없지만 수작업의 번거로움을 상당히 감소시켰음을 확인하였다.
PDF

효율적인 기계학습을 위한 데이터 전처리 (Data preprocessing for efficient machine learning)

김동현;유승언;이병준;김경태;윤희용
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
- /
- pp.49-50
- /
- 2019
데이터를 기반으로 한 기계학습은 데이터의 양, 학습 모델, 그리고 데이터의 특징 등 다양한 환경에 민감한 특징을 지니고 있어, 보다 효율적인 기계학습을 위해 데이터의 전처리 과정을 필요로 한다. 데이터의 전처리 과정이란 특징 선택(Feature selection), 노이즈 데이터의 제거, 차원 감소(Demension reduction), 클러스터링(Clustering) 등 보다 효율적인 기계학습을 위한 방법이다. 따라서 본 논문에서는 다양한 환경에서 보다 효율적인 기계학습을 위한 데이터 전처리 기술의 종류 및 간단한 특징에 대해 서술한다.
PDF

프랙탈 차원을 이용한 모음인식 (Vowel Recognition Using the Fractal Dimension)

최철영;김형순;김재호;손경식
- 한국통신학회논문지
- /
- 제19권6호
- /
- pp.1140-1148
- /
- 1994
본 논문에서는 음성신호의 프랙탈 차원을 이용하여 한국어 모음인식 실험을 수행하였다. 프랙탈 차원은 Minkowski-Bouligand 차원을 사용하였으며, 형태학적 커버링(morphological covering) 방법을 이용하여 구하였다. 프렉탈 차원과 더불어 기존에 우수한 음성 인식 파라메타로 알려져 있는 LPC 켐스트럼(cepstrum)을 함께 사용하였으며, 프랙탈 차원의 음성인식에의 유용성 여부를 조사하였다. 다양한 자음환경에서의 모음인식 실험결과, LPC 켐스트럼 만을 사용하는 경우 및 프렉탈 차원과 LPC 켐스트럼을 함께 사용하는 경우의 모음 오인식율이 각각 5.6% 및 3.2%로 얻어졌다. 이는 LPC 켑스트럼에 프렉탈 차원을 추가함으로써 오인식되는 데이터가 40%이상 감소되는 결과이며, 프랙탈 차원이 음성인식에 있어서 유용한 특징 파라메터임을 보여준다.
PDF

기계학습 분석을 위한 차원 확장과 차원 축소가 적용된 지진 카탈로그 (Application of Dimensional Expansion and Reduction to Earthquake Catalog for Machine Learning Analysis)

장진수;소병달
- 지질공학
- /
- 제32권3호
- /
- pp.377-388
- /
- 2022
최근, 다수의 연구가 지수적으로 증가하는 지진 자료를 효율적이고 정확하게 처리하기 위해 기계학습을 활용하고 있다. 본 연구는 지진의 발생 시간, 위치, 규모의 정보를 확장하여 기계학습에 적용 가능한 자료를 제작한 후, 주성분 분석을 통해 추출한 자료의 주요 성분으로 자료의 차원을 축소하였다. 차원이 확장된 자료는 36,699개의 지진 사건을 포함하는 Global Centroid Moment Tensor 카탈로그로부터 얻은 지진 정보의 통계량으로 구성되었다. 표준화와 최대-최소화 스케일링을 활용하여 자료 전처리를 수행하였으며, 스케일링이 완료된 자료에 주성분 분석을 적용하여 자료의 주요 특징을 추출하였다. 스케일링은 상이한 단위로 인한 특징 값의 차이를 현저히 감소시켰으며, 그 중 표준화는 다른 전처리에 비해서 각 특징의 중앙값을 더 균등하게 변환하였다. 주성분 분석이 스케일링이 적용되지 않은 자료로부터 추출한 여섯 개의 주성분은 원본 자료의 정보를 99% 설명하였다. 표준화와 최대-최소 스케일링이 적용된 자료로부터 추출한 열여섯 개의 주성분은 원본 자료의 정보의 98%를 재구성하였다. 이는 특징 값의 분포가 균등한 자료의 정보를 보존하기 위해서는 더 많은 주성분이 필요함을 지시한다. 본 연구는 지진 데이터와 지진 거동과의 관계를 분석하는 효율적이고 정확한 기계 학습 모형을 훈련시키기 위한 데이터 처리 방법을 제안하였다.
https://doi.org/10.9720/kseg.2022.3.377 인용 PDF KSCI HTML

퍼지적분을 이용한 웨이블릿 기반의 3차원 얼굴 인식 (Wavelet based Fuzzy Integral System for 3D Face Recognition)

이영학;심재창
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제35권10호
- /
- pp.616-626
- /
- 2008
깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있으며, 얼굴 영상으로부터 분리한 주파수 성분은 동일한 얼굴에 대하여 또 다른 중요한 하나의 얼굴 특징으로 볼 수 있다. 본 논문은 3차원 얼굴 영상으로부터 등고선 값에 의해 추출된 영역에 대하여 각 영역별로 주파수 분리를 하여 특징을 추출한 후 이 주파수에 대한 퍼지적분을 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾고, 회전에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형판별분석 알고리즘을 이용하여 유사도를 비교하였다. 클래스간의 분별 정보를 등고선 영역과 각 영역의 주파수 영역에 대해 퍼지적분 방법을 사용하여 인식률을 향상 시켰으며, 깊이 혼합 방식의 경우는 98.6%의 인식률을 나타내었다. 제안된 방법이 다른 알고리즘보다 인식률이 향상되었다.
PDF KSCI

펴지 군집화 알고리즘 기반의 웨이블릿 변환을 이용한 3차원 얼굴 인식 (3D Face Recognition using Wavelet Transform Based on Fuzzy Clustering Algorithm)

이영학
- 한국멀티미디어학회논문지
- /
- 제11권11호
- /
- pp.1501-1514
- /
- 2008
깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있다. 다른 형상을 가진 얼굴 영상으로부터 분리한 주파수 성분은 동일 얼굴에 대한 또 다른 중요 특징 성분의 하나가 될 수 있다. 본 논문은 3차원 얼굴 영상에서 등고선 값을 따라 추출된 영역에 대하여 각 영역별로 주파수 분리를 이용하여 특징을 추출한다. 그리고 이 주파수에 대한 수정된 퍼지 군집화를 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾는다. 이를 이용하여 회전된 얼굴에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 이는 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형 판별 분석 알고리즘을 이용하여 유사도를 비교하였다. 본 논문에서는 클래스간의 분별 정보를 향상시키고자 각각의 등고선 영역과 각 영역의 주파수별로 수정된 퍼지 군집화 알고리즘을 적용하여 인식률을 향상 시켰으며, 코끝으로부터 깊이 값이 60인 영역의 경우 98.3%의 인식률을 나타내었다.
PDF

신경망을 이용한 고신뢰성의 회귀분석 모델 (Regression Model With High Reliability by Using Neural Networks)

조용현
- 정보처리학회논문지B
- /
- 제8B권4호
- /
- pp.327-334
- /
- 2001
본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.
PDF

검색결과 164건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)