• 제목/요약/키워드: 가우시안 분해

검색결과 104건 처리시간 0.022초

연속 음성 인식 시스템을 위한 향상된 결정 트리 기반 상태 공유 (Improved Decision Tree-Based State Tying In Continuous Speech Recognition System)

  • 김동화;;;김형순;김영호
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.49-56
    • /
    • 1999
  • 결정 트리 기반 상태 공유 방법은 HMM을 사용하는 많은 연속 음성 인식 시스템에서 강인하고 정확한 문맥 종속 음향 모델링 뿐만 아니라 훈련 중에는 나타나지 않은 모델들의 합성을 위하여 널리 사용되고 있다. 음성 결정 트리를 구성하기 위한 표준적인 방법은 단일 가우시안 트라이폰 모델을 이용한 1계층 프루닝 만을 사용하고 있다. 본 논문에서는 더욱 정교한 음향 모델링을 통하여 인식 성능 향상을 도모하기 위하여 새로운 2가지 접근 방법 즉, 2계층 결정 트리와 복수 혼합 결정 트리를 제안한다. 2계층 결정 트리는 상태 공유와 혼합 가중치 공유를 위하여 2계층 프루닝을 수행하며, 두 번째 계층을 사용하여 공유 상태들도 음성 문맥의 유사도에 따라서 서로 다른 가중치들을 사용할 수 있다. 두 번째 제안된 방법 에서는 훈련 과정 즉, 혼합 분할 및 재추정 과정과 함께 음성 결정 트리가 계속 갱신되어 진다. 복수 혼합 결정 트리를 구성하기 위하여 단일 가우시안 뿐만 아니라 복수 혼합 가우시안 모델이 함께 사용된다. 제안된 방법들을 이용하여 BN-96과 WSJ5k 데이터를 사용한 연속 음성 인식 실험을 수행한 결과, 표준 결정 트리를 사용한 시스템과 비교하여 공유 상태의 개수를 비슷하게 유지하면서 단어 오인식률을 줄일 수 있었다.

  • PDF

라이다 파장 분석 방법론에 대한 연구 (Analysis Method for Full-length LiDAR Waveforms)

  • 정명희;윤의중;김천식
    • 전자공학회논문지CI
    • /
    • 제44권4호통권316호
    • /
    • pp.28-35
    • /
    • 2007
  • 최근 중요한 매핑기술이 된 LiDAR(Light Detection And Ranging)는 다른 수치표고자료 획득 기법에 비해 높은 정확도와 세밀한 밀도를 가지고 있어 3차원 모델링에 필요한 높이정보를 제공한다. 이러한 시스템의 가장 중요한 작업은 디지털화된 리턴 펄스의 모양을 이해하여 수신권내의 반사되어 오는 시간을 측정하여 이와 대응되는 표면 위치를 계산하고 이를 지리좌표와 연결시키는 것이다. 디지털화된 파형(waveform)은 수신권내의 지표 형태에 따라 다른데 처음 발생된 펄스와 같은 단일 모드이거나 수신권내에 여러 표면이 있는 경우 각 반사 표면에 해당하는 여러 모드로 구성된 복잡한 파형일 수 있다. 자료처리 과정에서 반사표면에 대해 일관성 있는 거리측정 지점을 찾기 위해서는 리턴 파장에서 각 모드의 중심위치나 피크 진폭의 위치를 찾아내는 방법이 필요하다. 복잡한 파장의 경우에는 여러 개의 반사지점에 대해 정확한 높이를 계산해 내는 것이 쉽지 않은데 이를 위해 각 모드가 수신권내의 반사 표면에서 레이저 에너지가 반사되는 분포를 나타낸다고 가정하고 리턴 파장을 각 구성 모드로 분해하는 방법이 제안되었다. 이때 분석을 단순화하기 위해 레이저 출력 펄스 모양이 가우시안 분포를 따른다고 가정하고 전체 리턴 파장을 다변량 가우시안(multivariate Gaussian) 분포를 이용하여 분석한다. 여기서는 혼합분포에서 정확한 피크 위치와 half-width와 같이 모형의 파라미터에 대한 추정치를 구하기 위해 EM 알고리즘을 적용하여 MLE 값을 구하였다. 그러나 실제 레이저 고도계에서 얻어진 데이터는 가우시안이 아닌 오른쪽으로 기울어진 분포를 보여주고 있어 응용분야에 따라 정확한 분석이 필요한 경우 이러한 펄스 모양을 고려한 방법이 필요하다. 본 연구에서는 이러한 펄스 모양을 처리하기 위한 새로운 방법론이 제시되어 있다.

레벨 셋 방법을 이용한 뇌 MR 영상에서 해마영역 분할 (A Hippocampus Segmentation in Brain MR Images using Level-Set Method)

  • 이영승;최흥국
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1075-1085
    • /
    • 2012
  • 영상분할은 의료 임상연구에서 가장 중요한 과정 중의 하나이다. 특히 뇌 MRI영상에서 해마의 위축은 알츠하이머병 진행과정의 초기 특정 표지자로서 해마의 볼륨은 초기 알츠하이머병의 임상적 진단에 도움이 된다. 정확한 볼륨 측정에 있어서 해마 영역의 분할은 중요한 역할을 한다. 하지만 MRI 영상에서 해마영역은 낮은 대조도, 낮은 신호 대 잡음 비율, 불연속성 경계의 특징을 보이며, 이러한 특징들은 MRI 영상에서 해마의 정확한 분할을 어렵게 만든다. 이 문제를 해결하기 위해 전처리 과정으로 실험영상에서 관심영역을 선택한 후 반전영상과 원본영상과의 차영상 대조도를 향상시킨 후 비등방성 확산(Anisotropic diffusion) 필터링, 가우시안(Gaussian) 필터링을 수행하였다. 마지막으로 두 개의 레벨 셋(Level Set)기반의 동적 윤곽선(Active Contour) 모델을 결합하여 해마를 분할하는 방법을 제안하였다. 제안된 해마분할방법의 유효성을 다양한 방법으로 평가한 결과 제안된 해마분할방법은 분할 속도와 정확도 면에서 뚜렷하게 개선이 되었음을 확인하였다. 결론적으로 제안된 방법이 해마와 같은 특징을 가진 영역을 분할하는데 적합하다고 할 수 있다. 향후 다른 연구 기법들과 결합할 경우 더욱 잠재성이 증대될 수 있을 것이다.

영상의 이진화평면 분해에 기반한 확장된 블록매칭 잡음제거 (Enhanced Block Matching Scheme for Denoising Images Based on Bit-Plane Decomposition of Images)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.321-326
    • /
    • 2019
  • 블록매칭을 이용한 잡음제거 방법은 영상 내의 이웃하는 블록들이 서로 비슷한 특질을 가지고 있다는 실험적 관찰에 기반한 방법으로서 잡음제거에 있어서 우수한 성능을 보인다. 그러나 블록매칭 잡음제거 방법은 유사한 블록을 찾고 수집하는 작업이 영상 내의 이웃 블록들을 대상으로 이루어지며 참조블록의 특질은 유사한 블록을 찾는 목적 외에는 사용되지 않는다. 따라서 가우스분포 상의 이상치(outlier)가 존재할 때 잡음제거 성능은 그 값의 영향을 받을 수 밖에 없다. 본 논문에서는 잡음에 오염된 영상을 이진화평면으로 분해하여 각 블록의 참 화소값의 범위를 추정하고 이를 근거로 이상치 값을 추정된 참 화소값의 범위내의 값으로 대치하는 방법을 통해 확장된 블록매칭 기법을 제안한다. 전통적인 가우시안 필터는 잡음제거 대상이 되는 화소와 이웃하는 화소들의 값을 모두 계산에 적용하므로 영상의 세부적인 특질이 보존되지 않는 단점이 있는데 이를 극복하기 위해 이진화평면을 구성하여 해당 화소의 참값 범위를 추정한 후 그 범위 안에 속하는 화소값만을 이용하여 잡음제거를 하므로 세부적인 특질이 보존될 수 있는 장점이 있다. 가우시안 필터의 장점과 블록매칭의 장점을 융합하는 방법을 통해 성능 향상을 꾀할 수 있을 것으로 예상되며 실제로 잡음이 추가된 다양한 영상을 통해 실험을 한 결과 잡음제거의 성능을 향상시킬 수 있음을 검증하였다.

명암도 응집성 강화 및 분류를 통한 3차원 뇌 영상 구조적 분할 (Structural Segmentation for 3-D Brain Image by Intensity Coherence Enhancement and Classification)

  • 김민정;이정민;김명희
    • 정보처리학회논문지A
    • /
    • 제13A권5호
    • /
    • pp.465-472
    • /
    • 2006
  • 최근 대용량 의료영상 데이터로부터 인체 기관 또는 질환 부위 추출을 위한 영상 분할 기법이 매우 다양하게 제안되고 있으나, 뇌와 같이 다중 구조를 가지면서 구조간 경계 구분이 어려운 영상의 구조적 분할에는 한계를 가진다. 이를 위해 주로 복셀을 유한 개의 군집으로 분류하는 군집화 (clustering) 기법이 이용되나 이는 개별 복셀 단위의 연산을 수행함으로 인해 잡음의 영향을 받는 제한점이 있다. 그러므로 잡음의 영상을 최소화하고 영상 경계를 강화시키는 향상기법을 적용함으로써 보다 견고한 구조적 분할을 수행할 수 있다. 본 연구에스는 뇌 자기공명영상에 대하여 백질(white matter), 회백질(gray matter), 뇌척수액(cerebrospinal fluid)의 내부 구조를 효율적으로 추출하기 위한 필터링 기반 군집화에 의한 구조적 분할 기법을 제안한다. 우선 구조간 경계를 강화하고 구조 내 잡음을 약화시키기 위해 응집성 향상 확산 필터링(coherence enhancing diffusiion filtering)을 적용한다. 또한 이 과정을 통해 강화된 영상에 퍼지 c-means 군집화 기법을 적용하여 각 복셀이 속하는 구조에 해당하는 군집의 인덱스를 할당함으로써 구조적 분할을 수행한다. 제안된 구조적 분할기법은 기존의 가우시안 또는 일반적인 비등방성 확산 필터링과 군집화 기법을 적용한 기법에 비해 전문가의 수동분할 결과와의 일치 비율에 의한 분할 정확도를 향상시킴을 보였다. 또한 경계 부분에 있어서의 세밀한 분할을 통해 재생산 가긍하고 사용자 수동후 처리를 최소화할 수 있는 결과를 제시함으로써 형태적 뇌 이상 진단을 위한 효율적인 보조 수단을 제공한다.

Watersheds 기반 계층적 이진화를 이용한 단백질 반점 분할 알고리즘 (The Algorithm of Protein Spots Segmentation using Watersheds-based Hierarchical Threshold)

  • 김영호;김정자;김대현;원용관
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.239-246
    • /
    • 2005
  • 생물학자가 단백질을 검색하고 분석하기 위해서는 2차원 젤 전기영동(2DGE : Two Dimensional Gel Electrophoresis) 실험을 해야 한다. 실험 결과는 2차원 영상이 생성된다. 2차원 영상에서 단백질 반점의 패턴 분석을 위해 2차원 젤 영상에 펼쳐진 단백질 반점들을 영상처리를 통해 분할하고, 대조 그룹의 단백질 패턴과 비교분석을 통해 밝히고자하는 단백질 반점을 찾아내야 한다. 단백질 반점을 분할하는 알고리즘에 있어서 기존에는 가우시안 함수를 적용하였지만, 최근 들어 형태학 분리개념에 의한 Watersheds 영역기반 분할(Watersheds region-based segmentation) 알고리즘을 활용하고 있다. 그러나 Watersheds 영역기반 분할 알고리즘은 크기가 큰 영상에서 원하는 영역을 신속하게 분할한다는 장점이 있지만, 영상 화소의 그레이 값이 연속적인 경우 실제 반점의 개수 에 비해 과다분할(over-segmentation)되거나 과소분할(under-segmentation)의 문제점을 안고 있다. 이는 마커(marker) 포인트의 설정에 의해 어느 정도 해결할 수 있지만 병합(merge)과 분할(split) 과정을 반복해야 한다. 본 논문은 Watersheds 기반 계층적 이진화 기법을 적용하여 마커 드리븐 Watersheds 영상분할의 문제점을 해결하고자 한다.

화상전송 서비스를 위한 객체 분할 및 지식 기반 얼굴 특징 검출 (Object Segmentation for Image Transmission Services and Facial Characteristic Detection based on Knowledge)

  • 임춘환;양홍영
    • 전자공학회논문지T
    • /
    • 제36T권3호
    • /
    • pp.26-31
    • /
    • 1999
  • 이 논문에서는 영상통신을 위한 객체 분할 알고리즘과 지식기반 얼굴 특징 검출 알고리즘을 제안한다. 이를 위해 일정한 조도 상태에서 비디오 카메라로부터 동일거리에서 256×256 크기의 그레이 스케일 256 레벨로 두장의 영상을 취득한 후 가우시안 필터를 이용하여 영상 내에 존재하는 잡음을 제거한다. 취득된 두 입력영상은 비디오가 가리키고 있는 배경영상과 배경영상 내에 사람이 포함된 경우의 영상이다. 그리고 배경 영상과 얼굴이 포함된 입력 영상의 차를 구한다. 다음으로 차영상에 대해 축소와 팽창 과정을 통해 얼굴영역 내의 잡음을 제거한 후 좌, 우에서 픽셀 값을 조사하여 마스크를 생성한다. 그리고 마스크를 얼굴이 존재하는 원 영상에 투영하여 배경에서 얼굴영역을 분할한 후 얼굴영역의 에지성분을 조사하여 눈, 코, 귀, 입을 분할한다 시뮬레이션 결과를 통하여 제안된 알고리즘의 효율성을 입증한다.

  • PDF

단일 프레임 영상에서 초점을 이용한 깊이정보 생성에 관한 연구 (A Study on Create Depth Map using Focus/Defocus in single frame)

  • 한현호;이강성;이상훈
    • 디지털융복합연구
    • /
    • 제10권4호
    • /
    • pp.191-197
    • /
    • 2012
  • 본 논문에서는 단일 프레임 영상에서 초점을 이용하여 초기 깊이정보를 추출한 후 입체 영상을 생성하는 방법을 제안하였다. 단일 프레임 영상에서 깊이를 추정하기 위해 원본 영상과 가우시안 필터를 중첩 적용하여 생성된 영상의 비교를 통해 영상의 초점 값을 추출하고 추출된 값을 기반으로 초기 깊이정보를 생성하도록 하였다. 생성된 초기 깊이정보를 Normalized cut을 이용한 객체 분할 결과에 할당하고 각 객체의 깊이를 객체 내 깊이 정보의 평균값으로 보정하여 동일 객체가 같은 깊이 값을 갖도록 하였다. 객체를 제외한 배경 영역은 객체를 제외한 배경 영역의 에지 정보를 이용하여 깊이를 생성하였다. 생성된 깊이를 DIBR(Depth Image Based Rendering)을 이용하여 입체 영상으로 변환하였고 기존 알고리즘을 통해 생성된 영상과 비교 분석하였다.

사전정보를 이용한 가우시안 커널 레벨 셋 알고리즘 기반 무릎 관절 연골 자기공명영상 분할기법 (Knee Articular Cartilage Segmentation with Priors Based On Gaussian Kernel Level Set Algorithm)

  • 안천수;;이용우;신지태
    • 한국통신학회논문지
    • /
    • 제39C권6호
    • /
    • pp.490-496
    • /
    • 2014
  • 무릎 관절 연골은 두께가 얇아 대부분 무릎 질환의 원인이 되고 있다. 그러므로 무릎 자기공명영상에서 관절 연골 분할은 무릎 질환의 정확한 진단을 위한 필수조건이다. 특히 수동이 아닌 전자동 방식으로 무릎 관절 연골을 분할하여야만 효과적인 무릎 질환 진단을 할 수 있다. 본 논문에서는 뇌 자기공명영상에서 대표적으로 사용되는 레벨 셋 기반의 영상 분할 기법을 분석하여 무릎 자기공명영상에 적용 시 문제점을 파악하고 이를 해결함으로써, 무릎 자기공명영상에 레벨 셋 기반 영상분할 방식을 적용하였다. 이는 본 논문에서 제안하는 분할기법을 사용할 경우 무릎 관절 연골 분할에 대한 모든 과정이 전자동화 되어 기존 반자동화 방식보다 빠른 처리가 가능하며, 3차원 형상화를 통해 보다 정확한 진단에 도움을 줄 수 있다. 또한 우리는 제안하고 있는 분할기법이 기존 대표적인 무릎 관절 분할보다 더 높은 정확도를 갖는 것을 실험을 통해 확인할 수 있었다.

볼륨영상 분할을 위한 새로운 레벨 셋 방법과 기존 방법의 성능비교 (Performance Comparison Between New Level Set Method and Previous Methods for Volume Images Segmentation)

  • 이명은;조완현;김선월;진연연;김수형
    • 정보처리학회논문지B
    • /
    • 제18B권3호
    • /
    • pp.131-138
    • /
    • 2011
  • 본 논문에서는 볼륨 의료영상 분할에 대한 기존의 레벨 셋 기법과 제안하는 방법의 성능을 비교하고자 한다. 기존의 방법들은 영역의 정보만을 이용하여 분할을 시행하므로, 영상의 종류에 따라서 정확한 분할을 못한 경우가 있다. 따라서 새롭게 제안하는 방법은 정확한 분할 결과를 위하여 영상의 객체가 가지고 있는 에지 정보와 영역 정보를 함께 이용한다. 에지 정보는 레벨 셋의 곡면이 객체의 표면에 잘 도달할 수 있도록 해주는 기울기 벡터장을 이용하고, 영역 정보는 각 영역에서 픽셀의 밝기 값을 가우시안 분포를 이용하여 통계적 모델로 적합시킴으로써 영상의 분할에 적용하였다. 또한, 곡면 주변 잡음의 영향을 최소화 시켜주는 정규화 항을 사용한다. 기존의 레벨 셋 기반의 방법들과 제안한 방법의 성능 평가를 위하여 실제 볼륨 의료영상에 대하여 다양한 실험을 실시하고, 분할된 결과의 비교를 통하여 제안된 방법의 우수성을 입증한다.