• 제목/요약/키워드: Multi-observation sequence

검색결과 17건 처리시간 0.021초

다중 관측열을 토대로한 HMM에 의한 음성 인식에 관한 연구 (A study on the speech recognition by HMM based on multi-observation sequence)

  • 정의봉
    • 전자공학회논문지S
    • /
    • 제34S권4호
    • /
    • pp.57-65
    • /
    • 1997
  • The purpose of this paper is to propose the HMM (hidden markov model) based on multi-observation sequence for the isolated word recognition. The proosed model generates the codebook of MSVQ by dividing each word into several sections followed by dividing training data into several sections. Then, we are to obtain the sequential value of multi-observation per each section by weighting the vectors of distance form lower values to higher ones. Thereafter, this the sequential with high probability value while in recognition. 146 DDD area names are selected as the vocabularies for the target recognition, and 10LPC cepstrum coefficients are used as the feature parameters. Besides the speech recognition experiments by way of the proposed model, for the comparison with it, the experiments by DP, MSVQ, and genral HMM are made with the same data under the same condition. The experiment results have shown that HMM based on multi-observation sequence proposed in this paper is proved superior to any other methods such as the ones using DP, MSVQ and general HMM models in recognition rate and time.

  • PDF

일회 영상으로 확산텐서 자기공명영상을 얻을 수 있는 다편-다에코 펄스 경사자장 스핀에코(MePGSE) 시퀀스의 초기 결과 (Multi-slice Multi-echo Pulsed-gradient Spin-echo (MePGSE) Sequence for Diffusion Tensor Imaging MRI: A Preliminary Result)

  • 장건호
    • 한국의학물리학회지:의학물리
    • /
    • 제18권2호
    • /
    • pp.65-72
    • /
    • 2007
  • 대부분의 임상용 자기공명영상 장치에서 확산텐서(difiusion tensor) 영상을 얻기 위하여 에코플렌(EPI) 스핀에코(spin-echo) 시퀀스를 사용한다. 하지만 이 영상법은 자화감수성에 매우 예민한 단점이 있다. 따라서 본 연구의 목적은 자화감수성에 의해 발생하는 영상의 변질을 최소화하면서 확산텐서를 한번에 얻을 수 있는 시퀀스를 개발하는데 있다. 모든 확산 텐서 성분을 한번에 얻기 위하여 다편(multi-slice) 8에코 스핀에코 시퀀스(MePGSE)가 개발되었다. 모든 180도 펄스는 기존에 사용된 방법과는 달리 선택된(slice selective) 경사자장을 이용하였다. 처음 7개의 에코 영상은 확산텐서 영상을 위하여 사용하였고, 마지막 에코 영상에서는 영상을 얻는 경사자장은 사용하지 않고 남아있는 자화를(residual magnetization) 최소화하기 위하여 삼차원 경사자장(crusher gradients)만을 사용하였다. 따라서 6개의 텐서 성분을 단 한번의 실험에 의하여 얻을 수 있었다. 이 시퀀스를 사용하여 물과 수박을 이용하여 실험을 하였으며 물에서의 확산 값이 기존에 출판된 값과 유사하게 나타나 본 연구에서 MePGSE 시퀀스의 신뢰를 가질 수 있었다.

  • PDF

VQ와 Multi-layer perceptron을 이용한 단모음 인식에 관한 연구 (A Study on Single Vowels Recognition using VQ and Multi-layer Perceptron)

  • 안태옥;이상훈;김순협
    • 한국음향학회지
    • /
    • 제12권1호
    • /
    • pp.55-60
    • /
    • 1993
  • 본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, VQ(Vectro Quantization)와 MLP(multi-layer perceptron)에 의한 음성 인식 방법을 제안한다. 이 방법은 VQ codebook을 구하고 이를 이용해서 관측열(observation sequence)을 구해각 codeword가 데이터로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상으로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 것으로 시스템의 효율성을 알아보기 위해 VQ/HMM(hidden markov model)에 의한 인식과 비교 실험한다. 실험 결과에 의하면, 시스템의 단순성에도 불구하고 학습능력애 뛰어난 관계로 VQ/HMM보다 VQ와 MLP에 의한 음성 인식률이 향상됨을 보여준다.

  • PDF

레일리 페이딩 채널에서의 이중직교 신호에 대한 다중심볼 검파 (Multi-symbol detection for biorthogonal signals over rayleigh fading channels)

  • 엄의식;윤순영;이황수
    • 한국통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.30-39
    • /
    • 1997
  • 본 논문은 CDMA 셀룰라 역방향 접속 시스템의 성능개선을 위하여 이중직교 신호에 대한 다중심볼 검파방식을 제안하고, 이에 대한 성능해석과 컴퓨터 모의실험을 수행한다. 이 방식은 기존의 심볼단위 비동기 검파대신 복잡도를 줄인 근사 MLSE에 의해 다중심볼로 구성된 복조 데이터와 채널을 동시에 예측한다. 이 방식은 또한 주어진 심볼의 워드수 M에 대해 관측하는 다중심볼 길이 N을 적절히 선택할 때 채널의 예측이 없이도 이상적인 동기검파 방식에 근접한 오류성능을 얻게 해준다. 특히 매우 의미 있는 사항은 이 방식을 CDMA 역방향 접속 시스템에 적용할 때 요구되는 평균 비트당 신호대 잡은 전력비 ${\gamma}_{b}$를 약 1.4dB정도 줄일 수 있어 38% 정도의 용량이 증가된다.

  • PDF

FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 음성 인식 (HMM-based Speech Recognition using FSVQ and Fuzzy Concept)

  • 안태옥
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.90-97
    • /
    • 2003
  • 본 논문은 FSVQ(first section vector quantization)와 퍼지 개념을 이용한 HMM(hidden Markov model)에 기초를 둔 음성인식을 제안한다. 제안된 연구 방법에서는 첫 번째 구간의 코드북(codebook)을 만든 후, 첫 번째 구간의 코드북으로부터, 퍼지 개념을 도입하여 확률값이 큰 순서에 의해 다중 관측열을 구한다. 그 다음, 코드북으로부터 첫 번째 구간의 관측열을 학습시키고 인식할 때에도 같은 개념으로 첫 번째 구간에서의 확률 값이 가장 높은 단어를 인식된 단어로 선택한다. 인식 대상 어휘로는 전철역명을 선택하였으며, 특징 파라메타로는 LPC ?스트럼을 사용하였다. 제안된 방법에 의한 인식 실험을 수행하는 것 이외에도 비교를 위하여 이전에 실험한 몇 가지 방법의 인식 실험을 같은 조건하에서 같은 데이터로 수행한다. 실험 결과, 본 연구에서 제안한 FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 방법이 다른 음성 인식방법들보다 인식률이 우수함을 입증하였다.

다차원 신호공간 분할을 이용한 데이터 복원 (Data Retrieval by Multi-Dimensional Signal Space Partitioning)

  • 전태현
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.674-677
    • /
    • 2004
  • 본 논문에서는 심볼간의 간섭이 존재하는 채널에서 고정 지연 값을 가지는 트리검색 신호검출기의 효율적인 구성방법을 다룬다. 이 접근방법은 효율적인 다차원 신호공간 분할에 기반을 두고 있다 다차원 공간에서의 Voronoi 다이어그램 (VoD)과 Delaunay 분할 (DT)이 신호검출 알고리즘의 구현에 적용된다 제안된 방식에서는 VOD/DT에 포함되어 있는 기하학적인 정보를 활용하여 관찰된 순차적인 신호의 상대적인 위치가 결정되며 이러한 방식이 구현치 복잡도를 감소시키는 장점이 있음을 보인다. 구체적인 구성 절차가 심볼간의 간섭이 존재하는 통신채널에서의 예를 가지고 논의되며 시뮬레이션 결과가 논의된다.

Fuzzy를 이용한 VQ/NN에 기초를 둔 음성 인식 (Speech Recognition Based on VQ/NN using Fuzzy)

  • 안태옥
    • 한국음향학회지
    • /
    • 제15권6호
    • /
    • pp.5-11
    • /
    • 1996
  • 본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, fuzzy개념를 이용한 VQ(Vector Quantization)/NN(Neural Network)에 의한 음성 인식 방법을 제안한다. 이 방법은 fuzzy를 이용하여 VQ codebook에 의해 다중 관측열(multi-observation sequence)을 구해 각 symbol이 데이타로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상어로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 음성 데이터베이스를 이용하여 fuzzy를 이용하지 않은 VQ/NN과 fuzzy를 이용한 VQ/HMM(hidden Markov model)에 의한 인식률과 비교 실험한다. 실험 결과에 의하며, VQ/NN에 의한 인식률은 92.3%이며, fuzzy를 이용한 VQ/HMM에 의한 인식률은 93.8%이고, fuzzy를 이용한 VQ/Nn에 의한 인식률은 95.7%이다. 그러므로, 본 연구의 fuzzy를 이용한 VQ/NN이 학습 능력이 뛰어난 관계로 fuzzy를 이용한 VQ/HMM과 일반적인 VQ/NN 보다 인식률이 향상됨을 보여준다.

  • PDF

Cytospora elaeagnicola sp. nov. Associated with Narrow-leaved Oleaster Canker Disease in China

  • Zhang, Linxuan;Alvarez, Lourdes V.;Bonthond, Guido;Tian, Chengming;Fan, Xinlei
    • Mycobiology
    • /
    • 제47권3호
    • /
    • pp.319-328
    • /
    • 2019
  • Cytospora is a genus including important phytopathogens causing severe dieback and canker diseases distributed worldwide with a wide host range. However, identification of Cytospora species is difficult since the currently available DNA sequence data are insufficient. Aside the limited availability of ex-type sequence data, most of the genetic work is only based on the ITS region DNA marker which lacks the resolution to delineate to the species level in Cytospora. In this study, three fresh strains were isolated from the symptomatic branches of Elaeagnus angustifolia in Xinjiang Uygur Autonomous Region, China. Morphological observation and multi-locus phylogenetic analyses (ITS, LSU, ACT and RPB2) support these specimens are best accommodated as a distinct novel species of Cytospora. Cytospora elaeagnicola sp. nov. is introduced, having discoid, nearly flat, pycnidial conidiomata with hyaline, allantoid conidia, and differs from its relatives genetically and by host association.

Variable Blue Stragglers in the Metal-Poor Globular Clusters in the Large Magellanic Cloud - Hodge 11 and NGC1466

  • Yang, Soung-Chul;Bhardwaj, Anupam
    • 천문학회보
    • /
    • 제46권1호
    • /
    • pp.35.2-35.2
    • /
    • 2021
  • Blue straggler stars (BSs) are "rejuvenated" main sequence stars first recognized by Allan Sandage from his observation of the prominent northern globular cluster M3 in the year of 1953. BSs are now known to be present in diverse stellar environments including open clusters, globular clusters, dwarf galaxies, and even the field populations of the Milky Way. This makes them a very useful tool in a wide range of astrophysical applications: Particularly BSs are considered to have a crucial role in the evolution of stellar clusters because they affect on the dynamics, the binary population, and the history of the stellar evolution of the cluster they belong to. Here we report a part of the preliminary results from our ongoing research on the BSs in the two metal-poor globular clusters (GCs) in the Large Magellanic Cloud (LMC), Hodge 11 and NGC1466. Using the high precision multi-band images obtained with the Advanced Camera for Survey (ACS) onboard the Hubble Space Telescope (HST), we extract time-series photometry to search for the signal of periodic variations in the luminosity of the BSs. Our preliminary results confirm that several BSs are intrinsic "short period (0.05 < P < 0.25 days)" variable stars with either pulsating or eclipsing types. We will discuss our investigation on the properties of those variable BS candidates in the context of the formation channels of these exotic main sequence stars, and their roles in the dynamical evolution of the host star clusters.

  • PDF

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 김동수;남기환;한준희;배철수;나상동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.181-185
    • /
    • 1998
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 독순(lipreading)을 PC에서 구현하고자 한다. 간 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 독순(lipreading)을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식 단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의한다. 인식은 다차원(multi-dimensional), 다단계 라벨링 방법을 사용하여 3차원 특징벡터를 입력으로 한 이산 HMM을 사용하였다.

  • PDF