• Title/Summary/Keyword: 분절

Search Result 1,037, Processing Time 0.025 seconds

Modeling of Speech Signals Using Segmental-Features (분절 특징을 이용한 음성 신호의 모델링)

  • 윤영선;오영환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.371-373
    • /
    • 2000
  • 본 논문에서는 분절 특징을 모수적 궤적 모델을 이용하여 표현하고, 이 특징을 분절 HMM(segmental HMM)의 입력으로 하는 음성 신호의 모델링 방식을 제안한다. 분절 특징은 음성의 경향을 나타내는 궤적으로 표현되고, 그 궤적은 연속되는 프레임 상에서 전이 정보를 포함하도록 디자인 행렬과 다항식의 회귀 함수를 이용하여 구해진다. 이 궤적을 분절 HMM에 적용하기 위하여, 외적 분절 변이와 내적 분절 변이에 대한 확률 분포 표현을 개선하였다. 제안된 방법의 효과를 살펴보기 위하여 TIMIT 데이터 베이스를 이용하여 실험한 결과, 제안된 분절 특징은 음성 신호의 인접한 프레임간의 상관관계를 표현하는 동적 특징과 같은 효과를 보였으며, 1차 미분계수를 포함하여 분절 특징을 구한 경우에는 기존의 특징 표현보다 좋은 성능을 보였다.

  • PDF

Reduction of Number of Free Parameters in Segmental-feature HMM (분절 특징 HMM의 매개 변수 수의 감소에 관한 연구)

  • 윤영선;오영환
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.7
    • /
    • pp.48-52
    • /
    • 2000
  • 음성 인식에 많이 사용되는 HMM (hidden Markov model)을 개선하기 위하여 분절 특징을 사용한 분절 특징 HMM은 성능이 우수하다고 발표되었다. 그러나, 분절 길이가 증가하고 회귀 차수가 놓아질수록 분절 특징 HMM을 표현하는 매개 변수의 수도 같이 증가된다. 따라서, 본 연구에서는 상태에서 관측 가능한 분절의 분산을 분절 내의 모든 프레임에 대하여 공통적으로 표현하는 고정 분산 방법을 통하여 성능의 저하 없이 매개 변수의 수를 줄이도록 시도하였다. 실험 결과, 두 혼합 밀도인 경우 고정 분산을 이용한 분절 특징 HMM의 성능과 시변 분산을 이용한 성능의 차이가 거의 없어, 제안된 방법의 유효성을 입증하였다.

  • PDF

English Phoneme Recognition using Segmental-Feature HMM (분절 특징 HMM을 이용한 영어 음소 인식)

  • Yun, Young-Sun
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.3
    • /
    • pp.167-179
    • /
    • 2002
  • In this paper, we propose a new acoustic model for characterizing segmental features and an algorithm based upon a general framework of hidden Markov models (HMMs) in order to compensate the weakness of HMM assumptions. The segmental features are represented as a trajectory of observed vector sequences by a polynomial regression function because the single frame feature cannot represent the temporal dynamics of speech signals effectively. To apply the segmental features to pattern classification, we adopted segmental HMM(SHMM) which is known as the effective method to represent the trend of speech signals. SHMM separates observation probability of the given state into extra- and intra-segmental variations that show the long-term and short-term variabilities, respectively. To consider the segmental characteristics in acoustic model, we present segmental-feature HMM(SFHMM) by modifying the SHMM. The SFHMM therefore represents the external- and internal-variation as the observation probability of the trajectory in a given state and trajectory estimation error for the given segment, respectively. We conducted several experiments on the TIMIT database to establish the effectiveness of the proposed method and the characteristics of the segmental features. From the experimental results, we conclude that the proposed method is valuable, if its number of parameters is greater than that of conventional HMM, in the flexible and informative feature representation and the performance improvement.

The effect of binocular disparity on neon color spreading (양안 부등 정보가 네온 색 확산에 미치는 효과)

  • Jung, Woo-Hyun;Cha, Han-Nim
    • Korean Journal of Cognitive Science
    • /
    • v.22 no.3
    • /
    • pp.235-254
    • /
    • 2011
  • Two experiments were conducted to investigate the impact of binocular disparity information on Neon color spreading (NCS). The stimuli was the modification of Ehrenstein figure used by Redies and Spillmann(1981); inner and outer segments were achromatic and middle segments was chromatic. In experiment 1, the effect of binocular disparity was tested in each segment that were divided inner, middle and outer segments. In experiment 2, the impact of added segments that were put in different depth place were tested. The results showed that the segments on same place were, the clearer the NCS was. Consistent with the previous studies, the effect of color segment in front or in behind was not appeared. The case of added segments, regardless of added segments were placed either front or behind, the NCS was reduced. But the effect of added outer segments was more affect then added inner segments. This results were suggested that NCS could be affected by depth information but more affected by stage of before depth processing.

  • PDF

An Effective Segmentation Scheme for Korean Sentence Classification tasks (한국어 문장 분류 태스크에서의 효과적 분절 전략)

  • Kim, Jin-Sung;Kim, Gyeong-Min;Son, Junyoung;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.173-177
    • /
    • 2021
  • 분절을 통한 양질의 입력 자질을 구성하는 것은 언어모델의 문장에 대한 이해도를 높이기 위한 필수적인 단계이다. 분절은 문장의 의미를 이해하는 데 있어 중요한 역할을 하기 때문이다. 따라서, 한국어 문장 분류 태스크를 수행함에 있어 한국어의 특징에 맞는 분절 기법을 선택하는 것은 필수적이다. 명확한 판단 기준 마련을 위해, 우리는 한국어 문장 분류 태스크에서 가장 효과적인 분절 기법이 무엇인지 감성 분석, 자연어 추론, 텍스트 간 의미적 유사성 판단 태스크를 통해 검증한다. 이 때 비교할 분절 기법의 유형 분류 기준은 언어학적 단위에 따라 어절, 형태소, 음절, 자모 네 가지로 설정하며, 분절 기법 외의 다른 실험 환경들은 동일하게 설정하여 분절 기법이 문장 분류 성능에 미치는 영향만을 측정하도록 한다. 실험 결과에 따르면 자모 단위의 분절 기법을 적용한 모델이 평균적으로 가장 높은 성능을 보여주며, 반복 실험 간 편차가 적어 일관적인 성능 결과를 기록함을 확인할 수 있다.

  • PDF

A Study on Trend Sharing in Segmental-feature HMM (분절 특징 은닉 마코프 모델에서의 경향 공유에 관한 연구)

  • 윤영선
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.7
    • /
    • pp.641-647
    • /
    • 2002
  • In this paper, we propose the reduction method of the number of parameters in the segmental-feature HMM using trend quantization method. The proposed method shares the trend information of the polynomial trajectories by quantization. The trajectory is obtained by the sequence of feature vectors of speech signals and can be divided by trend and location information. The trend indicates the variation of consequent frame features, while the location points to the positional difference of the trajectories. Since the trend occupies the large portion of SFHMM, if the trend is shared, the number of parameters maybe decreases. To exploit the proposed system the experiments are performed on TIMIT corpus. The experimental results show that the performance of the proposed system is roughly similar to that of previous system. Therefore, the proposed system can be considered one of parameter reduction method.

Sensitivity of Marker Set and Knee Joint Centre on Knee Angles during Cutting Movement (방향 전환 달리기 동작시 마커 정의에 따른 슬관절각 비교)

  • Park, Sang-Kyoon;Lee, Joong-Sook
    • Korean Journal of Applied Biomechanics
    • /
    • v.16 no.3
    • /
    • pp.19-31
    • /
    • 2006
  • 이 연구의 목적은 각 분절의 마커세트와 무릎관절 중심 정의가 3차원 무릎 관절각을 산출하는데 얼마나 민감하게 영향을 미치는지를 연구하였다. 자료수집은 1명을 실험대상자로 하여 두 가지 형태의 각기 다른 분절의 정의와 무릎관절의 중심을 나타내는 반사마커들을 동시에 오른쪽 하지에 부착시켜 실험을 실시하였다. 실험대상자의 달리기동작 중 좌측으로 45도 방향전환동작의 지지기를 분석하였다. 이를 위해서 8대의 고속카메라들을 이용하였고 달리기속도는 4m/$sec{\pm}(10%)$로 통제하였다. 하지분절의 발분절에는 하나의 마커세트를, 정강이와 대퇴분절에는 두 가지의 다른 마커세트들을 부착시켰다. 발분절에는 3개의 마커를 신발의 뒷부분에 부착하였고 정강이분절을 정의하기 위하여 첫 번째 마커세트는 경골을 중심으로 3개의 마커들을 두 번째 마커세트는 비골을 중심으로 3개의 마커를 부착하였다. 대퇴분절의 마커세트를 정의하기 위하여 첫 번째 마커세트에는 대퇴골을 중심으로 3개의 마커를 두 번째 마커세트에는 대퇴근육을 중심으로 3개의 마커들을 부착하였다. 무릎관절중심을 정의하는데 두 가지 다른 정의가 적용되었다. 첫 번째 무릎중심을 무릎의 내측과 외측의 마커들을 통해 두 마커의 중심을 무릎관절의 중심으로 정의하였다. 두 번째 무릎중심정의는 무릎의 외측부분과 슬개골의 중심에 부착된 마커들로부터의 교차점을 무릎관절중심으로 산출하였다. 무릎관절의 각도를 산출하기 위해서 JCS(Joint Coordinate System)의 정의가 적용되었고 연구의 결과는 다음과 같았다. 두 가지의 다른 분절마커세트 사이에서 무릎의 신전(extension)과 굴곡(flexion)은 유사한 형태를 나타냈으며 최대 무릎굴곡(peak knee flexion)각에서 $4.746^{\circ}$의 차이를 나타냈다. 다른 분절마커세트 사이의 회전(rotation)각과 내전(adduction)/외전(abduction)에서는 서로 다른 형태를 나타내었고, 두 마커세트간 최대무릎외측회전(peak knee external rotation)각도에서는 $15.628^{\circ}$의 차이를 나타냈다. 또한, 각 분절마커세트 내에서 두 가지의 다른 무릎관절 중심의 정의가 얼마나 무릎도 산출에 영향을 미치는지를 비교했을 때 무릎의 최대외측회전(peak external rotation)각에서 차이를 나타내었다. 첫 번째 분절마커세트의 무릎관절중심정의의 형태변화에 따라 최대외측회전각은 $0.549^{\circ}$의 차이를 나타냈고, 두 번째 분절마커 세트에서 무릎관절중심정의의 형태변화에 따라 최대외측회전각은 $0.309^{\circ}$의 차이를 나타냈다. 이와 같이 분절을 나타내는 마커세트와 무릎관절중심정의의 형태변화에 따라 무릎간을 계산하는데 있어서 결과가 다르게 산출되었다. 즉, 관절각의 계산이 분절에 부착되는 마커의 정의 혹은 위치에 매우 민감하게 영향을 받았다. 따라서 연구자가 여러 실험대상자들을 대상으로 실험시 마커세트 혹은 마커들을 동일한 위치에 가깝게 부착하는 것이 마커부착으로부터 발생하는 실험오차를 줄일 수 있을 것이다.

Nonparametric Bayesian Approach for Multichannel based Semantic Segmentation of TV Dramas (멀티채널 기반 드라마 동영상 의미 분절화를 위한 비모수 베이지안 방법)

  • Seok, Ho-Sik;Lee, Ba-Do;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.474-476
    • /
    • 2012
  • 본 논문에서는 드라마 동영상의 의미 분절화(Semantic segmentation)를 위한 멀티 채널 기반 비모수적 베이지만 방법론을 소개한다. 기존 방법론은 매우 한정적인 특징만을 이용하여 분절화를 시도하거나 이미지 채널이나 오디오 채널과 같은 단일 채널에서만 유효한 방법론을 이용하여 데이터 분석을 시도하였기에, TV 드라마와 같이 예측할 수 없는 변화를 보여주는 스트림 데이터에 적용하기에는 어려움이 많았다. 이와 같은 단점을 극복하기 위해 우리는 주어진 동영상을 단일 모달리티의 채널로 분할한 후 각 채널 별로 분절화를 시도하고 각 채널의 분절 결과를 동적으로 결합하여 주어진 동영상에서의 의미 분절화를 근사하는 방법을 개발하였다. 제안 방법은 실제 TV 동영상의 의미 분절화에 적용되었으며 인간 평가자에 의한 의미 변화 구간과의 비교를 통해 그 성능을 확인하였다.

Segmentation Methods for Different Speech Rate in Simultaneous Interpretation (발화자별 발화 속도를 고려한 실시간 동시통역 분절 방법론)

  • Koo, Youngeun;Kim, Jiyoun;Hong, Jungpyo;Hong, Munpyo;Choi, Sung-Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.369-374
    • /
    • 2020
  • 동시통역은 원천텍스트의 의미를 잘 전달하는 것 뿐만 아니라, 순차통역이나 번역과 달리, 지연 시간없이 즉각적으로 번역하는 것이 매우 중요하다. 따라서 적절한 길이의 지점에서 원천텍스트를 분절해야 한다. 그러나 발화자마다 발화 속도가 서로 다르며, 이 발화 속도는 전체 발화에서 늘 일정하지 않기 때문에, 분절단위의 적절한 길이를 설정하는 것은 상당히 어려운 과제이다. 본 연구에서는 발화자마다 발화 속도가 다른 상황과 발화가 진행되는 동안 실시간으로 발화 속도가 변화하는 상황에 적응 가능한 동시통역 분절 방법론(개인화 기법)을 제안한다. 이를 위해 본 논문에서는 먼저 동시통역 데이터를 이용하여 기준 발화 속도를 설정하였다. 그 다음 이를 원천 발화의 현재 속도와 비교하여 실시간으로 해당 발화자에게 있어 최적의 분절길이가 얼마인지 계산한다. 제안한 개인화 기법의 효력을 검증하기 위해 실험을 진행하였고, 그 결과 개인화를 적용하면 분절 성능이 높아졌다.

  • PDF

The Postprocessor of Automatic Segmentation for Synthesis Unit Generation (합성단위 자동생성을 위한 자동 음소 분할기 후처리에 대한 연구)

  • 박은영;김상훈;정재호
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.7
    • /
    • pp.50-56
    • /
    • 1998
  • 본 논문은 자동 음소 분할기의 음소 경계 오류를 보상하기 위한 후처리 (Postprocessing)에 관한 연구이다. 이는 현재 음성 합성을 위한 음성/언어학적 연구, 운율 모델링, 합성단위 자동 생성 연구 등에 대량의 음소 단위 분절과 음소 레이블링된 데이터의 필요성에 따른 연구의 일환이다. 특히 수작업에 의한 분절 및 레이블링은 일관성의 유지가 어렵고 긴 시간이 소요되므로 자동 분절 기술이 더욱 중요시 되고 있다. 따라서, 본 논문은 자동 분절 경계의 오류 범위를 줄일 수 있는 후처리기를 제안하여 자동 분절 결과를 직접 합성 단위로 사용할 수 있고 대량의 합성용 운율 데이터 베이스 구축에 유용함을 기술한다. 제안된 후처리기는 수작업으로 조정된 데이터의 특징 벡터를 다층 신경회로망 (MLP:Multi-layer perceptron)을 통해 학습을 한 후, ETRI(Electronics and Telecommunication Research Institute)에서 개발된 음성 언어 번역 시스템을 이용한 자동 분절 결과와 후처리기인 MLP를 이용하여 새로운 음소 경계를 추출한다. 고립단어로 발성된 합성 데이터베이스에서 후처리기로 보정된 분절 결과는 음성 언어 번역 시스템의 분할율보 다 약 25%의 향상된 성능을 보였으며, 절대 오류(|Hand label position-Auto label position |)는 약 39%가 향상되었다. 이는 MLP를 이용한 후처리기로 자동 분절 오류의 범위를 줄 일 수 있고, 대량의 합성용 운율 데이터 베이스 구축 및 합성 단위의 자동생성에 이용될 수 있음을 보이는 것이다.

  • PDF