• 제목/요약/키워드: 음소

검색결과 529건 처리시간 0.027초

한글 음소 단위 딥러닝 모형을 이용한 감성분석 (Sentiment Analysis Using Deep Learning Model based on Phoneme-level Korean)

  • 이재준;권순범;안성만
    • 한국IT서비스학회지
    • /
    • 제17권1호
    • /
    • pp.79-89
    • /
    • 2018
  • Sentiment analysis is a technique of text mining that extracts feelings of the person who wrote the sentence like movie review. The preliminary researches of sentiment analysis identify sentiments by using the dictionary which contains negative and positive words collected in advance. As researches on deep learning are actively carried out, sentiment analysis using deep learning model with morpheme or word unit has been done. However, this model has disadvantages in that the word dictionary varies according to the domain and the number of morphemes or words gets relatively larger than that of phonemes. Therefore, the size of the dictionary becomes large and the complexity of the model increases accordingly. We construct a sentiment analysis model using recurrent neural network by dividing input data into phoneme-level which is smaller than morpheme-level. To verify the performance, we use 30,000 movie reviews from the Korean biggest portal, Naver. Morpheme-level sentiment analysis model is also implemented and compared. As a result, the phoneme-level sentiment analysis model is superior to that of the morpheme-level, and in particular, the phoneme-level model using LSTM performs better than that of using GRU model. It is expected that Korean text processing based on a phoneme-level model can be applied to various text mining and language models.

Harmonic 분산값 최소화 알고리즘에 의한 주파수 영역 평탄화 기법 (The Technique of Spectrum Flattening by Algorithm for Minimized Harmonics Variance Value)

  • 민소연;김영규
    • 한국산학기술학회논문지
    • /
    • 제11권9호
    • /
    • pp.3558-3562
    • /
    • 2010
  • 음성신호처리 분야에 있어서 정확한 기본주파수(피치)를 검출하는 것은 매우 중요하다. 그러나 포만트의 영향과 천이 진폭의 영향으로 인하여 음성신호로부터 정확한 피치를 검출하는 것은 매우 어렵다. 따라서 본 논문에서는 음소의 천이나 변동의 영향이 적은 주파수 영역에서의 하모닉스 분산값 최소화 알고리즘을 통해 스펙트럼을 평탄화 하여 피치를 검출하는 방법에 대하여 연구하였다. 실험결과에서는 제안한 방법이 기존의 방법인 LPC법, 켑스트럼법과 비교하여 평탄화 특성이 어느 정도의 우수성을 보이는지를 평가하였다. 또한 각각의 방법을 적용하여 기본주파수를 검출한 결과를 비교함으로써 제안한 방법이 우수함을 입증하였다.

이야기배열그림 발화분석을 통해 살펴본 초피질감각실어증환자 치료경과 1례(例) (A Case of Transcortical Sensory Aphasia Assessed with Analysing the Patient's Speech at the Series of Pictures)

  • 유경;김락형;정은희
    • 동의신경정신과학회지
    • /
    • 제16권2호
    • /
    • pp.251-257
    • /
    • 2005
  • 본 증례의 뇌경색 초피질감각실어증 환자는 한양방 치료 및 언어치료 시행을 통하여 K-WAB, K-BNT 등 표준화된 실어증 검사의 수행능력의 향상을 보였으며, 이야기 배열 과제에 대한 발화 분석에서 주제진술률의 향상, 의미착어와 음소착어의 감소 등 실제적 담화능력의 향상을 나타내었다. 실어증 환자의 경과관찰에서 이야기배열그림이 활용이 유용하리라 사료된다. 이후, 한방치료의 효과를 검증 및 이야기 배열과제 발화분석의 유용성에 대한 확대된 연구가 필요하다.

  • PDF

통계적 방법과 인지실험을 통한 한국어 초성파열음의 음소단위 분석에 관한 연구 (A Study on the Phoneme Based Analysis of Korean Initial Plosives Using Statistical Method and Perception Tests)

  • 조철우;이우선;이규호;김종안;임광일;이태원
    • 한국음향학회지
    • /
    • 제8권5호
    • /
    • pp.78-85
    • /
    • 1989
  • 본 논문에서는 한국어의 규칙합성에 관한 연구중 파열음의 함성 파라미터를 추정하기 위하여 사용한 통계적 방법과 인지실험에 의한 방법에 관하여 기술하고 있다. 합성기로는 직렬 포만트 합성기를 구성하여 사용하였고 통제적 분석에 사용된 음성시료는 9개의 초성 파열음과 8개의 모음으로 구성되는 72개의 독립 CV형태를 갖는 단음절을 만일 화자를 통하여 수집하였다. 음성의 분석은 시간 및 주파수 평면에서 파라미터의 변화를 중심으로 행하였으며, 인지실험을 통한 파라미터 추정방법을 통하여 독립적으로 포만트 파라미터의 변화에 관하여 조사하였다.

  • PDF

유ㆍ무성음 척도를 포함한 재구성 특징 파라미터의 음성 인식 성능평가 (Performance Evaluation of Speech Recognition Using the Reconstructed Feature Parameter with Voiced-Unvoiced Measure)

  • 이광석;한학용;고시영;허강인
    • 한국정보통신학회논문지
    • /
    • 제7권2호
    • /
    • pp.177-182
    • /
    • 2003
  • 본 연구는 유사음에 강인한 음성인식을 위하여 음성의 유ㆍ무성음 척도를 특징 파라미터에 추가 구성하여 음절과 음소단위의 음성인식을 행하였다. 이를 위하여 피치검출에 이용되는 알고리듬인 HPS(Harmonic Product Spectrum)의 스펙트럼 정보를 이용하여 유ㆍ무성음의 정도를 나타내는 척도를 제안한다. 제안된 척도는 HPS의 첨도와 피크의 개수 그리고 높이척도이다. 이들 척도 값을 포함하여 특징 파라미터를 재구성하고 제안된 특징의 유효성을 검증하기 위하여 CVC형 유사 음절 DB하에서 기존 특징 파라미터와 비교하여 음성인식 실험을 행하였다.

대용량 음성인식을 위한 인식기간 감축 알고리즘 (A Recognition Time Reduction Algorithm for Large-Vocabulary Speech Recognition)

  • 구준모;은종관
    • 한국음향학회지
    • /
    • 제10권3호
    • /
    • pp.31-36
    • /
    • 1991
  • 본 논문에서는 대용량 음성인식 시스템의 인식시간을 감축하기 위하여 후보단어를 선정하는 효과적인 방법을 제안하고 이 방법의 성능을 향상시키기 위하여 spectral smoothing과 temporal smoothing을 사용하는 것에 관하여 연구하였다. 제안된 방법은 사전내의 각 단어에 대하여 음성인식 단위의 음성 spectrum관찰확률과 길이정보를 이용하여 대강의 관찰확률을 계산하여 후보단어를 선정한다. 제안된 방법을 음소단위의 HMM을 이용하는 1160단어 인식 시스템에 적용한 결과, 전체 계산량의 74% 가량을 감축할 수 있었으며 이때 인식율의 감소는 매우 작았다. 또한 제안된 대감의 likelihood점수 계산방법은 Viterbi방법에 의하여 계산되는 likelihood 점수를 잘 추정함을 알 수 있었다.

  • PDF

음소대조 검사방법을 이용한 마비말장애인의 말소리 명료도 특성 (The Speech Characteristics of Korean Dysarthria: An Experimental Study with the Use of a Phonetic Contrast Intelligibility Test)

  • Kim Soo Jin;Kim Young Tae;Kim Gi Na
    • The Journal of the Acoustical Society of Korea
    • /
    • 제24권1E호
    • /
    • pp.28-33
    • /
    • 2005
  • This study was designed to suggest an assessment tool for analyzing the characteristics of Korean phonetic contrast intelligibility among dysarthric individuals. The intelligibility deficit factors of phonetic contrast in Korean dysarthric patients were analyzed through stepwise regression analysis. The 19 acoustic-phonetic contrasts proposed by Kent et al. (1999) have been claimed to be useful for clinical assessment and research on dysarthria. However, the test cannot be directly applied to Korean patients due to linguistic differences between English and Korean. Thus, it is necessary to devise a Korean word intelligibility test that reflects the distinct characteristics of the Korean language. To identify the speech error characteristics of a Korean dysarthric group, a Korean word list was audio-recorded by 3 spastic, 4 flaccid, and 5 mixed type of dysarthric patients. The word list consisted of monosyllabic consonant-vowel-consonant (CVC) real word pairs. Stimulus words included 41 phonemic contrast pairs and six triplets. The results showed that the percentage of errors in final position contrast was higher than in any other position. Unlike the results of previous studies, the initial-position contrasts were crucial in predicting the overall intelligibility among Korean patients.

연결 단어 음성 인식기 학습용 음성DB 녹음을 위한 최적의 대본 작성 알고리즘 (The Optimal and Complete Prompts Lists Generation Algorithm for Connected Spoken Word Speech Corpus)

  • 유하진
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.187-191
    • /
    • 2004
  • 연결 단어 인식기, 특히 연결 숫자음 인식기를 제작하기 위한 음성 데이터베이스를 구축하는데 있어서 완전하고 효율적인 발성목록을 작성하기 위한 알고리즘을 제안한다. 기존의 음성 DB에서 사용되는 목록은 주로 난수 발생기에 의하여 만들어지거나 사용자의 전화번호, 우편번호 등을 이용하여 만들어져 왔으므로 다양한 환경의 음소 또는 단어를 균일하게 포함하고 있지 못하다. 따라서 본 논문에서는 하나의 단어에 대하여 전후에 모든 단어가 연결되는 조합을 모두 한번씩 포함하는 목록을 만드는 효율적인 알고리즘을 제안한다. 본 알고리즘으로 7연 숫자 목록을 만들면 200개의 문장으로 모든 조합을 포함할 수 있게 된다. 본 논문에서는 알고리즘 예제와 본 알고리즘의 완전성과 효율성에 대하여 기술하였다.

MLLR 화자적응 기법을 이용한 새로운 화자확인 디코딩 알고리듬 (A Noble Decoding Algorithm Using MLLR Adaptation for Speaker Verification)

  • 김강열;김지운;정재호
    • 한국음향학회지
    • /
    • 제21권2호
    • /
    • pp.190-198
    • /
    • 2002
  • 화자확인에서 사용되는 디코딩 방법에는 음성인식에서 주로 사용되는 비터비 알고리듬을 사용하여 왔다. 그러나 화자확인에서는 화자의 특성을 최대한 발휘하여 같은 음소라도 화자마다 다르게 인식해야 하는 어려움이 있다. 본 논문에서는 기존 화자확인 디코딩에서 사용하는 비터비 알고리듬을 대신하는 새로운 알고리듬을 제안하였다. 제안된 알고리듬은 음성인식에서 사용되고 있는화자 적응 알고리듬을 화자의 특성에 따라 모델 파라미터로 변환하는 것을 응용한 방법이다. 본 논문에서는 여러 적응 알고리듬중 MLLR(Maximum Likelihood Linear Regression)과 MAP (Maximum A-Posterior) 적응 알고리듬을 사용하였고 제안된 알고리듬이 기존의 비터비 알고리듬을 사용하였을 때보다 평균 30%의 EER (Equal Error Rate) 향상을 이루었다.

순환 신경망 모델을 이용한 한국어 음소의 음성인식에 대한 연구 (A Study on the Speech Recognition of Korean Phonemes Using Recurrent Neural Network Models)

  • 김기석;황희영
    • 대한전기학회논문지
    • /
    • 제40권8호
    • /
    • pp.782-791
    • /
    • 1991
  • In the fields of pattern recognition such as speech recognition, several new techniques using Artifical Neural network Models have been proposed and implemented. In particular, the Multilayer Perception Model has been shown to be effective in static speech pattern recognition. But speech has dynamic or temporal characteristics and the most important point in implementing speech recognition systems using Artificial Neural Network Models for continuous speech is the learning of dynamic characteristics and the distributed cues and contextual effects that result from temporal characteristics. But Recurrent Multilayer Perceptron Model is known to be able to learn sequence of pattern. In this paper, the results of applying the Recurrent Model which has possibilities of learning tedmporal characteristics of speech to phoneme recognition is presented. The test data consist of 144 Vowel+ Consonant + Vowel speech chains made up of 4 Korean monothongs and 9 Korean plosive consonants. The input parameters of Artificial Neural Network model used are the FFT coefficients, residual error and zero crossing rates. The Baseline model showed a recognition rate of 91% for volwels and 71% for plosive consonants of one male speaker. We obtained better recognition rates from various other experiments compared to the existing multilayer perceptron model, thus showed the recurrent model to be better suited to speech recognition. And the possibility of using Recurrent Models for speech recognition was experimented by changing the configuration of this baseline model.