• 제목/요약/키워드: Korean word recognition

검색결과 515건 처리시간 0.025초

효율적 대화 정보 예측을 위한 개체명 인식 연구 (A Study on Named Entity Recognition for Effective Dialogue Information Prediction)

  • 고명현;김학동;임헌영;이유림;지민규;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.58-66
    • /
    • 2019
  • 대화 문장 내 고유명사와 같은 개체명에 대한 인식 연구는 효율적 대화 정보 예측을 위한 가장 기본적이며 중요한 연구 분야이다. 목적 지향 대화 시스템에서 가장 주요한 부분은 대화 내 객체가 어떤 속성을 가지고 있느냐 하는 것을 인지하는 것이다. 개체명 인식모델은 대화 문장에 대하여 전처리, 단어 임베딩, 예측 단계를 통해 개체명 인식을 진행한다. 본 연구는 효율적인 대화 정보 예측을 위해 전처리 단계에서 사용자 정의 사전을 이용하고 단어 임베딩 단계에서 최적의 파라미터를 발견하는 것을 목표로 한다. 그리고 설계한 개체명 인식 모델을 실험하기 위해 생활 화학제품 분야를 선택하고 관련 도메인 내 목적 지향 대화 시스템에서 적용 할 수 있는 개체명 인식 모델을 구축하였다.

음성인식 시스템에서의 잡음 제거 개선에 관한 연구 (Study of the Noise Processing to Technique Speech Recognition System)

  • 이창윤;이영훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.73-78
    • /
    • 2002
  • 본 논문에서는 음성인식 시스템에서의 잡음 처리 기술로서 SNR정규화와 RAS를 결합한 방법을 사용하여 여러 가지 잡음 처리 방법을 연구하여 인식 시스템의 성능을 개선하였다. 인식 시스템으로는 범용 DSP (TI사의 TM9320C31)가 내장된 모듈을 사용하였다. 실험에 사용된 인식 단어 샘플은 일반 사무 및 컴퓨터의 명령을 위한 60단어이며. 일반환경에서 잡음과 함께 가상의 여러 유색 잡음을 고려하여 샘플된 데이터를 시뮬레이션 하였다. 녹음된 데이터에 대한 컴퓨터 시뮬레이션 상에서 잡음 처리 방법으로 SNR정규화와 스펙트럼 차감법을 결합하여 실험한 경우 최고 94.61%의 높은 인식 성능을 보였다.

  • PDF

가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저 (Voice Command Web Browser Using Variable Vocabulary Word Recognizer)

  • 이항섭
    • 한국음향학회지
    • /
    • 제18권2호
    • /
    • pp.48-52
    • /
    • 1999
  • 본 논문에서는 웹 브라우저 상에서 한국어 음성인식을 이용하여 정보검색을 할 수 있는 가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저에 대하여 기술한다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 링크를 가지는 HyperText Word들과 웹 브라우저 메뉴를 음성으로 인식할 수 있는 것으로, 마우스 click 뿐만이 아니라 음성인식을 이용하여서도 웹 브라우저를 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 문서에서 추출되는 인식 후보들은 각 문서에 따라 고정되지 않고 계속하여 변화하므로, 이러한 가변적인 인식 후보들을 인식하기 위해 가변어휘 단어 인식기를 사용하였다. 가변어휘 단어 인식기는 훈련용 음성 데이터와 무관한 임의의 새로운 어휘를 훈련 없이 인식해 낼 수 있는 인식기로 POW (Phonetically Optimized Words) 3,848 단어를 사용하여 훈련한 결과 32단어에 대해 93.8%의 단어 인식률을 보인다. 음성 명령 웹 브라우저는 Windows 95/NT 환경에서 Netscape Navigator를 사용하여 개발되었으며, 사용자가 음성을 사용하는 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 음성 명령 웹 브라우저는 환경 독립, 화자 독립에 대해 On-line으로 실험한 결과 평균 90%의 인식성능을 보인다.

  • PDF

신경회로망과 Markov 모델을 이용한 한국어 속담 인식에 관한 연구 (A study on the Recognition of Korean Proverb Using Neural Network and Markov Model)

  • 홍기원;김선일;이행세
    • 전자공학회논문지B
    • /
    • 제32B권12호
    • /
    • pp.1663-1669
    • /
    • 1995
  • This paper is a study on the recognition of Korean proverb using neural network and Markov model. The neural network uses, at the stage of training neurons, features such as the rate of zero crossing, short-term energy and PLP-Cepstrum, covering a time of 300ms long. Markov models were generated by the recognized phoneme strings. The recognition of words and proverbs using Markov models have been carried out. Experimental results show that phoneme and word recognition rates are 81. 2%, 94.0% respectively for Korean proverb recognition experiments.

  • PDF

한국어 단독음 인식을 위한 표준패턴 설정에 관한 연구 (A Study on Creating Reference Pattern for Recognition of Korean Isolated Word)

  • 김계국;고덕영;이종악
    • 한국음향학회지
    • /
    • 제6권1호
    • /
    • pp.23-28
    • /
    • 1987
  • 본 연구에서는 집단화 알고리즘을 이용하여 한국어 단독음의 표준 패턴을 설정하였다. Minimax기법을 이용하여 각 단독음에 대하여 최고 3개까지 표준패턴을 설정하여 인식하였다. 특징 파라미터는 선형예측계수와 자기 상관 계수를 이용하였으며 패턴들 간의 유사도 비교는 Itakura가 제안한 거리측정법을 이용하였다. 표준패턴을 1개만 설정하였을 때 $55.9\%$, 2개를 설정했을 때 $76.9\%$, 3개를 설정했을 경우는 $89.5\%$의 인식률을 얻었다.

  • PDF

한국어 시각 단어재인과정에서 음운정보와 표기정보의 역할 (The Effect of the Orthographic and Phonological Priming in Korean Visual Word Recognition)

  • 태진이;이창환;이윤형
    • 인지과학
    • /
    • 제26권1호
    • /
    • pp.1-26
    • /
    • 2015
  • 본 연구의 목적은 한국어 시각 단어 재인과정에서 음운 정보가 주로 사용되는지(음운재부호화 가설) 혹은 표기 정보 중심으로 처리되고 음운 정보가 부수적인 역할을 하는지(이중경로가설)를 살펴보는 것이다. 이를 위하여 본 연구에서는 목표 단어(예: 녹말)와 음운이 완전히 일치하는 형태의 자극(예: 농말), 목표 단어와 첫음절의 음운은 일치하지만 두 번째 음절은 일치하지 않는 자극(예: 농알), 목표 단어와 첫음절의 표기가 일치하는 자극(예: 녹알)을 통제자극(예: 적감)과 비교하였다. 실험 1에서는 비단어 어휘판단과제를 사용하여 비단어 처리 시 음운 정보와 표기 정보의 영향을 살펴보았는데 그 결과 목표단어와 표기가 일치하는 조건은 통제조건에 비해 느린 반응시간과 높은 오류율을 보였지만 음운정보가 일치하는 조건에서는 통제조건에 비해 빠른 반응시간과 낮은 오류율을 보였다. 이러한 결과는 한국어 시각 단어 재인과정에서 표기 정보가 주도적으로 사용되지만, 음운정보도 어휘접근이나 그 이후의 과정에서 사용된다는 것을 시사한다. 실험 2와 실험 3에서는 두 SOA조건(60ms, 150ms)에서 차폐점화실험 패러다임을 사용한 어휘판단과제를 실시하였다. 그 결과 두 실험에서 모두 일음절의 표기정보가 동일한 조건에서만 점화효과가 나타나고 음운이 완전히 일치한 조건과 일음절의 음운정보만 일치한 조건에서는 점화효과가 나타나지 않았다. 이러한 결과는 실험 1과 마찬가지로 한국어 시각 단어 재인 시 표기 정보가 주로 사용되며 음운정보는 부수적인 역할을 한다는 것을 보여준다. 본 연구는 음운재부호화가설에 비해 이중경로 가설이 한글 시각단어재인과정을 설명하기에 더 적합함을 보여주는 경험적 증거라 볼 수 있다.

한국어 시각단어재인에서 나타나는 이웃효과 (The Neighborhood Effect in Korean Visual Word Recognition)

  • 권유안;조혜숙;김충명;남기춘
    • 대한음성학회지:말소리
    • /
    • 제60호
    • /
    • pp.29-45
    • /
    • 2006
  • We investigated whether the first syllable plays an important role in lexical access in Korean visual word recognition. To do so, one lexical decision task (LDT) and two form primed LDT experiments examined the nature of the syllabic neighborhood effect. In Experiment 1, the syllabic neighborhood density and the syllabic neighborhood frequency was manipulated. The results showed that lexical decision latencies were only influenced by the syllabic neighborhood frequency. The purpose of experiment 2 was to confirm the results of experiment 1 with form-primed LDT task. The lexical decision latency was slower in form-related condition compared to form-unrelated condition. The effect of syllabic neighborhood density was significant only in form-related condition. This means that the first syllable plays an important role in the sub-lexical process. In Experiment 3, we conducted another form-primed LDT task manipulating the number of syllabic neighbors in words with higher frequency neighborhood. The interaction of syllabic neighborhood density and form relation was significant. This result confirmed that the words with higher frequency neighborhood are more inhibited by neighbors sharing the first syllable than words with no higher frequency neighborhood in the lexical level. These findings suggest that the first syllable is the unit of neighborhood and the unit of representation in sub-lexical representation is syllable in Korea.

  • PDF

한국어 교재의 행 바꾸기 -띄어쓰기와 읽기 능력의 계발 - (Examining Line-breaks in Korean Language Textbooks: the Promotion of Word Spacing and Reading Skills)

  • 조인정;김단비
    • 한국어교육
    • /
    • 제23권1호
    • /
    • pp.77-100
    • /
    • 2012
  • This study investigates issues in relation to text segmenting, in particular, line breaks in Korean language textbooks. Research on L1 and L2 reading has shown that readers process texts by chunking (grouping words into phrases or meaningful syntactic units) and, therefore, phrase-cued texts are helpful for readers whose syntactic knowledge has not yet been fully developed. In other words, it would be important for language textbooks to avoid awkward syntactic divisions at the end of a line, in particular, those textbooks for beginners and intermediate level learners. According to our analysis of a number of major Korean language textbooks for beginner-level learners, however, many textbooks were found to display line-breaks of awkward syntactic division. Moreover, some textbooks displayed frequent instances where a single word (or eojeol in the case of Korean) is split between different lines. This can hamper not only learners' learning of the rules of spaces between eojeols in Korean, but also learners' development in automatic word recognition, which is an essential part of reading processes. Based on the findings of our textbook analysis and of existing research on reading, this study suggests ways to overcome awkward line-breaks in Korean language textbooks.

백색소음하의 단어재인검사 수행에 따른 자율신경계 스트레스 반응 (AUTONOMIC MECHANISMS OF AN ACUTE STRESS RESPONSE DURING WORD RECOGNITION TASK PERFORMANCE WITH INTENSE NOISE BACKGROUND)

  • 최상섭;이경화;민윤기;;손진훈
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 춘계학술발표논문집 논문집
    • /
    • pp.127-132
    • /
    • 1999
  • Cardiovascular, respiratory and electrodermal responses to acute stress episodes modeled by combined presentation of intense white noise and performance of word recognition task with noise background were studied in 15 college students. Experimental procedure consisted in sessions with white noise, word recognition task presentation with noise background and test with noise background. Recorded physiological variables were analyzed in terms of their sensitivity to detect activation of sympathetic and parasympathetic branches of autonomic nervous system and thus reflect autonomic arousal level during shout-term stress-inducing experimental manipulations. It was shown that performance of effortful mental task with noise background elicited significant physiological responses typical for active coping behavior, namely electrodermal arousal and increased cardiovascular activity. this response profile was more profound as compared to white noise only or attending task in noise background. However, all physiological responses were mostly phasic, without long-term tonic changes, since almost all variables recovered to their initial baseline levels, suggesting that dominant autonomic mechanisms in transient acute stress episodes were of parasympathetic nature (withdrawal in stress with subsequent activation in restoration period), while sympathetic contribution was not long-lasting. Nevertheless, increased number of stressors and their longer exposure may result in higher profile of tonic sympathetic arousal and reduced functional role of vagal mechanisms in autonomic balance regulation.

  • PDF

A Salient Based Bag of Visual Word Model (SBBoVW): Improvements toward Difficult Object Recognition and Object Location in Image Retrieval

  • Mansourian, Leila;Abdullah, Muhamad Taufik;Abdullah, Lilli Nurliyana;Azman, Azreen;Mustaffa, Mas Rina
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권2호
    • /
    • pp.769-786
    • /
    • 2016
  • Object recognition and object location have always drawn much interest. Also, recently various computational models have been designed. One of the big issues in this domain is the lack of an appropriate model for extracting important part of the picture and estimating the object place in the same environments that caused low accuracy. To solve this problem, a new Salient Based Bag of Visual Word (SBBoVW) model for object recognition and object location estimation is presented. Contributions lied in the present study are two-fold. One is to introduce a new approach, which is a Salient Based Bag of Visual Word model (SBBoVW) to recognize difficult objects that have had low accuracy in previous methods. This method integrates SIFT features of the original and salient parts of pictures and fuses them together to generate better codebooks using bag of visual word method. The second contribution is to introduce a new algorithm for finding object place based on the salient map automatically. The performance evaluation on several data sets proves that the new approach outperforms other state-of-the-arts.