• 제목/요약/키워드: recognition unit

검색결과 515건 처리시간 0.022초

한국의 지하철역명을 위한 음소 기반의 음성인식에 관한 연구 (A Study on Speech Recognition based on Phoneme for Korean Subway Station Names)

  • 김범승;김순협
    • 한국철도학회논문집
    • /
    • 제14권3호
    • /
    • pp.228-233
    • /
    • 2011
  • 본 논문에서는 한국의 지하철역명을 위하여 음운론적 특성을 반영한 음소 기반의 음성인식 구현에 관한 방법을 제시하였다. 한국의 지하철역명의 음소 기반의 음성인식을 위하여 사용되는 최적의 유사음소 단위(PLU: Phoneme-Likely Unit)를 선정하기 위하여 네 가지의 Case 별로 PLU set과 음운 현상을 고려한 발음사전을 구성하여 인식률을 평가하였다. 적용된 유사음소 단위의 경우 초성과 종성 자음의 인식 단위 구분 및 음운 현상을 반영한 경우 트라이폰 모델에서 최적의 인식률(97.74%)을 보임을 알 수 있었다.

계층구조 시간지연 신경망을 이용한 한국어 변이음 인식에 관한 연구 (A Study on Korean Allophone Recognition Using Hierarchical Time-Delay Neural Network)

  • 김수일;임해창
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.171-179
    • /
    • 1995
  • In many continuous speech recognition systems, phoneme is used as a basic recognition unit However, the coarticulation generated among neighboring phonemes makes difficult to recognize phonemes consistently. This paper proposes allophone as an alternative recognition unit. We have classified each phoneme into three different allophone groups by the location of phoneme within a syllable. For a recognition algorithm, time-delay neural network(TDNN) has been designed. To recognize all Korean allophones, TDNNs are constructed in modular fashion according to acoustic-phonetic features (e.g. voiced/unvoiced, the location of phoneme within a word). Each TDNN is trained independently, and then they are integrated hierarchically into a whole speech recognition system. In this study, we have experimented Korean plosives with phoneme-based recognition system and allophone-based recognition system. Experimental results show that allophone-based recognition is much less affected by the coarticulation.

  • PDF

다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 (Machine Printed Character Recognition Based on the Combination of Recognition Units Using Multiple Neural Networks)

  • 임길택;김호연;남윤석
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.777-784
    • /
    • 2003
  • 본 논문에서는 다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 방법을 제안한다. 입력 문자영상은 한글 문자 형식 6가지와 한글 이외의 기타 문자 형식의 전체 7가지 형식으로 분류되어 인식된다. 한글 문자는 2단계의 MLP 신경망 인식기에 의해 인식된다. 첫째 단계에서는 한글 문자를 자소의 조합 형태에 따라 2개 또는 3개의 인식단위로 나누고, 각 인식단위에서 추출된 방향각도 특징 벡터를 입력으로 하는 MLP 신경망으로 1차 인식한다. 둘째 단계에서는 첫째 단계의 인식단위별 MLP 신경망 인식기의 인식양상 특징을 추출하고 다른 MLP 신경망에 입력하여 최종 한글 문자인식을 한다. 한글 이외의 기타 문자의 인식을 위해서는 단일 MLP 신경망을 사용한다. 인식 실험에서는 실제 우편물 50,000통 영상으로부터 추출한 문자영상 데이터베이스를 이용하였는데, 실험 결과 본 논문에서 제안한 방법이 매우 우수함을 알 수 있었다.

IMU센서를 이용한 실내 위치 인식 교육용 장비 및 응용 (Education Equipment and Its Application for Indoor Position Recognition Using Inertial Measurement Unit Sensor)

  • 서보인;유윤섭
    • 실천공학교육논문지
    • /
    • 제10권2호
    • /
    • pp.119-124
    • /
    • 2018
  • IMU(Inertial Measurement Unit) 센서의 가속도와 각속도를 이용하여 거리측정을 하고 측정값을 이용하여 사용자가 원하는 실내공간에 적용하여 사용자 혹은 디바이스가 실내공간을 인식하는 교육용 장비를 소개한다. 본 교육장비를 이용해서 다양한 위치 인식 및 추적 알고리즘을 학습할 수 있고 창의적 공학설계 작품을 구현할 수 있다. IMU 센서의 데이터 값을 $I^2C$(Inter-Integrated Circuit)을 통해 MCU(microcontroller unit)에 전송하고 필터와 연산방식을 통해 데이터 값을 처리 후 실내 위치 인식 알고리즘을 통해 위치인식을 한다. 그리고 무선통신을 이용하여 처리된 값을 송수신하여 사용자가 인식하도록 설계한다. 본 교육 장비를 이용하여 "IMU센서를 이용하여 이동거리를 산출과 데이터 값을 이용한 가상공간 구현 및 인식"의 사례를 소개하고 그 설계를 기반하여 다양한 창의적 공학설계 적용에 대해서 논한다.

심해저용 원격 착탈 시스템 제어를 위한 수중음향신호 인식 알고리즘의 개발 (A Development of Underwater Sound Signal Recognition Algorithm for Acoustic Releaser in the Seafloor)

  • 김영진;우종식;조영준;허경무
    • 제어로봇시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.421-427
    • /
    • 2004
  • In order to exploit underwater resources successfully, the first step would be a marine environmental research and exploration in the seafloor. Generally one sets up a long-term underwater experimental unit in the seafloor and retrieves the unit later after a certain period time. Essential to these applications is the reliable teleoperation and telemetering of the unit. In this paper we presents a robust underwater sound recognition algorithm by which we can identify the sound signal without the influence of disturbances due to underwater environmental changes. The proposed method provides a means suitable for the acoustic releaser which requires low power dissipation and long-time underwater operation. We demonstrate its ability of securing stability and fast sound recognition through simulation methods.

반음절기반의 한국어 연속숫자음인식과 그 후처리에 대한 연구 (A Study on Korean Connected Digit Recognizer Based on Semi-syllable and Post-processing)

  • 정재부;정훈;정익주
    • 음성과학
    • /
    • 제8권4호
    • /
    • pp.1-15
    • /
    • 2001
  • This paper describes the effect of new recognition unit, a unit based on semisyllable, and its post processing method. A recognition unit based on semi-syllable expresses Korean connected digit's coarticulation effect. An existing method using semi-syllable limits next models, derived from current recognized models, to make complete connected digit sequence. However, this paper uses a new method to make complete connected digit sequence. The new post-processing method recognizes isolated digit words which include digits sequence from the digit combinations being able to occur from current recognized semi-syllable sequence. This method gives an improved accuracy rate than that of existing method. This new post processing provides two advantages. 1) It corrects current mis-recognized semi-syllable unit. 2) When people say each digit, they say it without regard to saying duration.

  • PDF

An Action Unit co-occurrence constraint 3DCNN based Action Unit recognition approach

  • Jia, Xibin;Li, Weiting;Wang, Yuechen;Hong, SungChan;Su, Xing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권3호
    • /
    • pp.924-942
    • /
    • 2020
  • The facial expression is diverse and various among persons due to the impact of the psychology factor. Whilst the facial action is comparatively steady because of the fixedness of the anatomic structure. Therefore, to improve performance of the action unit recognition will facilitate the facial expression recognition and provide profound basis for the mental state analysis, etc. However, it still a challenge job and recognition accuracy rate is limited, because the muscle movements around the face are tiny and the facial actions are not obvious accordingly. Taking account of the moving of muscles impact each other when person express their emotion, we propose to make full use of co-occurrence relationship among action units (AUs) in this paper. Considering the dynamic characteristic of AUs as well, we adopt the 3D Convolutional Neural Network(3DCNN) as base framework and proposed to recognize multiple action units around brows, nose and mouth specially contributing in the emotion expression with putting their co-occurrence relationships as constrain. The experiments have been conducted on a typical public dataset CASME and its variant CASME2 dataset. The experiment results show that our proposed AU co-occurrence constraint 3DCNN based AU recognition approach outperforms current approaches and demonstrate the effectiveness of taking use of AUs relationship in AU recognition.

한국어 음성 인식을 위한 mono-phone 구성의 기초 연구 (The Basic Study on making mono-phone for Korean Speech Recognition)

  • 황영수;송민석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.45-48
    • /
    • 2000
  • In the case of making large vocabulary speech recognition system, it is better to use the segment than the syllable or the word as the recognition unit. In this paper, we study on the basis of making mono-phone for Korean speech recognition. For experiments, we use the speech toolkit of OGI in U.S.A. The result shows that the recognition rate of :he case in which the diphthong is established as a single unit is superior to that of the case in which the diphthong is established as two units, i.e. a glide plus a vowel. And also, the recognition rate by the number of consonants is a little different.

  • PDF

조망 경관에 대한 아파트 거주자들의 인지 특성 (The Tendencies in Apartment Inhabitants' Recognition of Landscape Elements)

  • 이상복;문지원;하재명
    • 한국주거학회:학술대회논문집
    • /
    • 한국주거학회 2006년도 추계학술발표대회 논문집
    • /
    • pp.248-252
    • /
    • 2006
  • This study is intended to understand the intrinsic attributes of the view from the apartment unit in consideration of the diverse and complex elements of the view. To this end, the Questionnaire survey was conducted to identify the tendency in the recognition by apartment dwellers. The Questionnaire survey was conducted for the apartment residents to identify their interest in and the general trend in their recognition of the view from the living rooms of their housing unit, where Questionnaire items regarding landscape elements, the distances to and location of the landscape elements, and floor locations were compiled on the basis of the results from the field survey in the previous study. Consequently, the following results have been derived. 1) Apartment residents recognize not only natural landscape elements but also artificial elements, and prefer natural elements to artificial ones. 2) It is also indicated that they recognize the distances to and locations of landscape elements and that the satisfaction for the distance and location varies depending on the type of the landscape elements. 3) Furthermore, the floor of each unit is shown to result in certain differences in the recognized landscape elements. The cross-analysis between the floor and satisfaction indicates that the higher the floor, the more satisfied the residents are with the view.

  • PDF

한국어 분절음 인식을 위한 인식 단위에 대한 연구 (A Study on Recognition Units for Korean Speech Recognition)

  • 황영수;송민석
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.47-52
    • /
    • 2000
  • 본 연구는 한국어 분절음 인식을 위한 인식단위 설정에 대한 연구이다. 대용량 음성 인식을 수행할 경우, 표준 패턴의 인식 단위를 단어나 음절이 아닌 분절음 단위로 사용하여야 효율적인 음성 인식을 수행할 수 있다. 본 연구는 이와 같은 분절음 인식을 수행하기 위한 연구로서, 인식 단위 설정 변화에 따른 인식 결과를 미국 OGI 연구소의 speech toolkit을 이용하여 검토한다. 인식 단위에 관해서 특히 모음의 경우 철자에 기초한 음소별 인식단위 설정과 현대어 발음에 기초한 인식단위 설정을 비교했으며, 그 결과 발음에 기초해 몇 개의 모음을 통합한 경우가 더 우수한 결과를 보였다. 또한 인식단위의 설정에 있어서 독려된 분절음으로 설정한 경우보다 앞, 뒤의 소리의 상황을 고려한 바이폰(biphone)을 이용할 경우가 5.7%-25.9%의 향상된 인식 결과를 보였다. 인식 방법에 있어서는 HMM 만을 이용한 방법보다 신경회로망과 HMM을 결합한 인식 방법이 6.1%-7.5%의 더 좋은 인식률을 나타내었다.

  • PDF