• 제목/요약/키워드: Recognition Unit

검색결과 513건 처리시간 0.021초

운율구 단위의 연속음 인식 (The Continuous Speech Recognition with Prosodic Phrase Unit)

  • 강지영;엄기완;김진영;최승호
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.9-16
    • /
    • 1999
  • 일반적으로 사람은 말을 할 때 어절들은 몇몇의 구로 그룹핑하여 발음함으로써 발화한다. 이것은 듣는 사람으로 하여금 발화의 의미와 의도를 잘 파악하도록 도와준다. 특히, 이러한 목적으로 발화자는 무의식적으로 운율정보(억양, 장단, 리듬 등)를 적절히 사용하게 된다. 본 논문에서는 발화된 문장에서 운율경계를 인식의 단위로 하는 음성인식방법에 대하여 제안한다. 즉, 발화된 문장을 운율구단위로 나누는 방법을 제안하고 나누어진 단위에 따라 연속음 인식실험을 수행하였다. 인식실험결과 연속음인식 시간의 감소를 관찰할 수 있었으며, 물론 음성인식률도 20-10%정도 증가하였다.

  • PDF

분리수거를 위한 페트병 분리시스템의 구현 (Implementation of Plastic Bottle Classification System for Recycling)

  • 박용하;박지훈;정호영;이주상;이중엽
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.365-368
    • /
    • 2021
  • 본 연구에서는 적외선 센서를 이용한 페트병 분리수거 시스템을 구현하였다. 제안된 시스템은 인식부, 제어부, 알람부 및 구동부로 구성된다. 인식부는 페트병을 감지해 페트병과 센서와의 거리를 측정하고 값을 추출하고 추출된 값을 표준 범위와 비교하여 값이 표준 범위를 벗어날 경우에는 제어값을 제어부에 전송하고, 특정범위를 넘어간 경우 라벨 혹은 뚜껑의 유무결과를 제어부에 전송한다. 제어부에서는 센서부로부터 전송받은 결과값에 따라서 수거함의 입구를 개방하거나 알람부를 제어하는 기능을 수행한다. 제안된 시스템 구현을 위하여 인식부는 적외선 센서로 구현하였고, 제어부는 C언어 기반의 아두이노 스케치 프로그램으로 제작하였다. 또한, 인식부와 제어부는 아날로그 신호를 이용하여 통신할 수 있게 하였다. 제안된 시스템은 정해진 알고리즘에 따라 페트병의 라벨과 뚜껑의 유무를 정확히 판단한 후 라벨 혹은 뚜껑이 부착되었을 때 수거함의 입구를 막는다. 국민 1인당 배출되는 폐기물의 양이 높고 재활용이 되지 않아 쓰레기의 대다수를 소각시키고 있는 상황에서 본 연구에서 제안한 시스템을 통하여 페트병의 재활용률을 높이기를 기대한다.

  • PDF

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자 음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition Using the Transformed Successive State Splitting and Demi-syllable Pair)

  • 서은경;최갑근;김순협;이수정
    • 한국멀티미디어학회논문지
    • /
    • 제9권1호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, Finile State Network(FSN) 노드를 두 음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단 음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 인한 오 인식을 줄이기 위해 인식단위를 반음절 쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징부분에서 K-means 알고리즘으로 군집화 하여, 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문맥종속 음소모델에서 10.5%, 음향모델에서 인식단위를 반음절 쌍으로 하였을 경우 문맥종속 음소모델에 비해 12.5%, 변형된 연쇄 상태분할을 하였을 경우 1.5%의 인식률을 향상시킬 수 있었다.

  • PDF

화자적응화 연속음성 인식 시스템의 구현에 관한 연구 (A Study on Realization of Continuous Speech Recognition System of Speaker Adaptation)

  • 김상범;김수훈;허강인;고시영
    • 한국음향학회지
    • /
    • 제18권3호
    • /
    • pp.10-16
    • /
    • 1999
  • 본 연구에서는 소량의 음성 데이터만으로 적응화가 가능한 MAPE(최대사후확률추정)을 이용한 연속음성 인식시스템 개발에 대해 연구하였다. 음절단위 모델을 구축한 후 적응화 하고자 하는 화자의 데이터를 연결학습법과 Viterbi 알고리즘으로 음절단위의 추출을 자동화 한 후 MAPE로 적응화하였다. 자동차 제어문에 대해 화자 적응화한 경우의 인식률(O(n)DP인 경우)은 77.18%로 적응화 전의 결과보다 약 6%향상되었다.

  • PDF

해저 탐사 및 관측 장비 회수를 위한 초음파 원격제어시스템 개발 (A Development of Ultrasonic-wave Remote Control System For Recovering a Submarine Survey Equipment)

  • 김영진;허경무;정한철;조영준;우종식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.117-119
    • /
    • 2004
  • In order to successfully exploit underwater resources, the first step would be a marine environmental research and exploration on the seafloor. Traditionally one sets up a long-term underwater experimental unit on the seafloor and retrieves the unit later after a certain period time. Essential to these applications is the reliable teleoperation and telemetering of the unit. This study presents ultrasonic-wave remote control system and an underwater sound recognition algorithm that can identify the sound signal without the influence of disturbances due to underwater environmental changes. The proposed method provides a means suitable for units which require low power dissipation and long-time underwater operation. We demonstrate its ability of securing stability and fast sound recognition through experimental methods.

  • PDF

한국어 음성인식을 위한 음성학 기반의 유사음소단위 집합 설계 (A Phonetics Based Design of PLU Sets for Korean Speech Recognition)

  • 홍혜진;김선희;정민화
    • 대한음성학회지:말소리
    • /
    • 제65호
    • /
    • pp.105-124
    • /
    • 2008
  • This paper presents the effects of different phone-like-unit (PLU) sets in order to propose an optimal PLU set for the performance improvement of Korean automatic speech recognition (ASR) systems. The examination of 9 currently used PLU sets indicates that most of them include a selection of allophones without any sufficient phonetic base. In this paper, a total of 34 PLU sets are designed based on Korean phonetic characteristics arid the effects of each PLU set are evaluated through experiments. The results show that the accuracy rate of each phone is influenced by different phonetic constraint(s) which determine(s) the PLU sets, and that an optimal PLU set can be anticipated through the phonetic analysis of the given speech data.

  • PDF

수중 관측 및 탐사장비 원격분리 시스템의 개발 (A Separator system for underwater observing instrument)

  • 김영진;정한철;허경무;조영준
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.158-160
    • /
    • 2005
  • In order to successfully exploit underwater resources, the first step would be a marine environmental research and exploration on the seafloor. Traditionally one sets up a long-term underwater experimental unit on the seafloor and retrieves the unit later after a certain period time. Essential to these applications is the reliable teleoperation and telemetering of the unit. In our proposed ultrasonic-wave remote control system and an underwater sound recognition algorithm that can identify the sound signal without the influence of disturbances due to underwater environmental changes. The proposed method provides a means suitable for units which require low power dissipation and long-time underwater operation. We demonstrate its ability of securing stability and fast sound recognition through experimental methods.

  • PDF

Korean LVCSR for Broadcast News Speech

  • Lee, Gang-Seong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권2E호
    • /
    • pp.3-8
    • /
    • 2001
  • In this paper, we will examine a Korean large vocabulary continuous speech recognition (LVCSR) system for broadcast news speech. The combined vowel and implosive unit is included in a phone set together with other short phone units in order to obtain a longer unit acoustic model. The effect of this unit is compared with conventional phone units. The dictionary units for language processing are automatically extracted from eojeols appearing in transcriptions. Triphone models are used for acoustic modeling and a trigram model is used for language modeling. Among three major speaker groups in news broadcasts-anchors, journalists and people (those other than anchors or journalists, who are being interviewed), the speech of anchors and journalists, which has a lot of noise, was used for testing and recognition.

  • PDF

한국어 음성인식 시스템 향상을 위한 동음이철 단위의 중의성 유형 분류 (Ambiguity Types of the Homonymic & Heterographic Units for Improving Korean Voice Recognition System - a Preliminary Research)

  • 윤애선;강미영
    • 음성과학
    • /
    • 제15권4호
    • /
    • pp.67-81
    • /
    • 2008
  • The accuracy rate of P2G (Phoneme-to-Grapheme) is one of the important factors determining the quality of unlimited voice recognition (VR) systems. Few studies were, however, conducted to reduce ambiguities of a phoneme string which can be segmented into a variety of different linguistic units (i.e. morphemes, words, eo-jeols), thus be transformed into more than one grapheme string. This paper is a preliminary research for building a large knowledge base of those homonymic & heterographic units(HHUs), which will provide unlimited Korean VR systems with more accurate P2G information. This paper analyzes 2 main factors generating HHUs: (1) boundary determination of the prosodic unit; (2) its segmentation into linguistic units. In this paper, linguistic characteristics determining variable boundaries of a prosodic unit are investigated, and the ambiguity types of HHUs are classified in accordance with their morphological and syntactic structures as well as with the phonological rules governing them.

  • PDF

박새(Parus major)의 Partial Song(1 phrase)의 신호적 가치 (Signal Value of Partial Song (Composed of 1 Phrase Unit) in Great Tits, Parus major: Evidence from Playback Experiments)

  • 천세민;박시룡
    • 한국동물학회지
    • /
    • 제38권2호
    • /
    • pp.230-237
    • /
    • 1995
  • Playback experiments were excecuted with seven threat Tit males inhabited in Gsngnae Myeon, Darak Ri, Chungbuk province to investigate the signal value of partial song (one unit phrase composed of two notes) as a species recognition releaser. Territorial males responded strongly to their own natural, synthetic and partial songs played in the field. However, thew showed weak or no responses to the playback songs of other species: Coal Tit (Porus ate4 and Yellow-throated Bunting (EmberiEa elegansl.6reat Tits distinguished conspecific partial songs readily from songs of other species. The results demonstrated that one unit phrase which is a basic arrangement of the Great Tit song, containes information on species recognition.

  • PDF