• 제목/요약/키워드: Code of Phoneme

검색결과 8건 처리시간 0.026초

분산 메모리 다중프로세서 환경에서의 병렬 음성인식 모델 (A Parallel Speech Recognition Model on Distributed Memory Multiprocessors)

  • 정상화;김형순;박민욱;황병한
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.44-51
    • /
    • 1999
  • 본 논문에서는 음성과 자연언어의 통합처리를 위한 효과적인 병렬계산모델을 제안한다. 음소모델은 연속 Hidden Markov Model(HMM)에 기반을 둔 문맥종속형 음소를 사용하며, 언어모델은 지식베이스를 기반으로 한다. 또한 지식베이스를 구성하기 위해 계층구조의 semantic network과 병렬 marker-passing을 추론 메카니즘으로 쓰는 memory-based parsing 기술을 사용한다. 본 연구의 병렬 음성인식 알고리즘은 분산메모리 MIMD(Multiple Instruction Multiple Data) 구조의 다중 Transputer 시스템을 이용하여 구현되었다. 실험결과, 본 연구의 지식베이스 기반 음성인식 시스템의 인식률이 word network 기반 음성인식 시스템보다 높게 나타났으며 code-phoneme 통계정보를 활용하여 인식성능의 향상도 얻을 수 있었다. 또한, 성능향상도(speedup) 관련 실험들을 통하여 병렬 음성인식 시스템의 실시간 구현 가능성을 확인하였다.

  • PDF

새로운 한글코드 “Truecode”의 개발과 응용 (The Development of New Hangul Code "Truecode" and Its Applications)

  • 이문형;김기두
    • 전자공학회논문지B
    • /
    • 제30B권5호
    • /
    • pp.43-51
    • /
    • 1993
  • A new Hangul code called Truecode is developed for accomodating to the future computing environments of graphical user interface and multimedia as well as for corresponding with the invention principle of Hangul. Truecode is not a forced two-byte code of syllable unit, as completion-type of combination-type, currently used, but a one byte code of phoneme unit, which can represent initial consonant, vowel, and final consonant each. It is quite different from three-byte code of syllable unit and also does not require the fill code used for three-byte code. We expect great contribution to the Hangul culture from Truecode's some important following features. It can express all the Korean characters we may imagine and does not cause any problem in communication. As well as we may use direct connection font, we can assign ont-to-one correspondence between Truecode and a keyboard with three sets. Truecode has a good advantage in developing application softwares of Hangul and it can nicely be applied to the fields of speech recognition and artificial intelligence using natural language.

  • PDF

다국어 음성 인식을 위한 자동 어휘모델의 생성에 대한 연구 (A Study on the Automatic Lexical Acquisition for Multi-lingustic Speech Recognition)

  • 지원우;윤춘덕;김우성;김석동
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.434-442
    • /
    • 2003
  • 특정한 언어 (영어)로 구현된 소프트웨어를 다른 언어 (한국어, 중국어 등)에서 처리할 수 있도록 하는 과정인 소프트웨어의 국제화는 음성기술 분야에 적응할 때 매우 복잡해진다. 그 이유는 음성 자체가 언어와 많은 연관 관계를 갖기 때문이다. 그러나 어떠한 언어라 해도 그 나라의 언어표현은ASCII코드나 혹은 그 나라 고유의 코드 기반으로 소프트웨어를 처리한다. 영어의 경우는 ASCII코드의 코드체계로 이루어지지만 다른 나라 언어인 경우 다른 형태의 언어코드를 사용하는 것이 일반적이다. 음성 처리에서 언어의 본질적 특성은 어휘모델에 나타난다. 어휘모델은 문자집합, 음소집합, 발음규칙으로 구성된다. 본 논문에서는 다국어 음성인식처리를 위한 어휘모델을 자동으로 생성하기 위하여, 4단계로 나누어 처리하는 어휘모델 구축 방법을 제안한다. 우선 전처리 과정으로 특정한 언어로 표현한 단어를 유니코드로 변환한다. (1단계) 유니코드로부터 중간 형태 코드로의 변환 (2단계) 발음 형태를 기본으로 하는 표준화된 규칙 적용 (3단계) 음소 규칙들에 의한 문자소 구현 (4단계) 음운론을 적용하는 순서로 구성된다.

Spatio-temporal방법을 이용한 지역명 인식에 관한 연구 (A Study on the recognition of local name using Spatio-Temporal method)

  • 지원우
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.121-124
    • /
    • 1993
  • This paper is a study on the word recognition using neural network. A limited vocabulary, speaker independent, isolated word recognition system has been built. This system recognizes isolated word without performing segmentation, phoneme identification, or dynamic time wrapping. It needs a static pattern approach to recognize a spatio-temporal pattern. The preprocessing only includes preceding and tailing silence removal, and word length determination. A LPC analysis is performed on each of 24 equally spaced frames. The PARCOR coefficients plus 3 other features from each frame is extracted. In order to simplify a structure of neural network, we composed binary code form to decrease output nodes.

  • PDF

획 정보를 이용한 한글문자와 펜 제스처 인식 시스템의 설계 및 구현 (Design and Implementation for Korean Character and Pen-gesture Recognition System using Stroke Information)

  • 오준택;김욱현
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.765-774
    • /
    • 2002
  • 본 논문은 멀티미디어 단말기, PDA등에 적용할 목적으로 획 정보를 이용한 한글문자와 펜 제스처 인식 시스템을 설계 및 구현한다. 한글문자 인식은 다양한 필체 유형을 수용하기 위해 한글의 특성정보와 획 정보 등을 기반으로 구축한 한글데이터베이스를 이용하며 빠른 자소분리를 수행하기 위해서 획간의 위치정보를 이용한 순차적 자소분리와 자소를 이루는 획 수의 변경에 의한 백트래킹 자소분리를 이용한다. 펜 제스처 인식은 정의한 15가지 유형의 펜 제스처에 대해서 민감한 획 정보가 아닌 획 내의 교차수, 방향변화, 방향벡터, 방향코드의 개수, 위치관계, 획에 대한 시작점과 끝점간의 거리 비율정보 등을 분류특징으로 이용함으로써 강건한 인식과 빠른 처리속도를 가진다. 제안한 방법에 의해 구현한 인식 시스템은 실시간으로 수행하며 실험결과, 높은 인식률과 빠른 처리속도를 보였다.

Web strain based prediction of web distortion influence on the elastic LTB limiting length

  • Bas, Selcuk
    • Steel and Composite Structures
    • /
    • 제43권2호
    • /
    • pp.271-278
    • /
    • 2022
  • Buckling is one of the most critical phoneme in the design of steel structures. Lateral torsional buckling (LTB) is particularly significant for slender beams generally subjected to loading in plane. The web distortion effects on LTB are not addressed explicitly in standards for flexural design of steel I-section members. Hence, the present study is focused to predict the influence of the web distortion on the elastic (Lr) limiting lengths given in American Institute of Steel Construction (AISC) code for the lateral torsional buckling (LTB) behavior of steel beams due to no provision in the code for consideration of web distortion. For this aim, the W44x335 beam is adopted in the buckling analysis carried out by the ABAQUS finite element (FE) program since it is one of the most critical sections in terms of lateral torsional buckling (LTB). The strain results at mid-height of the web at mid-span of the beam are taken into account as the monitoring parameters. The web strain results are found to be relatively greater than the yield strain value when L/Lr is equal to 1.0. In other words, the ratio of L/Lr is estimated from the numerical analysis to be about 1.5 when the beam reaches its first yielding at mid-span of the beam at mid-height of the section. Due to the effect of web distortion, the elastic limiting length (Lr) from the numerical analysis is obtained to be considered as greater than the calculated length from the code formulation. It is suggested that the formulations of the limiting length proposed in the code can be corrected considering the influence of the web distortion. This correction can be a modification factor or a shape factor that reduces sectional slenderness for the LTB formulation in the code.

가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환 시스템 (Knowledge based Text to Facial Sequence Image System for Interaction of Lecturer and Learner in Cyber Universities)

  • 김형근;박철하
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.179-188
    • /
    • 2008
  • 본 논문에서는 가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환(TTFSI : Text to Facial Sequence Image) 시스템에 관해 연구하였다. TTFSI 시스템의 구현을 위해, 한글의 문법적 특징을 기반으로 가상강의에 사용된 자막정보에 립싱크된 얼굴 동영상 합성하기 위하여 자막정보를 음소코드로 변환하는 방법, 음소코드별 입모양의 변형규칙 작성법, 입모양 변형규칙에 의한 얼굴 동영상 합성법을 제안한다. 제안된 방법에서는 한글의 구조분석을 통해 기본 자모의 발음을 나타내는 10개의 대표 입모양과 조음결합에서 나타나는 78개의 혼합 입모양으로 모든 음절의 입모양을 표현하였다. 특히 PC환경에서의 실시간 영상을 합성하기 위해서 매 프레임마다 입모양을 합성하지 않고, DB에서 88개의 해당 입모양을 불러오는 방법을 사용하였다. 제안된 방법의 유용성을 확인하기 위하여 텍스트 정보에 따른 다양한 얼굴 동영상을 합성하였으며, PC환경에서 구현 가능한 TTFSI 시스템을 구축하였다.

음소의 가로선형 배열을 통한 밀도 분산형 한글꼴연구 ( 새로운 음소형 코드체계를 위한 한글꼴 ) (Study on the Hangul typeface of the decentralized density through the horizontal disposition of phoneme. (Hangul typeface for New Hangul Code))

  • 문석배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.223-230
    • /
    • 1994
  • 본 한글꼴은 음절 및 음소의 가시성을 높이고자 한글 음소의 이중 가로선형 배열을 통한 밀도 분산형 한글꼴과 음소 나열형 한글꼴 등의 새로운 한글꼴의 다양한 표현의 실험 연구이다. 일도 분산형 한글꼴은 새로운 음소형 한글코드(닿소리, 홑소리, 받침 조합형)와 서로 대응하드록 일원화 한글꼴로 한글 및 옛 한글의 음소 조합형의 입.출력이 가능하다. 이러한 시도는 1바이트 이내에서 현대한글 및 옛한글을 구현하며, 이는 한글의 구현원리에 따른 음소형 코드체계의 실현 가능성으로 한글 코드체계의 최적화에 대한 새로운 가설을 제시 한다.

  • PDF