• 제목/요약/키워드: English alphabets

검색결과 23건 처리시간 0.025초

Sequence-to-Sequence Model을 이용한 영어 발음 기호 자동 변환 (Automatic Conversion of English Pronunciation Using Sequence-to-Sequence Model)

  • 이공주;최용석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권5호
    • /
    • pp.267-278
    • /
    • 2017
  • 영어는 동일 철자의 발음이 매우 다양한 언어이기 때문에 사전에 기술되어 있는 단어의 발음기호를 읽어야만 정확한 발음을 알 수 있다. 영어 사전마다 사용하는 발음기호(phonetic alphabet) 시스템이 다르며 같은 단어에 대해 기술하고 있는 발음 역시 다르다. 본 연구에서는 최근 딥 러닝 분야에서 널리 사용되고 있는 sequence-to-sequence (seq2seq) model을 이용하여 사전마다 다른 발음을 자동으로 변환해 보고자 한다. 4가지 다른 종류의 사전에서 추출한 발음 데이터를 이용하여 모두 12개의 seq2seq model을 구현하였으며, 발음 자동 변환 모듈의 정확 일치율은 74.5% ~ 89.6%의 성능을 보였다. 본 연구의 주요 목적은 다음의 두 가지이다. 첫째 영어 발음기호 시스템과 각 사전의 발음 데이터 특성을 살펴보는 것이고, 둘째, 발음 정보의 자동 변환과 오류 분석을 통해 seq2seq model의 특성을 살펴보는 것이다.

최적의 휴대폰 키패드 디자인을 위한 알고리즘 (Algorithms for Designing Optimal Keypads of Mobile Devices)

  • 김현민;김용혁
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.814-820
    • /
    • 2009
  • 일반 12-키 휴대폰 키패드의 알파벳 배치 방식은 한두 가지로 통일되어 있다. 대개 하나의 키에 여러 개의 알파벳을 순서가 있게 배치한다. 영문을 입력할 때 우리나라를 포함한 비영어권 국가에서는 대부분 멀티탭(multi-tap) 방식을 사용하는데, 이 멀티탭 방식에서는 같은 키를 반복해서 눌러야 다음 알파벳을 입력할 수 있게 된다. 본 논문에서는 멀티탭 방식으로 다양한 상황의 영문 데이터를 입력할 때 필요한 키 누름 횟수를 최소화하는 키패드를 디자인한다. 제안한 유전 알고리즘을 이용해 최적의 키패드를 디자인할 수 있었다. 키의 개수는 최소 8개에서 최대 12개까지를 사용하며 알파벳 순서를 유지한 것과 그렇지 않은 키패드 디자인에 대해 다양하게 실험하였고, 결과적으로 모든 경우에 개선된 키패드 디자인을 도출 해냈다.

한글 한자 자동변환이 가능한 WC

  • 이기식;서용무
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1983년도 춘계학술발표회논문집
    • /
    • pp.18-28
    • /
    • 1983
  • This paper describes the result of a series of fundamental researches on a word processing system, named WORD80. Given the text consisting of Ilanguel characters, Chinese characters, English alphabets and other special characters, it can provide-ㄴo-see printout, after having processed according to the commands used to control the output format of the text. Since each Hanguel character in input text is made up of and is represented as some compoents, it uses the deterministic finite automata for the formation of Hanguel from its components. When developed at first, the WORD80 can perform Hanguel to Chinese transition character by character by character. But it was thought to be more practical to do this word by word.

  • PDF

원형 마스크 팽창법에 의한 무자인식 (The character classifier using circular mask dilation method)

  • 박영석;최철용
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 하계종합학술대회논문집
    • /
    • pp.913-916
    • /
    • 1998
  • In this paper, to provide the robustness of character recognition, we propose a recognition method using the dilated boundary curve feature which has the invariance characteristics for the shift, scale, and rotation changes of character pattern. And its some characteristics and effectieness are evaluated through the experiments for both the english alphabets and the numeral digits. The feature vector is represented by the fourier descriptor for a boundary curve of the dilated character pattern which is generated by the circular mask dilation method, and is used for a nearest neighbort classifier(NNC) or a nearest neighbor mean classifier(NNMC). These the processing time and the recognition rate, and take also the robustness of recognition for both some internal noise and partial corruption of an image pattern.

  • PDF

CAI 응용프로그램 작성시 자료공유를 위한 한글 코드 체계 정의에 관한 연구 (A Study on Data Sharing Codes Definition of Hangul in CAI Application Programs)

  • 고대곤
    • 정보교육학회논문지
    • /
    • 제2권1호
    • /
    • pp.138-161
    • /
    • 1998
  • This research addresses to establish a systematic approach to design a standard Hangul code system for educational purposes in development of CAI courseware using Korean, English, and Chinese characters, which requires data exchanges and database construction. In this paper, types of Korean alphabetic code systems already in use, their representational environments and consonant/vowel order have been studied and analysed. This paper presents the requirements that the hangul code system for educational purpose needs to obtain. First, it should be able to represent all contemporary as well as ancient Korean alphabets. Second, character elements should be separable. Third, consonant/vowel order should be determined to easily retrieve and exchange data. Lastly, the code should maintain compatibility with other national codes and provide uniqueness of user-defined character codes.

  • PDF

CBAM 모델에 관한 연구 (A Study on CBAM model)

  • 임용순;이근영
    • 전자공학회논문지B
    • /
    • 제31B권5호
    • /
    • pp.134-140
    • /
    • 1994
  • In this paper, an algorithm of CBAM(Combination Bidirectional Associative Memory) model proposes, analyzes and tests CBAM model `s performancess by simulating with recalls and recognitions of patterns. In learning-procedure each correlation matrix of training patterns is obtained. As each correlation matrix's some elements correspond to juxtaposition, all correlation matrices are merged into one matrix (Combination Correlation Matrix, CCM). In recall-procedure, CCM is decomposed into a number of correlation matrices by spiliting its elements into the number of elements corresponding to all training patterns. Recalled patterns are obtained by multiplying input pattern with all correlation matrices and selecting a pattern which has the smallest value of energy function. By using a CBAM model, we have some advantages. First, all pattern having less than 20% of noise can be recalled. Second, memory capacity of CBAM model, can be further increased to include English alphabets or patterns. Third, learning time of CBAM model can be reduced greatly because of operation to make CCM.

  • PDF

Thai Online Practitioners' Attitude Towards CAPTCHA

  • Tangmanee, Chatpong;Sujarit-Apirak, Paradorn
    • Journal of Information Technology Applications and Management
    • /
    • 제17권3호
    • /
    • pp.43-56
    • /
    • 2010
  • Completely Automated Public Turing test to tell Computers and Humans Apart or CAPTCHA has received remarkable attention. Deciphering distorted texts is still a human task. The current CAPTCHA mainly requires users to read English alphabets. As such, Thai CAPTCHA may be the choice for Thai online practitioners. However, no published work has examined how Thai online practitioners perceive CAPTCHA. This study thus attempts to fill this void. Based on the 112 number of usable online questionnaire submission, Thai online practitioners are all aware of CAPTCHA. Also, nine out of ten samples identified correctly the prime benefits of CAPTCHA. Using exploratory factor analysis, their attitude towards CAPTCHA was classified into two dimensions. They perceived (1) drawback of general CAPTCHA and (2) feasibility of Thai CAPTCHA. In addition to extending our insight into application of CAPTCHA, policy-makers responsible for electronic commerce in Thailand could initiate plans in response to Thai online practitioners' perception.

  • PDF

음소 및 성조 레이블링 프로그램 개발 (Development of a Phoneme and Tone Labeling Program)

  • 이윤경;곽철;권오욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.435-436
    • /
    • 2007
  • Although previous speech analysis programs usually provide speech analysis and phoneme labeling functionalities, they require much time in manual labeling and support only English alphabets. To solve these problems, we develop a new Windows-based program with an improved phoneme and tone labeling method as well as the conventional speech analysis functionalities. The developed program has the unique feature in semi-automatic phoneme and tone labeling based on hidden Markov models.

  • PDF

인간의 정보처리 방법에 기반한 특징추출 및 필기체 문자인식에의 응용 (Feature extraction motivated by human information processing method and application to handwritter character recognition)

  • 윤성수;변혜란;이일병
    • 인지과학
    • /
    • 제9권1호
    • /
    • pp.1-11
    • /
    • 1998
  • 본 논문에서는 인간의 정보처리 과정에 관한 심리학적 실험에 바탕을 두고 인간이 사용하고 있는 것으로 생각되는 특징을 이용하여 이를 문자 인식에 적용하였다. 인간의 경우 화소단위의 정보뿐만 아니라 일정지역의 정보를 함께 처리하는 경향이 있다. 그러므로 일정지역에 대한 정보를 표시하는 영역 특징을 정의하고 정의된 이 영역 특징과 기존의 화소단위 특징들을 결합하였다. 사용한 특징으로는 영역 특징에 기반 한 초등 적 분석결과, 영역특징을 포함한 망 특징, 교차거리와 특징 그리고 기울기 특징들이다. 성능 평가 실험은 필기 한글자모, 숫자 그리고 대소영문자를 대상으로 하였으며, 인식기는 역전과 학습 방법을 이용한 신경망 인식기를 사용하였다. 각각의 인식 결과는 90.27∼93.25%, 98.00% 그리고 79.73∼85.75였다. 영역 특징과 유사한 UDLRH 특징을 대상으로 비교한 결과 전체적으로 1∼2% 정도 인식률 향상이 있었으며 인간이 판단하기에 보다 납득하기 쉬운 오 인식 성향을 보였다.

  • PDF

역전파 알고리듬과 사전을 이용한 필기체 영문자 인식 (A Recognition of Handwritten English Characters Using Back Propagation Algorithm and Dictionary)

  • 김응성;조성환;이근영
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.157-168
    • /
    • 1993
  • 본 논문에서는 역전파 알고리듬으로 학습된 신경회로망과 사전을 이용하여 필기체 영문자 인식을 수행하였다. 스캐너를 이용하여 입력된 영상화일로부터 불필요한 데이터 부분을 제거하고 문자의 다양성을 최소화하기 위해서 여러가지 전처리과정, 즉 문자분리, 중심변환, 잡음제거, 배율조정과 세선화과정을 거쳤다. 다음으로 세선화된 문체 패턴으로부터 문자의 특징이 추출되고, 신경회로망에 시험데이터에 대한 특징들을 학습시켰다. 그리고 테스트할 영문자에 대해서도 특징들을 추출하여 이미 학습된 신경회로망에 의해 분류하였다. 마지막으로 학습시간을 줄이고 인식율을 향상시키기 위한 방법과 학습시간과 은닉층의 노드수에 대해 고찰하였다. 실험 결과로서 이와 같은 시스템으로 필기체 영문제에 대하여 학습후에 약 93%의 높은 인식율을 얻을 수 있었을 사전을 이용했을 경우 인식율이 약 97%였다.

  • PDF