• Title/Summary/Keyword: 음성문자변환

Search Result 52, Processing Time 0.04 seconds

Development of User Interface for Tablet PC-based PBL (Problem-based Learning) System (태블릿 PC 기반의 PBL 학습시스템 인터페이스 설계)

  • Na, Hye-Jung;Jun, Woo-Chun
    • 한국정보교육학회:학술대회논문집
    • /
    • 2007.08a
    • /
    • pp.96-101
    • /
    • 2007
  • u-learning (Ubiquitous Learning) 환경에서는 학습자들이 언제, 어디에서나 어떤 단말기로도 자유롭게 학습할 수 있는 학습자 중심의 교육과정이 가능해야 한다. 최근 각광을 받고 있는 태블릿 (Tablet) PC는 펜을 주로 입력 매개로 활용하고, 음성을 인식하여 이를 문자로 변환하여 저장할 수 있는 기능도 가지고 있어 초등교육 현장에 적합한 단말기이다. 또한 PBL (Problem-based Learning)은 학습자들이 자기주도적으로 문제를 해결해 가는 과정에서 문제해결력과 비판적 사고 기능을 신장시킬 수 있는 학습형태로 태블릿 PC 기반의 PBL 학습시스템은 u-learning 환경에서 학습자 중심의 교육과정 실현에 적합한 시스템이다. 본 연구에서는 태블릿 PC 기반의 PBL 학습시스템의 인터페이스 설계 방안을 제시해 보았다. 본 연구에서 제시하는 사용자 인터페이스의 특징은 다음과 같다. 첫째, 학습의 프로세스를 프로젝트의 목적 및 과제 파악 단계, 학습계획 수립단계, 자료의 수집 및 정리단계, 프로젝트 마무리 단계로 구분하고, 각 단계에서의 학습자의 활동을 지원하는 시스템으로 구성한다. 둘째, 태블릿 PC 기반에서의 학습 활동에 서투른 학습자도 직관적으로 접근 할 수 있도록 인터페이스에 아이콘을 적절하게 활용한다. 셋째, 태블릿 PC에 펜이나 음성으로 입력된 자료를 문자, 도형, 이미지로 손쉽게 저장하고 축적할 수 있도록 한다. 넷째, 학습자들간의 상호작용과 교사의 피드백을 손쉽게 할 수 있도록 게시판, 자료실, 통합 메시지함의 기능을 활성화한다.

  • PDF

The Development of the Internet Web Browser for the Blind (시각장애을 위한 인터넷 웹 브라우저 개발)

  • 박찬용;장병태김동현
    • Proceedings of the IEEK Conference
    • /
    • 1998.10a
    • /
    • pp.829-832
    • /
    • 1998
  • In this paper, We have developed the Internet web browser for the blind and visually impaired person. The Internet Web browser system consists of personal computer connected to Internet, braille display, voice synthesis devices for character information, tactile display for the representation of web image and braille printer for web page printing. We convert character in the web page to braille and print it to braille display. The image in the web page is printed with tactile display actuated by solenoid. The blind can acess the Internet web site with this web browser system and understand the Internet information.

  • PDF

Automatic Notification System of Expiration Date Based on YOLO and OCR algorithm for Blind Person (시각 장애우를 위한 YOLO와 OCR 알고리즘 기반의 유통기한 자동 알림 시스템)

  • Kim, Min-Soo;Moon, Mi-kyung;Han, Chang-hee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.697-698
    • /
    • 2021
  • 본 논문에서는 시각 장애우의 식품 안전성 증진을 위해 광학 문자 인식 (optical character recognition, OCR) 및 실시간 객체 인식 (you only look once, YOLO) 알고리즘에 기반한 식품의 유통기한 자동 알림 시스템을 제안한다. 제안하는 시스템은 1) 스마트폰 카메라를 통해 실시간으로 입력되는 영상에서 YOLO 알고리즘을 활용하여 유통기한으로 예측되는 이미지 영역을 검출하고, 2) 검출된 영역에서 OCR 알고리즘을 활용하여 유통기한 데이터를 추출하며, 3) 최종 추출된 유통기한 데이터를 음성으로 변환하여 시각 장애우에게 전달한다. 개발된 시스템은 유통기한 정보를 추출해서 사용자에게 전달하기까지 평균 약 7초 이내의 빠른 응답 속도를 보였으며, 62.8%의 객체 인식 정확도와 93.6%의 문자 인식 정확도를 보였다. 이러한 결과들은 제안하는 시스템을 시각 장애우들이 실용적으로 활용할 수 있다는 가능성을 보여준다.

  • PDF

Assessment of Synthesized Speech by Text-to-Speech Conversion (Text-to-Speech 합성음 품질 평가)

  • 정유현
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1993.06a
    • /
    • pp.98-101
    • /
    • 1993
  • 본 논문은 한국전자통신연구소 음성응용연구실에서 개발한 문자-음성변환 시스팀(Text-to-Speech Conversion System)의 음질개선 연구의 일환으로 Phoneme-Balanced Words 110개에 대해서 개선전 시스팀(V.1)과 개선 후 시스팀(v.2)을 대상으로 각각 실시한 명료도 실험결과에 대하여 기술하고 있다. 본 실험의 목적은 연구개발자 입장에서 합성음 개선에 대한 정량적 성과 및 문제점 파악을 위한 진단형 평가이며 남자 5명, 여자 5명을 대상으로 1회 실시한 청취 실험결과 V.1에 대해서는 최저 37.3%(41개) ~ 최고 55.5%(61개)이고, V.2에 대해서는 최고 39.1%(43개) ~ 최고 60.9%(67개) 결과를 얻었다.

  • PDF

The Interaction of Information Input using Image Sensor (이미지 센서를 이용한 정보입력 인터랙션)

  • Yang, Pil-Seung;Han, Kuk-Hyun
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.1180-1183
    • /
    • 2009
  • 최근 온라인 환경에서 다양한 컨텐츠들이 의사소통의 매개체로 활용되고 있다. 하지만 많은 사용자들은 다양한 형태로 되어있는 정보를 공유, 전달하기 위해 기존 주로 사용되는 의사소통 방법인 문자, 음성으로 변환해야하는 불편함을 겪고 있다. 본 고에서는 온라인 환경에서 사용자들간의 의사소통 방법으로써 원하는 정보를 쉽게 전송하는 방법을 제안한다. 제안된 방법(Information-Picker)은 사용자가 타인에게 전송하려는 정보를 정해진 표식으로 지정하거나 종이에 쓰고, 근접 센서를 통해 사용자가 전송의사를 입력하면, 그 내용을 이미지 센서를 통해 입력 받아 적합한 정보 형태로 변환하여, 타인에게 전송하는 방식이다. Information- picker 는 온라인 환경에서 사용자들간의 의사소통에 있어서 방법의 폭을 넓히는 측면뿐만 아니라, 입력하려는 정보를 센서에 근접시키는 직관적인 인테페이스를 제공하여 사용자로 하여금 쉽고 폭 넓은 의사소통의 편의를 제공할 수 있으며, 특히 현 상황에서의 온라인 사용자들간의 의사전달의 한계를 개선하고, 더욱 풍부한 의도 표현 수단을 제공 할 수 있다.

  • PDF

A Study on Processing of Speech Recognition Korean Words (한글 단어의 음성 인식 처리에 관한 연구)

  • Nam, Kihun
    • The Journal of the Convergence on Culture Technology
    • /
    • v.5 no.4
    • /
    • pp.407-412
    • /
    • 2019
  • In this paper, we propose a technique for processing of speech recognition in korean words. Speech recognition is a technology that converts acoustic signals from sensors such as microphones into words or sentences. Most foreign languages have less difficulty in speech recognition. On the other hand, korean consists of vowels and bottom consonants, so it is inappropriate to use the letters obtained from the voice synthesis system. That improving the conventional structure speech recognition can the correct words recognition. In order to solve this problem, a new algorithm was added to the existing speech recognition structure to increase the speech recognition rate. Perform the preprocessing process of the word and then token the results. After combining the result processed in the Levenshtein distance algorithm and the hashing algorithm, the normalized words is output through the consonant comparison algorithm. The final result word is compared with the standardized table and output if it exists, registered in the table dose not exists. The experimental environment was developed by using a smartphone application. The proposed structure shows that the recognition rate is improved by 2% in standard language and 7% in dialect.

Speech syntheis engine for TTS (TTS 적용을 위한 음성합성엔진)

  • 이희만;김지영
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.23 no.6
    • /
    • pp.1443-1453
    • /
    • 1998
  • This paper presents the speech synthesis engine that converts the character strings kept in a computer memory into the synthesized speech sounds with enhancing the intelligibility and the naturalness by adapting the waveform processing method. The speech engine using demisyllable speech segments receives command streams for pitch modification, duration and energy control. The command based engine isolates the high level processing of text normalization, letter-to-sound and the lexical analysis and the low level processing of signal filtering and pitch processing. The TTS(Text-to-Speech) system implemented by using the speech synthesis engine has three independent object modules of the Text-Normalizer, the Commander and the said Speech Synthesis Engine those of which are easily replaced by other compatible modules. The architecture separating the high level and the low level processing has the advantage of the expandibility and the portability because of the mix-and-match nature.

  • PDF

Design of CNN-based Braille Conversion and Voice Output Device for the Blind (시각장애인을 위한 CNN 기반의 점자 변환 및 음성 출력 장치 설계)

  • Seung-Bin Park;Bong-Hyun Kim
    • Journal of Internet of Things and Convergence
    • /
    • v.9 no.3
    • /
    • pp.87-92
    • /
    • 2023
  • As times develop, information becomes more diverse and methods of obtaining it become more diverse. About 80% of the amount of information gained in life is acquired through the visual sense. However, visually impaired people have limited ability to interpret visual materials. That's why Braille, a text for the blind, appeared. However, the Braille decoding rate of the blind is only 5%, and as the demand of the blind who want various forms of platforms or materials increases over time, development and product production for the blind are taking place. An example of product production is braille books, which seem to have more disadvantages than advantages, and unlike non-disabled people, it is true that access to information is still very difficult. In this paper, we designed a CNN-based Braille conversion and voice output device to make it easier for visually impaired people to obtain information than conventional methods. The device aims to improve the quality of life by allowing books, text images, or handwritten images that are not made in Braille to be converted into Braille through camera recognition, and designing a function that can be converted into voice according to the needs of the blind.

Design and Fabrication FM-VMS using Watermarking Method (워터마킹 기법을 이용한 FM-VMS 설계 및 구현)

  • Moon, Byeong-Sup;Park, Bum-Jin;Weon, Young-Su;Kim, Cheol-Seong
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.12
    • /
    • pp.43-50
    • /
    • 2010
  • In this thesis, Traffic information which is provided to the VMS used a FM frequency and provides real-time traffic information about the mobile production unit system which designed and produced and a quality evaluated. Result of the research, we will be able to confirm converted audio and text information from traffic information is linked with VMS information, FM broadcast traffic information to motorists passing through it were found to be and as a result of this study, which sees raises the effectiveness of VMS users and using VMS to build low-cos transport infrastructure will be an opportunity.

A Development of the Business processing unit for visually-handicapped persons (시각 장애인을 위한 사무 자동화 보조 장치 개발)

  • Kim, Song-Min
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.7 no.1
    • /
    • pp.141-147
    • /
    • 2012
  • Blind persons are information alienation class in spite of development of an Information-Communication technology. Need dog's paw of a business automation technology that apply Information-Communication know-how to do these in white-collar job go to work. I wish to develop VI 05 that can improve computer practical use ability by developing integration solution that can analyze know-how that need in transaction of business and overcome this technologically. Because developed VI 05 reserves and handles work that require screen spread, function that convert data of screen including character into voice, accuracy by integration solution that is necessary in transaction of business the process simplificaton make function that need in Secretariat state process such as knowing function have.