• 제목/요약/키워드: Speech-to-text

검색결과 505건 처리시간 0.028초

딥 러닝을 이용한 시각장애인을 위한 실시간 버스 도착 알림 시스템 (A Real-time Bus Arrival Notification System for Visually Impaired Using Deep Learning )

  • 장세영;유인재;김석윤;김영모
    • 반도체디스플레이기술학회지
    • /
    • 제22권2호
    • /
    • pp.24-29
    • /
    • 2023
  • In this paper, we propose a real-time bus arrival notification system using deep learning to guarantee movement rights for the visually impaired. In modern society, by using location information of public transportation, users can quickly obtain information about public transportation and use public transportation easily. However, since the existing public transportation information system is a visual system, the visually impaired cannot use it. In Korea, various laws have been amended since the 'Act on the Promotion of Transportation for the Vulnerable' was enacted in June 2012 as the Act on the Movement Rights of the Blind, but the visually impaired are experiencing inconvenience in using public transportation. In particular, from the standpoint of the visually impaired, it is impossible to determine whether the bus is coming soon, is coming now, or has already arrived with the current system. In this paper, we use deep learning technology to learn bus numbers and identify upcoming bus numbers. Finally, we propose a method to notify the visually impaired by voice that the bus is coming by using TTS technology.

  • PDF

사회과학 분야 도서의 목차 텍스트에 대한 통계적 특성에 관한 연구 (A Study on the Statistical Characteristics for Table of Contents Text of the Books in Social Sciences Field)

  • 이용구
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.255-273
    • /
    • 2019
  • 이 연구는 최근 접근 및 활용이 높아지고 있는 목차에 대해 품사 측면과 주제 측면에서 가지는 기술통계와 비교 분석을 수행하였다. 이를 위해 대학 도서관의 수서 목록에서 사회과학분야 도서를 추출하고 해당하는 도서에 대해 종합목록으로부터 DDC 분류기호를, 인터넷 서점으로부터 목차 정보를 추출하였다. 서명과 목차를 대상으로 형태소 분석하여 명사 중심의 어휘에 대해 기술통계와 빈도 분석을 실시하였다. 그 결과 형태소 측면에서 서명과 목차는 명사가 대략 절반가량 차지하며, 서명과 비교하여 목차는 50배 정도 더 많은 명사를 가지며, 목차에 출현한 명사 중에 목차만이 고유하게 가지는 비율이 95.2%에 달하는 것으로 파악되었다. 또한 목차는 사회과학 학문분야에 따라 길이가 차이가 나는 것으로 나타났다.

119 응급신고에서 수보요원과 신고자의 통화분석을 활용한 머신 러닝 기반의 심정지 탐지 모델 (Machine-learning-based out-of-hospital cardiac arrest (OHCA) detection in emergency calls using speech recognition)

  • 김종인;이주영;정지오;신대진;최동현;김기홍;홍기정;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.109-118
    • /
    • 2023
  • 심정지는 초기 대응에 따라 생존율과 예후에 영향을 미치는 중요한 응급 상황이다. 특히 병원밖심정지(out-of-hospital cardiac arrest, OHCA)의 경우, 119 구조대의 초기 조치가 심정지 환자의 생존율을 높이는 데 결정적인 역할을 한다. 그러나 국내에서는 수보요원의 수가 제한적이지만 다량의 신고 전화에 응대해야 하는 현실이다. 이런 상황에서 머신러닝 기반의 OHCA 탐지 프로그램은 수보요원의 보조 역할로 심정지 환자의 생존률을 높일 수 있다. 본 연구에서는 이러한 문제를 해결하기 위해 머신러닝 기반의 심정지(OHCA) 탐지 프로그램을 개발하였다. 이 프로그램은 수보요원과 신고자의 통화 녹취록을 분석하여 심정지 여부를 판단한다. 제안한 모델은 수보요원 및 신고자와의 통화를 자동으로 전사하는 모델, 텍스트 기반의 심정지 탐지 모델, 그리고 프로그램 개발을 위한 서버와 클라이언트로 구성되어 있다. 실험 결과, 본 연구에서 제안한 모델은 F1 점수 기준으로 79.49%의 성능을 보였으며, 수보요원과 비교하여 심정지 감지 시간을 15초 단축하였다. 이 연구는 소규모 데이터셋을 사용하였음에도 불구하고, 심정지 기반의 탐지 프로그램이 수보요원의 보조 역할로 심정지 생존률에 기여할 수 있음을 입증하였다.

Multimodal Approach for Summarizing and Indexing News Video

  • Kim, Jae-Gon;Chang, Hyun-Sung;Kim, Young-Tae;Kang, Kyeong-Ok;Kim, Mun-Churl;Kim, Jin-Woong;Kim, Hyung-Myung
    • ETRI Journal
    • /
    • 제24권1호
    • /
    • pp.1-11
    • /
    • 2002
  • A video summary abstracts the gist from an entire video and also enables efficient access to the desired content. In this paper, we propose a novel method for summarizing news video based on multimodal analysis of the content. The proposed method exploits the closed caption data to locate semantically meaningful highlights in a news video and speech signals in an audio stream to align the closed caption data with the video in a time-line. Then, the detected highlights are described using MPEG-7 Summarization Description Scheme, which allows efficient browsing of the content through such functionalities as multi-level abstracts and navigation guidance. Multimodal search and retrieval are also within the proposed framework. By indexing synchronized closed caption data, the video clips are searchable by inputting a text query. Intensive experiments with prototypical systems are presented to demonstrate the validity and reliability of the proposed method in real applications.

  • PDF

유비쿼터스 환경을 위한 하프미러형 인터페이스 시스템 개발과 응용 (Development of Half-Mirror Interface System and Its Application for Ubiquitous Environment)

  • 권영준;김대진;이상완;변증남
    • 제어로봇시스템학회논문지
    • /
    • 제11권12호
    • /
    • pp.1020-1026
    • /
    • 2005
  • In the era of ubiquitous computing, human-friendly man-machine interface is getting more attention due to its possibility to offer convenient services. For this, in this paper, we introduce a 'Half-Mirror Interface System (HMIS)' as a novel type of human-friendly man-machine interfaces. Basically, HMIS consists of half-mirror, USB-Webcam, microphone, 2ch-speaker, and high-speed processing unit. In our HMIS, two principal operation modes are selected by the existence of the user in front of it. The first one, 'mirror-mode', is activated when the user's face is detected via USB-Webcam. In this mode, HMIS provides three basic functions such as 1) make-up assistance by magnifying an interested facial component and TTS (Text-To-Speech) guide for appropriate make-up, 2) Daily weather information provider via WWW service, 3) Health monitoring/diagnosis service using Chinese medicine knowledge. The second one, 'display-mode' is designed to show decorative pictures, family photos, art paintings and so on. This mode is activated when the user's face is not detected for a time being. In display-mode, we also added a 'healing-window' function and 'healing-music player' function for user's psychological comfort and/or relaxation. All these functions are accessible by commercially available voice synthesis/recognition package.

Study of Machine-Learning Classifier and Feature Set Selection for Intent Classification of Korean Tweets about Food Safety

  • Yeom, Ha-Neul;Hwang, Myunggwon;Hwang, Mi-Nyeong;Jung, Hanmin
    • Journal of Information Science Theory and Practice
    • /
    • 제2권3호
    • /
    • pp.29-39
    • /
    • 2014
  • In recent years, several studies have proposed making use of the Twitter micro-blogging service to track various trends in online media and discussion. In this study, we specifically examine the use of Twitter to track discussions of food safety in the Korean language. Given the irregularity of keyword use in most tweets, we focus on optimistic machine-learning and feature set selection to classify collected tweets. We build the classifier model using Naive Bayes & Naive Bayes Multinomial, Support Vector Machine, and Decision Tree Algorithms, all of which show good performance. To select an optimum feature set, we construct a basic feature set as a standard for performance comparison, so that further test feature sets can be evaluated. Experiments show that precision and F-measure performance are best when using a Naive Bayes Multinomial classifier model with a test feature set defined by extracting Substantive, Predicate, Modifier, and Interjection parts of speech.

시각장애인의 보행보조를 위한 스마트폰 케이스 구현 (Development of Walking Assist Smartphone Case for Blind People)

  • 최진우;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권3호
    • /
    • pp.239-242
    • /
    • 2015
  • 시각장애인들은 외출을 하기 위해 보행 보조기기를 사용하고 있다. 또한, 최근에는 보행 보조기기뿐만 아니라 음성인식 명령기능을 탑재한 스마트폰도 이용하고 있다. 이러한 추세에 따라, 본 논문에서는 시각장애인 보행 보조를 위한 스마트 폰 케이스를 설계하고 구현하였다. 조도 센서와 스마트폰 카메라 플래시를 이용하여 어두운 장소에서 자신의 위치를 알려주는 자기 위치 알림 시스템과 초음파 센서를 이용하여 장애물을 감지하고 시각장애인들에게 음성으로 경고를 해주는 음성 경고 시스템을 제공한다. 이를 이용하면 시각장애인은 어두운 곳에서 자신의 위치를 알리고, 전방의 장애물을 피해갈 수 있어서 보다 안전하게 보행하여 사고를 방지할 수 있다.

NFC 기반 2 Factor 모바일 전자결제를 위한 갤러리-옥션의 사용자인증 모듈 개발 (User certification module development of Gallery-Auction for NFC-based 2 Factor mobile electronic payment)

  • 조원오;차윤석;오수희;최명수;김형종
    • 스마트미디어저널
    • /
    • 제6권3호
    • /
    • pp.29-40
    • /
    • 2017
  • 최근 NFC 기능이 탑재되어있는 스마트폰의 비중이 급속하게 많아지고 있으며, 이로 인해 NFC 관련 기술이 많은 기업들에 의해 만들어지고 있다. NFC기반 2 factor 전자결제시스템의 보안기능 향상과 새로운 서비스를 위해 갤러리-옥션을 개발하였다. XenServer를 이용해 효율적으로 서버를 관리 할 수 있도록 하였으며, 향상된 보안기능은 FIDO 인증기술을 적용하기 위해 지문인식을 통한 사용자 인증 모듈의 개발 및 TTS를 이용한 갤러리-옥션의 전자계약 음성서비스를 개발하였으며, 실제 적용을 통해 테스트 한 결과, NFC 모바일 전자결제를 통한 사용자의 편리하고 간단한 인증방식과 보안성을 강화하였다.

비보건계열 일반인을 위한 단계별 CPR 가이드라인과 학습자료 제공 어플리케이션 개발 연구 (A Study on Development of Applications which Provides Step-by-step CPR Guidelines and Learning Materials for Non Health-related Person)

  • 김종민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.649-651
    • /
    • 2021
  • 우리 나라의 연간 심정지 환자는 3만명 안팎이며, 점차 그 수가 증가 하고 있다. 이러한 배경으로 심폐소생술 교육과 홍보사업을 전국적으로 확대 시행해왔지만 일반인에 의한 목격자 심폐소생술 시행 비율은 4.4%로 외국의 20%~70% 비율과 비교하면 현저히 낮은 실정이다. 따라서 본 논문에서는 심정지 환자를 발견한 목격자가 CPR을 수행하는 데 영향을 주는 요인을 분석하고 그 결과를 바탕으로, 일반인 목격자의 의한 심폐소생술 시행 비율 증가에 효과적으로 보조할 수 있도록 사용자에게 올바른 심정지 대처요령과 단계별 CPR 가이드라인을 사용자에게 제공하는 어플리케이션 기획·개발 연구를 수행하였다.

  • PDF

『적천수(滴天髓)』 격국론의 후대 평주 간 비교연구 (A Study on Comparison of Later Commentaries about Kyeokguk theory of Jeokcheonsu)

  • 이보영;김기승
    • 산업진흥연구
    • /
    • 제7권1호
    • /
    • pp.81-87
    • /
    • 2022
  • 이 연구는 『적천수』에 대한 다양한 판본들을 비교하고 분석하여 한가지 원문을 두고 평주한 시각에 따라 달라져 있는 주석에 대하여 어떤 해석이 더 타당한 것인가를 확인하고자 하는 데 목적이 있다. 『적천수』의 명리이론에 대한 오해 중에서 가장 크게 차지하고 있는 부분이 격국론이다. 『적천수』는 격국을 중시하지 않았으며 억부용신을 강조하는 명리 고전이라는 평가를 많이 받는다. 하지만 원문을 이론별로 분류해 본 결과 억부론을 직접적으로 언급한 문장은 5개 남짓에 불과 하지만, 격국론을 설명하고 있는 문장은 9개 그리고 종격과 화격을 설명한 것까지 포함한다면 격국을 설명하는 문장이 15개에 이른다. 은유적 화법을 주로 사용하고 있는 것만 보더라도 명리 초급자에게 읽히고자 저술된 서적이 아님도 분명하다. 명리의 원리를 이미 학습하여 충분한 지식을 가지고 있는 이들에게 더 심오한 이치를 전달하고 깨우침을 갖게 하고자 저술된 명리서이다. 이런 수준의 독자를 가정하고 저술되었기에 "재관인수분편정(財官印綬分偏正) 겸론식상격국정(兼論食傷格局定)"이라는 하나의 문장이면 격국론에 대한 설명으로 충분하였을 것이다. 『적천수』에 담겨있는 후대 평주 간 명리이론중에서 격국론에 관련된 '팔격', '관살', '상관', '월령', '생시', '청탁'원문에 대한 4인의 평주를 비교 분석하였다.