• Title/Summary/Keyword: 시각 음성인식

Search Result 130, Processing Time 0.025 seconds

Object Detection Algorithm for Explaining Products to the Visually Impaired (시각장애인에게 상품을 안내하기 위한 객체 식별 알고리즘)

  • Park, Dong-Yeon;Lim, Soon-Bum
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.10
    • /
    • pp.1-10
    • /
    • 2022
  • Visually impaired people have very difficulty using retail stores due to the absence of braille information on products and any other support system. In this paper, we propose a basic algorithm for a system that recognizes products in retail stores and explains them as a voice. First, the deep learning model detects hand objects and product objects in the input image. Then, it finds a product object that most overlapping hand object by comparing the coordinate information of each detected object. We determine that this is a product selected by the user, and the system read the nutritional information of the product as Text-To-Speech. As a result of the evaluation, we confirmed a high performance of the learning model. The proposed algorithm can be actively used to build a system that supports the use of retail stores for the visually impaired.

Development of a Vegan Decipher System for the Social Vulnerable, such as the Low Vision Person and the Visually Impaired Person Using Optical Character Recognition (OCR) (광학 문자 인식(OCR)을 활용한 저시력자 및 시각장애인 등 사회적 약자를 위한 비건 판독 시스템 개발)

  • Hye-Rim OH;Ye-Na Kong;Jeong-Min Kim;Jea-Jun Choi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.990-991
    • /
    • 2023
  • 커져만 가는 비건 시장에 비해서 비건 제품의 가격은 높고, 한정되어 있다. 성분표만을 보고 비건 여부를 파악하기에는 어렵고, 저시력자 및 시각장애인에게는 더욱 어려운 일이다. 치주 질환이나 당뇨를 포함한 크고 작은 다양한 질병으로 인해 육식 섭취 대신 불가피하게 채식을 실천해야 하는 경우 또는 가격 부담이 크고 찾기 어렵다. 그래서 비건 인증을 받은 제품 대신 일반 제품들 사이에서 비건에 적합한 제품을 찾는 데 도움이 되는 시스템을 개발하고자 한다. 본 논문에서는 저시력자 및 시각장애인을 위한 큰 글씨 화면, 음성 입출력 시스템 제공과 성분표 촬영을 통해 비건 적합 여부 및 알레르기 정보 제공, 사용자 특성 분석을 통한 UI 구성의 서비스를 제공한다. 성분표 촬영에 어려움을 겪는 저시력자 및 시각장애인에게 편리를 제공하기 위해 소프트웨어 뿐만 아니라 하드웨어를 구성한다.

Implementation of a Smart Shelf for the Elderly and Infirm (노약자를 위한 스마트 선반의 구현)

  • Choi, Duk-Kyu;Kim, Min-Su;Ha, Hun-Cheol;Park, Hye-Min
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.285-286
    • /
    • 2018
  • 본 과제는 일반적인 선반 사용에 어려움과 불편함을 겪고 있는 노약자들을 위한 해결 방법으로 제안되었다. 스마트선반을 이용할 경우 스마트폰과 블루투스 연결을 하게 되며 앱과 연동하게 된다. 이때 초음파 센서가 선반과 장애자 사이의 거리를 측정하게 되며 거리 안에 들어오게 되면 스피커 모듈을 통해 알람이 울리게 되며, 시각장애인의 경우 선반의 위치를 알고 그 자리에서 원하는 선반의 층의 버튼을 누르거나 음성인식을 통하여 원하는 층을 말하게 되면 높은 위치에 있는 선반의 물건을 어렵게 꺼내지 않고도 원하는 위치에 올 수 있게 된다.

  • PDF

Data Preprocessing Algorithm for Developing Voice Recognition-based Shopping Applications (음성 인식 기반 쇼핑 어플리케이션 개발을 위한 데이터 전처리 알고리즘)

  • Gu, Yeonwoo;Park, Eunbi;Choo, Seoyeon;Kim, Yujeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.1006-1008
    • /
    • 2022
  • 시각장애인이 이미지로 구성된 온라인 쇼핑몰에서 정보를 얻기 어려운 문제를 해결하기 위해, 본 논문에서는 이미지 텍스트 변환 알고리즘 연구를 진행하였다. 해당 연구를 기반으로 개발한 어플리케이션 <들리네>는 쇼핑몰 홈페이지로부터 정보를 수집하고, 이미지 속 텍스트를 추출하여 전처리 및 음성 변환 과정을 거쳐 사용자에게 제공한다. <들리네>는 사용자가 이미지 정보로 이루어진 온라인 쇼핑몰에서 명확한 정보를 편리하게 얻는 것을 목표로 한다.

Personal Smart Mirror Using Open API (Open API를 활용한 개인용 스마트미러)

  • Sung Jin Kim;Jin Myung Choi;Nak Jun Choi;Dong Eun Lee;Da Eun Kim;Sung Jin Yun;Nak Jin Choi
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.109-112
    • /
    • 2023
  • 본 논문에서는 정보화 시대의 바쁜 현대인들에게 일상생활 속 필요한 정보들을 거울과 IOT 기술을 접목하여 인포그래픽(inforgraphics) 형태로 제공하는 개인용 스마트 미러를 제작하였다. 제공되는 정보는 날짜 및 시간, 일정, 날씨, 뉴스 속보, 실시간 버스 도착 정보, 실시간 지하철 도착 정보가 있으며 Google Assistant SDK를 활용하여 시각적 정보제공의 한계를 개선하였다.

  • PDF

Consideration for cognitive effects in smart environments for effective UXD(User eXperience Design) (스마트환경의 효과적인 UXD를 위한 인지작용 고찰)

  • Lee, Chang Wook;Chung, Jean-Hun
    • Journal of Digital Convergence
    • /
    • v.11 no.2
    • /
    • pp.397-405
    • /
    • 2013
  • The development of the technology of the 21st century, wireless Internet technology development in smart environments, was rapidly settled. In such an environment, the user is faced with many smart devices and smart content. This study is the analysis of the smart environment and smart devices, and user-to-user cognitive out about the effects reported. Cognitive effects observed behavior, technology, and user-centered system design, and plays a very important role to play in educating the users. And theoretical consideration about the UX (User eXperience) and UXD (User eXperience Design), by case analysis on the technical aspects of 'effective' visual aspect of interoperation aspects (interaction), and the cognitive effects of UXD (User eXperience Design) examined. As a result, on the visual aspects of the user experience based on the design that can be used to know, and be sound or through interaction with the user of the machine-to-machine interaction (and interaction) that must be provided, such as location-based or speech recognition technology will help you through the convenience of the user. Through this research, the smart environment and helping act of understanding, effective UXD (User eXperience Design) to take advantage of to help.

Walking Assistive for the Visually Impaired using Real-Time Image Processing (실시간 영상처리를 이용한 시각장애인용 보행 보조기구)

  • Hyeok-Min Kwon;Seok-Hwan Go;Kyoung-Hyung Lee;Woo-Jae Lee;Hae-Jun Park;Young-Seok Jung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.457-458
    • /
    • 2023
  • 본 논문에서는 실시간 영상처리 라이브러리인 OpenCV와 YOLO를 활용하여 사용자가 횡단보도 보행 시 안전을 제공해 주는 시스템을 개발하였다. 객체 인식 알고리즘인 YOLOv4-tiny를 이용하여 Ubuntu 환경에서 구현하였다. 데이터 셋은 인도 보행 영상 데이터 셋을 이용하였고 하드웨어는 Jetson Nano를 이용하여 구현하였다. 신호등의 색에 따른 보행 가능 여부를 카메라를 이용하여 전방의 장애물을 음성신호를 이용하여 사용자에게 전달한다. 제안된 시스템은 횡단보도와 신호등, 자동차와 같은 도로 위의 객체들로 설계된 알고리즘을 이용해 다양한 곳에서 사용이 가능하여 활용도가 높을 것으로 예상된다.

  • PDF

Expansion of Sensibility Area and Industrial Application in the Convergence Era - With Special Reference to Analysis of the Internet Arts of Sommerer and Mignonneau - (컨버전스시대 감성영역의 확장과 산업활용 -Sommerer와 Mignonneau의 인터넷 아트 분석을 중심으로-)

  • Kim, Hee-Young;Lee, Yong-Jae
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.12
    • /
    • pp.146-154
    • /
    • 2010
  • Recently 'convergence' and 'communication' have been keywords in many areas. Artists and engineers have begun to communicate each other through collaboration based on new technologies. One of the exemplary technologies of this era of convergence is a technology of fusing five senses used by both Internet Art and industrial technologies such as car navigation systems and the iPhone. Sommerer and Mignonneau's Internet Art $\ll$Riding the Net$\gg$,$\ll$The Living Room$\gg$, and $\ll$The Living Web$\gg$ implement the Internet and the five-sense fusion technology to translate not only sound into visual images but also tactile senses into tempo-spatial representations. Likewise, industrial technologies such as car navigation systems and the iPhone employ the five-sense fusion technology of speech recognition, which leads to the expansion of the realm of senses in technology as seen in Internet Art. As examined in this study, the development of art and technology through their convergence will open up a new dimension of digital art and culture technology industry.

Development of a Portable Card Reader for the Visually Impaired using Raspberry Pi (라즈베리 파이를 적용한 시각장애인을 위한 휴대용 카드 리더기 개발)

  • Lee, Hyun-Seung;Choi, In-Moon;Lim, Soon-Ja
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.18 no.10
    • /
    • pp.131-135
    • /
    • 2017
  • We developed a portable card reader for the visually impaired. In South Korea, there is insufficient development of lifestyle aids for people with disabilities. Living aids for people with disabilities are being developed using information technology, smart phones, Internet of Things(IoT) devices, 3D printers, and so on. Blind people were interviewed, which showed that the card recognition function using a currently developed smart phone app was not able to recognize the screen of the smart phone by the hand of the visually impaired, and it was inconvenient to operate. In recent years, devices that enable the visually impaired to recognize cards have been studied in foreign countries and are emerging prototypes. But what is currently available is expensive and inconvenient. In addition, visually impaired people are most vulnerable to low-income families, which makes it difficult to purchase and use expensive devices. In this study, we developed a card reader that recognizes a card using a Raspberry Pi, which is an open-source hardware that can be applied to IoT. The card reader plays it by voice and vibration, and the visually impaired can use it at a low price.

Development of RFID terminal for the Blind to Voice Guide Pharmaceutical E-pedigree (시각장애인을 위한 RFID 의약품 음성안내 단말기 개발)

  • Kang, Joon-Hee;Ahn, Sung-Soo;Kim, Jin-Young
    • 전자공학회논문지 IE
    • /
    • v.47 no.3
    • /
    • pp.19-25
    • /
    • 2010
  • We developed a RFID terminal to voice guide the blind who have difficulties in reaching out to the pharmaceutical information. In this work, we used RFID technology to instruct the pharmaceutical information to the blind. The voice guidance reader was made to read the RFID tag attached to the drugs and announced the pharmaceutical information matching to the tag specific ID. We had the reader to obtain the pharmaceutical information from the ezDrug site operated by Korea Food & Drug Association. The voice guidance reader was fabricated as necklace type for the easy carry, and we added mp3 player as dual uses. ARM series Cortex M3 chip was used for the reader's core chip and low power MFRC523 chipset of NXP was used to construct RFID circuit. MFRC523 chip uses low power to meet the mobile application. We used VS1003B MP3 Decoder IC to make the voice generation circuit and CC2500 chipset for the wireless communication to the pharmaceutical information server. We also developed the system that can support ISO 14443A type and ISO 14443B type so that the system can be used to extend to various RFID protocols. Utilization of this system can conveniently convey the pharmaceutical information to the blind and reduce the drug abuse.