• 제목/요약/키워드: Voice Recognition Technology

검색결과 213건 처리시간 0.025초

인공지능 컨트롤러를 이용한 전기 시퀀스 제어 안전 모듈 회로 개발 (Development of Electrical Sequence Control Safety Module Circuit Using Artificial Intelligence Controller)

  • 김홍용
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.699-705
    • /
    • 2022
  • 연구목적: 시퀀스제어는 제조, 유통, 건설, 의료 산업분야의 자동화 등에 응용되어 널리 사용하고 있다. 4차산업의 발전으로 제어분야에 인공지능 융합 기술이 산업에 중요한 요소가 되어가고 있다. 특히 기존 시스템에 마이크로프로세서와 인공지능이 융합된 설비의 안전성과 혁신성을 평가하고 신뢰성 높은 장비개발이 요구되고 있어 교육목적의 장비를 개발하여 해당분야의 발전을 견인하고자 한다. 연구방법: 자체 개발한 일체형 인공지능 컨트롤러 모듈은 기존의 시퀀스 및 PLC제어 회로에 인공지능 능력을 융합한 장비이다. 본 장비의 성능평가항목으로 동작, 음성, 문자, 색상 등의 인식 능력과 회로의 안정성, 신뢰성을 평가하였다. 결론: 시퀀스 및 PLC 회로를 설계 후 융합된 일체형 인공지능 컨트롤러 모듈의 성능평가항목이 모두 만족하였고 회로의 안전성과 신뢰성에 문제가 없는 것으로 나타났다.

Gesture Control Gaming for Motoric Post-Stroke Rehabilitation

  • Andi Bese Firdausiah Mansur
    • International Journal of Computer Science & Network Security
    • /
    • 제23권10호
    • /
    • pp.37-43
    • /
    • 2023
  • The hospital situation, timing, and patient restrictions have become obstacles to an optimum therapy session. The crowdedness of the hospital might lead to a tight schedule and a shorter period of therapy. This condition might strike a post-stroke patient in a dilemma where they need regular treatment to recover their nervous system. In this work, we propose an in-house and uncomplex serious game system that can be used for physical therapy. The Kinect camera is used to capture the depth image stream of a human skeleton. Afterwards, the user might use their hand gesture to control the game. Voice recognition is deployed to ease them with play. Users must complete the given challenge to obtain a more significant outcome from this therapy system. Subjects will use their upper limb and hands to capture the 3D objects with different speeds and positions. The more substantial challenge, speed, and location will be increased and random. Each delegated entity will raise the scores. Afterwards, the scores will be further evaluated to correlate with therapy progress. Users are delighted with the system and eager to use it as their daily exercise. The experimental studies show a comparison between score and difficulty that represent characteristics of user and game. Users tend to quickly adapt to easy and medium levels, while high level requires better focus and proper synchronization between hand and eye to capture the 3D objects. The statistical analysis with a confidence rate(α:0.05) of the usability test shows that the proposed gaming is accessible, even without specialized training. It is not only for therapy but also for fitness because it can be used for body exercise. The result of the experiment is very satisfying. Most users enjoy and familiarize themselves quickly. The evaluation study demonstrates user satisfaction and perception during testing. Future work of the proposed serious game might involve haptic devices to stimulate their physical sensation.

감성평가를 이용한 선교알람관리시스템의 청각아이콘 평가 (Selection of Auditory Icons in Ship Bridge Alarm Management System Using the Sensibility Evaluation)

  • 오승빈;장준혁;박진형;김홍태
    • 한국항해항만학회지
    • /
    • 제37권4호
    • /
    • pp.401-407
    • /
    • 2013
  • 선박 기술 발전에 따라 다양한 장비가 개발되고 있지만 인적요인에 의한 해양사고는 여전히 지속적으로 발생하고 있다. 이러한 상황에서 인적요인에 의한 사고 감소를 위하여 선교 내 항해장비의 인간공학적 설계가 많은 관심의 대상이 되고 있다. 선교에는 항해 및 통신장비로부터 나오는 음향 신호 등 항해사에게 정보를 전달하기 위한 다양한 청각 신호들이 존재한다. 하지만 이러한 청각 신호, 청각 경고음에 대한 인간의 인지능력에 관한 연구는 미흡한 실정이다. 청각 경고음은 크게 음성(speech), 함축적 소리(abstract sound), 청각 아이콘(auditory icon)으로 구분 할 수 있다. 본 연구에서는 청각 경고음 중 청각아이콘을 활용하여 5가지의 경보상황(엔진, 화재, 조타, 전기, 충돌)에서 청각아이콘에 대한 감성평가를 통해 각 상황에 적합한 청각아이콘을 선별하였다. 5가지 경보상황 중 뚜렷한 경향이 나타난 2가지 경보상황(엔진, 충돌)에 대하여 분석을 하였다. 본 연구 결과는 선교 내 청각표시장치와 통합선교알람관리시스템을 위한 기초자료로 활용될 수 있을 것으로 기대된다.

대상객체 맥락 기반 생체정보 분석방법 (Method of Biological Information Analysis Based-on Object Contextual)

  • 김경준;김주연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.41-43
    • /
    • 2022
  • 최근 코로나-19의 유행에 따른 전염병 예방 및 차단을 위해 비접촉 생체 정보 취득 및 분석 기술이 주목을 받고 있다. 습식 및 부착형 생체정보 취득 방법은 정확하게 생체정보를 측정 할 수 있는 장점이 있지 만 밀 접촉에 따른 전염이 높아지는 위험성을 내포하고 있다. 이러한 문제점을 해결하기 위해 사람의 지문, 얼굴, 홍채, 정맥, 음성, 서명 등의 생체 정보를 자동화된 장치로 추출하는 비접촉 방식은 빅데이터와 AI 기술 적용으로 데이터 처리 속도가 빨라지고 인식 정확도가 높아지면서 다양한 산업에서 활용이 증가하고 있다. 그러나, 비접촉식 생체 데이터 취득 기술의 정확도가 개선되었지만, 비접촉 방법은 측정 대상 객체를 둘러싸고 있는 외부 온도, 습도, 조도 등의 주위 환경에 많은 영향을 받아 측정정보가 왜곡되는 현상이 발생하고 또한 정확도가 떨어지는 단점이 있다. 본 논문에서는 생체정보 분석을 위한 개인화 정보(이미지, 신호 등)의 해석을 위한 맥락기반 생체신호 모델링 기법을 제안 한다. 맥락기반 생체정보 모델링 기법은 성능 개선을 위해 생체정보 측정의 정황 정보와 사용자 정보를 복합적으로 고려하는 모델을 제시한다. 제안 모델은 예측 값 확률을 최대화할 수 있는 맥락기반 신호 해석을 통한 특징 확률분포를 기반으로 신호 정보를 분석한다.

  • PDF

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

대화형 에이전트의 오류 상황에서 사회적 전략 적용: 사전 양해와 사과를 이용한 사례 연구 (Applying Social Strategies for Breakdown Situations of Conversational Agents: A Case Study using Forewarning and Apology)

  • 이유미;박선정;석현정
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.59-70
    • /
    • 2018
  • 음성인식 기술의 비약적 발전으로 최근 몇 년 사이 대화형 에이전트는 스마트폰, 인공지능 스피커 등을 통해 널리 보급되었다. 음성인식 기술의 인식의 정확도는 인간의 수준까지 발전하였으나, 여전히 말의 의미나 의도를 파악하는 것과 긴 대화를 이해하는 것 등에는 한계를 보이고 있다. 이에 따라 사용자는 대화형 에이전트를 사용함에 있어 다양한 오류 상황들을 경험하고 있으며 이는 사용자 경험에 부정적인 영향을 미칠 수 있다. 또한, 목소리를 주 인터페이스로 하는 인공지능 스피커의 경우, 대화형 에이전트의 기능 및 한계에 대한 피드백의 부족은 지속적 사용을 저해하는 요소로 꼽히고 있다. 따라서 사용자가 대화형 에이전트의 기능 및 한계를 보다 잘 이해하고 오류 상황에서 부정적인 감정을 완화할 수 있는 방안에 대한 연구에 대한 필요성이 높으나, 아직 관련 연구는 미비한 실정이다. 이에 본 연구에서는 사회적 전략 중 '사전 양해'와 '사과'를 대화형 에이전트에 적용하고 이러한 전략이 사용자가 에이전트에 대해 느끼는 인식에 어떠한 영향을 미치는지 조사하였다. 이를 위해 사전 양해와 사과 여부를 나누어 사용자가 대화형 에이전트와 대화하는 데모 영상을 제작하였고, 실험참가자들에게 영상을 보여준 뒤 느끼는 호감도와 신뢰도를 설문을 통해 평가하도록 하였다. 총 104명의 응답을 분석한 결과, 문헌조사를 토대로 한 우리의 예상과는 상반되는 결과를 얻었다. 사전 양해는 오히려 사용자에게 부정적인 인상을 주었으며, 특히 에이전트에 대한 신뢰도에 부정적인 영향을 주었다. 또한 오류 상황에서의 사과는 사용자가 느끼는 호감도나 신뢰도에는 유의미한 영향을 미치지 않았다. 심층인터뷰를 통해 원인을 파악한 결과, 실험참가자들은 인공지능 스피커를 사람과 같은 인격체보다는 단순한 기계에 가깝다고 인식했기 때문에 인간관계에 작용하는 사회적 전략이 영향력을 발휘하지 못한 것으로 해석된다. 이러한 결과는 사용자가 에이전트를 얼마나 기계, 혹은 사람에 가깝게 인식하는지에 따라 오류 상황에 대한 에이전트의 대처 방식 또한 달라져야 함을 보여준다.

라즈베리 파이를 적용한 시각장애인을 위한 휴대용 카드 리더기 개발 (Development of a Portable Card Reader for the Visually Impaired using Raspberry Pi)

  • 이현승;최인문;임순자
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.131-135
    • /
    • 2017
  • 본 논문에서는 라즈베리 파이를 적용하여 시각 장애인들을 위한 휴대용 카드 리더기를 개발하였다. 국내에서는 장애인들을 위한 생활보조기구 개발이 미비한 상태이다. 세계적으로도 장애인들을 위한 생활보조기구가 미약했으나 최근에 IT, 스마트폰, 사물 인터넷, 3D 프린터 등의 개발로 점점 장애인들을 위한 생활 보조 기구들이 개발되고 있다. 시각장애인들을 만나서 설문한 결과 현재 개발된 스마트폰 앱을 이용한 카드인식기능은 스마트 폰의 화면을 시각장애인들의 손으로 인지할 수 없고 작동하기도 불편하다고 입을 모았다. 근래에 시각 장애인들이 카드인식을 가능 하도록 하는 기기들이 외국에서 연구되고 있고 시제품으로 나오고 있는 실정이다. 그러나 현재 상용되는 휴대용 카드 리더기들은 가격이 높고 편리성이 떨어진다. 또한 시각장애인들은 취약 저소득층이 대부분이어서 값 비싼 기기들을 구입하여 사용하기가 힘들다. 본 연구에서는 시각장애인들이 저렴한 가격으로 사용하기 편리하도록 사물인터넷에 적용 가능한 오픈소스 하드웨어인 라즈베리 파이를 이용하여 자기스트립 리더(Magnetic strip reader)와 IC칩 리더(IC chip reader)로 카드를 인식하고 음성과 진동을 통해 알려주는 카드리더기를 개발하였다.

해사영어 플랫폼을 활용한 표준해사영어 실력 향상에 관한 연구 (Study on Improving Maritime English Proficiency Through the Use of a Maritime English Platform)

  • 설진기;박영수;신동수;김대원
    • 해양환경안전학회지
    • /
    • 제29권7호
    • /
    • pp.930-938
    • /
    • 2023
  • 해사영어는 선박 운항, 해양 안전, 선내 의사소통 및 선외 교신을 위해 설계된 특수한 영어 언어체계이다. 국제해사기구 STCW(선원의 훈련, 자격증명 및 당직근무의 기준에 관한 국제협약)에 따르면 국제항해에 종사하는 항해사가 되기 위해서는 SMCP를 포함한 해사영어 대한 충분한 이해가 수반되어야 한다. 본 연구는 음성인식, 번역, 단어 기입 등 유형의 해사영어시험을 통하여 학생들의 해사영어 활용 능력을 측정하고 플랫폼 사용에 따른 시험 점수 향상 정도, 나아가 초임항해사로 나가기 위하여 요구되는 해사영어 시험 플랫폼 활용 시간 등을 조사하고자 하였다. 실험은 먼저 초기 시험을 통해 학생들의 일반영어능력과 SMCP 활용 능력에 대한 연관성을 조사한 후, 중간 시험 및 최종 시험을 통해 플랫폼 활용에 대한 점수 향상 정도, 응시시간 변화 등 요인을 측정하였다. 초기 시험을 통해 개인 요인(예: 토익 점수, 본인 스스로에 대한 영어능력 평가)에 따른 그룹 간 해사영어시험 점수에 유의한 차이가 있음을 확인하였으며, 중간시험 및 최종시험을 통해 플랫폼 활용이 유의한 시험점수 향상으로 이어졌음을 확인하였다. 해당 연구는 해사 교육분야에 다양하게 적용할 수 있는 학습 플랫폼 활용 효능을 조사하였으며 향후 해사영어 교육 외 그 범위를 넓혀 활용될 수 있을 것으로 사료된다.

고객 맞춤형 서비스를 위한 관객 행동 기반 감정예측모형 (The Audience Behavior-based Emotion Prediction Model for Personalized Service)

  • 유은정;안현철;김재경
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.73-85
    • /
    • 2013
  • 정보기술의 비약적 발전에 힘입어, 오늘날 기업들은 지금까지 축적한 고객 데이터를 기반으로 맞춤형 서비스를 제공하는 것에 많은 관심을 가지고 있다. 고객에게 소구하는 맞춤형 서비스를 효과적으로 제공하기 위해서는 우선 그 고객이 처한 상태나 상황을 정확하게 인지하는 것이 중요하다. 특히, 고객에게 서비스가 전달되는 이른바 진실의 순간에 해당 고객의 감정 상태를 정확히 인지할 수 있다면, 기업은 더 양질의 맞춤형 서비스를 제공할 수 있을 것이다. 이와 관련하여 사람의 얼굴과 행동을 이용하여 사람의 감정을 판단하고 개인화 서비스를 제공하기 위한 연구가 활발하게 이루어지고 있다. 얼굴 표정을 통해 사람의 감정을 판단하는 연구는 좀 더 미세하고 확실한 변화를 통해 정확하게 감정을 판단할 수 있지만, 장비와 환경의 제약으로 실제 환경에서 다수의 관객을 대상으로 사용하기에는 다소 어려움이 있다. 이에 본 연구에서는 Plutchik의 감정 분류 체계를 기반으로 사람들의 행동을 통해 감정을 추론해내는 모형을 개발하는 것을 목표로 한다. 본 연구는 콘텐츠에 의해 유발된 사람들의 감정적인 변화를 사람들의 행동 변화를 통해 판단하고 예측하는 모형을 개발하고, 4가지 감정 별 행동 특징을 추출하여 각 감정에 따라 최적화된 예측 모형을 구축하는 것을 목표로 한다. 모형 구축을 위해 사람들에게 적절한 감정 자극영상을 제공하고 그 신체 반응을 수집하였으며, 사람들의 신체 영역을 나누었다. 특히, 모션캡쳐 분야에서 널리 쓰이는 차영상 기법을 적용하여 사람들의 제스쳐를 추출 및 보정하였다. 이후 전처리 과정을 통해 데이터의 타임프레임 셋을 20, 30, 40 프레임의 3가지로 설정하고, 데이터를 학습용, 테스트용, 검증용으로 구분하여 인공신경망 모형을 통해 학습시키고 성과를 평가하였다. 다수의 일반인들을 대상으로 수집된 데이터를 이용하여 제안 모형을 구축하고 평가한 결과, 프레임셋에 따라 예측 성과가 변화함을 알 수 있었다. 감정 별 최적 예측 성과를 보이는 프레임을 확인할 수 있었는데, 이는 감정에 따라 감정의 표출 시간이 다르기 때문인 것으로 판단된다. 이는 행동에 기반한 제안된 감정예측모형이 감정에 따라 효과적으로 감정을 예측할 수 있으며, 실제 서비스 환경에서 사용할 수 있는 효과적인 알고리즘이 될 수 있을 것으로 기대할 수 있다.

스마트카의 인터페이스를 위한 경험 디자인 가이드라인 (Experience Design Guideline for Smart Car Interface)

  • 유훈식;주다영
    • 디자인융복합연구
    • /
    • 제15권1호
    • /
    • pp.135-150
    • /
    • 2016
  • 통신 기술의 발달, 지능형교통체계(ITS: Intelligent Transport Systems)의 확산으로 자동차는 단순한 기계장치에서 종합편의 기능을 가진 제2의 생활 공간으로 변모하고 있으며, 이를 위한 인터페이스로써의 역할을 하는 플랫폼으로 진화하고 있다. 탑승자들에게 다양한 정보를 제공하는 인터페이스 영역이 확장됨에 따라 스마트카 기반의 사용자 경험(UX: User Experience) 연구에 대한 중요성이 높아지고 있다. 이 연구는 스마트카의 사용자 경험 요소에 대한 가이드라인을 제안하는데 목적을 두고 있다. 연구의 수행을 위해 기존 연구를 기반으로 스마트카의 사용자 경험 요소를 기능(function), 상호작용(interaction), 표면(surface)으로 정의하였으며, UX/UI 전문가들의 논의를 통해 각 요소 별로 8개의 대표 기술, 14개의 대표 기능, 8개의 유리창의 위치를 정의하였다. 이 후 100명의 운전자를 대상으로 정의된 스마트카 사용자 경험 요소들에 대한 우선순위를 설문조사 방식으로 분석하였다. 분석을 통해 사용자들은 차량에 주요 기술을 적용함에 있어서 안전, 주행, 감성의 순으로, 조작 방식에 있어서는 음성인식, 터치, 제스처, 물리적 버튼, 아이트레킹의 순으로, 디스플레이 위치에 대해서는 운전석을 중심으로 전방에서 후방으로 높은 우선순위를 가지고 있는 것을 알 수 있었다. 성별에 따른 분석에 있어서는 2개의 기능 외에는 큰 차이를 보이지 않아 남성과 여성에 대한 가이드가 공통되게 적용될 수 있음을 알 수 있었다.