• 제목/요약/키워드: 대화 서비스

검색결과 506건 처리시간 0.028초

Voice Browser를 위한 음성 인식 웹서비스 환경에 관한 연구 (A Study of Speech Recognition Web Services Environment for Voice Browser)

  • 홍인숙;김윤중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.142-145
    • /
    • 2009
  • 음성인터페이스 관련 표준화는 음성 대화, 음성인식/합성, 전화망 등의 접속망을 상호 분리하여 음성정보시스템 구성요소들 각각의 상호 독립적인 개발을 보장해 주며, 각 요소의 이해가 없이도 음성정보시스템을 개발할 수 있도록 함으로써 음성정보기술의 보급 및 확산에 크게 기여하고 있다. 이에 W3C에서는 Voice Browser에 대한 표준화를 현재 진행 중에 있으며 Vocie Browser WG에서 Voice Browser를 위한 SIF(Speech Interface Framework)를 제안하였다. 제안된 SIF에서 Voice Browser가 음성인식을 실행하기 위해서는 많은 자원의 소요와 부하가 생길 수 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 음성인식 웹 서비스를 기존의 SIF에 추가한 새로운 형태의 SIF를 제안하고자 한다. 음성인식은 원격 시스템에서 수행하고 그 결과를 Voice Browser가 사용할 수 있도록 음성인식 웹서비스 환경을 구축하였다. 그리고, XML-SRGS 포멧의 grammar를 음성인식기가 사용하는 EBNF 포멧의 grammar로 변환시키는 변환기를 구현하였다.

상용 API 의 감정에 따른 음성 인식 성능 비교 연구 (A Study on the Comparison of the Commercial API for Recognizing Speech with Emotion)

  • 양장훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.52-54
    • /
    • 2023
  • 최근 인공지능 기술의 발전에 따라서 다양한 서비스에서 음성 인식을 활용한 서비스를 제공하면서 음성 인식에 대한 중요성이 증가하고 있다. 이 논문에서는 국내에서 많이 사용되고 있는 대표적인 인공지능 서비스 API 를 제공하는 구글, ETRI, 네이버에 대해서 감정 음성 관점에서 그 차이를 평가하였다. AI Hub 에서 제공하는 감성 대화 말뭉치 데이터 셋의 일부인 음성 테스트 데이터를 사용하여 평가한 결과 ETRI API 가 문자 오류율 (1.29%)과 단어 오류율(10.1%)의 성능 지표에 대해서 가장 우수한 음성 인식 성능을 보임을 확인하였다.

학교 생활 대화 요약 및 감정 기록 AI 챗봇 서비스 (AI Chatbot Service for Summarizing School Life Conversations and Recording Emotions)

  • 박고은;정윤현;조다은;김수현;노윤하;박정규;유견아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1027-1028
    • /
    • 2023
  • 학교상담은 학생들의 학업 및 심리적 건강을 촉진하는 핵심 구성 요소 중 하나로 자리 잡고 있으며, 코로나 19 로 인한 언택트 시대로의 전환은 비대면 상담 방식의 혁신을 촉발하였다. 본 연구는 AI 챗봇을 활용한 상담 서비스를 통해 학교상담의 효과를 높이고, 학생들의 학업 및 심리적 건강에 대한 지원을 강화하는 데 주력한다. 이러한 연구는 미래의 학교 상담 서비스 분야에 크게 이바지할 것으로 기대된다.

원격 의료의 혁신 (A Study on Tools for Agent System Development)

  • 하소희;박보경;한성수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.602-603
    • /
    • 2024
  • 이 논문은 코로나 팬데믹 시대에 원격 의료 서비스의 중요성이 부상함에 따라, LLM(Large Language Model)과 웨어러블 기기를 활용한 의료 기술의 발전과 이를 통한 의료 서비스의 혁신에 대해 다루고 있다. 코로나 19 대응을 위해 원격 의료에 대한 법적 제한이 완화되며, 이에 따른 원격 의료 시스템의 확대를 언급하고 있다. LLM 을 활용한 의료 정보 관리와 웨어러블을 통한 건강 모니터링을 소개하며, 대화형 AI 를 통한 문의사항 처리와 2 차 처방, 실시간 번역 AI 기술 등의 기술적 혁신을 언급하고 있다. 이러한 기술들이 의료 서비스의 혁신과 개인 건강 관리에 새로운 차원을 열어주지만, 보안 문제와 디지털 격차 등의 문제가 동반될 수 있다고 경고하며, 이를 극복하기 위한 대책과 지속적인 개선이 필요하다고 강조하고 있다.

  • PDF

KI Cloud: 슈퍼컴퓨터를 통한 빅데이터 분석 및 머신 러닝 서비스 구축 방안 (KI Cloud: Design and Implementation of BigData Analysis and Machine Learning Applications on Supercomputer)

  • 박주원;이승민;정기문;홍태영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.80-82
    • /
    • 2020
  • 전통적으로 기초 과학 분야의 대규모 워크로드 작업들은 슈퍼컴퓨터와 같은 대용량 클러스터 시스템을 이용하여 수행해왔다. 그러나 최근 빅데이터 및 머신 러닝과 같은 새로운 분야에서의 컴퓨팅 자원 요구가 증가하고 기존 사용자의 요구 사항도 다양해짐에 따라 기존의 클러스터 시스템 운영 환경에서는 많은 어려움이 나타나고 있다. 이러한 문제를 해결하기 위해 한국과학기술정보연구원(KISTI)에서는 지난 3 월부터 KI (KISTI Intelligent) Cloud 서비스를 개발하여 서비스를 제공하고 있다. KI Cloud 서비스는 다음과 같은 특징이 있다. 첫째, Jupyter 과 RStudio 와 같은 대화형 개발 환경을 웹을 통해 제공함으로써 사용자는 언제, 어디서나 손쉽게 서비스를 활용할 수 있다. 둘째, 컨테이너 기술을 활용하여 사용자가 요구하는 개발 및 실행 환경을 실시간으로 구성하여 제공한다. 셋째, 사용자의 서비스 환경을 동적으로 구성하여 제공함으로써 컴퓨팅 자원의 효율성을 높일 수 있다.

사용성 향상을 위한 국가R&D정보 내비게이션 서비스의 사용자 니즈 분석과 정보 시각화 (User Needs Analysis and Information Visualization of National R&D Information Navigation Service for Improving Usability)

  • 이병희;손강렬
    • 한국콘텐츠학회논문지
    • /
    • 제13권2호
    • /
    • pp.512-521
    • /
    • 2013
  • 본 논문에서는 정보 서비스 기획 단계에서 시맨틱 기반으로 NDSL+NTIS 데이터베이스를 융 복합하여 국가R&D정보 내비게이션 서비스를 개발하기 위한 사용자 니즈 분석과 정보 시각화에 대해 알아본다. 사용자 니즈를 조사 분석하기 위해 산 학 연 연구자 중심으로 30명의 설문과 12명의 현장 인터뷰를 통해 여러 R&D 정보 서비스로부터 개선 방안을 마련하였다. 또한 새로운 정보 시각화 서비스를 설계하기 위해 대화형 내비게이션 타입의 국가R&D 정보 시각화 서비스를 제안하고 사용자 니즈 분석에 따라 페르소나와 화면 프로토타입을 작성하였다. 본 논문에서는 345,411건의 학술 논문과 620,55건의 공저자, 49,958건의 연구보고서를 NDSL에서 가져오고 187,466건의 국가R&D 과제를 NTIS에서 가져와서 융합하는 국가 R&D정보 융 복합 아키텍처를 설계하였다. 향후 본 논문에서 제안한 국가R&D정보 융 복합 아키텍처가 R&D 정보 융 복합의 선도 모델 및 표준이 되고 대화형 내비게이션 타입의 정보시각화 서비스가 사용성을 크게 향상시키기를 기대한다.

시맨틱 브로커 기반 시맨틱 서비스 조합 (Semantic Service Composition Based on Semantic Broker)

  • 정한민;이미경;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.283-288
    • /
    • 2009
  • 시맨틱 서비스는 온톨로지 기반으로 검색 API 또는 추론 API를 제공하는 서비스로 정의할 수 있는데, 웹 서비스 등의 대화 방식을 이용하며 웹상에서 공개된다. 온톨로지 기반이므로 URI (Uniform Resource Identifier)를 지원하며 온톨로지 스키마에 정의된 클래스와 속성 (Property)을 사용하여 미리 정의된 작업을 수행한다. 시맨틱 서비스는 입력 인자가 온톨로지에 정의된 클래스들로 구성되므로 시맨틱 서비스 조합 시에 온톨로지를 반드시 참조할 필요가 있다. 본 연구는 사용자 제시 조건을 입력받아 시맨틱 브로커를 이용하여 시맨틱 서비스 관리 서버에 등록된 시맨틱 서비스들 내의 온톨로지 정보와 관리 정보를 참조하여 조건에 맞는 시맨틱 서비스를 조합하는 방법을 제시한다. 사용자 제시 조건으로는 입력 인스턴스, 출력 클래스, 시각화 유형 (Visualization Type), 시맨틱 서비스명, 속성명 등이 있다. 시맨틱 서비스 조합은 사용자 제시 조건을 기반으로 동적으로 이루어지며, 그 결과는 복합 시맨틱 서비스를 포함하는 시맨틱 서비스 파이프라인들로서 사용자에게 순위화되어 제시된다. 사용자는 시맨틱 브로커에 의해 제시된 시맨틱 서비스 파이프라인들을 실행해 봄으로써 원하는 시맨틱 서비스 조합을 찾을 수 있다. 결국, 본 연구를 통해 개발된 도구는 다양한 곳에서 개발된 시맨틱 서비스들을 동적으로 연계하여 새로운 시맨틱 서비스를 개발하고자 하는 서비스 기획자를 지원하데 도움을 준다.

  • PDF

방사선(학)과 분야에서 챗봇을 이용한 학습방법의 유용성 (The Utility of Chatbot for Learning in the Field of Radiology)

  • 박윤서;이용기;안성민
    • 한국방사선학회논문지
    • /
    • 제17권3호
    • /
    • pp.411-416
    • /
    • 2023
  • 본 연구에서는 방사선(학)과 재학생의 주요 학습 도구의 활용성을 조사하고, 방사선사면허 국가시험의 대화형 인공지능 서비스 프로그램인 챗봇의 정답률을 분석하여 방사선학 분야에서 대화형 인공지능 서비스 프로그램의 유용성에 대한 기초 연구에 목적이 있다. 방사선(학)과 재학생의 학습 시 전자기기를 적극적으로 활용한다는 응답자가 84.3%로 나타났다. 또한 학습 시 자료수집의 효율성을 묻는 질문에 140명 중 검색엔진을 1순위로 활용한다고 답한 응답자가 104명이었다. 챗봇을 알고 있는지 붇는 질문에 80%가 알고 있다고 답하였으며, 학업 목적으로 챗봇을 사용한 경험은 22.9%가 1회 이상 사용 경험을 가지고 있었다. 2018년도부터 2022년도까지 시험문제 중 1교시와 2교시의 문제를 챗봇에게 정답을 물어보았다. 그 결과 Chat GPT의 1교시 정답률은 48.28%에서 60%였으며, 2교시 문제의 정답률은 50%에서 62.22%로 나타났다. Bing의 1교시 정답률은 55%에서 64.55%였으며, 2교시 문제의 정답률은 48%에서 52.22%로 나타났다. 본 연구를 통하여 방사선(학)과 재학생들이 전자기기를 통해 학습하고 인터넷을 통해 정보를 찾는 것이 일반적인 경향임을 확인할 수 있었다. 그러나 방사선학 분야에서 대화형 인공지능 서비스 프로그램은 정확성과 신뢰성에 대한 문제가 있으며, 완벽한 해답을 제공하는 것은 어렵기 때문에 계속해서 발전하고 개선되어야 한다.

지역성과 지연시간 기반의 P2P 스트리밍 시스템 구현 (Implementation of P2P Streaming System Based on Locality and Delay)

  • 안선희;박승철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.116-119
    • /
    • 2009
  • 본 논문에서는 실시간 상호작용이 요구되는 커뮤니티 TV 서비스를 위한 P2P 스트리밍 서비스를 설계하고 구현하였다. 대화 기반의 커뮤니티 TV 서비스는 짧은 지연시간의 스트리밍 서비스를 요구하기 때문에 지연시간이 짧은 트리 방식의 P2P 네트워크를 구축하고 종단간 지연 시간 한계 내에 사용자들이 원활한 커뮤니티 서비스를 받을 수 있게 구현하였다. 본 연구에서 P2P 네트워크는 지역성과 종단간 지연시간을 이용한 알고리즘을 사용하여 구성된다. 본 논문의 P2P 스트리밍 시스템은 웹서버와 애플리케이션으로 구성되며 각각 ASP.Net, C#.Net으로 구현되었다.

  • PDF

소프트웨어 로봇을 위한 인간-로봇 상호작용

  • 곽근창;지수영;조영조
    • 전자공학회지
    • /
    • 제33권3호
    • /
    • pp.49-55
    • /
    • 2006
  • 인간과 로봇의 자연스러운 상호작용을 위하여 영상과 음성을 기반으로 한 인간-로봇 상호작용 (HRI: Human Robot Interaction) 기술들을 소개한다. URC개념의 서버/클라이언트 구조를 갖는 소프트웨어 로봇에 수행 가능한 얼굴 인식 및 검증, 준 생체정보(semi biometrics)를 이용한 사용자 인식, 제스처인식, 화자인식 및 검증, 대화체 음성인식 기술들에 대하여 살펴본다. 이러한 인간-로봇 상호작용 기술들은 초고속 인터넷과 같은 IT 인프라를 이용하는 URC(Ubiquitous Robotic Companion) 기반의 지능형 서비스 로봇을 위한 핵심기술로서 사용되어진다.

  • PDF