• 제목/요약/키워드: 모델 발화

검색결과 207건 처리시간 0.028초

생성 기반 질의응답 채팅 시스템 구현을 위한 지식 임베딩 방법 (Knowledge Embedding Method for Implementing a Generative Question-Answering Chat System)

  • 김시형;이현구;김학수
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.134-140
    • /
    • 2018
  • 채팅 시스템은 사람의 말을 기계가 이해하고 적절한 응답을 하는 시스템이다. 채팅 시스템은 사용자의 간단한 정보 검색 질문에 대답해야 하는 경우가 있다. 그러나 기존의 생성 채팅 시스템들은 질의응답에 필요한 정보인 지식 개체(트리플 형태 지식에서의 주어와 목적어)의 임베딩을 고려하지 않아 발화에 나타나는 지식 개체가 다르더라도 같은 형태의 답변이 생성되었다. 본 논문에서는 생성 기반 채팅 시스템의 질의응답 정확도를 향상시키기 위한 지식 임베딩 방법을 제안한다. 개체와 유의어의 지식 임베딩을 위해 샴 순환 신경망을 사용하며 이를 이용해 주어와 술어를 인코딩 하고 목적어를 디코딩하는 sequence-to-sequence 모델의 성능을 향상 시켰다. 자체 구축한 채팅데이터를 통한 실험에서 제안된 임베딩 방법은 종래의 합성곱 신경망을 통한 임베딩 방법 보다 12.48% 높은 정확도를 보였다.

Deep-Learning Based Real-time Fire Detection Using Object Tracking Algorithm

  • Park, Jonghyuk;Park, Dohyun;Hyun, Donghwan;Na, Youmin;Lee, Soo-Hong
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권1호
    • /
    • pp.1-8
    • /
    • 2022
  • 본 논문에서는 실시간 객체 탐지(Real-time Object Detection)가 가능한 YOLOv4 모델과 DeepSORT 알고리즘을 활용한 객체 추적(Object Tracking) 기술을 활용하여 CCTV 영상 이미지 기반의 화재 탐지 시스템을 제안한다. 화재 탐지 모델은 10800장의 학습용 데이터로부터 학습되었으며 1000장의 별도 테스트 셋을 통해 검증되었다. 이후 DeepSORT 알고리즘을 통해 탐지된 화재 영역을 추적하여 단일 이미지 내의 화재 탐지율과 영상 내에서의 화재 탐지 유지성능을 증가시켰다. 영상 내의 한 프레임 혹은 단일 이미지에 대한 화재 탐지 속도는 장당 0.1초 이내로 실시간 탐지가 가능함을 확인하였으며 본 논문의 AI 화재 탐지 시스템은 기존의 화재 사고 탐지 시스템 보다 안정적이고 빠른 성능을 지니고 있어 화재현장에 적용 시 화재를 조기 발견하여 빠른 대처 및 발화단계에서의 진화가 가능할 것으로 예상된다.

대화 영상 생성을 위한 한국어 감정음성 및 얼굴 표정 데이터베이스 (Korean Emotional Speech and Facial Expression Database for Emotional Audio-Visual Speech Generation)

  • 백지영;김세라;이석필
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.71-77
    • /
    • 2022
  • 본 연구에서는 음성 합성 모델을 감정에 따라 음성을 합성하는 모델로 확장하고 감정에 따른 얼굴 표정을 생성하기 위한 데이터 베이스를 수집한다. 데이터베이스는 남성과 여성의 데이터가 구분되며 감정이 담긴 발화와 얼굴 표정으로 구성되어 있다. 성별이 다른 2명의 전문 연기자가 한국어로 문장을 발음한다. 각 문장은 anger, happiness, neutrality, sadness의 4가지 감정으로 구분된다. 각 연기자들은 한 가지의 감정 당 약 3300개의 문장을 연기한다. 이를 촬영하여 수집한 전체 26468개의 문장은 중복되지 않으며 해당하는 감정과 유사한 내용을 담고 있다. 양질의 데이터베이스를 구축하는 것이 향후 연구의 성능에 중요한 역할을 하므로 데이터베이스를 감정의 범주, 강도, 진정성의 3가지 항목에 대해 평가한다. 데이터의 종류에 따른 정확도를 알아보기 위해 구축된 데이터베이스를 음성-영상 데이터, 음성 데이터, 영상 데이터로 나누어 평가를 진행하고 비교한다.

A Design and Implementation of The Deep Learning-Based Senior Care Service Application Using AI Speaker

  • Mun Seop Yun;Sang Hyuk Yoon;Ki Won Lee;Se Hoon Kim;Min Woo Lee;Ho-Young Kwak;Won Joo Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.23-30
    • /
    • 2024
  • 본 논문에서는 딥러닝 기반의 개인 맞춤형 실버세대 케어 서비스 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 사용자의 편의성을 고려하여 STT(Speech to Text) 기술을 사용해 사용자의 발화를 텍스트로 변환하고, 이를 Microsoft 사의 대화형 멀티 에이전트 거대 언어 모델인 Autogen의 입력으로 사용한다. Autogen은 사용자와 ChatBot의 대화 데이터를 활용하여 상대방의 의도를 파악하여 답변에 대하여 응답한다. 그리고 백엔드 에이전트를 활용하여 위시리스트, 공유 달력 그리고 보이스 클로닝을 위한 딥러닝 모델을 통해 상대방의 목소리가 담긴 안부 메시지 기능을 제공한다. 또한, 애플리케이션은 SKT 사의 인공지능 누구(NUGU) 스피커를 탑재하여 홈 IoT 서비스 기능을 제공한다. 이러한 기능을 통해 제안하는 지능형 애플리케이션은 향후 미래 인공지능 기반의 실버세대 케어 기술에 기여할 것이다.

변별과제에서 초등학생의 안구운동 분석을 통한 발견적 주의 모델 개발 (Development of the Heuristic Attention Model Based on Analysis of Eye Movement of Elementary School Students on Discrimination task)

  • 신원섭;신동훈
    • 한국과학교육학회지
    • /
    • 제33권7호
    • /
    • pp.1471-1485
    • /
    • 2013
  • 본 연구에서는 변별과제를 해결하는 동안 초등학생의 안구운동을 분석하여 발견적 주의모델을 개발하였다. 연구 참여자는 초등학교 6학년 20명이었고 모두 부모의 동의 절차를 거친 자발적인 지원자였다. 본 연구에 사용된 변별과제는 권재술과 김범기(1994)가 개발한 과학탐구능력 검사지에서 아이트래킹으로 실험 가능한 두 과제를 선택하였다. 학생들의 안구운동의 수집은 SMI사의 iView X TM RED 120 Hz를 사용하였고 실험설계와 분석은 동사의 Experiment 3.2와 BeGaze 3.2의 소프트웨어를 사용하였다. 학생들의 모든 안구운동은 응시시간에 대한 정량적인 분석과 문제해결과정에서 학생개인의 인지사고과정을 추론하는 정성적인 분석과정을 거쳤다. 본 연구결과는 다음과 같다. 첫째, 학생들의 실험 자료의 시각정보의 복잡한 정도에 따라 인지적 부담이 가중되었고 대상을 재인하는 관점 의존적이었다. 둘째, 실험 자료의 제시로 상향식주의가 발화되었고 하향식주의에 의해 의도적이고 목표지향적인 안구운동과 혼란 주의에 의한 안구운동을 구분할 수 있었다. 이를 토대로 인간의 주의와 안구운동을 도식할 수 있었다. 셋째, 압축된 시선흐름(compressed scan-path)을 분석하여 학생들의 문제해결전략을 도출하였다. 넷째, 본 연구의 결과를 통해 발견적 주의 모델(HAM)을 개발하였다. 이 발견적 주의 모델은 앞으로 학생들의 문제해결과정을 분석하는데 효과적인 분석관점을 제공할 것으로 기대된다.

가연물의 발열량 특성을 고려한 화재감식 적용방안에 관한 연구 (A Study on the Application Scheme of Fire Identification Considering the Heat Release Rate Characteristics of Inflammable Material)

  • 강정기;오진희;유우준;유홍선;최돈묵
    • 한국화재소방학회논문지
    • /
    • 제28권6호
    • /
    • pp.52-57
    • /
    • 2014
  • 본 연구는 건축 구조물의 방화 등으로 인해서 발생한 가연물의 연소현상을 분석하여 화재발생 시점을 예측하기 위한 기초 방안을 제시하였다. 이를 위해서 계단실 화재사고 사례로부터 가연물을 인터폰 개별현관기(이하 '인터폰'으로 표시)로 선정하고 룸코너시험기(room corner test equipment)에서 화재실험을 실시하여 시간 변화에 따른 발열량을 산출하였으며, 화재시뮬레이션 프로그램인 fire dynamics simulator (FDS)를 사용하여 화재성상 변화에 따라서 발화지점 하층부로 연기가 유입되는 시간을 비교하였다. 그 결과 가연물이 ABS 재질로 구성된 인터폰은 계단실 총 체적 공간 $291.3m^3$, 바닥면적 $23.3m^2$, 층간 높이 2.5 m인 경우 발화원의 열 유속 및 환경 조건에 따라서 최대 4.93배 정도 연기 유입 시간이 차이가 나는 것을 확인하였다. 본 연구는 가연물의 열화학적 특성 변화를 고려한 실험 자료를 해석모델에 적용하여 화재감식을 분석적으로 판단하는데 유용한 자료가 될 것으로 사료된다.

지하 공동구 화재재난 감지를 위한 음향수집 프로토타입 장치 및 시스템 모듈 개발 (Development of a Acoustic Acquisition Prototype device and System Modules for Fire Detection in the Underground Utility Tunnel)

  • 이병진;박철우;이미숙;정우석
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.7-15
    • /
    • 2022
  • 지하 공동구 화재 발생에 따른 직·간접적 피해는 사회 전반에 매우 큰 영향을 미치므로 이를 사전에 예방 및 관리하기 위한 노력이 필요하다. 화재의 발생 원인 중 케이블 자체에서 발생하는 경우는 단락, 누전, 과전류에 의한 발화 및 도체 접속부 과열, 절연체의 졀연 파괴에 의한 스파크 발생으로 인한 발화가 대부분이다. 지하 공동구의 특성에 의해 발생하는 이러한 원인을 조기에 찾아내기 위해서 지하 공동구는 영상분석을 활용한 감지 시스템을 통해 재난 및 안전사고 방지를 위한 상시 관리를 하기 위한 노력을 하고 있으며, 이 중에서 CCTV 기반의 딥러닝 영상분석 기술을 적용한 화재 감지 시스템 개발사례가 보고되고 있다. 하지만 CCTV의 경우는 사각지대가 존재하기 때문에 이를 좀 더 보완하기 위해서 스파크 발생으로 불꽃이 발생하기 전 스파크 소리를 사전에 감지해 화재 예방을 할 수 있는 고성능의 음향 기반 딥러닝 모델을 개발하고자 한다. 본 연구에서 마이크 센서를 이용하여 지하 공동구 환경에서 음향을 수집을 할 수 있는 방안을 프로토타입 모듈 개발과 실험을 통해 제안하며, 결로가 많은 지하 공동구 환경에서 음향 센서를 배치하고 기능 이상 없이 실시간으로 정보 수집 여부에 대한 가능성을 검증한다.

Deep neural network-hidden Markov model 하이브리드 구조의 모델을 사용한 사용자 정의 기동어 인식 시스템에 관한 연구 (A study on user defined spoken wake-up word recognition system using deep neural network-hidden Markov model hybrid model)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.131-136
    • /
    • 2020
  • 음성 인식기를 대기모드에서 동작 모드로 전환하기 위해 발화하는 짧은 단어를 기동어(Wake Up Word, WUW)라고 하며, 음성 인식기를 실제로 사용하는 사용자가 지정한 기동어를 사용자 정의 기동어라고 한다. 본 논문에서는 이러한 사용자 정의 기동어를 인식하기 위해 기존의 Gaussian Mixture Model-Hidden Markov Model(GMM-HMM) 기반의 시스템, Linear Discriminant Analysis(LDA)를 적용한 LDA-GMM-HMM 기반의 시스템과, LDA-GMM-HMM 모델에서 GMM을 Deep Neural Network(DNN)로 대체한 LDA-DNN-HMM 기반의 시스템을 제작하고 각 시스템의 사용자 정의 기동어 인식 성능 및 비기동어 거절 성능을 비교한다. 또한 기동어 인식기의 체감 성능을 향상시키고자 각 모델에 threshold를 적용하여 기동어 인식 실패율을 약 10 % 수준으로 감소 시킨 후에 비기동어(non-WUW)의 거절 실패율을 비교 평가한다. Threshold 적용시에 LDA-DNN-HMM 기반의 시스템의 경우 기동어 인식 실패율 9.84 % 수준에서 비기동어 거절 실패율이 0.0058 %의 인식 성능을 나타내어 LDA-GMM-HMM 시스템 보다 약 4.82배 향상된 비기동어 거절 성능을 나타낸다. 이러한 결과는 본 논문에서 제작한 LDA-DNN-HMM 모델이 사용자 정의 기동어 인식 시스템을 구축하는데 효과적임을 입증한다.

한국 산불 발생에 대한 확률 시뮬레이션 모델 개발 (Stochastic Simulation Model of Fire Occurrence in the Republic of Korea)

  • 이병두;이요한;이명보
    • 한국산림과학회지
    • /
    • 제100권1호
    • /
    • pp.70-78
    • /
    • 2011
  • 본 연구에서는 국내 과거 산불 자료를 기초로 하여 계절별 산불 발생 확률 시뮬레이션 모델을 개발하였다. 산불 발생 확률 모델은 산불 발생 사건의 시간적 분포가 과거 자료와 부합해야 하므로, 세 단계를 거쳐 생성하였다. 먼저, 산불 기간 중의 산불 발생 일은 베르누이 분포에서 임의로 추출하여 일일 단위로 산불의 발생 여부를 결정하였다. 다음 단계로, 산불이 발생하면 기하학적 다중 분포에서 임으로 추출하여 그 날 하루 중에 발생하는 산불의 수를 결정하였다. 마지막 단계로, 각 산불의 발화 시간은 포아송 분포를 가정하여 하루 중 산불 발생이 가능한 시간중 임의로 추출하여 결정하였다. 산불 발생의 확률적 분포는 과거 산불 발생 자료를 바탕으로 추정하였다. 확률 분포에 대한 중요 계수 값을 구하기 위해 최우도추정법을 이용하였다. 개발된 확률 시뮬레이션 모델에 의해 생성된 일련의 산불 발생 사건들은 과거 산불 통계 자료와 비교할 때 발생 주기 분포, 산불간의 시간 간격, 연간 일어나는 산불 총 건수에서 통계적으로 부합하는 것으로 나타났다. 본 연구의 결과는 향후 산불 관련 자원 활용 및 진화 계획 수립 시에 중요한 보조 자료로 활용될 것으로 기대된다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.