• 제목/요약/키워드: dialog

검색결과 226건 처리시간 0.022초

최대 엔트로피 모델을 이용한 연속음성인식에서의 인식 신뢰도 측정 (CONFIDENCE MEAUSRING METHOD FOR CONTIUOUS SPEECH RECOGNITION USING MAXIMUM ENTROPY MODEL)

  • 정상근;정민우;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.200-204
    • /
    • 2004
  • 음성인식기술을 실제 생활에 적용할 때 발생하는 대표적인 문제로. 인식기의 낮은 인식률로 인한 오동작을 들 수 있다. 본 연구에서는, 텔레뱅킹 도메인에서의 HTK(Hidden Markov Model Toolkit) 연속 음성 인식 시스템과, 최대 엔트로피 기법에 기반한 사용자 발화에서의 핵심이 되는 단어(주로 고유 명사들)들에 대한 인식 신뢰도의 측정 방법을 제시한다. 음향특징과 언어특징들을 모두 고려하여 인식 신뢰도를 구하였으며 인식된 단어들에 대해 오인식 되었음을 약 86%의 정확도로 판단할 수 있음을 확인하였다. 본 인식신뢰도를 이용하여 차후에 음성인식의 확인대화(Clarification Dialog)모델을 개발하는데 활용하고자 한다.

  • PDF

Long Short-Term Memory를 이용한 통합 대화 분석 (Integrated Dialogue Analysis using Long Short-Term Memory)

  • 김민경;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도 되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

MovieDic 말뭉치를 이용한 대화 참여 모델의 구성 (Construction of Dialog Engagement Model using MovieDic Corpus)

  • 구상준;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.249-251
    • /
    • 2016
  • 다중 화자 대화 시스템에서, 시스템의 입장에서 어느 시점에 참여해야하는지를 아는 것은 중요하다. 이러한 참여 모델을 구축함에 있어서 본 연구에서는 다수의 화자가 대화에 참여하는 영화 대본으로 구축된 MovieDic 말뭉치를 사용하였다. 구축에 필요한 자질로써 의문사, 호칭, 명사, 어휘 등을 사용하였고, 훈련 알고리즘으로는 Maximum Entropy Classifier를 사용하였다. 실험 결과 53.34%의 정확도를 기록하였으며, 맥락 자질의 추가로 정확도 개선을 기대할 수 있다.

  • PDF

지하수 흐름을 고려한 지하구조계의 탄소성해석에 대한 전-후처리기법의 개발 (Development of Pre-Postprocessing Toolbox for Elasto-plastic Analysis of Underground Structures with Water Flow)

  • 김문겸;임성철;이재영;송재성
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 1997년도 봄 학술발표회 논문집
    • /
    • pp.79-86
    • /
    • 1997
  • In this study, pre-postprocessing toolbox is developed to perform elasto-plastic analyze of underground structures with transient ground water flow. This toolbox is composed of three modules. The first is the data input processor for the structural analysis. The preprocessing Is using GUI (Graphic User Interface), which is consist of dialog box, pull down, and short-cut icon, etc. The second is the structural analysis module. The analysis is based on the elasto-plastic finite element method involving additional options such as ground excavation effect, transient ground water flow, and rock bolts behavior. The last is the postprocessing module. The postprocessing is able to verify the result of the structural analysis by the graphical simulation which visualizes the element mesh, the node displacements, the element stress states, the stress contour, the ground water surface, and the rock bolt stresses. Since various options are considered separately in this toolbox, it is easy to modify the module of each processing, and to update other functional modules for the given analysis conditions.

  • PDF

화면해설방송을 위한 오디오/자막 기반의 무 대사 구간 검출 (Audio/Subtitles based Non-Dialog Section Detection for DVS)

  • 장인선;임우택;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.79-80
    • /
    • 2013
  • 화면해설방송이란 시각장애인들이 TV 프로그램, 영화와 같은 미디어에 접근할 수 있도록 해주는 서비스로써 화면을 볼 수 없는 시각장애인들을 위해 상황 변화적 요소와 자막, 그래픽 등의 시각적 요소들을 설명하여 프로그램 내용의 이해를 도와주는 서비스이다. 이러한 화면해설은 대사나 효과음이 없는 부분에 전체 프로그램의 이해를 저해하지 않는 수준에서 삽입된다. 본 논문에서는 화면해설방송 제작을 위한 무 대사 구간 검출 방법을 제안한다. 본 방법은 방송스트림에 포함되어 있는 오디오와 자막 정보를 분석함으로써 화면해설을 삽입할 수 있는 구간을 검출한다. 실제 방송컨텐츠를 이용한 실험을 통해 본 방법을 검증하고 성능을 확인한다.

  • PDF

대화체 음성에서의 한국어 연결 숫자음 인식 (Recognition of Korean Connected Digits in a Natural Spoken Dialog)

  • 김중철;고종철;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.377-379
    • /
    • 2000
  • 대화체 음성의 인식을 위해서는 음성 파형에 관한 음향학적인 연구뿐만 아니라 인식하려는 언어자체에 대한 언어학적인 연구를 필요로 한다. 본 논문에서는 숫자음의 언어학적인 요소를 고려하고, 포만트 주파수를 숫자음 검출과 숫자음 인식에 적용하는 방식을 제안한다. 시스템의 입력은 특정 질의에 대한 응답으로 대화체 문장이며, 끝점 추출 기술을 이용하여 고립단어로 분류한 후, 숫자음만을 검출해 내고, 검출된 숫자음을 인식하기 위해 포만트 주파수를 이용한다. 한국어 연결 숫자음 인식은 한국어 숫자음이 단음절로 구성된다는 점과 발음상의 조음효과 등으로 한계를 가지고 있다. 본 논문에서는 숫자음과 발성에 필요한 음소들을 추출하고, 숫자들을 모음에 따라 6개의 그룹으로 분류하여 인식의 범위를 좁히고, 포만트 주파수 정보와 음소 HMM 모델에 의한 두 단계에 걸친 인식을 수행함으로써 연결 숫자음 인식에 대한 성능을 향상시킨다.

  • PDF

치매노인을 위한 자동대화시스템 (Automatic Dialog System for the Elderly with Dementia)

  • Kim, Sung-ill;Joo, Chang-bok;Shin, Wee-jae
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.137-140
    • /
    • 2003
  • 본 연구는 치매노인환자의 생활의 질을 향상시키기 위한 대화시스템의 개발에 목표를 둔다. 제안된 시스템은 주로 세 가지 모듈, 즉, 음성인식, 시간테이블에 의해 구분된 대화 데이터베이스의 자동검색, 그리고 간호사의 녹음음성에 의한 응답 등으로 구성되어 있다. 우선 치매환자가 요양시설에서 자주 발화하는 대화의 내용을 조사하고, 그들의 발화 음성을 인식하고 적절히 응답하도록 구성하였다. 시스템의 평가를 위해서 시스템이 도입되었을 때와 도입되지 않았을 때를 비교, 조사하였다. 시스템이 도입되지 않았을 때는 간호사가 자유로이 케어서비스를 행할 수 있도록 하였다. 비디오 촬영을 통해서 대상자의 행동 및 반응을 조사한 결과, 치매환자의 요구를 충족시키는데 있어서 대화 시스템이 간호사들보다 더 응답적이었다는 것을 알 수 있었다. 게다가, 제안된 시스템은 상호 대화에 있어서 환자가 더 많이 말하도록 유도함을 알 수 있었다.

  • PDF

방공교전모델(DADSim) 개발 및 활용사례 (Distributed Air Defense Simulation Model and its Applications)

  • 최상영;김의환
    • 한국국방경영분석학회지
    • /
    • 제27권2호
    • /
    • pp.134-148
    • /
    • 2001
  • In this paper, air-defense simulation model, called "DADSim", will be introduced. DADSim(Distributed Air Defense Simulation Model) was developed by Modeling&Simulation Lab of K.N.D.U.(Korea National Defence Univ) Weapon Systems Department. This model is an analysis-purpose model in the engagement-level. DADSim can simulate not only the global air-defense or Korean Peninsula but also the local air-defense or a battle field. DADSim uses the DTED(digital terrain elevation data) LeveII it for the representation of peninsula terrain characteristics. The weapon systems cooperated in the model are low/medium-range missile systems such as HAWK, NIKE, SAM. DADSim was designed in the way of object-oriented development method, implemented by C++ language. The simulation view is an event-sequenced object-orientation. For the convenience of input, output analysis, GUI(Graphic User Interface) of menu, window, dialog box, etc. are provided to the user, For the execution of DADSim, Silicon Graphic IRIX 6.3 or high version is required. DADSim can be used for the effectiveness analysis of­defence systems. Some illustrative examples will be shown in this paper.

  • PDF

DCL을 이용한 가공정보의 DB구축 및 CAM용 프로그램 개발에 관한 연구 (A Study of Development of Program for CAM and DB Construction of the Processing Information using DCL)

  • 손영지;김순경;전언찬
    • 한국정밀공학회지
    • /
    • 제16권9호
    • /
    • pp.143-148
    • /
    • 1999
  • G code has to be made after changing the drawing information to DXF file, the converting file. When the information is changed, the converted file had the unnecessary time of rapid feed during working and the large DATA capacity. It need for arranging the information ordered irregularly. This CAM program based AutoCAD can be decreased uncomfortableness in contrast to use of each system. Also it can be increased productivity by arranging information. And it can be used easily for the beginner of the minor enterprises. its program can be decreased system error between others by using one system and increased work efficiency by using DCL.

  • PDF

Comics with Drama: New Communication in Wedia

  • Hu, Jia-Wen;Tsang, Seng-Su
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권10호
    • /
    • pp.4143-4159
    • /
    • 2015
  • We-the-media (aka wedia) is a concept where the users of social networking sites, such as Facebook, turn into the broadcasters. This study used the popular application Bitstrips as the experiment tool. Facebook was used as the Wedia platform for publishing designed comics, then used the three elements of Goffman's dramaturgy model-role, scene and dialog-to analyze 265 comics created by 3 researchers and observe the audience's responses within 9 months. The results showed that people want to see a good story with positive dialogue, and prefer scene is school more than work. As all these elements are controllable, Wedia communication has the potential for more applications. We also found that including the elements of news, gambling and gift-giving tended to trigger greater response. Furthermore, We suggesting that such embedding of product information in web episodes (webisodes) with caricature could be a successful marketing strategy.