• Title/Summary/Keyword: 언어 모델링

Search Result 582, Processing Time 0.026 seconds

Neural Question Difficulty Estimator with Bi-directional Attention in VideoQA (비디오 질의 응답 환경에서 양방향 어텐션을 이용한 질의 난이도 분석 모델)

  • Yoon, Su-Hwan;Park, Seong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.501-506
    • /
    • 2020
  • 질의 난이도 분석 문제는 자연어 질의문을 답변할 때 어려움의 정도를 측정하는 문제이다. 질의 난이도 분석 문제는 문서 독해, 의학 시험, 비디오 질의 등과 같은 다양한 데이터셋에서 연구되어 왔다. 본 논문에서는 질의문과 질의문에 응답하기 위한 정보들 간의 관계를 파악하는 것으로 질의 난이도 분석 문제를 접근하여 이를 BERT와 Dual Multi-head Attention을 사용하여 모델링 하였다. 본 논문에서 제안하는 모델의 우수성을 증명하기 위하여 최근 자연언어이해 부분에서 높은 성능을 보여주는 기 학습 언어 모델과 이전 연구의 질의 난이도 분석 모델과의 성능을 비교하였고, 제안 모델은 대표적인 비디오 질의 응답 데이터셋인 DramaQA의 Memory Complexity에서 99.76%, Logical Complexity에서는 89.47%의 정확도로 가장 높은 질의 난이도 분석 성능을 보여주었다.

  • PDF

A Real-time Collaborative Group Workflow Editor (실시간 협업 지원 그룹 워크플로우 모델링 도구)

  • Kim, Sang-Bae;Bae, Sung-Yong;Kim, Kwang-Hoon;Paik, Su-Ki
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.125-128
    • /
    • 2000
  • 본 논문에서는, 워크플로우 모델링에 사용하는 ICN(Information Control Net)을 위한 자바 기반의 워크플로우 모델링 도구의 설계 및 구현에 관하여 기술하였다. 특히, 본 워크플로우 모델링 도구는 기존의 워크플로우 모델링 도구들과는 달리, 인터넷 기반의 실시간 그룹웨어 기술을 통해 일련의 사용자 그룹이 동시에 워크플로우를 모델링 할 수 있는 기능을 제공하고 있다. 즉, 기존의 워크플로우 모델링 기능에 실시간 그룹웨어 특성들을 통합함으로써, 한 차원 높은 수준의 모델링 환경을 제공하고, 이를 통하여 기존의 워크플로우 시스템들이 지원하지 못했던 조직 내의 구성원들간의 협동 작업을 실시간으로 지원할 수 있을 뿐 만 아니라, 요즘과 같이 대형화와 복잡화 그리고 다양화의 특징을 갖는 조직내의 워크플로우(또는 사무업무 프로세스)들에 대한 효율적인 분석 및 모델링 환경을 제공하는데 그 목적이 있다. 또한, 본 도구를 통한 모델링 결과는 WPDL(Workflow Process Definition Language)라는 국제 표준화 워크플로우 정의 언어로 저장됨으로써, 기존의 다른 워크플로우 시스템들과의 상호 호환성을 제공하고자 하였다.

  • PDF

Open API를 활용한 다국어 정보검색 시스템 모델링에 관한 연구

  • Hwang, Se-Chan;Kim, Heung-Cheol;Kim, Seon-Jin;Jeong, Ju-Seok;Kang, Sin-Jae
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.129-132
    • /
    • 2009
  • 본 논문은 오픈 API를 이용하여 다국어 정보검색 시스템을 모델링하는 방법론을 제시한다. 웹 2.0이 대두되면서 웹 2.0의 개념을 활용한 기술들이 발달하고 있는데, 그 중 한 기술이 오픈 API이다. 기업에서 개발한 새로운 서비스나 기능, 데이터 등을 API로 공개함으로써 사용자들이 공개된 API를 이용하여 새로운 서비스를 쉽게 개발할 수 있게 되었다. 본 연구에서는 구글, 플리커, 유튜브, 네이버, 다음 등의 사이트에서 제공하는 오픈 API를 이용하여, 다국어 정보 검색 시스템을 구현하였다. 구글 번역 API를 이용하여 한국어 질의어를 검색 대상 언어(영어, 일본어, 중국어 등)로 번역한 후, 소설 웹 사이트(플리커, 유튜브, 다음, 네이버 등)의 정보를 검색하고, 검색된 결과 내 텍스트를 다시 한국어로 번역한 후, 통합된 검색 결과를 사용자에게 보여준다.

  • PDF

Cyber-Salesman : An Agent negotiating with Customers (가상점원 : 고객과의 협상을 위한 에이전트)

  • 조의성;조근식
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.217-225
    • /
    • 1999
  • 협상은 상거래에 있어서 매우 중요한 요소 중 하나이다. 현재의 웹 기반 전자상거래 시스템은 이러한 중요한 협상 구조를 상거래에 잘 반영하지 못하는 문제점을 가지고 있다. 이러한 문제점중 기업과 소비자간의 미비한 협상 구조를 보안하기 위해 실세계 상거래에서 존재하는 점원을 전자상거래상의 가상점원으로 모델링하여 회사의 정책과 구매자의 특성을 반영하여 구매자와 전략적으로 자동 협상을 수행할 수 있는 에이전트의 구조를 설계하고 표현하고, 그 제안에 대한 평가 내용과 결정사항을 전달할 수 있는 언어적인 구조가 필요하며, 협상의 대상이 되는 사안들의 특성을 반영할 수 있는 표현 구조도 요구된다. 또한 이러한 협상에서 전략을 세우고 알맞은 제안을 제시하며 상대의 제안에 대하여 전략적으로 반응할 수 있는 의사결정 모델이 요구된다. 본 논문에서는 회사의 정책 모델과 구매자의 모델을 정의하고 이를 이용한 협상 모델을 설계 구현하였다. 협상 구조의 모델링을 위해 KQML(Knowledge Query Manipulation Language)을 기반으로 전자상거래 프로토콜로 설계하고, 논쟁 기반 협상 모델을 기초로 협상언어를 설계하였다. 또한 협상에서의 전략적인 의사결정을 위해 게임이론을 이용하고, 규칙 기반 시스템으로 이를 보충하였다. 마지막으로 가상점원 모델을 바탕으로 조립 컴퓨터 판매를 위한 가상점원으로 구현하였고, 이에 대한 실험을 통하여 가상점원의 유용성을 보였다.

  • PDF

Emotion and Speech Act classification in Dialogue using Multitask Learning (대화에서 멀티태스크 학습을 이용한 감정 및 화행 분류)

  • Shin, Chang-Uk;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.532-536
    • /
    • 2018
  • 심층인공신경망을 이용한 대화 모델링 연구가 활발하게 진행되고 있다. 본 논문에서는 대화에서 발화의 감정과 화행을 분류하기 위해 멀티태스크(multitask) 학습을 이용한 End-to-End 시스템을 제안한다. 우리는 감정과 화행을 동시에 분류하는 시스템을 개발하기 위해 멀티태스크 학습을 수행한다. 또한 불균형 범주 분류를 위해 계단식분류(cascaded classification) 구조를 사용하였다. 일상대화 데이터셋을 사용하여 실험을 수행하였고 macro average precision으로 성능을 측정하여 감정 분류 60.43%, 화행 분류 74.29%를 각각 달성하였다. 이는 baseline 모델 대비 각각 29.00%, 1.54% 향상된 성능이다. 본 논문에서는 제안하는 구조를 이용하여, 발화의 감정 및 화행 분류가 End-to-End 방식으로 모델링 가능함을 보였다. 그리고, 두 분류 문제를 하나의 구조로 적절히 학습하기 위한 방법과 분류 문제에서의 범주 불균형 문제를 해결하기 위한 분류 방법을 제시하였다.

  • PDF

Handwritten Hangul Recognition by Dynamic Lattice Search with Structural Constraints (문자의 구조적 제약과 동적 격자 탐색을 이용한 필기 한글 문자 인식)

  • Kang, Kyung-Won;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.359-364
    • /
    • 2001
  • 필기 한글문자 인식은 다양한 필기 변형, 자모 간의 접촉과 같은 문제들을 내포하고 있다. 최근 이를 해결하기 위한 방법으로 랜덤 그래프를 이용한 필기 한글 모델링이 제안되었으나, 상향식 정보처리의 한계인 시간 복잡도 문제를 겪고 있다. 영어 단어인식에 관한 인지과학적 연구에서는 하향식 정보처리의 주요한 역할 중 하나로 인식 과정에서의 계산 중복을 없애는 필터링의 역할을 들고 있다. 본 논문에서는 랜덤 그래프를 이용한 필기 한글 모델링을 기반으로 하여 필기체에 나타나는 다양한 변형을 흡수하며, 시간 복잡도를 해결하기 위한 한글 문자의 구조에 바탕을 둔 하향식 정보처리 방법을 제안한다. 제안하는 방법은 모델 발화를 이용한 자모 후보 추출 DP 정합과 동적 격자 탐색을 이용한 문자 후보 탐색, 그리고 문자의 구조적 제약을 이용한 후보 제거 기법을 포함한다. 필기 한글 데이터베이스인 SERI-DB에 대한 예비 실험 결과, 제안한 방법은 인식률의 큰 저하 없이 상향식 정보 처리에 바탕을 둔 기존 방법에 비해 높은 속도 향상을 가져 왔다.

  • PDF

Regression Tree based Modeling of Segmental Durations For Text-to-Speech Conversion System (Text-to-Speech 변환 시스템을 위한 회귀 트리 기반의 음소 지속 시간 모델링)

  • Pyo, Kyung-Ran;Kim, Hyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.191-195
    • /
    • 1999
  • 자연스럽고 명료한 한국어 Text-to-Speech 변환 시스템을 위해서 음소의 지속 시간을 제어하는 일은 매우 중요하다. 음소의 지속 시간은 여러 가지 문맥 정보에 의해서 변화하므로 제어 규칙에 의존하기 보다 방대한 데이터베이스를 이용하여 통계적인 기법으로 음소의 지속 시간에 변화를 주는 요인을 찾아내려고 하는 것이 지금의 추세이다. 본 연구에서도 트리기반 모델링 방법중의 하나인 CART(classification and regression tree) 방법을 사용하여 회귀 트리를 생성하고, 생성된 트리에 기반하여 음소의 지속 시간 예측 모델과, 자연스러운 끊어 읽기를 위한 휴지 기간 예측 모델을 제안하고 있다. 실험에 사용한 음성코퍼스는 550개의 문장으로 구성되어 있으며, 이 중 428개 문장으로 회귀 트리를 학습시켰고, 나머지 122개의 문장으로 실험하였다. 모델의 평가를 위해서 실제값과 예측값과의 상관관계를 구하였더니 음소의 지속 시간을 예측하는 회귀 트리에서는 상관계수가 0.84로 계산되었고, 끊어 읽는 경계에서의 휴지 기간을 예측하는 회귀 트리에서는 상관계수가 0.63으로 나타났다.

  • PDF

An Approach to Modeling and Verifying OSEK/VDX-based OS with C language (C 언어를 이용한 OSEK/VDX 기반 운영 체제의 모델링 및 검증 기법)

  • Chung, Yoohee;Park, Seongjun;Choi, Yunja
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.504-507
    • /
    • 2016
  • 내장형 소프트웨어의 검증은 운영체제와 응용 소프트웨어에 대해 동시적으로 수행되어야 한다. 선행연구에서는 운영체제를 정형적으로 모델링하고 이를 이용한 내장형 소프트웨어 안전성 검증 기법을 제안하였다. 본 연구에서는 선행 연구에서 Promela로 작성되었던 정형 모델을 참조하여 C 언어로의 변환 규칙을 정의함으로써 구현에 독립적인 모델을 작성하였다. 작성된 검증 모델을 CBMC 모델 체커로 검증한 결과 요구사항으로부터 도출된 35개의 안전성 속성 중 가변 속성을 제외한 21개에 대하여 21개를 모두 만족함을 입증하였다.

Using the DEVS formalism for evaluating logistics system performance (DEVS 형식론을 이용한 물류 시스템의 성능 측정)

  • 조병헌
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1999.04a
    • /
    • pp.179-183
    • /
    • 1999
  • 최근 기업활동의 일부로서 물류의 중요성이 급속히 부각되고 있고, 물류의 전략 개발과 모델링 방면에서 많은 연구가 진행되었다. 본 논문에서는 이산 사건 시스템을 기술하는 언어인 DEVS 형식론을 이용하여 물류 시스템의 성능을 측정하는 시뮬레이터를 구현한다. 본 논문의 대상 시스템은 다수의 차량을 이용하여 다수의 창고에서 다종의 물건들을 다수의 판매처로 운송하는 시스템이다. 각각의 창고에서는 판매처에서 요구한 물건들을 적재하여 판매처에서는 원하는 물건들을 하차하고 정해진 시간 내에 배달되는지를 검증한다. 모델링된 시스템을 시뮬레이션화하기 위해 DEVSim++를 이용한다. DEVSim++는 DEVS 형식론을 C++ 언어로 표현한 것이다. 여러 가상의 데이터로 시뮬레이션한 결과 적절히 동작하는 것을 알 수 있었다. 향후 모델을 확장해서 전국적인 규모에서 시뮬레이션할 수 있는 무류 시뮬레이터를 구현하면 물류 관련 업무에서 필수적으로 쓰일 도구가 될 것이다.

  • PDF

Text Corpus Construction for Language Model (대어휘 음성인식 언어모델링을 위한 텍스트 코퍼스 구축)

  • Kim Jeong-se;Yoon Aesun;Kwon Hyuk-Chul
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.155-158
    • /
    • 2002
  • 본 논문은 음성정보연구센터에서 추진하고 있는 대용량 텍스트 코퍼스 구축에 관하여 기술한다. 총 3 년 동안 약 3 억$\~$5 억 어절 수집을 목표로 하고 있으며, 주 목적은 대어휘 음성인식용 언어모델링을 위한 통계정보 추출용으로 활용할 예정이다. 1 차년도인 2002 년에 수집할 텍스트의 양은 약 6 천만 어절로 주요 일간지와 방송뉴스를 대상으로 하고 있다. 이 중 2 천만 어절은 띄어쓰기, 철자오류 수정 등을 수동으로 수행하고, 나머지 어절은 자동 검증 툴을 사용하여 오류를 수정하고자 한다. 본 논문에서는 공동 이용 가능한 텍스트 코퍼스의 구축 방안과 구축 시의 고려해야 할 사항들을 제시하고자 한다.

  • PDF