• 제목/요약/키워드: multi-language

검색결과 676건 처리시간 0.024초

FiD를 이용한 멀티 모달 오픈 도메인 질의 응답 (Fusion-in-Decoder for Open Domain Multi-Modal Question Answering)

  • 박은환;이성민;서대룡;전동현;강인호;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-99
    • /
    • 2022
  • 오픈 도메인 질의 응답 (ODQA, Open-Domain Question Answering)은 주어진 질문에 대한 답을 찾는 과업으로서 질문과 관련있는 지식을 찾는 "검색" 단계를 필요로 한다. 최근 이미지, 테이블 등의 검색을 요구하는 멀티 모달 ODQA에 대한 연구가 많이 진행되었을 뿐만 아니라 산업에서의 중요도 또한 높아지고 있다. 본 논문은 여러 종류의 멀티 모달 ODQA 중에서도 테이블 - 텍스트 기반 멀티 모달 ODQA 데이터 집합으로 Fusion-in-Decoder (FiD)를 이용한 멀티 모달 오픈 도메인 질의 응답 연구를 제안하며 베이스라인 대비 최대 EM 20.5, F1 23.2 향상을 보였다.

  • PDF

MMA: 한국어 시각적 질의응답을 위한 멀티 모달 메시지 통합 (MMA: Multi-modal Message Aggregation for Korean VQA)

  • 박성진;박찬준;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.468-472
    • /
    • 2020
  • 시각적 질의응답(Visual Question Answering, VQA)은 주어진 이미지에 연관된 다양한 질문에 대한 올바른 답변을 예측하는 기술이다. 해당 기술은 컴퓨터 비전-자연어 처리 연구분야에서 활발히 연구가 진행되고 있으며, 질문의 의도를 정확히 파악하고, 주어진 이미지에서 관련 단서 정보를 찾는 것이 중요하다. 또한, 서로 이질적인 특성을 지닌 정보(이미지 객체, 객체 위치, 질문)를 통합하는 과정도 중요하다. 본 논문은 질문의 의도에 알맞은 정보를 효율적으로 사용하기 위해 멀티 모달 입력 이미지 객체, 객체 위치, 질문)에 대한 Multi-modal Message Aggregation (MMA) 제안하며 이를 통해 한국어 시각적 질의응답 KVQA에서 다른 모델보다 더 좋은 성능을 확인하였다.

  • PDF

페르소나 대화모델에서 일관된 발화 생성을 위한 연구 (Personality Consistent Dialogue Generation in No-Persona-Aware System)

  • 문현석;이찬희;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.572-577
    • /
    • 2020
  • 일관된 발화를 생성함에 있어 인격데이터(persona)의 도입을 이용한 연구가 활발히 진행되고 있지만, 한국어 데이터셋의 부재와 데이터셋 생성의 어려움이 문제점으로 지적된다. 본 연구에서는 인격데이터를 포함하지 않고 일관된 발화를 생성할 수 있는 방법으로 다중 대화 시스템에서 사전 학습된 자연어 추론(NLI) 모델을 도입하는 방법을 제안한다. 자연어 추론 모델을 이용한 관계 분석을 통해 과거 대화 내용 중 발화 생성에 이용할 대화를 선택하고, 자가 참조 모델(self-attention)과 다중 어텐션(multi-head attention) 모델을 활용하여 과거 대화 내용을 반영한 발화를 생성한다. 일관성 있는 발화 생성을 위해 기존 NLI데이터셋으로 수행할 수 있는 새로운 학습모델 nMLM을 제안하고, 이 방법이 일관성 있는 발화를 만드는데 기여할 수 있는 방법에 대해 연구한다.

  • PDF

영화 포스터의 장르 예측을 위한 멀티 레이블과 NLP 학습 기반의 네트워크 아키텍처 (Network Architecture Based on Multi-label and NLP Learning for Genre Prediction of Movie Posters)

  • 김수미;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.373-375
    • /
    • 2023
  • 본 논문에서는 멀티 레이블을 이용한 CNN 구조 활용과 NLP 학습을 이용하여 한국 영화의 장르를 예측하는 방법을 제안한다. 포스터는 영화의 전반적인 내용을 한눈에 알아볼 수 있게 하는 매체이기 때문에 다양한 요소들로 구성되어 있다. 합성곱 신경망(Convolutional neural network)을 활용해, 한국 영화 포스터가 가지는 특징들을 추출하여 영화 장르 분류를 진행하였다. 하지만, 영화의 경우 감독이 생각하는 장르와 관객이 영화를 봤을 때, 느끼는 장르가 다를 수 있다. 그렇기 때문에 장르 예측에 있어서 문제가 발생할 수 있다. 이러한 문제를 완화하기 위해 본 논문에서는 합성곱 신경망 활용뿐만 아니라, 자연어 처리(Natural Language Processing)를 같이 활용한 방법을 제안한다.

  • PDF

다문화가정 유아의 어린이집 경험이 의사소통능력에 미치는 영향: 어머니 한국어능력의 조절효과 (Effects of Experiences in Child-Care Centers on Communication Ability of Children from Multi-Cultural Families: The Moderating Effect of Mothers' Korean Fluency)

  • 임양미;박주희
    • 대한가정학회지
    • /
    • 제50권8호
    • /
    • pp.65-77
    • /
    • 2012
  • This study aimed to investigate how mothers' Korean fluency and children's experiences in child-care centers influenced the communication ability of children from multi-cultural families. The subjects were 600 children from multi-cultural families who enrolled in child-care centers in Gyeonggi province, their mothers, and 350 teachers caring for these children. The data were collected by administrating a questionnaire and analyzed with descriptive statistics and hierarchical regressions. The results of this study were as follows. The mothers' Korean fluency, number of years children had attended child-care centers, and language guidance provided by child-care centers for children from multi-cultural families all had positive effects on children's general and oral communication ability. On the other hand, the number of years that the children had attended child-care centers had no significant effect on the children's written communication ability, but the mothers' Korean fluency and language guidance provided by child-care centers for children from multi-cultural families had positive effects on children's written communication ability. Finally, the mothers' Korean fluency moderated the effects of children's child-care experiences on their communication ability. Specifically, the more fluent the mothers' Korean, the stronger the effects of children's child-care experiences on their communication ability.

좌표계 맵핑을 이용한 다축 CNC 머시닝센터에서의 캠 가공에 관한 연구 (Study On Manufacturing of General Cam Using Coordinate Mapping in Multi CNC Machining Center)

  • 박세환;신중호;장세원;강동우
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2002년도 추계학술대회 논문집
    • /
    • pp.999-1002
    • /
    • 2002
  • Cylindrical Cam Mechanism is widely used in the fields of industries, such as machine tool exchangers, textile machinery. This paper proposes a method for manufacturing of cylindrical cam in Multi CNC machining center. Multi CNC machining center has two different types depending on the tilting axis. For the manufacturing procedures. in this paper the location and the orientation of cutter path are defined from shape design data of cam. The integral NC code fur the both types of multi-axis CNC machining center can be created using the coordinates mapping between design coordinates and work coordinates. Finally, CAD/CAM program is developed on $C^{++}$ language. This program can display manufacturing and kinematics simulation, which can make integral NC code for multi-axis CNC machining center of two types.

  • PDF

Unicode 기반 다국어 명함인식기 개발 (A Development of Unicode-based Multi-lingual Namecard Recognizer)

  • 장동협;이재홍
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.117-122
    • /
    • 2009
  • 명함을 이용한 전세계적인 고객 관리 시스템을 구축하기 위해 다국어 명함인식기를 개발하였다. 먼저 다양한 언어의 문자인식 및 학습을 위해 Unicode 기반 문자 이미지 DB를 구축하였으며, 다양한 입력 장치를 통해 획득한 명함 영상에 대하여 정확한 데이터를 얻기 위한 다양한 컬러영상 처리 기술이 적용되었다. 다음에 다층 퍼셉트론 신경망, 언어 유형별 개별 문자인식, 각 언어별 명함에 사용된 필드별 키워드 DB를 이용한 후처리를 적용하여 명함 인식률을 향상시켰다.

기능블록 구성에 의한 공정제어 언어의 개발 (Development of a Process Control Language Using Function Block Configuration)

  • Byung Kook Kim
    • 전자공학회논문지B
    • /
    • 제29B권8호
    • /
    • pp.24-34
    • /
    • 1992
  • A process control language is developed using function block configuration, to simplify software development for large scale process control systems, and to implement advanced control algorithms with ease. A function block parser and controller is implemented to be suitable for multi-loop control systems having hierachical structure. On-line change of controller parameter is possible, and inclusion of user defined function block is also possible. By adding plant model block, control performance can be checked in advance. Function blocks of the Smith Predicotor, auto-tuners are implemented to demonstrate usefulness of function block configuration.

  • PDF

MTRNN을 이용한 한국어 대화 모델 생성 (Korean Dialogue Modeling using MTRNN)

  • 신창욱;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-287
    • /
    • 2017
  • 본 논문에서는 Multi-layer sequence-to-sequence 구조를 이용해 한국어 대화 시스템을 개발하였다. sequence-to-sequence는 RNN 혹은 그 변형 네트워크에 데이터를 입력하고, 입력이 완료된 후의 은닉층의 embedding에 기반해 출력열을 생성한다. 우리는 sequence-to-sequence로 입력된 발화에 대해 출력 발화를 내어주는 대화 모델을 학습하였고, 그 성능을 측정하였다. RNN에 대해서는 약 80만 발화를, MTRNN에 대해서는 5만 발화를 학습하고 평가하였다. 모델의 결과로 나타난 발화들을 정리하고 분석하였다.

  • PDF

한중일영 다국어 어휘 데이터베이스의 모형

  • 차재은;강범모
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 학술대회 발표논문집
    • /
    • pp.48-67
    • /
    • 2002
  • This paper is a report on part of the results of a research project entitled "Research and Model Development for a Multi-Lingual Lexical Database". It Is a six-year project in which we aim to construct a model of a multilingual lexical database of Korean, Chinese, Japanese, and English. Now we have finished the first two-year stage of the project In this paper, we present the goal of the project, the construction model of items in the lexical database, and the possible (semi-)automatic methods of acquisition of lexical information. As an appendix, we present some sample items of the database as an i1lustration.

  • PDF