• 제목/요약/키워드: multi-language

Search Result 676, Processing Time 0.12 seconds

Korean Dependency Parsing Using ELMo and Multi-head Attention (ELMo와 멀티헤드 어텐션을 이용한 한국어 의존 구문 분석)

  • Park, Seongsik;Oh, Shinhyeok;Kim, Hongjin;Kim, Sihyung;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.8-12
    • /
    • 2018
  • 구문 분석이란 문장을 단어, 어절, 구 등의 구성 성분으로 분해하고 각각의 구조적 정보를 분석하여 문장의 구조를 알아내는 작업을 말한다. 최근 의존 구문 분석은 심층 신경망을 이용하는 방법이 활발히 연구되고 있다. 특히 포인터 네트워크를 사용하는 방법은 다른 심층 신경망보다 높은 성능을 보이고 있다. 그러나 포인터 네트워크의 사용만으로 의존 관계와 의존 관계명을 예측하는 것은 한계가 존재한다. 본 논문에서는 최근 사용하는 단어 표상 방법 별로 비교 실험을 진행하고 의존 구문 분석에서 GloVe의 성능이 가장 좋음을 보인다. 또한 언어 모델을 통한 단어 표상 방법인 ELMo와 멀티헤드 어텐션을 사용하여 포인터 네트워크만을 사용 했을 때보다 높은 성능(UAS 92.85%, LAS 90.65%)을 보였다.

  • PDF

Multi-Decoder Conversational Model for Generating Robust Response Based on Denoising Mechanism (강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델)

  • Kim, Tae-Hyeong;Park, Seong-Bae;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.141-146
    • /
    • 2018
  • 최근 대화 모델 학습에는 시퀀스-투-시퀀스 모델이 널리 활용되고 있다. 하지만 기본적인 시퀀스-투-시퀀스 모델로 학습한 대화 모델은 I don't know 문제와 사오정 문제를 내포한다. I don't know 문제는 입력 발화에 대해 안전하고 무미건조한 단편적인 대답을 많이 생성하는 문제이다. 사오정 문제는 입력 발화에 대해 적절한 응답을 생성했지만 입력 발화와 동일한 의미를 지니지만 어순, 어미 등의 변화가 있는 발화에는 적절한 응답을 생성하지 못하는 문제이다. 이전 연구에서 디노이징 메커니즘을 활용하여 각각의 문제를 완화하는 대화 모델들을 학습할 수 있음을 보였으나 하나의 모델에서 두 문제를 동시에 해결하지는 못하였다. 본 논문에서는 디노이징 메커니즘을 활용하여 각각의 문제에 강점을 지닌 디코더들을 학습하고 응답 생성 시 입력 발화에 따라 두 디코더를 적절하게 반영하여 언급한 문제 모두에 대해 강건한 응답을 생성할 수 있는 모델을 제안한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 한국어 대화 데이터로 실험을 수행하였다. 실험 결과 단일 문제를 해결하는 모델들과 비교하여 ROUGE F1 점수와 사람이 평가한 정성 평가에서 성능 향상을 보였다.

  • PDF

Generative Multi-Turn Chatbot Using Generative Adversarial Network (생성적 적대적 신경망을 이용한 생성기반 멀티턴 챗봇)

  • Kim, Jintae;Kim, Harksoo;Kwon, Oh-Woog;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.25-30
    • /
    • 2018
  • 기존의 검색 기반 챗봇 시스템과 다르게 생성 기반 챗봇 시스템은 사전에 정의된 응답에 의존하지 않고 채팅 말뭉치를 학습한 신경망 모델을 사용하여 응답을 생성한다. 생성 기반 챗봇 시스템이 사람과 같이 자연스러운 응답을 생성하려면 이전 문맥을 반영해야 할 필요가 있다. 기존 연구에서는 문맥을 반영하기 위해 이전 문맥과 입력 발화를 통합하여 하나의 벡터로 표현했다. 이러한 경우 이전 문맥과 입력 발화가 분리되어 있지 않아 이전 문맥이 필요하지 않는 경우 잡음으로 작용할 수 있다. 본 논문은 이러한 문제를 해결하기 위해 입력 발화와 이전 문맥을 각각의 벡터로 표현하는 방법을 제안한다. 또한 생성적 적대적 신경망을 통해 챗봇 시스템을 보강하는 방법을 제안한다. 채팅 말뭉치(55,000 개의 학습 데이터, 5,000개의 검증 데이터, 5,260 개의 평가 데이터)를 사용한 실험에서 제안한 문맥 반영 방법과 생성적 적대적 신경망을 통한 챗봇 시스템 보강 방법은 BLEU와 임베딩 기반 평가의 성능 향상에 도움을 주었다.

  • PDF

Summarization Based Multi-news Title Extraction Using Term Relevance Estimation and Byte Pair Encoding (단어 관련성 추정과 바이트 페어 인코딩(Byte Pair Encoding)을 이용한 요약 기반 다중 뉴스 기사 제목 추출)

  • Yu, Hongyeon;Lee, Seungwoo;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.115-119
    • /
    • 2018
  • 다중 문서 제목 추출은 하나의 주제를 가지는 다중 문서에 대한 제목을 추출하는 것을 말한다. 일반적으로 다중 문서 제목 추출에서는 다중 문서 집합을 단일 문서로 본 다음 키워드를 제목 후보군으로 추출하고, 추출된 후보를 나열하는 형식의 연구가 많이 진행되어져 왔다. 하지만 이러한 방법은 크게 두 가지의 한계점을 가지고 있다. 먼저, 다중 문서를 단순히 하나의 문서로 보는 방법은 전체적인 주제를 반영한 제목을 추출하기 어렵다는 문제점이 있다. 다음으로, 키워드를 조합하는 형식의 방법은 키워드의 단위를 찾는 방법에 따라 추출된 제목이 자연스럽지 못하다는 한계점이 있다. 따라서 본 논문에서는 이 한계점들을 보완하기 위하여 단어 관련성 추정과 Byte Pair Encoding을 이용한 요약 기반의 다중 뉴스 기사 제목 추출 방법을 제안한다. 평가를 위해서는 자동으로 군집된 총 12개의 주제에 대한 다중 뉴스 기사 집합을 사용하였으며 전문 교육을 받은 연구원들이 정성평가를 진행하여 5점 만점 기준 평균 3.68점을 얻었다.

  • PDF

The Acquisition of National Identity: A Comparison of In-country and Over-seas Korean Adolescents (한국청소년과 재외교포 청소년의 민족정체감조사 비교)

  • Yi, Soon Hyung
    • Korean Journal of Child Studies
    • /
    • v.13 no.2
    • /
    • pp.99-112
    • /
    • 1992
  • The purpose of the present study was to investigate methodological and theoretical problems in measuring the acquisition of national identity of in-country and over-seas Korean adolescents. The subjects consisted of 344 in-country and 89 over-seas (total 433) adolescents. 14 to 26 years of age. Data were collected with the use of two questionnaires. The Cognition of National Characteristics(CNC) and The Measure of National Belongings(MNB). As statistical measures. F-test and Pearson's correlation coefficient were used. The results are disclosed as follows; 1) The concept of national identity organized not only cognition of the national characteristics in multi-dimension which is related each other, but also a sense of belonging. 2) Two measuring methods(CNC and MNB) for this study are closely related. 3) Overseas Korean adolescents performed more than in-country Korean adolescents in 5 sub-national characteristics(language, social norm, history of the nation, & breaking with ideological thinking) except the consanguinity, of CNC and MNB. Crisis hypothesis was supposed as alternative factor to explain that overseas Korean adolescents cognified about the national characteristics and feel a sense of belonging more than the in-country respondents. 4) Some demographic variables, such as age of the respondents, place of birth, level of understanding Korean language, are contributed to acquiring national identity.

  • PDF

A Multimodal Interface for Telematics based on Multimodal middleware (미들웨어 기반의 텔레매틱스용 멀티모달 인터페이스)

  • Park, Sung-Chan;Ahn, Se-Yeol;Park, Seong-Soo;Koo, Myoung-Wan
    • Proceedings of the KSPS conference
    • /
    • 2007.05a
    • /
    • pp.41-44
    • /
    • 2007
  • In this paper, we introduce a system in which car navigation scenario is plugged multimodal interface based on multimodal middleware. In map-based system, the combination of speech and pen input/output modalities can offer users better expressive power. To be able to achieve multimodal task in car environments, we have chosen SCXML(State Chart XML), a multimodal authoring language of W3C standard, to control modality components as XHTML, VoiceXML and GPS. In Network Manager, GPS signals from navigation software are converted to EMMA meta language, sent to MultiModal Interaction Runtime Framework(MMI). Not only does MMI handles GPS signals and a user's multimodal I/Os but also it combines them with information of device, user preference and reasoned RDF to give the user intelligent or personalized services. The self-simulation test has shown that middleware accomplish a navigational multimodal task over multiple users in car environments.

  • PDF

DLMS SCADA System based on TETRA (TETRA 기반 DLMS 원방감시 시스템)

  • Song, Byung-Kwen;Lee, Suk-Hee
    • Journal of IKEEE
    • /
    • v.13 no.3
    • /
    • pp.95-102
    • /
    • 2009
  • TETRA(TErrestrial Trunked RAdio) is wireless communication system generally adopted to public network and backbone network, as the technology of Trunked Radio System specified by ETSI(European Telecommunications Standards Institute) and currently adopted to the Electric Power IT Backbone Network in Korea. DLMS(Device Language Message Specification) is used in order to meter an electric measuring instrument value. In this paper, DLMS Server and Client simulator are used based on Window operating system. The multi-functional gateway, which transforms the communications based on RS-232C between DLMS Server Simulator and Client Simulator to the one based on TETRA PEI(Peripheral Equipment Interface), is developed such that DLMS SCADA(Supervisory Control And Data Acquisition) system is constructed based on TETRA.

  • PDF

A Korean Morphological Analyzer Supports Multi-Threads (정보 검색용 다중 스레드 한국어 형태소 해석기)

  • Choi, Yoo-Kyung;An, Dong-Un;Chung, Sung-Jong
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.41-47
    • /
    • 2001
  • 본 논문에서는 한국어 형태소 해석기에 다중 스레드 기법을 도입하여 다중 처리가 가능하도륵 하였다. 기존의 여러 형태소 해석기들은 언어 분석에만 관심이 있었기 때문에 다량의 문서를 동시에 처리하는 기능을 고려하지 않았다. 그러나 형태소 해석기가 정보 검색 시스템 분야에서 사용되기 시작하면서, 다수의 사용자가 대량의 문서를 처리해야 하는 필요성이 생겼다. 스레드 간에는 메모리 영역과 같은 자원을 공유한다. 이러한 특징 때문에 자칫하면 예상치 못한 결과가 야기될 수 있다. 따라서, 다중 스레드 기법을 사용하기 위해서는 스레드의 특징을 고려한 조치가 필요하다 기존의 한국어 형태소 해석기의 소스 코드를 분석하여 자주 사용되는 전역 변수는 하나의 구조체로 구성하였다. 그리고 이러한 전역 변수와 크기가 큰 지역 변수를 사용할 때 메모리를 동적으로 할당하였다. 또한, 파일에서 입력값을 읽어오거나 파일에 결과값을 쓰는 등 여러 스레드가 접근할 때 값이 변경될 위험이 있는 부분은 조건 변수를 이용하여 동기화 시켰다. 구현된 시스템의 검증을 위하여, 단일 스레드 방식으로 순차적인 처리를 하는 원래의 형태소 해석기와 비교 실험을 실시하였다. 35Kbyte 문서 30개를 처리하는 경우, 다중 처리가 가능한 형태소 해석기가 단일 스레드 방식의 형태소 해석기보다 처리속도가 약 12% 향상되었다.

  • PDF

Development of Mmotor Group Control System for Continuous Process Automation (연속공정 자동화를 위한 전동기 그룹제어시스템의 개발)

  • Cho, Y. J.;Oh, S. R.;Choy, I.;Ahn, H. S.;Kwon, S. H.;Lee, J. S.;Kim, K. B.;Lim, J. H.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 1990.10a
    • /
    • pp.218-224
    • /
    • 1990
  • A motor group control system is developed for continuous manufacturing processes such as rolling process or electrolytic tinning process. The control system consists of four subsystems ; Multi-Function Controller (MFC), Flexible Motor Drive (FMD), Bulky Input/Output (BIO), Graphic Console and Simulator (GCS). A graphic control language, called Function Block Language, is used to configure the control algorithms for each subsystem. All subsystem are linked together thru a field bus to communicate data with each other.

  • PDF

A Study on Participation Experience of Immigrants in Korea Immigration & Integration Program of the Ministry of Justice (이민자의 법무부 사회통합프로그램 참여경험에 관한 연구)

  • Choi, Bae-Young;Han, Eun-Joo
    • Journal of Families and Better Life
    • /
    • v.30 no.3
    • /
    • pp.83-103
    • /
    • 2012
  • This thesis is based on an in-depth interview on participation experience of ten immigrants who reside in S Multi-cultural Family Support Center that is located in Gyeonggi-do in Korea Immigration & Integration Program(KIIP). The purpose of this research is to present through it's basic data for improvement in the operation of KIIP in the future by grasping participation process in KIIP that the immigrants have experienced, problems involved in their operation, and related requirements. Major results of the research are as follows: First, the motive for the immigrants' participation in KIIP was to acquire Korean nationality, learn Korean, and prepare for their future in Korea. Second, as a difficulty in participation in KIIP, access to educational institutions loomed large. Third, regarding improvements in the operation of KIIP, marriage immigrants needed to continue Korean language education, whereas other immigrants revealed a demand for opening evening classes or weekend classes. In the final analysis, it seems that for KIIP to provide an opportunity for the immigrants to have a vision for their life in the future, as well as for its realization in Korean society, policy-oriented institutional support that pays attention to their life situation and demands is badly needed.