• Title/Summary/Keyword: 다국어

Search Result 221, Processing Time 0.027 seconds

An Intelligent Character System Using Multi-Language Based Question Answering System (다국어 기반의 질의응답시스템을 활용한 지능형 케릭터 시스템)

  • Park, Hong-Won;Lee, Ki-Ju;Lee, Su-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.215-220
    • /
    • 2002
  • 질의응답시스템을 지능형 케릭터 시스템에 활용하기 위해서는 불특정한 주제에 대해 불특정 다수의 사용자와 대화할 수 있는 정교한 대화 모델이 필요하다. 이러한 대화 모델은 사용자의 질의문장을 인식하고 질의의도를 파악한 후 케릭터의 특정지식으로 접근하여 해당 지식을 사용자의 요구에 맞는 응답문의 형태로 생성해 내는 과정이 필수적으로 포함되어야 한다. 본 논문에서는 논의의 대상이 되는 질의응답시스템이 다국어 기반이라는 점을 고려하여 질의응답시스템을 지능형 케릭터에 활용하는 과정에서 케릭터의 지식구조 설계는 물론이고 질의문장 분석과 응답 문 생성의 방법론에 있어서도 한국어, 영어, 일본어, 중국어 각각의 언어적 특질을 반영함으로써 형태적, 통사적 차이로 인한 애로점을 최소화할 수 있도록 하였다.

  • PDF

Service factors affecting satisfaction on academic library usage of chinese students (중국인 유학생의 대학도서관 이용만족도에 영향을 미치는 서비스 요인에 관한 연구)

  • Liu, Jiayi
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2018.08a
    • /
    • pp.91-96
    • /
    • 2018
  • 교육의 국제화로 인해 국내 대학에 재학 중인 유학생의 수가 매년 증가하고 있다. 그러나 유학생들이 학습 자원을 얻기 위한 가장 큰 정보원인 대학도서관은 유학생들을 위한 다국어 지원 서비스를 충분히 제공하고 있지 않은 상황이다. 따라서 본 연구에서는 대학도서관에서 제공하는 서비스 중 다국어 지원이 가능한 서비스 요인들을 선정하고 해당 요인들이 유학생들의 대학도서관 이용 만족도에 미치는 영향을 파악하고자 하였다. 이를 위해 먼저 선행연구를 바탕으로 사서/직원의 서비스(응답능력, 태도), 도서관 시설 이용(시설 안내, 장비 사용), 자료 접근 및 이용(홈페이지, 서가 배치), 이용자 서비스(이용자교육, 기타서비스)를 요인을 도출하였고 회귀분석을 실시하였다. 연구 결과에 따르면 도서관 시설 이용이 대학도서관 이용 만족도에 가장 큰 영향을 미치고 있었으며 사서/직원의 서비스와 이용자 서비스 또한 영향을 미치는 것으로 나타났다.

  • PDF

Multi-lingual Emergency Alert Service by Terrestrial Broadcasting Network (지상파 방송을 활용한 다국어 재난경보 서비스)

  • Suh, Young-Woo;Kwak, Chunsub
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.495-496
    • /
    • 2020
  • 재난상황에서 통신망의 불통상황에 대비하여 지상파 방송망을 통한 재난경보메시지를 전달하는 것이 사회안전망의 구축을 위해 매우 중요하게 부각되고 있다. 특히, 사회가 국제화 되고 다양한 국가의 사람들과의 경제 교류를 통해 국내 서비스라고 할지라도 외국인을 대상으로 한 재난경보 메시지도 제공 되어야 재난 상황에서 인명 피해를 최소화 할 수 있다. 지상파 방송 시스템은 비디오 등 정규 프로그램 편성 외에 데이터 채널을 활용하여 다양한 정보를 송출할 수 있으며, ATSC 3.0 방송 시스템은 IP 방식의 데이터 송출을 통해 특정 대상을 타겟으로 정보를 보내는 것이 가능하다. 따라서 이러한 지상파 방송망을 통한 IP 데이터 송출의 장점을 잘 활용하면 재난 상황에서 적은 데이터를 가지고도 효율적으로 다양한 언어로 국민들에게 안전 정보를 보낼 수 있다. 이를 통해 국내 거주 외국인들이 재난에 대비하는데 크게 기여할 수 있다. 본 연구는 디지털 방송망을 통해 다국어 재난메시지를 보내기 위한 효율적인 방법을 제안한다.

  • PDF

Research on Features for Effective Cross-Lingual Transfer in Korean (효과적인 한국어 교차언어 전송을 위한 특성 연구)

  • Taejun Yun;Taeuk Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.119-124
    • /
    • 2023
  • 자원이 풍부한 언어를 사용하여 훈련된 모델을 만들고 해당 모델을 사용해 자원이 부족한 언어에 대해 전이 학습하는 방법인 교차언어 전송(Cross-Lingual Transfer)은 다국어 모델을 사용하여 특정한 언어에 맞는 모델을 만들 때 사용되는 일반적이고 효율적인 방법이다. 교차언어 전송의 성능은 서비스하는 언어와 전송 모델을 만들기 위한 훈련 데이터 언어에 따라 성능이 매우 다르므로 어떤 언어를 사용하여 학습할지 결정하는 단계는 효율적인 언어 서비스를 위해 매우 중요하다. 본 연구에서는 교차언어 전송을 위한 원천언어를 찾을 수 있는 특성이 무엇인지 회귀분석을 통해 탐구한다. 또한 교차언어전송에 용이한 원천 학습 언어를 찾는 기존의 방법론들 간의 비교를 통해 더 나은 방법을 도출해내고 한국어의 경우에 일반적으로 더 나은 원천 학습 언어를 찾을 수 있는 방법론을 도출한다.

  • PDF

Knowledge Transfer in Multilingual LLMs Based on Code-Switching Corpora (코드 스위칭 코퍼스 기반 다국어 LLM의 지식 전이 연구)

  • Seonghyun Kim;Kanghee Lee;Minsu Jeong;Jungwoo Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.301-305
    • /
    • 2023
  • 최근 등장한 Large Language Models (LLM)은 자연어 처리 분야에서 눈에 띄는 성과를 보여주었지만, 주로 영어 중심의 연구로 진행되어 그 한계를 가지고 있다. 본 연구는 사전 학습된 LLM의 언어별 지식 전이 가능성을 한국어를 중심으로 탐구하였다. 이를 위해 한국어와 영어로 구성된 코드 스위칭 코퍼스를 구축하였으며, 기본 모델인 LLAMA-2와 코드 스위칭 코퍼스를 추가 학습한 모델 간의 성능 비교를 수행하였다. 결과적으로, 제안하는 방법론으로 학습한 모델은 두 언어 간의 희미론적 정보가 효과적으로 전이됐으며, 두 언어 간의 지식 정보 연계가 가능했다. 이 연구는 다양한 언어와 문화를 반영하는 다국어 LLM 연구와, 소수 언어를 포함한 AI 기술의 확산 및 민주화에 기여할 수 있을 것으로 기대된다.

  • PDF

Analyzing Korean hate-speech detection using KcBERT (KcBERT를 활용한 한국어 악플 탐지 분석 및 개선방안 연구)

  • Seyoung Jeong;Byeongjin Kim;Daeshik Kim;Wooyoung Kim;Taeyong Kim;Hyunsoo Yoon;Wooju Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.577-580
    • /
    • 2023
  • 악성댓글은 인터넷상에서 정서적, 심리적 피해를 주는 문제로 인식되어 왔다. 본 연구는 한국어 악성댓글 탐지 분석을 위해 KcBERT 및 다양한 모델을 활용하여 성능을 비교하였다. 또한, 공개된 한국어 악성댓글 데이터가 부족한 것을 해소하기 위해 기계 번역을 이용하고, 다국어 언어 모델(Multilingual Model) mBERT를 활용하였다. 다양한 실험을 통해 KcBERT를 미세 조정한 모델의 정확도 및 F1-score가 타 모델에 비해 의미 있는 결과임을 확인할 수 있었다.

  • PDF

Study of CAP Profile Requirement for Emergency Alert System in Korea (공통경보프로토콜을 대한민국 경보시스템에 적용하기 위한 프로파일 요구사항 연구)

  • Kim, Jihee;Ahn, Soyoung;Jeon, Inchan;Lee, Yong Tae;Choi, Seong Jong
    • Journal of Broadcast Engineering
    • /
    • v.19 no.6
    • /
    • pp.847-853
    • /
    • 2014
  • When a disaster occurs, effective alerts will reduce human life and property loss. The Integrated Emergency Alert System is a national disaster management system which integrates existing alert systems to deliver effective disaster alerts. Alert message exchange protocol is the essential technology for the System. In Korea, the first specification for "Common Alerting Protocol Profile for Integrated Emergency Alert System" was established in 2014. In this paper, we derive two additional requirements for more enhanced alert service and propose revision of the specification: multilingual alert service for foreigners and more flexible representation of target area. We review the associated foreign profile specifications as well as the domestic specifications to analyze these requirements. Finally, we propose the most efficient way to deliver multilingual alert message and to represent target area.

Classification Performance Analysis of Cross-Language Text Categorization using Machine Translation (기계번역을 이용한 교차언어 문서 범주화의 분류 성능 분석)

  • Lee, Yong-Gu
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.43 no.1
    • /
    • pp.313-332
    • /
    • 2009
  • Cross-language text categorization(CLTC) can classify documents automatically using training set from other language. In this study, collections appropriated for CLTC were extracted from KTSET. Classification performance of various CLTC methods were compared by SVM classifier using machine translation. Results showed that the classification performance in the order of poly-lingual training method, training-set translation and test-set translation. However, training-set translation could be regarded as the most useful method among CLTC, because it was efficient for machine translation and easily adapted to general environment. On the other hand, low performance was shown to be due to the feature reduction or features with no subject characteristics, which occurred in the process of machine translation of CLTC.

A Research on Cool URI based on Internationalized Resource Identifier for Web 2.0 (웹 2.0을 위한 다국어 식별자 기반의 Cool URI에 대한 연구)

  • Jung, Eui-Hyun;Kim, Weon;Song, Kwan-Ho;Park, Chan-Ki
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.5 s.43
    • /
    • pp.223-230
    • /
    • 2006
  • Web 2.0 and Semantic Web technology will be merged to be a next generation Web that leads presentation-oriented Web to data-centric Web. In the next generation Web, semantic processing, Web platform, and data fusion are most important technology factors. Among them, Cool URI used for data fusion can provide permanent and human readable URI and it has been already used in Blog system. However, Cool URI is not suitable to I18N environment such as Hangul and it is difficult to be adopted because several encodings are mingled in Korea Web society. In this paper, we discussed technology issues and Cool URI Web component to use Cool URI with Internationalized Resource Identifier (IRI). A proposed approach provides same function regardless of encoding type and supports both file system based and CGI based methods to be easily used from other applications. Results from several test environments show the implemented Web component satisfy the design purpose.

  • PDF