• 제목/요약/키워드: multi-language

검색결과 676건 처리시간 0.021초

Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식 (Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition)

  • 천민아;김창현;박호민;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-171
    • /
    • 2018
  • 개체명 인식은 문서에서 인명, 지명, 기관명 등의 고유한 의미를 나타내는 단위인 개체명을 추출하고, 추출된 개체명의 범주를 결정하는 작업이다. 최근 개체명 인식과 관련된 연구는 입력 데이터의 앞, 뒤를 고려하기 위한 Bi-RNNs와 출력 데이터 간의 전이 확률을 이용한 CRFs를 결합한 방식을 기반으로 다양한 변형의 심층학습 방법론이 제안되고 있다. 그러나 대부분의 연구는 입력 단위를 단어나 형태소로 사용하고 있으며, 성능 향상을 위해 띄어쓰기 정보, 개체명 사전 자질, 품사 분포 정보 등 다양한 정보를 필요로 한다는 어려움이 있다. 본 논문은 기본적인 학습 말뭉치에서 얻을 수 있는 문자 기반의 입력 정보와 Multi-Head Attention을 추가한 Bi-GRU/CRFs을 이용한 다국어 개체명 인식 방법을 제안한다. 한국어, 일본어, 중국어, 영어에 제안 모델을 적용한 결과 한국어와 일본어에서는 우수한 성능(한국어 $F_1$ 84.84%, 일본어 $F_1$ 89.56%)을 보였다. 영어에서는 $F_1$ 80.83%의 성능을 보였으며, 중국어는 $F_1$ 21.05%로 가장 낮은 성능을 보였다.

  • PDF

다음절 단어재인에 있어서 음운적 활성화 (Phonological Activation in Multi-syllabic Word Recognition)

  • 이창환;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.225-228
    • /
    • 2004
  • 영어단어 중에는 글자 열에 소리가 나지 않는 묵음자를 가진 단어들이 있다(예 : $\underline{k}nowledge$). 이러한 단어들은 같은 위치의 글자 열에 소리가 나는 글자를 가진 단어들(예 :available)과 수행을 비교하여 다음절 단어 재인에 있어서 음운 정보의 역할을 검증할 수 있는 기회를 제공한다. 파일럿 연구의 성격을 가진 본 연구의 결과, 어휘판단 과제에서 묵음자가 삭제된 단어 (예 : _nowledge)의 수행이 소리음이 삭제된 단어 (예 :_vailable)의 수행보다 빨랐다. 어휘접근을 반영하는 어휘판단과제에서의 이러한 결과는 다음절 단어재인에 있어서 음운 재부호화가 일어날 수 있는 개연성을 보여주는 것이다.

  • PDF

단어 구분 및 인식 알고리즘을 이용한 안드로이드 플랫폼 기반의 멀티 성경 애플리케이션 (A Multi-Bible Application on an Android Platform Using a Word Tokenization and Recognition Algorithm)

  • 강성모;강명수;김종면
    • 대한임베디드공학회논문지
    • /
    • 제6권4호
    • /
    • pp.215-221
    • /
    • 2011
  • Mobile phones, which were used for simply calling and sending text messages, have recently moved to application-oriented digital devices such as smart phones and tablet phones. The rapid increase of smart and tablet phones which can offer advanced ability and run a variety of applications based on Java requires various digital multimedia content activities. These days, there are more than 2.2 billions of Christians around the world. Among them, more than 300 millions of people live in Asian, and all of them have and read the bible. If there is an application for the bible which translates from English to their own languages, it could be very helpful. With this reason, this paper proposes a multi-bible application that supports various languages. To do this, we implemented an algorithm that recognize sentences in the bible as word by word. The algorithm is essentially composed of the following three functions: tokenizing sentences in the bible into word by word (word tokenization), recognizing words by using touch event (word recognition), and translating the selected words to the desired language. Consequently, the proposed multi-bible application supports language translation efficiently by touching words of sentences in the bible.

상상공동체 관점을 통한 한국어 학습자 동기 이해 (Understanding the Language Learner from the Imagined Communities Perspective: The Case of Korean Language Learners in the U.S.)

  • 이시원;조혜원
    • 한국어교육
    • /
    • 제28권4호
    • /
    • pp.367-402
    • /
    • 2017
  • 본 연구는 언어 학습이 실행공동체 (Communities of practice) 참여를 통한 사회적 학습과정이라는 전제 하에, Norton (2001)의 상상 공동체 (Imagined communities) 개념을 바탕으로 언어학습자들의 다면적 동기를 이해하기 위한 목적으로 수행되었다. 특별히 기존 제2언어습득 문헌에서 상대적으로 연구되지 않은 미국 내 소수민족언어 (less commonly taught languages) 중 하나인 한국어 학습자의 다면적 동기를 조명하고자 하였다. 이를 위해 미국 동부 소재 대학에서 한국어 강의를 수강하는 11명의 학생들을 대상으로 심층적 인터뷰를 실시하였다. 연구 분석결과 학습자 그룹 내에 관찰되는 상상공동체의 유형으로 K-pop 문화공동체, 직업 공동체, 한국 친인척 공동체, 민족 정체성 공동체의 네가지 유형이 관찰되었다. 그리고 학습자 개개인의 상상 공동체는 언어 배경, 학습 기간, 매체 사용 등의 다양한 경험을 통해 다양하게 발전, 변화하는 것으로 나타났다. 특히 계승어 학습자와 비계승어 학습자 간에 지향하는 상상 공동체의 유형을 비교해 보았을 때 명확한 차이가 나타났다. 또한 기존 문헌에서 계승어 관련 동기 (heritage motivation or motivation related to heritage)라 명명되는 개념 내에도 학습자의 경험에 따라 실제로는 상이한 공동체 유형이 존재함이 발견되었다.

CNN을 이용한 발화 주제 다중 분류 (Multi-labeled Domain Detection Using CNN)

  • 최경호;김경덕;김용희;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.56-59
    • /
    • 2017
  • CNN(Convolutional Neural Network)을 이용하여 발화 주제 다중 분류 task를 multi-labeling 방법과, cluster 방법을 이용하여 수행하고, 각 방법론에 MSE(Mean Square Error), softmax cross-entropy, sigmoid cross-entropy를 적용하여 성능을 평가하였다. Network는 음절 단위로 tokenize하고, 품사정보를 각 token의 추가한 sequence와, Naver DB를 통하여 얻은 named entity 정보를 입력으로 사용한다. 실험결과 cluster 방법으로 문제를 변형하고, sigmoid를 output layer의 activation function으로 사용하고 cross entropy cost function을 이용하여 network를 학습시켰을 때 F1 0.9873으로 가장 좋은 성능을 보였다.

  • PDF

수평분할과 뷰를 이용한 다단계 데이터베이스에서의 질의 처리 (Query Processing for Multi-level Databases Using Horizontal Partitioning and Views)

  • 나민영;최병갑
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 1995년도 종합학술발표회논문집
    • /
    • pp.79-88
    • /
    • 1995
  • Most works done so far have concentrated on developing data modeling techniques such as multi-level relation for data protection. These techniques, however, cannot be applied to practical area. This is because they require new queries or new architectures. In this paper, we propose a query processing technique for multi-level databases using horizontal partitioning and views, which does not need any change in database architecture and query language.

  • PDF

An Implementation of Single Stack Multi-threading for Small Embedded Systems

  • Kim, Yong-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.1-8
    • /
    • 2016
  • In small embedded systems including IoT devices, memory size is very small and it is important to reduce memory amount for execution of application programs. For multi-threaded applications, stack may consume a large amount of memory because each thread has its own stack of sufficiently large size for worst case. This paper presents an implementation of single stack multi-threading, called SSThread (Single Stack Thread), by sharing a stack for all threads to reduce stack memory size. By using SSThread, multi-threaded applications can be programmed based on normal C language environment and there is no requirement of transporting multi-threading operating systems. It consists of several library functions and various C macro definitions. Even though some functional restrictions in comparison to operating systems supporting complete multi-thread functionalities, it is very useful for small embedded systems with tiny memory size and it is simple to setup programming environment for multi-thread applications.

미술을 활용한 다문화 자녀의 언어와 사회성에 관한 연구 (A Study on Languages and Socialities of Children in Multi-cultural Families Using Fine Arts)

  • 도경은
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.793-801
    • /
    • 2013
  • 최근 우리사회는 세계화의 조류와 경제발전을 위한 노동력 등의 확보를 위해 다수의 외국인이 우리나라로 들어오게 되면서 단일민족의 단일문화사회에서 다민족 다문화사회로 전이되어가고 있다. 이로 인해 언어가 다른 사람들로 구성된 다문화가족이 생겨나게 되고 이 자녀들은 서로 다른 이중 언어 환경에서 한국어 습득의 어려움과 사회적 부적응 현상을 겪고 있다. 이에 본인은 이 논문이 미술을 통한 여러 미술방법을 활용하여 다문화 자녀의 언어능력과 사회성 발달에 도움이 되고자 하는데 그 목적이 있다. 연구방법은 먼저 다문화가족의 실태와 선행 논문과 자료를 통한 미술이 가지고 있는 양질의 효과를 알아보고 분석하여 다문화 자녀의 언어와 사회성에 도움을 줄 수 있는 방안을 미술 활용을 통해 제시하고자 하였다. 그 결과 첫째, 언어의 극복을 위해 이중언어강사와 미술적 멀티미디어의 적극적인 활용이 교육적으로 필요하다. 둘째, 여러 다른 과목의 학습증진 효과를 위해 미술의 다양한 방법 활용이 필요하다. 셋째, 감정조절과 사회성을 기르기 위해 미술놀이와 미술체험활동을 교육에 적용시킨다. 넷째, 창의성과 사회성뿐만 아니라 공동체적 인성교육을 위해 미술 중심의 통합문화예술교육을 적극 활용한다는 방안이다.

A Simple Syntax for Complex Semantics

  • Lee, Kiyong
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.2-27
    • /
    • 2002
  • As pact of a long-ranged project that aims at establishing database-theoretic semantics as a model of computational semantics, this presentation focuses on the development of a syntactic component for processing strings of words or sentences to construct semantic data structures. For design arid modeling purposes, the present treatment will be restricted to the analysis of some problematic constructions of Korean involving semi-free word order, conjunction arid temporal anchoring, and adnominal modification and antecedent binding. The present work heavily relies on Hausser's (1999, 2000) SLIM theory for language that is based on surface compositionality, time-linearity arid two other conditions on natural language processing. Time-linear syntax for natural language has been shown to be conceptually simple and computationally efficient. The associated semantics is complex, however, because it must deal with situated language involving interactive multi-agents. Nevertheless, by processing input word strings in a time-linear mode, the syntax cart incrementally construct the necessary semantic structures for relevant queries and valid inferences. The fragment of Korean syntax will be implemented in Malaga, a C-type implementation language that was enriched for both programming and debugging purposes arid that was particluarly made suitable for implementing in Left-Associative Grammar. This presentation will show how the system of syntactic rules with constraining subrules processes Korean sentences in a step-by-step time-linear manner to incrementally construct semantic data structures that mainly specify relations with their argument, temporal, and binding structures.

  • PDF

다중 인터페이스 환경에서의 문자언어와 음성언어의 차이에 관한 비교 연구 (Comparative Analysis of Written Language and Colloquial Language for Information Communication of Multi-Modal Interface Environment)

  • 최인환;이건표
    • 디자인학연구
    • /
    • 제19권2호
    • /
    • pp.91-98
    • /
    • 2006
  • 제품의 융합과 그 사용 환경의 복잡화로 인하여 다양한 감각을 활용해서 제품과 교감하는 다중 인터페이스의 필요성이 제기되고 있다. 전통적이고 일반적인 정보의 습득에는 시각이 압도적으로 많이 활용되었으나 디지털 네트워크 기술을 기반으로 발달할 미래 정보 사회에서는 보다 편리하고 합리적인 제품의 사용을 위하여 다양한 감각의 활용이 요구될 것이다. 정보 전달에 있어서 시각과 더불어 점차적으로 활용 가능성이 높아지고 있는 청각은 그 쓰임새가 더욱 넓어지고 또한 다양한 방식으로 발전될 것이다. 이러한 배경을 바탕으로 본 연구에서는 정보의 전달에서 사용되는 문자언어와 음성언어의 특성과 그에 대한 반응에 있어서 남성과 여성의 차이점의 비교분석에 관한 연구가 수행되었다. 이를 위하여 일단 언어를 구성하는 여러 가지 요소에 대한 문헌자료의 연구를 수행하였다. 이어서 시각과 청각의 특성을 검토한 후 선행 연구를 기반으로 하여 적절한 실험이 설계 및 수행되었다. 수행된 실험은 객관적인 분석방법을 통하여 실험 결과가 검토되었다. 금번 연구의 결과로는 첫째, 문자언어에 대한 반응 시간이 음성언어에 대한 그것보다 짧다는 것, 둘째 각 자극에 대한 반응에 있어서 남녀간의 차이가 존재한다는 것, 셋째, 시각이 청각에 비하여 선택적인 측면에서 절대적 우위를 점하지 못한다는 점등을 들 수 있다. 이번 연구를 기반으로 하여 보다 다양한 감각에 대한 폭 넓은 연구 방법의 개발이 필요할 것으로 사료된다.

  • PDF