• 제목/요약/키워드: language transfer

검색결과 287건 처리시간 0.027초

MASS를 이용한 영어-한국어 신경망 기계 번역 (English-Korean Neural Machine Translation using MASS)

  • 정영준;박천음;이창기;김준석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.236-238
    • /
    • 2019
  • 신경망 기계 번역(Neural Machine Translation)은 주로 지도 학습(Supervised learning)을 이용한 End-to-end 방식의 연구가 이루어지고 있다. 그러나 지도 학습 방법은 데이터가 부족한 경우에는 낮은 성능을 보이기 때문에 BERT와 같은 대량의 단일 언어 데이터로 사전학습(Pre-training)을 한 후에 미세조정(Finetuning)을 하는 Transfer learning 방법이 자연어 처리 분야에서 주로 연구되고 있다. 최근에 발표된 MASS 모델은 언어 생성 작업을 위한 사전학습 방법을 통해 기계 번역과 문서 요약에서 높은 성능을 보였다. 본 논문에서는 영어-한국어 기계 번역 성능 향상을 위해 MASS 모델을 신경망 기계 번역에 적용하였다. 실험 결과 MASS 모델을 이용한 영어-한국어 기계 번역 모델의 성능이 기존 모델들보다 좋은 성능을 보였다.

  • PDF

한국어 사전학습 모델 KE-T5 기반 자동 논문 요약 (Korean Pre-trained Model KE-T5-based Automatic Paper Summarization)

  • 서현태;신사임;김산
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.505-506
    • /
    • 2021
  • 최근 인터넷에서 기하급수적으로 증가하는 방대한 양의 텍스트를 자동으로 요약하려는 연구가 활발하게 이루어지고 있다. 자동 텍스트 요약 작업은 다양한 사전학습 모델의 등장으로 인해 많은 발전을 이루었다. 특히 T5(Text-to-Text Transfer Transformer) 기반의 모델은 자동 텍스트 요약 작업에서 매우 우수한 성능을 보이며, 해당 분야의 SOTA(State of the Art)를 달성하고 있다. 본 논문에서는 방대한 양의 한국어를 학습시킨 사전학습 모델 KE-T5를 활용하여 자동 논문 요약을 수행하고 평가한다.

  • PDF

BERT을 이용한 한국어 문장의 스타일 변화 (Controlled Korean Style Transfer using BERT)

  • 이주성;오연택;변현진;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.395-399
    • /
    • 2019
  • 생성 모델은 최근 단순히 기존 데이터를 증강 시키는 것이 아니라 원하는 속성을 가지도록 스타일을 변화시키는 연구가 활발히 진행되고 있다. 스타일 변화 연구에서 필요한 병렬 데이터 세트는 구축하는데 많은 비용이 들기 때문에 비병렬 데이터를 이용하는 연구가 주를 이루고 있다. 이러한 방법론으로 이미지 분야에서 대표적으로 cycleGAN[1]이 있으며 최근 자연어 처리 분야에서도 많은 연구가 진행되고 있다. 많은 논문들이 사용하는 데이터도메인은 긍정 문장과 부정 문장 사이를 변화시키는 것이다. 본 연구에서는 한국어 영화리뷰 데이터 세트인 NSMC[2]를 이용한 감성 변화를 하는 문장생성에 대한 연구로 자연어 처리에서 좋은 성능을 보여주는 BERT[8]를 생성모델에 이용하였다.

  • PDF

한국어-영어 말처리 평가시스템 개발을 위한 기초 연구 (Pilot study for the development of Korean and English speech processing task system)

  • 김지영;하지완
    • 말소리와 음성과학
    • /
    • 제16권2호
    • /
    • pp.29-36
    • /
    • 2024
  • 심리언어학적 접근에 기반한 말처리 모델은 다양한 경로를 통해 말소리장애아동의 구체적인 말처리 결함을 한눈에 파악할 수 있는 모델이다. 말소리장애아동이 보이는 말산출 결함은 원인을 알 수 없는 경우가 대부분이기 때문에 개별화된 중재를 위해서는 기저의 강약점을 파악하는 것이 중요하다. 또한 말소리장애 아동의 모국어 결함은 외국어 산출에도 영향을 미칠 수 있기 때문에 모국어와 외국어라는 두 언어 간 말처리 능력을 함께 살펴볼 필요가 있다. 본 연구는 한국어-영어 말처리 평가시스템 개발을 위한 예비연구로, 말소리장애아동(SSD) 10명과 일반아동(NSA) 20명을 대상으로 말산출 과제와 말처리 과제(변별, 음운표상판단, 비단어따라말하기)를 한국어와 영어로 각각 실시하여 언어종류에 따른 집단 간 비교를 시도하였다. 연구 결과, SSD 집단은 두 언어에서 모두 NSA 집단에 비해 유의하게 낮은 산출능력을 보였다. 말처리 과제 결과, 변별과제에서는 유의한 차이를 보이지 않은 반면, 음운표상판단과제의 경우 언어 종류 간, 비단어따라말하기과제의 경우 언어종류와 집단 간에서도 그 차이가 유의하였다. 본 연구의 결과를 통해 아동의 모국어와 외국어 처리능력은 상이할 수 있으며, 추후 말처리 평가 프로그램 개발을 위해 하위과제를 보다 세분화하고 난이도를 조절할 필요가 있음을 확인하였다.

초기 슬로우 스타트 단계에서 SCTP의 평균 전송 시간 (Mean Transfer Time for SCTP in Initial Slow Start Phase)

  • 김주현;이용진
    • 대한공업교육학회지
    • /
    • 제32권2호
    • /
    • pp.199-216
    • /
    • 2007
  • SCTP(stream control transmission protocol)는 데이터 전송을 위한 전송 계층 프로토콜로서, 많은 부분에서 TCP(transmission control protocol) 방식을 따른다. 하지만 멀티 호밍(multi-homing)과 멀티 스트리밍(multi-streaming)의 특징을 가짐으로 성능의 차이를 갖는다. 이 논문에서는 SCTP 혼잡제어 중에서 초기 슬로우 스타트 단계에 초점을 맞추어 데이터 전송을 분석하고, 대역폭, 지연시간 및 데이터 크기에 따른 SCTP와 TCP 평균 전송 시간을 측정하고 비교하였다. 아울러 SCTP와 TCP의 평균 전송시간에 영향을 미치는 요인인 초기 윈도우 크기를 데이터 크기에 따라 측정하였다. 실험을 위한 서버와 클라이언트 프로그램은 SCTP socket API를 이용하여 C 언어로 작성되었고, 전송 시간은 이더리얼 프로그램을 사용하여 측정되었다. 서버와 클라이언트 사이의 데이터 전송 방법은 라운드 로빈(round robin) 방법을 사용하였다. 실험 결과, SCTP는 초기 슬로우 스타트 단계에서 TCP 보다 평균 전송 시간에 있어 약 15% 정도 향상된 성능을 보였으며, 그 이유는 SCTP 초기 윈도우 크기가 TCP 보다 크기 때문으로 확인되었다.

싱글홈드 환경에서 패킷 손실을 고려한 SCTP와 TCP의 평균 전송 시간 (Mean Transfer Time for SCTP and TCP in Single-homed Environment considering Packet Loss)

  • 김주현;이용진
    • 대한공업교육학회지
    • /
    • 제33권1호
    • /
    • pp.233-248
    • /
    • 2008
  • 새롭게 제안된 전송 계층 프로토콜인 SCTP(Stream Control Transmission Protocol)는 두 개 이상의 IP 주소를 갖는 멀티호밍(multi-homing) 환경에서 기존의 TCP(Transmission Control Protocol)보다 성능이 향상되는 것으로 알려져 있다. 하지만 현재 주로 사용되고 있는 컴퓨터는 한 개의 IP 주소를 갖는 싱글홈드(single-homed) 환경이다. 본 연구에서는 패킷 손실이 있는 싱글홈드 환경에서, SCTP의 평균 전송 시간이 TCP의 그것보다 우수한 가를 알아보기 위해, 대역폭, 지연 시간 및 패킷 손실률을 라우터에서 조절하는 실제 테스트베드 환경을 구축하여 실험하였다. SCTP와 TCP의 평균 전송 시간을 측정하기 위해 C 언어를 이용하여 서버 및 클라이언트 애플리케이션을 작성하였다. 실험 결과, 싱글홈드 환경에서 SCTP는 TCP 보다 전송 시간이 짧을 때도 있었지만, 대부분의 경우에 있어서 TCP의 전송 시간이 SCTP 보다 짧았다. 그 이유는 SCTP가 TCP에 비해 전송 중 타임아웃으로 인해 전송이 멈추거나, SACK의 폭주로 인해 데이터 전송이 지연되는 경우가 발생하기 때문인 것으로 확인되었다. 본 연구의 결과는 현재 구현된 SCTP 모듈을 사용하거나 또는 새로운 SCTP 모듈을 개발하는 데 있어서 정교한 성능 튜닝이 필요함을 보여주고 있다.

SSD의 PC적용을 위한 시스템 수준의 환경 구축 (Establishment of System Level environment to apply SSD to PC)

  • 김동;방관후;정의영
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.561-562
    • /
    • 2008
  • In this paper, we propose a establishment of system level environment to exploit PC system with SSD (Solid State Disk) by using TLM (Transaction Level Modeling) method with SystemC language. The reason why we choose this modeling method is that it eases RTL (Register Transfer Level) modeling burdens and we can accurately estimate the performance about different architectural changes. Also, it provides simulation speed which is relatively faster than RTL modeling method. The baseline architectural platform we implemented showed that SSD's internal transfer time is a dominant factor, so we need to improve that part and it is expected to be a good simulator to measure the system's overall performance by exploiting SSD's internal architectures.

  • PDF

The Molecular Basis of Adenomyosis Development

  • Yang, Woo Sub;Lim, Jeong Mook;Ahn, Ji Yeon
    • 한국수정란이식학회지
    • /
    • 제33권1호
    • /
    • pp.49-54
    • /
    • 2018
  • Adenomyosis is a benign gynecological disease frequently affecting women of reproductive age. It has a negative impact on the quality of life, causing bleeding disorders, dysmenorrhea, chronic pelvic pain, and infertility. However, the molecular mechanisms involved in adenomyosis development remain unclear. This paper summarizes the reports found in the MEDLINE database on the molecular mechanisms involved in the development and progression of uterine adenomyosis. The literature search included the following terms: "adenomyosis," "adenomyoma," "pathogenesis," "molecular mechanisms," and "gynecological disorders." Only peer-reviewed, English-language journal articles were included. This review focuses on the molecular genetics, epigenetic modifications, and pivotal signaling pathways associated with adenomyosis development and progression, which will provide insights into and a better understanding of its underlying pathophysiology.

Korean Learners' Development of English Passive Constructions

  • Park, Hye-Sook
    • 영어어문교육
    • /
    • 제15권4호
    • /
    • pp.199-216
    • /
    • 2009
  • This study investigates how Korean speakers develop their interlanguage of English passive constructions with a reference to the learners' grammar proficiency levels. Sixty two college students of different levels of English participated in this study. They were asked to complete a sentence-completion task. Their production was classified into accurate passives, malformed passives, pseudo-passives, unaccusatives, and actives according to the use of transitive, ergative and unergative verbs. They then were further analyzed depending on the subjects' levels of grammar by three main factors: L1 transfer, the English voice system, and universal cognitive factors. The results showed that the subjects of the lower group produced more pseudo-passives, malformed passives, and overpassivization than those of the higher group, and even subjects of higher group still made passives for ergative verbs. It was also shown that L1 and universal factors had more influence on the lower group than on the higher group. Based on the analyses of the subjects' responses, the development of the English passive system by Korean learners is shown and some implications are suggested for effective teaching of English.

  • PDF

HTTP을 의한 원격 모니터링 (Remote monitoring using HTTP)

  • 이경웅;최한수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2109-2111
    • /
    • 2003
  • In this paper, It is studied to monitor the remote system status using HTTP(HyperText Transfer Protocol) object communication. This system is organized by three different part depending on functionality - server part, client part, controller part. The JAVA technology is used to composite the server part, the client part and C language is used for a controller.

  • PDF