통합 검색 | Korea Science

전이학습 기반 기계번역 사후교정 모델 검증 (The Verification of the Transfer Learning-based Automatic Post Editing Model)

문현석;박찬준;어수경;서재형;임희석
- 한국융합학회논문지
- /
- 제12권10호
- /
- pp.27-35
- /
- 2021
기계번역 사후교정 (Automatic Post Editing, APE)이란 번역 시스템을 통해 생성한 번역문을 교정하는 연구 분야로, 영어-독일어와 같이 학습데이터가 풍부한 언어쌍을 중심으로 연구가 진행되고 있다. 최근 APE 연구는 전이학습 기반 연구가 주로 이루어지는데, 일반적으로 self supervised learning을 통해 생성된 사전학습 언어모델 혹은 번역모델이 주로 활용된다. 기존 연구에서는 번역모델에 전이학습 시킨 APE모델이 뛰어난 성과를 보였으나, 대용량 언어쌍에 대해서만 이루어진 해당 연구를 저 자원 언어쌍에 곧바로 적용하기는 어렵다. 이에 본 연구에서는 언어 혹은 번역모델의 두 가지 전이학습 전략을 대표적인 저 자원 언어쌍인 한국어-영어 APE 연구에 적용하여 심층적인 모델 검증을 진행하였다. 실험결과 저 자원 언어쌍에서도 APE 학습 이전에 번역을 한차례 학습시키는 것이 유의미하게 APE 성능을 향상시킨다는 것을 확인할 수 있었다.
https://doi.org/10.15207/JKCS.2021.12.10.027 인용 PDF KSCI

게임 제작 원리 학습을 위한 게임의 설계 및 구현 : 스크래치 언어를 중심으로 (Design and Implementation of Game for Learning Game Production Principles: Centering on Scratch Language)

이홍섭;정형원;김영교
- 디지털융복합연구
- /
- 제14권5호
- /
- pp.403-410
- /
- 2016
컴퓨터 게임은 다양한 학문 분야 융복합의 결과물로 컴퓨터 게임을 제작하기 위해서는 다방면의 지식과 경험을 필요로 한다. 본 연구에서는 게임 제작 교육의 시간과 비용 그리고 교육 난이도를 낮추어 보다 쉽게 게임 제작 프로젝트 과정을 수행하기 위하여 스크래치를 사용하는 게임 제작 과정을 보여준다. 스크래치를 사용하여 게임의 핵심 기능을 직접 만들어 보며 게임의 개발 과정과 제작 원리를 체험하도록 하였다. 그리하여 컴퓨터 게임의 제작 원리를 이해하고 제작과정에 필요한 프로그래밍과 멀티미디어의 기능을 보다 쉽고 재미있게 학습할 수 있도록 하였다. 교육이 끝난 이후 설문을 통하여 효과성을 검증하였다. 그 결과 스크래치를 사용한 게임 제작 원리의 학습은 게임의 구조를 이해하는데 도움을 주고 학습자의 흥미를 증진시키며 수업의 재미와 만족을 높여주는 것으로 나타났다. 또한 스크래치를 사용한 게임 제작 원리의 학습은 프로그래밍 과목의 학습에도 도움을 주는 것으로 나타났다.
https://doi.org/10.14400/JDC.2016.14.5.403 인용 PDF KSCI

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

신현호;정선기;전홍우;권이남;이재민;박강희;최성필
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제12권4호
- /
- pp.159-172
- /
- 2023
일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.
https://doi.org/10.3745/KTSDE.2023.12.4.159 인용 PDF

안전 필수 시스템을 위한 요구사항 명세 및 검증 방법 (A Method to Specify and Verify Requirements for Safety Critical System)

임혜선;이석원
- 정보과학회 논문지
- /
- 제44권9호
- /
- pp.893-907
- /
- 2017
안전 필수 시스템에서 소프트웨어 결함은 심각한 결과를 초래하므로, 개발의 첫 단계인 요구사항 명세부터 안전성을 고려해야한다. 자연어로 작성된 요구사항은 여러 이해관계자들에게서 도출되어 모호함과 부정확성에 의한 결함을 갖고 있어도 검출하기 어렵다. 이러한 문제를 해결하기 위해 표준문안과 GSN 모델을 이용한 요구사항 명세방법을 제안한다. 표준문안은 선 정의된 서식에 맞춰 요구사항을 작성하는 준-정형 언어로, 표준문안에 맞춰 요구사항을 작성하면 표현의 일관성을 갖기 때문에 이해관계자들이 요구사항이 의미하는 바에 대한 모호함을 방지하여 요구사항의 정확한 의미를 정의하는데 도움이 된다. GSN은 시스템이 안전하다는 것을 관련기관에 증명하기 위한 Safety Case 작성에서 적합성을 인정받고 있는 표기법으로 기능목표, Safety Evidence 등을 표현한다. 본 연구에서는 안전 필수 시스템의 요구사항을 명세하기에 적합하도록 설계된 표준문안과 GSN 모델을 이용하여 요구사항 명세단계에서부터 결함을 쉽게 식별하고, Safety Evidence와의 연결을 통해 안전적합성을 증명할 수 있다. 또한 이 과정에서 발견된 요구사항의 결함을 수정하여 안전성 있는 소프트웨어를 개발할 수 있다.
https://doi.org/10.5626/JOK.2017.44.9.893 인용 KSCI

Sentiment analysis of Korean movie reviews using XLM-R

Shin, Noo Ri;Kim, TaeHyeon;Yun, Dai Yeol;Moon, Seok-Jae;Hwang, Chi-gon
- International Journal of Advanced Culture Technology
- /
- 제9권2호
- /
- pp.86-90
- /
- 2021
Sentiment refers to a person's thoughts, opinions, and feelings toward an object. Sentiment analysis is a process of collecting opinions on a specific target and classifying them according to their emotions, and applies to opinion mining that analyzes product reviews and reviews on the web. Companies and users can grasp the opinions of public opinion and come up with a way to do so. Recently, natural language processing models using the Transformer structure have appeared, and Google's BERT is a representative example. Afterwards, various models came out by remodeling the BERT. Among them, the Facebook AI team unveiled the XLM-R (XLM-RoBERTa), an upgraded XLM model. XLM-R solved the data limitation and the curse of multilinguality by training XLM with 2TB or more refined CC (CommonCrawl), not Wikipedia data. This model showed that the multilingual model has similar performance to the single language model when it is trained by adjusting the size of the model and the data required for training. Therefore, in this paper, we study the improvement of Korean sentiment analysis performed using a pre-trained XLM-R model that solved curse of multilinguality and improved performance.
https://doi.org/10.17703/IJACT.2021.9.2.86 인용 PDF KSCI

상호 정보를 이용한 구조적 모호성 해소와 결과에 대한 확신도 측정 (Structural Disambiguation using Mutual Information and the Measure of Confidence)

심광섭
- 인지과학
- /
- 제4권1호
- /
- pp.153-176
- /
- 1993
구조적 모호성은 자연 언어 문장을 분석할 때 흔히 나타내는 문제점 중의 하나로,지금까지 이문제의 해결은 대단히 어려운 것으로 인식되어 왔다.그러나,구조적 모호성을 해소하지 않고 올바른 언어 처리를 한다는 것은 사실상 불가능하다.본 논문에서는 이 문제에 대하여 정보 이론적(information-theoretic)개념인 상호 정보(mutual information)를 이용한 통계적 접근방법을 제안한다.상호정보는 말 뭉치로 부터 자동 습득이 가능하므로 지식습득속도가 대단히 빠를뿐만 아니라 지속적인 지식습득이 가능하다. 구조적 모호성 해소는 물론 모호성 해소 결과의 옳고 그름을 스스로 판단할수 있는 능력을 부여할수 있다면 보다 지능적인 시스템을 개발하는데 도움이 될것이다.본 논문에서는 그와 같은 지적 능력을 부여한느데 필요한 확신도(congidence measure) 개념도 또한 제시한다.확신도는 구조적 모호성을 해소하고 난 후에 계산되는 수치로서,구조적 모호성이 올바르게 해소되었을 가능성이 높으면 높을수록 그 값이 커지는 성질을 가지고 있다. 본 논문에서 제시한 구조적 모호성 해소 알고리즘의 타당성을 검증하기 위하여 이공계 논문 초록으로부터 발췌된 약 160만 단어의 말뭉치로부터 상호 정보를 자동 습득하고 이를 이용하요,1,639개의 문장에 대하여 구조적 모호성을 해소하는 실험을 하였다. 실험결과 구조적 모호성 해소 정화도는 약 80%로 나타났다.확신도 개념을 이용할 경우 구조적 모호성 해소가 잘못된 문장을 찾아 정정하는 작업을 매우 효과적으로 진행할 수 있었다.

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

김태석;김석훈;임광혁
- 지식경영연구
- /
- 제22권4호
- /
- pp.27-40
- /
- 2021
Click-Through Rate(CTR) 예측은 추천시스템에서 후보 항목의 순위를 결정하고 높은 순위의 항목들을 추천하여 고객의 정보 과부하를 줄임과 동시에 판매 촉진을 통한 수익 극대화를 달성할 수 있는 핵심 기능이다. 자연어 처리와 이미지 분류 분야는 심층신경망(deep neural network)의 활용을 통한 괄목한 성장을 하고 있다. 최근 이 분야의 주류를 이루던 모델과 차별화된 어텐션(attention) 메커니즘 기반의 트랜스포머(transformer) 모델이 제안되어 state-of-the-art를 달성하였다. 본 연구에서는 CTR 예측을 위한 트랜스포머 기반 모델의 성능 향상 방안을 제시한다. 자연어와 이미지 데이터와는 다른 이산적(discrete)이며 범주적(categorical)인 CTR 데이터 특성이 모델 성능에 미치는 영향력을 분석하기 위해 임베딩의 일반화(regularization)와 트랜스포머의 정규화(normalization)에 관한 실험을 수행한다. 실험 결과에 따르면, CTR 데이터 입력 처리를 위한 임베딩 과정에서 L2 일반화의 적용과 트랜스포머 모델의 기본 정규화 방법인 레이어 정규화 대신 배치 정규화를 적용할 때 예측 성능이 크게 향상됨을 확인하였다.
https://doi.org/10.15813/kmr.2021.22.4.002 인용 PDF KSCI

음성인식과 자연어 처리 딥러닝을 통한 전자의무기록자동 생성 시스템 (Automatic Electronic Medical Record Generation System using Speech Recognition and Natural Language Processing Deep Learning)

손현곤;류기환
- 문화기술의 융합
- /
- 제9권3호
- /
- pp.731-736
- /
- 2023
최근 의료 현장은 전자의무기록, 전자건강기록 등의 의료 기록을 전산화하여 저장하고 관리하는 시스템이 의무적으로 적용되거나 전체 의료 현장에 보급되어 환자 개개인의 과거 의료 기록을 추가적인 의료 행위에 활용하고 있다. 그러나 일반적인 의료 문진 및 상담 간 발생하는 의료진과 환자 간의 대화는 별도로 기록되거나 저장되지 않고 있어 추가적인 환자의 주요 정보는 효율적으로 활용되지 못하고 있다. 이에 따라, 의료 문진 현장에서 발생하는 의료진과 환자와의 대화를 저장하고 이를 텍스트 데이터로 변환하여 주요한 문진 내용만 자동으로 추출, 요약하여 정보화하는 음성인식과 자연어 처리 딥러닝을 통한 의료상담 요약문을 자동으로 생성하는 전자의무기록 시스템을 제안한다. 본 시스템은 의료 종사자와 환자의 의료 상담 내용의 인식과정을 거쳐서 텍스트 정보를 획득한다. 이렇게 획득된 텍스트를 복수의 문장으로 구분하고, 생성된 문장에 포함된 복수 키워드의 중요도를 산출한다. 산출된 중요도를 기반으로 복수의 문장에 순위를 매기고, 순위를 기반으로 문장들을 요약하여 최종 전자의무기록 데이터를 생성한다. 제안하는 시스템 성능은 정량적 분석을 통하여 우수함을 확인한다.
https://doi.org/10.17703/JCCT.2023.9.3.731 인용 PDF

반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템 (A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary)

명재석;이동주;이상구
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제35권6호
- /
- pp.392-403
- /
- 2008
사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치 있는 데이타이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하고 상품의 순위를 산정하는 상품평 분석 시스템을 설계하고 구현하였다. 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동화된 도구들을 활용하여 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘를 의미 사전에서 정의하고 활용하는 방법에 대해서도 논의하였다. 실험은 2개 상품 분류의 20개 상품, 1796개의 실제 상품평을 수집하여 상품의 순위를 측정하고 주요 요소를 분석하는 방식으로 진행하였다. 그 중 2개 상품에 대한 63개의 상품평에 대하여 분석의 정확률과 재현율을 측정하였으며, 평균 88.94%의 정확률, 47.92%의 재현율을 나타내었다.
PDF KSCI

검색결과 247건 처리시간 0.031초

전이학습 기반 기계번역 사후교정 모델 검증 (The Verification of the Transfer Learning-based Automatic Post Editing Model)

최신 기계번역 사후 교정 연구 (Recent Automatic Post Editing Research)

게임 제작 원리 학습을 위한 게임의 설계 및 구현 : 스크래치 언어를 중심으로 (Design and Implementation of Game for Learning Game Production Principles: Centering on Scratch Language)

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

안전 필수 시스템을 위한 요구사항 명세 및 검증 방법 (A Method to Specify and Verify Requirements for Safety Critical System)

Sentiment analysis of Korean movie reviews using XLM-R

상호 정보를 이용한 구조적 모호성 해소와 결과에 대한 확신도 측정 (Structural Disambiguation using Mutual Information and the Measure of Confidence)

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

음성인식과 자연어 처리 딥러닝을 통한 전자의무기록자동 생성 시스템 (Automatic Electronic Medical Record Generation System using Speech Recognition and Natural Language Processing Deep Learning)

반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템 (A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary)

검색결과 247건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)