Search | Korea Science

Unpaired Korean Text Style Transfer with Masked Language Model (마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환)

Bae, Jangseong;Lee, Changki;Noh, Hyungjong;Hwang, Jeongin
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.391-395
- /
- 2021
텍스트 스타일 변환은 입력 스타일(source style)로 쓰여진 텍스트의 내용(content)을 유지하며 목적 스타일(target style)의 텍스트로 변환하는 문제이다. 텍스트 스타일 변환을 시퀀스 간 변환 문제(sequence-to-sequence)로 보고 기존 기계학습 모델을 이용해 해결할 수 있지만, 모델 학습에 필요한 각 스타일에 대응되는 병렬 말뭉치를 구하기 어려운 문제점이 있다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행하는 방법들이 연구되고 있다. 이 연구들은 주로 인코더-디코더 구조의 생성 모델을 사용하기 때문에 입력 문장이 가지고 있는 내용이 누락되거나 다른 내용의 문장이 생성될 수 있는 문제점이 있다. 본 논문에서는 마스크 언어 모델(masked language model)을 이용해 입력 텍스트의 내용을 유지하면서 원하는 스타일로 변경할 수 있는 텍스트 스타일 변환 방법을 제안하고 한국어 긍정-부정, 채팅체-문어체 변환에 적용한다.
PDF

Image Generation from Korean Dialogue Text via Prompt-based Few-shot Learning (프롬프트 기반 퓨샷 러닝을 통한 한국어 대화형 텍스트 기반 이미지 생성)

Eunchan Lee;Sangtae Ahn
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.447-451
- /
- 2022
본 논문에서는 사용자가 대화 텍스트 방식의 입력을 주었을 때 이를 키워드 중심으로 변환하여 이미지를 생성해내는 방식을 제안한다. 대화 텍스트란 채팅 등에서 주로 사용하는 형식의 구어체를 말하며 이러한 텍스트 형식은 텍스트 기반 이미지 생성 모델이 적절한 아웃풋 이미지를 생성하기 어렵게 만든다. 이를 해결하기 위해 대화 텍스트를 키워드 중심 텍스트로 바꾸어 텍스트 기반 이미지 생성 모델의 입력으로 변환하는 과정이 이미지 생성의 질을 높이는 좋은 방안이 될 수 있는데 이러한 태스크에 적합한 학습 데이터는 충분하지 않다. 본 논문에서는 이러한 문제를 다루기 위한 하나의 방안으로 사전학습된 초대형 언어모델인 KoGPT 모델을 활용하며, 퓨샷 러닝을 통해 적은 양의 직접 제작한 데이터만을 학습시켜 대화 텍스트 기반의 이미지 생성을 구현하는 방법을 제안한다.
PDF

An Information Extraction Approach for Spoken Language Understanding in a Hostile Environment. (열악한 환경의 음성 언어 이해를 위한 정보 추출 접근 방식)

Eun, Ji-Hyun;Lee, Chang-Ki;Lee, Gary Geun-Bae
- Annual Conference on Human and Language Technology
- /
- 2004.10d
- /
- pp.20-24
- /
- 2004
본 논문에서는 환경 잡음과 원거리 음성 입력 그리고 노인 발화 등의 열악한 음성 인식 환경에서의 음성 언어이해(spoken language understanding)를 위한 정보 추출 접근 방식에 대해 논하고 있다. 정보 추출의 목적은 미리 정의된 slot에 적절한 값을 찾는 것이다. 음성 언어 이해를 위한 정보 추출은 필수적인 요소만을 추출하는 것을 목적으로 하는 개념 집어내기(concept spotting) 접근 방식을 사용한다. 이러한 방식은 미리 정의된 개념 구조 slot에만 관심을 가지기 때문에. 음성 언어 이해에서 사용되는 정보 추출은 언어를 완전히 이해한다기보다는 부분적으로 이해하는 방식을 취하고 있다. 음성 입력 언어는 주로 열등한 인식 환경에서 이루어지기 때문에 많은 인식 오류를 가지고 이로 인해 텍스트 입력에 비해 이해하기 어렵다. 이러한 점을 고려하여, 특정 정보에 집중함으로써 음성 언어를 이해하고자 시도하였다. 도로 정보 안내 영역을 대상으로 한 실험에서 텍스트 입력(WER 0%)과 음성 입력(WER 39.0%)이 주어졌을 때, 개념 집어내기 방식의 F-measure 값은 각각 0.945, 0.823을 나타내었다.
PDF

LM Clustering based Dynamic LM Interpolation for ASR N-best Rescoring (언어모델 군집화와 동적 언어모델 보간을 통한 음성인식 성능 향상)

Chung, Euisok;Jeon, Hyung-Bae;Jung, Ho-Young;Park, Jeon-Gue
- Annual Conference on Human and Language Technology
- /
- 2015.10a
- /
- pp.240-245
- /
- 2015
일반영역 음성인식은 n-gram 희소성 문제로 인해 대용량의 언어모델이 필요하다. 대용량 언어모델은 분산형 모델로 구현될 수 있고, 사용자 입력에 대한 동적 언어모델 보간 기술을 통해 음성인식 성능을 개선할 수 있다. 본 논문은 동적 언어모델 보간 기술에 대한 새로운 접근방법을 시도한다. 텍스트 군집화를 통해 주제별 언어모델을 생성한다. 여기서 주제는 사용자 입력 영역에 대응한다. 본 논문은 사용자 입력에 대하여 실시간으로 주제별 언어모델의 보간 가중치 값을 계산하는 접근 방법을 제시한다. 또한 언어모델의 보간 가중치 값 계산의 부담을 감소하기 위해 언어모델 군집화를 통해 대용량 언어모델 보간 접근 방법의 연산 부담을 해소하기 위한 시도를 한다. 주제별 언어모델에 기반하고 언어모델 군집화를 통한 동적 언어모델 보간 기술의 실험 결과 음성인식 오류 감소율 6.89%를 달성했다. 또한 언어모델 군집화 기술은 음성인식 정확도를 0.09% 저하시켰을 때 실행 시간을 17.6% 개선시키는 실험결과를 보였다.
PDF

A Hangul Input Interface Using Continuous Gestures and Language Models (연속적인 제스처와 언어 모델을 이용한 한글 입력 인터페이스)

Kim Dongho;Kwon Younghee;Kim Jin-Hyung
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.07b
- /
- pp.586-588
- /
- 2005
휴대 전화와 PDA의 급속한 보급과 더불어, 휴대용 장치에서의 간단한 텍스트 입력 방식 연구의 중요성도 나날이 증대되고 있다. 현재 다양한 방식의 입력 방법들이 존재하나, 한글의 특성을 반영하지 않아 한글 입력에 적용하기 어려운 단점들이 존재한다. 본 연구에서는 2차원 평면상의 연속적인 제스처와 언어 모델을 이용하고, 한글의 특성을 고려한 새로운 한글 입력 방식을 제안한다.
PDF

Text Summarisation with Rhetorical Structure (수사구조를 이용한 텍스트 자동요약)

Lee, Yu-Ri;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 1999.10e
- /
- pp.97-102
- /
- 1999
텍스트 요약이란 중요정보만을 추출하여 본래 텍스트의 의미를 전달하는 축약 과정이다. 인터넷을 통한 온라인 정보가 급증함에 따라 정보에 대한 처리와 신속한 내용 파악을 위한 효율적인 자동 텍스트 방법이 필요하다. 기존의 통계적 방법으로는 전체 텍스트의 구조적인 특징을 고려할 수가 없기 때문에, 생성된 요약문의 의미적 흐름이 부자연스럽고, 문장간 응집도가 떨어지게 된다. 수사학적 방법은 요약문을 생성하기 위해서 문장간의 접속관계를 이용한다. 수사 구조란 텍스트를 이루는 문장들간의 논리적인 결합관계로, 수사학적 방법은 이러한 결합관계를 파악하여 요약문을 생성하는 방법이다. 본 논문에서는 표지들이 나타내는 접속 관계정보를 사용하여, 텍스트의 수사구조를 분석한 후 요약문을 생성하는 시스템을 구현한다. 수사구조 파싱 과정은 문장간의 수사구조 파싱과 문단간의 수사구조 파싱, 두 단계로 이루어진다. 파싱은 차트파싱 방법을 사용하여 상향식으로 진행된다. 입력된 문장들로부터 두 단계 파싱에 의해 전체 텍스트의 수사구조 트리를 생성하며, 생성된 트리에서 가중치를 계산하여 중요 문장들을 요약문으로 추출한다.
PDF

The Design and Implementation of Korean Text-to-Speech Conversion System on a Rule-Based Framework (한국어(韓國語) 규칙(規則) 음성(音聲) 합성(合成) 시스템의 구현(具現))

Son, Yung-Taek;Kim, Yong-Kap;Matsumoto, Tatsuro
- Annual Conference on Human and Language Technology
- /
- 1993.10a
- /
- pp.141-148
- /
- 1993
본고는, 한글 한자가 혼용된 입력 텍스트를 음성으로 변환 출력하는 포르만트 음성 합성 방식 즉, 한국어 규칙 음성 합성(이하에는 KTTS[Korean Text To Speech System]이라고 함)의 전반적인 처리 흐름에 대하여 소개한다. 특히, 입력 텍스트에 있어서, 한자 또는 각종 부호의 한글 변환 기능, 음성 출력용 문법 정보 추출에 필요한 입력문의 해석 및 구문경계 설정 기능, 또한 음소 기호 변환 및 파라메터 값 생성과 변경 처리기능을 중심으로 설명하고자 한다. 또한 본 시스템의 완성과 더불어 실시하였던 청취 실험 평가 결과에 대하여 덧붙이겠다.
PDF

Evaluation of Language Model Robustness Using Implicit Unethical Data (암시적 비윤리 데이터를 활용한 언어 모델의 강건성 평가)

Yujin Kim;Gayeon Jung;Hansaem Kim
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.633-637
- /
- 2023
암시적 비윤리 표현은 명시적 비윤리 표현과 달리 학습 데이터 선별이 어려울 뿐만 아니라 추가 생산 패턴 예측이 까다롭다. 고로 암시적 비윤리 표현에 대한 언어 모델의 감지 능력을 기르기 위해서는 모델의 취약성을 발견하는 연구가 반드시 선행되어야 한다. 본 논문에서는 암시적 비윤리 표현에 대한 표기 변경과 긍정 요소 삽입이라는 두 가지 변형을 통해 모델의 예측 변화를 유도하였다. 그 결과 모델이 야민정음과 외계어를 사용한 언어 변형에 취약하다는 사실을 발견하였다. 이에 더해 이모티콘이 텍스트와 함께 사용되는 경우 텍스트 자체보다 이모티콘의 효과가 더 크다는 사실을 밝혀내었다.
PDF

A Study on Auto-Generation of Dactylology and Chirology Animation from Text Inputs (텍스트 입력 기반 지화 및 수화 애니메이션 자동 생성에 관한 연구)

Lee, Geum-Yong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2002.04b
- /
- pp.1151-1154
- /
- 2002
Unicode 와 지화, 수화의 공통점은 각국 언어의 자모 혹은 단어에 고유한 표현양식이 1:1 로 대응되어 있다는 것이다. Unicode 의 경우 각 자모별 고유의 헥사코드가 지정되어 있고 지화, 수화의 경우 각 자모별, 단어별로 고유한 동작을 표현하는 손동작이 지정되어 있는 것이다. 본 논문에서는 텍스트 입력에 대응하는 지화, 수화 손동작 그림을 연속적으로 렌더링함으로써 애니메이션 효과를 낼 수 있는 알고리즘과 그 구현에 관한 연구를 소개한다.
PDF

Real Time Synthesis of Multimedia Tales in Korean with Combinatory Categorial Grammar (결합범주문법을 이용한 실시간 한국어 멀티동화 제작)

Kim, Hyun-Sook;Park, Jong-C.
- Annual Conference on Human and Language Technology
- /
- 2001.10d
- /
- pp.509-515
- /
- 2001
현재 인터넷을 통하여 제공되고 있는 멀티동화는 텍스트 형태의 동화와 함께 이와 관련된 애니메이션 음성 정보를 사전에 제작한 뒤에 사용자에게 제시하는 방법을 택하고 있다. 본 논문에서는 자연언어처리 기법을 이용하여 텍스트 형태의 한국어 동화를 실시간으로 분석한 뒤 그 내용을 삼차원 애니메이션으로 제시하는 멀티 동화 제작 시스템을 소개한다. 이 시스템은 줄거리가 완성된 동화뿐만 아니라 사용자가 변경한 줄거리를 가지는 동화에 대해서도 이에 따른 삼차원 애니메이션을 제시하여 보다 사용자 친화적인 인터페이스를 제공할 뿐만 아니라 사용자가 묘사하는 텍스트 형태의 내용을 입력받아 이에 맞는 애니메이션을 제시하여야 하는 많은 분야에서 응용될 수 있다. 본 논문에서는 이와 같은 실시간 멀티 동화 제작 시스템을 구현할 때 해결하여야 하는 문제점들을 알아보고 이에 해결 방안과 구현에 대하여 논의한다.
PDF

Search Result 86, Processing Time 0.021 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)