• 제목/요약/키워드: Language generation

검색결과 754건 처리시간 0.024초

계통보호 정정 프로그램의 데이터베이스 개선에 관한 연구 (A Study On Database Improvement Of The Power System Protection Program)

  • 김성훈;이승재;최면송;민병운
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 추계학술대회 논문집 전력기술부문
    • /
    • pp.193-195
    • /
    • 2002
  • This paper presents the methods to solve the problem about Power System Protection Program(PROSET) and describe the database relation and schema with UML. PROSET is a overall program system to protect power system and correct it. In the context of the PROSET it is so difficult to edit database data when topology is changed. When the renewal of data is performed. all changed values are disappeared. Therefore, it will not be expected to know the present situation by using the information of the databases data. So it is necessary to solve this problem. Solution is copy of the user. Only E.R diagram is used to express database schema and relation. So, in this paper, UML(Unified Modeling Language) will be used to express PROSET and database of MCD-H and MDT-H.

  • PDF

Recurrent Neural Network를 이용한 이미지 캡션 생성 (Image Caption Generation using Recurrent Neural Network)

  • 이창기
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.878-882
    • /
    • 2016
  • 이미지의 내용을 설명하는 캡션을 자동으로 생성하는 기술은 이미지 인식과 자연어처리 기술을 필요로 하는 매우 어려운 기술이지만, 유아 교육이나 이미지 검색, 맹인들을 위한 네비게이션 등에 사용될 수 있는 중요한 기술이다. 본 논문에서는 이미지 캡션 생성을 위해 Convolutional Neural Network(CNN)으로 인코딩된 이미지 정보를 입력으로 갖는 이미지 캡션 생성에 최적화된 Recurrent Neural Network(RNN) 모델을 제안하고, 실험을 통해 본 논문에서 제안한 모델이 Flickr 8K와 Flickr 30K, MS COCO 데이터 셋에서 기존의 연구들보다 높은 성능을 얻음을 보인다.

스키메틱 자동생성기의 개발 (The Development of Automatic Schematic Generator)

  • 배영환;백영석;박성범;이성봉;장영조;이현찬
    • 전자공학회논문지A
    • /
    • 제28A권9호
    • /
    • pp.761-773
    • /
    • 1991
  • In this paper, an algorithm for automatic schematic generation which creates schematic diagram from netlist are proposed. The important objectives on schematic generation are readability and clarity of resulting schematics. Each stage of generation should aim at enhancing these objectives. For this reason, schematic generation problem is divided into 5 subproblems` preprocessing, logical placement, pin assignment and improvement of placement, global routing, and detailed routing. The algorithm is implemented in C language, and it generates schematics from the results of logic synthesis in order to make it east for designers to understand the design and reflect their knowledge into design.

  • PDF

자동 대소문자 식별을 이용한 영어 음성인식 결과의 가독성 향상 (Readability Enhancement of English Speech Recognition Output Using Automatic Capitalisation Classification)

  • 김지환
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.101-111
    • /
    • 2007
  • A modified speech recogniser have been proposed for automatic capitalisation generation to improve the readability of English speech recognition output. In this modified speech recogniser, every word in its vocabulary is duplicated: once in a de-caplitalised form and again in the capitalised forms. In addition its language model is re-trained on mixed case texts. In order to evaluate the performance of the proposed system, experiments of automatic capitalisation generation were performed for 3 hours of Broadcast News(BN) test data using the modified HTK BN transcription system. The proposed system produced an F-measure of 0.7317 for automatic capitalisation generation with an SER of 48.55, a precision of 0.7736 and a recall of 0.6942.

  • PDF

생성형 대규모 언어 모델과 프롬프트 엔지니어링을 통한 한국어 텍스트 기반 정보 추출 데이터셋 구축 방법 (A Study on Dataset Generation Method for Korean Language Information Extraction from Generative Large Language Model and Prompt Engineering)

  • 정영상;지승현;권다롱새
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.481-492
    • /
    • 2023
  • 본 연구는 생성형 대규모 언어 모델을 활용하여 텍스트에서 정보를 추출하기 위한 한글 데이터셋 구축 방법을 탐구한다. 현대 사회에서는 혼합된 정보가 빠르게 유포되며, 이를 효과적으로 분류하고 추출하는 것은 의사결정 과정에 중요하다. 그러나 이에 대한 학습용 한국어 데이터셋은 아직 부족하다. 이를 극복하기 위해, 본 연구는 생성형 대규모 언어 모델을 사용하여 텍스트 기반 제로샷 학습(zero-shot learning)을 이용한 정보 추출을 시도하며, 이를 통해 목적에 맞는 한국어 데이터셋을 구축한다. 본 연구에서는 시스템-지침-소스입력-출력형식의 프롬프트 엔지니어링을 통해 언어 모델이 원하는 결과를 출력하도록 지시하며, 입력 문장을 통해 언어 모델의 In-Context Learning 특성을 활용하여 데이터셋을 구축한다. 생성된 데이터셋을 기존 데이터셋과 비교하여 본 연구 방법론을 검증하며, 관계 정보 추출 작업의 경우 KLUE-RoBERTa-large 모델 대비 25.47% 더 높은 성능을 달성했다. 이 연구 결과는 한국어 텍스트에서 지식 요소를 추출하는 가능성을 제시함으로써 인공지능 연구에 도움을 줄 것으로 기대된다. 더욱이, 이 방법론은 다양한 분야나 목적에 맞게 활용될 수 있어, 다양한 한국어 데이터셋 구축에 잠재력을 가진다고 볼 수 있다.

Sentence-Chain Based Seq2seq Model for Corpus Expansion

  • Chung, Euisok;Park, Jeon Gue
    • ETRI Journal
    • /
    • 제39권4호
    • /
    • pp.455-466
    • /
    • 2017
  • This study focuses on a method for sequential data augmentation in order to alleviate data sparseness problems. Specifically, we present corpus expansion techniques for enhancing the coverage of a language model. Recent recurrent neural network studies show that a seq2seq model can be applied for addressing language generation issues; it has the ability to generate new sentences from given input sentences. We present a method of corpus expansion using a sentence-chain based seq2seq model. For training the seq2seq model, sentence chains are used as triples. The first two sentences in a triple are used for the encoder of the seq2seq model, while the last sentence becomes a target sequence for the decoder. Using only internal resources, evaluation results show an improvement of approximately 7.6% relative perplexity over a baseline language model of Korean text. Additionally, from a comparison with a previous study, the sentence chain approach reduces the size of the training data by 38.4% while generating 1.4-times the number of n-grams with superior performance for English text.

서울 토박이들의 경음화 선호도 (Tensification Preference of Native Seoul Speakers of Korean)

  • 이호영
    • 말소리와 음성과학
    • /
    • 제1권2호
    • /
    • pp.151-162
    • /
    • 2009
  • This paper aims to investigate how tensification preference has changed over time and discuss how appropriately tensification preference is reflected in Principles of Standard Pronunciation and Standard Korean Language Dictionary. For this research, a questionnaire survey of tensification preference was conducted. 173 test words were used and 156 native Seoul speakers participated in this survey. The results have shown that tensification preference has gradually increased from older to younger generations. In addition, Principles of Standard Pronunciation and Standard Korean Language Dictionary do not reflect real pronunciation appropriately. Therefore, some ways of incorporating the actual pronunciation of Seoul speakers in the Principles of Standard Pronunciation and the Standard Korean Language Dictionary are suggested.

  • PDF

수화 자동 생성을 위한 한국어 문장 분석과 처리 (Analysis and Computational Processing of Sentences in Korean for Automatic Sign Language Generation)

  • 최지원;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.219-226
    • /
    • 2003
  • 한국 수화는 한국어에 대한 기본적인 유사성을 가지고 있지만, 교착어이자 청각-음성 체계 언어인 한국어와는 달리 고립어이자 시각-운동 체계 언어로서의 특성을 동시에 나타내고 있다. 그러므로 텍스트 형태의 한국어 문장으로부터 수화를 자동 생성하기 위해서는 한국어를 위해 미리 정의된 문법에 수화 표현을 무리하게 연계시키려고 하기 보다, 수화 고유의 의미 전달 체계를 분석하고 활용하여야 할 필요가 있다. 본 논문에서는 수화 표현상의 언어학적 특징을 재현 생략 변형 이동의 네 가지로 구분하여 분석하고 결합범주문법을 이용한 이 같은 형상의 처리 방법 및 구현 방안에 대하여 논의한다.

  • PDF

How is 'Contrast' Imposed on -Nun?

  • Kim, Ji-Eun
    • 한국언어정보학회지:언어와정보
    • /
    • 제16권1호
    • /
    • pp.1-24
    • /
    • 2012
  • -Nun is generally known as a Topic marker in Korean. However, when it is combined with an accent, it is thought to have a different function, which is alleged to indicate 'contrast' (Kuno 1972). Although the fact that -nun marked item generates some kind of 'contrastive meaning' is uncontroversial, what 'contrast(ive)' means is still unclear. In t his paper, I propose that accented -nun generates two types of implicit propositions in addition to its at-issue meaning. A simple sentence has been repeatedly tested in various models in order to see what type of proposition each proposition corresponds to and it has been concluded that one is presupposition and the other is implicature. This tedious-looking test forms the main part of the first-half of this paper. The presupposition is the essential factor for the -nun marked item to obtain the 'contrastive' meaning. Based on the generation of this presupposition, I argue that -nun works as a contrast operator in a sentence. To illustrate -nun's function as a contrast operator forms the latter part of this paper.

  • PDF

UML에 기초한 어플리케이션 자동 생성 Case Tool의 분석 (Analysis of Application Automatic Creation Case Tool Base on UML)

  • 한현관;이명진
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권12호
    • /
    • pp.1697-1712
    • /
    • 2002
  • UML(Unified Modeling Language)은 소프트웨어 시스템의 명세화, 시각화, 생성, 그리고 문서화를 목적으로 하는 언어이다. 또한 UML은 소프트웨어 생성을 위한 청사진을 만들어줌으로써 소프트웨어 설계의 복잡한 과정을 단순화시킨다. 본 연구에서는 Rational Rose, BizWiz와 같은 자동화된 응용프로그램 생성 도구들을 실제의 사이버 쇼핑몰에 적용하여 UML 관점에서 비교 및 분석한다. 그리고 위의 결과를 바탕으로 고객관리 업무에 UML을 적용하여 체계적인 시스템 분석, 설계 및 구현방안을 제시한다.

  • PDF