• Title/Summary/Keyword: 데이터 생성

Search Result 7,054, Processing Time 0.035 seconds

Reconstructing Contour Lines Algorithm and Reconstructing 3D Models Algorithm (외곽선 생성 알고리즘 및 3차원 기하모델 생성 알고리즘)

  • 백명엽;권희용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.637-639
    • /
    • 2004
  • 대기 중의 오염도를 한눈에 파악하기 위해서는 측정한 수치 데이터의 시각화가 필요하다. 시시각각 변화하는 대기 오염도를 시각화하고 활용하기에는 기존의 외곽선 생성 알고리즘과 3차원 기하모델 생성 알고리즘은 적절하지 못하다. 본 논문에서는 시시각각 변화하는 대기 오염도의 시각화를 위하여 측정한 수치 데이터를 보간 후 원하는 농도 값을 찾아 규칙적인 외곽선을 생성하여 주는 알고리즘과 높이별로 구해진 규칙적인 외곽선을 이용하여 빠르게 3차원 기하모델을 생성해 주는 알고리즘을 제안한다.

  • PDF

Natural Language Generation Using SC-GRU Encoder-Decoder Model (SC-GRU encoder-decoder 모델을 이용한 자연어생성)

  • Kim, Geonyeong;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.167-171
    • /
    • 2017
  • 자연어 생성은 특정한 조건들을 만족하는 문장을 생성하는 연구로, 이러한 조건들은 주로 표와 같은 축약되고 구조화된 의미 표현으로 주어지며 사용자가 자연어로 생성된 문장을 받아야 하는 어떤 분야에서든 응용이 가능하다. 본 논문에서는 SC(Semantically Conditioned)-GRU기반 encoder-decoder모델을 이용한 자연어 생성 모델을 제안한다. 본 논문에서 제안한 모델이 SF Hotel 데이터에서는 0.8645 BLEU의 성능을, SF Restaurant 데이터에서는 0.7570 BLEU의 성능을 보였다.

  • PDF

Natural Language Generation Using SC-GRU Encoder-Decoder Model (SC-GRU encoder-decoder 모델을 이용한 자연어생성)

  • Kim, Geonyeong;Lee, Changki
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.167-171
    • /
    • 2017
  • 자연어 생성은 특정한 조건들을 만족하는 문장을 생성하는 연구로, 이러한 조건들은 주로 표와 같은 축약되고 구조화된 의미 표현으로 주어지며 사용자가 자연어로 생성된 문장을 받아야 하는 어떤 분야에서든 응용이 가능하다. 본 논문에서는 SC(Semantically Conditioned)-GRU기반 encoder-decoder모델을 이용한 자연어 생성 모델을 제안한다. 본 논문에서 제안한 모델이 SF Hotel 데이터에서는 0.8645 BLEU의 성능을, SF Restaurant 데이터에서는 0.7570 BLEU의 성능을 보였다.

  • PDF

A Topic Related Word Extraction Method Using Deep Learning Based News Analysis (딥러닝 기반의 뉴스 분석을 활용한 주제별 최신 연관단어 추출 기법)

  • Kim, Sung-Jin;Kim, Gun-Woo;Lee, Dong-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 정보검색의 효율성을 위해 데이터를 분석하여 해당 데이터를 가장 잘 나타내는 연관단어를 추출 및 추천하는 연구가 활발히 이루어지고 있다. 현재 관련 연구들은 출현 빈도수를 사용하는 방법이나 LDA와 같은 기계학습 기법을 활용해 데이터를 분석하여 연관단어를 생성하는 방법을 제안하고 있다. 기계학습 기법은 결과 값을 찾는데 사용되는 특징들을 전문가가 직접 설계해야 하며 좋은 결과를 내는 적절한 특징을 찾을 때까지 많은 시간이 필요하다. 또한, 파라미터들을 직접 설정해야 하므로 많은 시간과 노력을 필요로 한다는 단점을 지닌다. 이러한 기계학습 기법의 단점을 극복하기 위해 인공신경망을 다층구조로 배치하여 데이터를 분석하는 딥러닝이 최근 각광받고 있다. 본 논문에서는 기존 기계학습 기법을 사용하는 연관단어 추출연구의 한계점을 극복하기 위해 딥러닝을 활용한다. 먼저, 인공신경망 기반 단어 벡터 생성기인 Word2Vec를 사용하여 다양한 텍스트 데이터들을 학습하고 룩업 테이블을 생성한다. 그 후, 생성된 룩업 테이블을 바탕으로 인공신경망의 한 종류인 합성곱 신경망을 활용하여 사용자가 입력한 주제어와 관련된 최근 뉴스데이터를 분석한 후, 주제별 최신 연관단어를 추출하는 시스템을 제안한다. 또한 제안한 시스템을 통해 생성된 연관단어의 정확률을 측정하여 성능을 평가하였다.

Broken Image Selection Algorithm based on Histogram Analysis (히스토그램 분석 기반 파손 영상 선별 알고리즘)

  • Cho, Jin-Hwan;Jang, Si-Woong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.72-74
    • /
    • 2021
  • Recently, the spread of deep learning environments has increased the importance of dataset generation. Therefore, data is being augmented using GAN for efficient data set generation. However, several problems have been found in data generated using GAN, such as problems that occur in the early stages of learning and pixel breakage occurring in the generated image. In this paper, we intend to implement an image data selection algorithm to solve various problems arising from the existing GAN. The broken image screening algorithm was implemented to analyze the histogram distribution in the image and determine whether to store the generated image according to whether the result value satisfies the specified threshold value.

  • PDF

A Security System that Flexibly Generates a Range of Direction Data and Recognizes the Pattern (적응적으로 방향 데이터의 범위를 생성하여 패턴을 인식하는 보안시스템)

  • Han, Juchan;Jeon, Minseong;Kim, Jeongyeong;Cheoi, Kyungjoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.103-105
    • /
    • 2016
  • 본 논문에서는 손의 움직임 패턴으로 암호를 구성하고, 이를 인식하는 보안 시스템에서 기존의 고정된 공간에서 방향 데이터 범위를 생성하여 입력되는 패턴마다 적응적으로 방향 데이터를 뽑아낼 수 없었던 단점을 극복하고자 입력되는 움직임 패턴의 방향 데이터를 입력 패턴마다 적응적으로 생성하는 방법을 제안한다. 기존의 고정된 공간에서의 방향 데이터 생성 방식 기법과 비교 실험한 결과 정인식률 94.2%로 기존방식의 91.4%보다 높은 인식률로 만족할 만한 성능을 보여줌을 확인할 수 있었다.

  • PDF

Design and Implementation of XForms-Generator based on DTD (DTD 기반의 XForms 자동 생성기 설계 및 구현)

  • Kim, Tae-Hun;Lee, Eun-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.639-642
    • /
    • 2005
  • XForms는 XML데이터를 사용하고 내용과 표현을 분리시킨 형태의 Form으로 기존의 HTML이 가지는 특징 외에 쉬운 데이터 처리, 모듈의 재사용성, 다른 장비로의 이식성, 데이터 접근성 등 몇 가지 추가적인 특징을 가진다. 본 논문에서는 XML 데이터의 구조를 나타내는 DTD(Document Type Definition)를 입력받아 XForms를 자동으로 생성해 주는 XForms-Generator의 설계와 구현을 소개한다. 이 시스템은 DTD정보를 분석하여 반복부를 추출하고, 반복부의 처리를 중심으로 XForms코드를 생성한다. 생성된 XForms의 실행 환경은 Orbeon사의 Presentation Server를 이용한다. 개발된 시스템은 XML 데이터를 이용하는 온라인 Form을 개발할 때 시간 및 비용을 줄이는데 도움을 줄 수 있을 것으로 기대된다.

  • PDF

Evaluation on Quality of Publisher-Generated Usage Statistics (출판사 생성 이용통계 데이터의 품질 평가에 대한 연구)

  • Jung, Young-Im
    • Journal of Information Management
    • /
    • v.43 no.3
    • /
    • pp.161-180
    • /
    • 2012
  • In this study, concept and importance of e-journal usage statistics has been examined and Journal Usage Factor project performed by Project COUNTER group has been investigated. Advantages and limits of usage statistics generated by library, link resolver and publisher have been clarified. By analyzing various errors and problems included in publisher-generated usage statistics, we conclude that the current usage statistics is not completely credible yet.

Korean Spell Correction based on Denoising Transformer (Denoising Transformer기반 한국어 맞춤법 교정기)

  • Park, Chanjun;Jeong, Sol;Yang, Kisu;Lee, Sumi;Joe, Jaechoon;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.368-372
    • /
    • 2019
  • 맞춤법 교정이란 주어진 문장에서 나타나는 철자 및 맞춤법 오류들을 올바르게 교정하는 것을 뜻하며 맞춤법 교정 시스템이란 컴퓨터가 이를 자동으로 수행하는 것을 의미한다. 본 논문에서는 맞춤법 교정을 기계번역의 관점으로 바라보고 문제를 해결하였다. 소스문장에 맞춤법 오류문장, 타겟 문장에 올바른 문장을 넣어 학습시키는 방법을 제안한다. 본 논문에서는 단일 말뭉치로 한국어 맞춤법 병렬 말뭉치를 구성하는 방법을 제안하며 G2P(Grapheme to Phoneme)를 이용한 오류 데이터 생성, 자모 단위 철자 오류데이터 생성, 통번역 데이터 기반 오류 데이터 생성 크게 3가지 방법론을 이용하여 맞춤법 오류데이터를 생성하는 방법론을 제안한다. 실험결과 GLEU 점수 65.98의 성능을 보였으며 44.68, 39.55의 성능을 보인 상용화 시스템보다 우수한 성능을 보였다.

  • PDF

Controlled Korean Style Transfer using BERT (BERT을 이용한 한국어 문장의 스타일 변화)

  • Lee, Joosung;Oh, Yeontaek;Byun, hyunjin;Min, Kyungkoo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.395-399
    • /
    • 2019
  • 생성 모델은 최근 단순히 기존 데이터를 증강 시키는 것이 아니라 원하는 속성을 가지도록 스타일을 변화시키는 연구가 활발히 진행되고 있다. 스타일 변화 연구에서 필요한 병렬 데이터 세트는 구축하는데 많은 비용이 들기 때문에 비병렬 데이터를 이용하는 연구가 주를 이루고 있다. 이러한 방법론으로 이미지 분야에서 대표적으로 cycleGAN[1]이 있으며 최근 자연어 처리 분야에서도 많은 연구가 진행되고 있다. 많은 논문들이 사용하는 데이터도메인은 긍정 문장과 부정 문장 사이를 변화시키는 것이다. 본 연구에서는 한국어 영화리뷰 데이터 세트인 NSMC[2]를 이용한 감성 변화를 하는 문장생성에 대한 연구로 자연어 처리에서 좋은 성능을 보여주는 BERT[8]를 생성모델에 이용하였다.

  • PDF