• Title/Summary/Keyword: 자동 데이터 구축

Search Result 716, Processing Time 0.025 seconds

Development of semi-automatic annotation tool for building land cover image data set (토지 관련 이미지 분석 데이터 셋 구축을 위한 반자동 annotation 도구 개발)

  • Jang, Dalwon;Lee, Jaewon;Lee, JongSeol
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.69-70
    • /
    • 2019
  • 본 논문에서는 토지 정보를 분류하는 연구를 수행하기 위한 이미지 데이터 셋을 개발하는데 필요한 반자동 annotation 도구를 제안한다. 논문에서 제안하는 도구는 합성개구레이더 영상을 입력으로 하고, 물/경작지/숲/건물을 구분하는 시스템을 개발하기 위해서 만들어진 것이나, 다른 목적을 가지는 토지 관련 이미지 분석 시스템의 개발에 사용될 수 있다. 제안하는 도구는 합성개구레이더 영상이 GPS 정보와 같이 입력되었을 때, GPS 정보에 기반하여 토지지목정보를 불러오고, 이를 재정리하여 1차 레이블링 결과를 자동적으로 생성한다. 국가에서 관리하는 토지지목정보는 개발하고자 하는 시스템의 분류 기준에 많은 부분 도움이 되긴 하지만, 일부분 차이점이 있기 때문에 이를 다시 수동으로 수정하는 도구을 동작하여 annotation이 완료된 이미지 데이터를 구축한다.

  • PDF

Internet English Newspaper Article Extraction Tool for English Corpus Construction (영어 말뭉치 구축을 위한 인터넷 영어 신문기사 추출 도구)

  • Kim, Sung-Dong;Eum, Jae-Young;Song, Chulmin
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.154-156
    • /
    • 2012
  • 영한 기계번역 시스템의 개발을 위해서는 여러 가지 사전이 필요하고, 다앙한 모호성 해소를 위한 연구를 위한 데이터가 필요하며, 번역 시스템의 테스트를 위해 많은 영어 문장이 필요하다. 따라서 영어 말뭉치를 구축하여 이로부터 사전에 필요한 정보, 모호성 해소 연구에 필요한 데이터, 번역 테스트를 위한 문장 등을 추출할 필요가 있다. 본 논문에서는 영어 말뭉치를 구축하기 위해 인터넷 영어 신문 사이트로부터 영어로 작성된 신문기사를 추출하는 도구를 개발하였다. 이를 통해 자동적으로 영어 신문기사를 추출하여 말뭉치를 구축할 수 있으며, 이를 통해 영한 기계번역 시스템의 성능 향상을 지원할 수 있다.

  • PDF

A Study on Automatic Data Tagging for Text-based Training Data Construction (텍스트 기반의 훈련 데이터 구축을 위한 자동 데이터 태깅 작업에 대한 연구)

  • Kim, NaYun;So, Hyeryung;Park, Joonho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1008-1009
    • /
    • 2020
  • 텍스트 기반의 훈련 데이터는 데이터를 수집한 이후에 각 문자별로 태깅 작업이 필요하다. 말뭉치(Corpus)는 언어학에서 주로 이루고 있는 텍스트 집합이다. 말뭉치는 각 단어의 품사 표기에 대한 정보가 태그 형태로 되어 있다. 본 연구에서는 한국어 기반의 태깅 작업을 연구했으며, 기본 한국어 말뭉치가 아닌 기업이나 연구 기관에서 데이터를 수집하여 말뭉치나 별도 학습 데이터를 구축하기 위한 자동 태깅 방법에 대해 알아본다.

Data Augmentation of English Reading Comprehension Tutoring Dialogs using ChatGPT (ChatGPT 를 이용한 독해 튜터링 대화 데이터 확장)

  • Hyunyou Kwon;Sung-Kwon Choi;Jinxia Huang;Oh-Woog Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.43-44
    • /
    • 2023
  • 대화형 독해 튜터링 시스템을 위한 학생주도 대화 데이터셋 생성 및 확장에 ChatGPT 의 활용 가능성을 평가하였다. 단순히 수동으로만 구축한 기존의 데이터셋과 ChatGPT 에 의해 반자동으로 확장된 데이터셋을 비교한 결과, 구축량, 소요 시간, 비용 및 반복 작업 측면에서 ChatGPT 가 가진 유용성을 알 수 있었다. 그러나, 유형별 배분의 편중과, 부적절한 데이터 생성 등의 한계도 나타났다. Chat GPT 의 빠른 발전이 예상됨에 따라 대화형 튜터링 분야에 ChatGPT 에 의한 반자동 데이터 확장 방법이 널리 활용될 것으로 기대된다.

Automatic Classification of Patent Documents Using Doc2Vec (Doc2Vec을 이용한 특허 문서 자동 분류)

  • Song, Jinjoo;Kang, Seung-Shik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.239-241
    • /
    • 2019
  • 지식과 정보의 중요성이 강조되는 지식기반사회에서는 지식재산권의 대표적인 유형인 특허의 중요성이 날로 높아지고 있고, 그 수 또한 급증하고 있다. 특허 문서의 효과적 검색과 이용을 위해서는 새롭게 출원되는 특허 문서의 체계적인 분류 작업이 선행되어야 하고, 따라서 방대한 양의 특허 문서를 자동으로 분류해주는 시스템이 필요하다. 본 연구에서는 Doc2Vec 모델을 이용하여 국내 특허 문서의 특징(feature)을 추출하고, 추출된 특징을 바탕으로 한 특허 문서의 자동 분류 모형을 제안한다. 먼저 국내에 등록된 31,495 건의 특허 문서의 IPC(International Patent Classification)와 요약정보를 바탕으로 Doc2Vec 모델을 구축하였다. 구축된 Doc2Vec 모델을 통하여 훈련데이터의 특징을 추출한 후, 이 특징 벡터를 이용하여 분류기를 학습하였다. 마지막으로 Doc2Vec 모델을 이용하여 실험데이터의 특징 벡터를 추출하고 분류기의 성능을 실험한 결과, 43%의 분류 정확도를 얻었다. 이를 통해, 특허 문서 분류 문제에 Doc2Vec 모델의 사용 가능성을 확인할 수 있었다.

Prediction of Camera Intrinsic Parameter using Go Board Image (바둑판 촬영 영상을 이용한 카메라 내부 파라미터 예측 방법)

  • Rhee, Kwang Jin;Lee, Yun Gu
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2017.06a
    • /
    • pp.237-240
    • /
    • 2017
  • 최근 바둑에 대한 관심이 급증함에 따라 바둑에 관련된 연구가 많이 진행되고 있다. 바둑에 관련된 연구가 진행 되기 위해서는 많은 양의 바둑 데이터를 취득할 필요가 있다. 바둑 데이터 중 아직도 사람의 도움없이 취득하기 어려운 데이터로는 대표적으로 기보 데이터가 있다. 따라서 기보를 자동으로 저장하는 연구가 활발하게 진행 되고 있다. 기보를 자동으로 저장하는 연구 중 바둑돌이 착수될 위치를 예측하여 기보를 저장하는 시스템은 카메라의 정보를 취득하는 것으로부터 시작된다. 많은 양의 데이터를 수집하기 위해서는 일반 사용자가 사용할 수 있는 어플리케이션의 역할이 중요하다. 하지만 카메라의 정보를 취득하는 것은 어플리케이션의 환경을 구축하는데 어려움을 야기한다. 따라서 본 논문은 어플리케이션의 환경 구축 문제점인 카메라의 정보를 바둑판 최 외각 네 끝점과 비교적 간단한 방법으로 예측하는 방법을 제안한다.

  • PDF

Research about SMT Performance Improvement Through Automatic Corpus Expansion (말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구)

  • Choi, Gyu-Hyun;Shin, Jong-Hun;Kim, Young-Kil
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.296-299
    • /
    • 2016
  • 현재 자동번역에는 통계적 방법에 속하는 통계기반 자동번역 시스템(SMT)이 많이 사용되고 있지만, 학습 데이터로 사용되는 대용량의 병렬 말뭉치를 수동으로 구축하는데 어려움이 있다. 본 연구의 목적은 통계기반 자동번역의 성능을 향상시키기 위해 기존 다른 언어쌍의 말뭉치와 SMT 자동번역 기술을 이용하여 대상이 되는 언어쌍의 SMT 병렬 말뭉치를 자동으로 확장하는 방법을 제안한다. 제안 방법은 서로 다른언어 B와 C의 병렬 말뭉치를 얻기 위해, A와 B의 SMT 자동번역 시스템을 구축하고 기존의 A-C 말뭉치의 A를 SMT를 통해 B로 번역하여 B와 C의 말뭉치를 자동으로 확장한다. 실험을 통해 확장한 병렬 말뭉치가 통계기반 자동번역 시스템의 성능을 향상시킬 수 있음을 확인한다.

  • PDF

Research about SMT Performance Improvement Through Automatic Corpus Expansion (말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구)

  • Choi, Gyu-Hyun;Shin, Jong-Hun;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.296-299
    • /
    • 2016
  • 현재 자동번역에는 통계적 방법에 속하는 통계기반 자동번역 시스템(SMT)이 많이 사용되고 있지만, 학습 데이터로 사용되는 대용량의 병렬 말뭉치를 수동으로 구축하는데 어려움이 있다. 본 연구의 목적은 통계기반 자동번역의 성능을 향상시키기 위해 기존 다른 언어쌍의 말뭉치와 SMT 자동번역 기술을 이용하여 대상이 되는 언어쌍의 SMT 병렬 말뭉치를 자동으로 확장하는 방법을 제안한다. 제안 방법은 서로 다른 언어 B와 C의 병렬 말뭉치를 얻기 위해, A와 B의 SMT 자동번역 시스템을 구축하고 기존의 A-C 말뭉치의 A를 SMT를 통해 B로 번역하여 B와 C의 말뭉치를 자동으로 확장한다. 실험을 통해 확장한 병렬 말뭉치가 통계기반 자동번역 시스템의 성능을 향상시킬 수 있음을 확인한다.

  • PDF

Platform Design for Constructing Web-EOC Integrated Monitoring Management System (Web-EOC 통합계측관리시스템 구축을 위한 플랫폼 설계)

  • Lee, jin-duk;Chang, ki-tae;Bhang, kon-joon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.175-176
    • /
    • 2019
  • 개별 단위현장으로부터 자동적으로 수신되는 데이터를 수집하여 데이터서버로 통합관리, 현장으로부터 수신되는 모든 데이터에 대해 관리치를 비교하여, 이를 벗어난 데이터가 수신될 경우 즉시 SMS 전송을 하고 상황실에 경고를 하게 된다. Web-EOC 현장 검색 메인화면은 급경사지 주민대피 계측관리 시스템의 계측센서가 설치된 현장을 3차원 지도로 위치 이동하고 개별 현장의 센서 변위 발생 시 해당 현장으로 자동 이동되도록 플랫폼을 설계하였다.

  • PDF

A Study on Constructing the Automatic Control System of the Power Cable lest Facility (배전급 전력케이블 장기열화설비 자동화시스템 구축에 관한 연구)

  • Kang Moon Ho
    • Proceedings of the KIEE Conference
    • /
    • summer
    • /
    • pp.512-514
    • /
    • 2004
  • 배전급 전력케이블의 장기수명특성 평가를 위한 기초자료를 확보하기 위해 고창 배전 실증시험장내에 장기열화시험을 수행할 수 있는 실증시험설비가 구축되었다. 이 설비를 안전하고 효과적으로 관리 운영하기 위해 원격감시제어기능, 자동운전기능 및 열화데이터의 효과적이 처리기능이 포함된 장기열화설비 자동화시스템의 구축이 필요하였다. 따라서 본 논문에서는 새롭게 개정된 한전 표준구매규격과 참고규격인 개정판 AEIC CS5 규격에 맞게 구축된 배전급 전력케이블 장기 열화시험설비를 원격감시제어, 자동운전 및 열화 데이터의 저장 및 처리가 가능한 전력케이블 장기열화설비 자동화시스템의 하드웨어 구성 및 MMI (Man-Machine Interface)화면의 구성방안에 대하여 기술하였다. 본 자동화시스템을 이용해 기존의 간이 차수형 CNCV케이블의 AEIC규격 수트리시험을 안전하게 수행하였다.

  • PDF