• Title/Summary/Keyword: 자동 데이터 구축

Search Result 716, Processing Time 0.032 seconds

3D symbol mapping for 3D spatial database construction (3차원 공간정보 제작을 위한 3차원 symbol의 자동 mapping에 관한 연구)

  • Park Seung-Yong;Lee Jae-Bin;Yu Ki-Yun;Kim Yong-Il
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2006.05a
    • /
    • pp.63-72
    • /
    • 2006
  • 정보화 시대에 있어 급변하는 기술발전과 함께 인간의 문화적 욕구가 증대됨에 따라 3차원 공간정보에 대한 수요가 증가하고 있다. 하지만 현재 3차원 공간정보를 구축하는 과정은 일반적으로 수작업 또는 반자동에 의해 이루어지고 있다. 이는 데이터의 구축 및 표현에 많은 시간과 비용이 소요된다는 제약을 가지고 있다. 따라서 본 연구에서는 3차원 symbol 라이브러리를 구축하여 분류된 객체에 부합되는 3차원 symbol을 자동으로 선택하며, 선택된 3차원 symbol을 파라메타를 이용하여 자동으로 mapping 하는 과정을 구축하였다. 이를 통해 3차원 공간데이터의 구축 및 표현에 요구되는 시간과 오류를 최소화할 수 있었다. 또한 LiDAR(Light Detection And Range) 데이터의 3차원 정보를 활용하여 symbol의 자동 mapping을 위한 파라메타들을 산출하였고, symbol의 분류를 위한 기본 데이터로 활용하였다. 구축된 알고리즘의 평가를 위하여 실재 데이터의 3차원 공간데이터베이스를 구축하였다. 구축된 데이터에 대해 symbol선택 및 자동 mapping 과정에 대한 오류 검사를 수행하였고, 더불어 구축된 3차원 데이터의 활용 가능성을 평가하였다. 그 결과 본 연구로부터 구축된 알고리즘들은 3차원 공간정보를 표현함에 있어 신속하고 안정적으로 기여할 수 있을 것으로 판단되었다.

  • PDF

Automatic Data Augmentation for Korean AMR Sembanking & Parsing (한국어 의미 자원 구축 및 의미 파싱을 위한 Korean AMR 데이터 자동 증강)

  • Choe, Hyonsu;Min, Jinwoo;Na, Seung-Hoon;Kim, Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.287-291
    • /
    • 2020
  • 본 연구에서는 한국어 의미 표상 자원 구축과 의미 파싱 성능 향상을 위한 데이터 자동 증강 방법을 제안하고 수동 구축 결과 대비 자동 변환 정확도를 보인다. 지도 학습 기반의 AMR 파싱 모델이 유의미한 성능에 도달하려면 대량의 주석 데이터가 반드시 필요하다. 본 연구에서는 기성 언어 분석 기술 또는 기존에 구축된 말뭉치의 주석 정보를 바탕으로 Semi-AMR 데이터를 변환해내는 알고리즘을 제시하며, 자동 변환 결과는 Gold-standard 데이터에 대해 Smatch F1 0.46의 일치도를 보였다. 일정 수준 이상의 정확도를 보이는 자동 증강 데이터는 주석 프로젝트에 소요되는 비용을 경감시키는 데에 활용될 수 있다.

  • PDF

An Automatic Data Construction Approach for Korean Speech Command Recognition

  • Lim, Yeonsoo;Seo, Deokjin;Park, Jeong-sik;Jung, Yuchul
    • Journal of the Korea Society of Computer and Information
    • /
    • v.24 no.12
    • /
    • pp.17-24
    • /
    • 2019
  • The biggest problem in the AI field, which has become a hot topic in recent years, is how to deal with the lack of training data. Since manual data construction takes a lot of time and efforts, it is non-trivial for an individual to easily build the necessary data. On the other hand, automatic data construction needs to handle data quality issue. In this paper, we introduce a method to automatically extract the data required to develop Korean speech command recognizer from the web and to automatically select the data that can be used for training data. In particular, we propose a modified ResNet model that shows modest performance for the automatically constructed Korean speech command data. We conducted an experiment to show the applicability of the command set of the health and daily life domain. In a series of experiments using only automatically constructed data, the accuracy of the health domain was 89.5% in ResNet15 and 82% in ResNet8 in the daily lives domain, respectively.

상수도 원격자동검침시스템에 관한 연구

  • Seo, Chang-Gap;Park, Yeong-Jae;Jeong, Gwang-U
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.1036-1042
    • /
    • 2007
  • 현재 우리나라 상수도 시스템의 경우 대부분 각 가정집에 설치된 계량기의 측정값을 검침원이 육안으로 확인, 수기 기입 방법으로 수도 검침이 이루어지고 있다. 이러한 방법은 사생활 침해 및 범죄로 이어질 가능성이 있다. 본 논문에서는 상수도의 검침데이터를 무선주파수 및 코드분할다중접속방식을 사용하여 송수신 가능한 네트워크 망을 구축, 수신된 데이터 값을 활용하여 각 상수도 수용가의 사용량을 자동으로 검침하여 청구 내역서까지 작성해 주는 상수도 자동검침시스템을 소개한다. 상수도 자동검침시스템은 검침을 디지털화하고 이를 무선송신 가능한 검침기와 검침기의 검침데이터 값을 송수신 할 수 있는 중계기 및 집중기, 그리고 CDMA 망을 통한 검침데이터를 수신할 수 있는 애플리케이션 서버 등을 구축하여 지역 내 원격 검침 네트워크 망을 구축하는 것을 포함하고 있다. 본 연구의 시스템은 화재, 가스, 전기 등의 검침데이터를 통합으로 수집하여 데이터를 관리하는 통합 시스템으로 확대가 용이하며 이러한 상수도 자동검침시스템은 누수 및 독거노인 등의 생활보호대상자의 안전을 확인하는 기초 정보로도 활용할 수 있다.

  • PDF

Semi-Automatic Learning Model for Health Data Ontology (건강데이터 온톨로지를 위한 반자동 학습 모델)

  • Kim, Kwnag-Seong;Hwang, Doo-Sung
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.05a
    • /
    • pp.388-392
    • /
    • 2009
  • 웹 관련 기술의 발전과 더불어 정보시스템의 개발에서 기계가 자동 처리할 수 있는 데이터의 기술 방법으로 온톨로지의 사용이 보편화되고 있다. 온톨로지는 특정 영역의 개념과 그들간의 관계를 단순 명료하게 기술한다. 지식 발견을 위한 도메인 온톨로지 구축은 도메인의 이해, 데이터의 이해, 테스크의 이해, 온톨로지 학습, 온톨로지 평가, 정제 등 다단계를 통해 완성되나 전문성이 요구된다. 본 논문에서는 학습 기반 도메인 온톨로지 구축방법을 제안하고 건강데이터를 위한 온톨로지 구축에서 응용하였다. 제안된 학습 기반 온톨로지 구축 방법은 건강데이터의 세부 영역별 개념과 관계를 밝히는데 유용하였다.

  • PDF

Evaluation Category Selection For Automated Essay Evaluation of Korean Learner (한국어 학습자 작문 자동 평가를 위한 평가 항목 선정)

  • Kwak, Yong-Jin
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.270-271
    • /
    • 2017
  • 본 연구는 한국어 학습자 작문의 자동 평가 시스템 개발의 일환으로, 자동 평가 결과에 대한 설명과 근거가 될 수 있는 평기 기준 범주를 선정하기 위한 데이터 구축과 선정 방법을 제시한다. 작문의 평가 기준의 영역과 항목은 평가체계에 대한 이론적 연구에 따라 다양하다. 이러한 평가 기준은 자동 평가에서는 식별되기 어려운 경우도 있고, 각각의 평가 기준이 적용되는 작문 오류의 범위도 다양하다. 그러므로 본 연구에서는 자동 평가 기준 선정의 문제는 다양한 평가 기준에 중 하나를 선정하는 분류의 문제로 보고, 학습데이터를 구축, 기계학습을 통해 자동 작문 평가에 효과적인 평가 기준을 선정 가능성을 제시한다.

  • PDF

Development of data conversion system between MOS & EMS (이기종 컴퓨터(MOS/EMS)간 데이터 자동변환시스템 개발)

  • Lee, Kang-Jae;Choi, Bong-Soo;Kim, Tae-Eon
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1863-1864
    • /
    • 2008
  • 한국전력거래소에서 운영중인 EMS(Energy Management System)와 MOS(Market Operation System) 설비는 각각 Alstom사와 ABB사에 의해 우리나라의 전력계통 특성에 맞게 제작되어 공급된 전력계통과 전력시장의 운영을 자동화한 시스템이다. EMS는 전력계통 감시와 효율적인 운영을 위해 전력계통을 모델링한 데이터를 활용하며, MOS는 실시간 급전계획 수립을 위한 기반자료로 전력계통을 모델링한 데이터를 사용하게 된다. 그러나, 대한민국 전력산업의 핵심인 두 시스템은 시스템 설계 방식 및 DB 구조가 상이하여 전력계통의 신.증설 및 변경 시 동일한 데이터를 양 시스템에 각각 따로 구축, 운영해야하는 실정이다. 이에 따라 DB작업을 위한 자료 준비부터 입력, 수정, 검증 등 모든 과정에 중복된 관리가 이루어지고 있다. 중복 관리는 양 시스템 간 DB의 주요 데이터 특성 및 명칭이 상이하여 일률적인 관리가 어렵고, 시스템별 특성 및 운영노하우가 없이는 인적실수에 의한 입력오류 개연성이 폭넓게 존재하는 등 현 상황에서 피할 수 없는 현실이었다. EMS와 MOS 시스템 중 최소한 개의 시스템을 전면 재구축하지 않으면 해결되지 않을 본 문제를 해소하기 위하여 전력거래소는 특정 시스템에 구축된 데이터를 변환알고리즘을 통해 나머지 하나의 시스템에 자동 구축할 수 있는 시스템을 개발하여 활용하고자 한다. 이것이 바로 EMS에 입력되어 정확성이 검증된 계통데이터를 추출하여 MOS의 데이터 형식으로 변환하고, 변환된 데이터를 MOS시스템에 자동으로 입력할 수 있는 MOS/EMS 데이터 자동변환시스템이다.

  • PDF

Automatic Construction and Evaluation of Movie Domain Korean Sentiment Dictionary (영화도메인 한국어 감성사전의 자동구축과 평가)

  • Cho, Heeryon;Choi, Sang-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.585-587
    • /
    • 2015
  • 본 연구에서는 네이버 영화평을 학습데이터로 사용하여 영화평 감성분류에 필요한 감성사전을 자동으로 구축하는 방법에 대해 제안한다. 이 때 학습데이터의 분량과 긍정/부정 영화평의 비율을 달리하여 네 가지의 학습데이터를 마련하고, 각 경우에 대하여 감성사전과 나이브베이즈(이하, NB) 분류기를 구축한 후, 이 둘의 성능을 비교했다. 네 종류의 학습데이터로 구축한 감성사전과 NB 분류기를 이용하여 영화평 감성 자동분류 성능을 비교한 결과, 네 경우의 평균 균형정확도는 감성사전이 78.2%, NB 분류기가 66.1%였다.

Automatic Meter Reading System for Water-Supply (상수도 자동검침 시스템)

  • Seo, Chang-Gap;Park, Yeong-Jae;Jeong, Gwang-U
    • 한국디지털정책학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.59-67
    • /
    • 2007
  • 현재 우리나라의 상수도 시스템의 경우 대부분 각 가정집에 설치된 계량기의 측정값을 검침원이 육안으로 확인, 수기 기입 방법으로 수도 검침이 이루어지고 있다. 이러한 방법은 사생활 침해 및 범죄로 이어질 가능성이 있다. 본 논문에서는 상수도의 검침데이터를 무선주파수 및 코드분할다중접속방식을 사용하여 송수신 가능한 네트워크 망을 구축, 수신된 데이터 값을 활용하여 각 상수도 수용가의 사용량을 자동으로 검침하여 청구 내역서까지 작성해 주는 상수도 원격검침시스템을 소개한다. 상수도 자동검침시스템은 검침을 자동화하고 이를 무선송신 가능한 검침기와 검침기의 검침데이터 값을 송수신 할 수 있는 중계기 및 집중기, 그리고 CDMA 망을 통한 검침데이터를 수신할 수 있는 애플리케이션 서버 등을 구축하여 지역 내 원격검침 네트워크 망을 구축하는 것을 포함하고 있다. 본 연구의 시스템은 화재, 가스, 전기 등의 검침데이터를 통합으로 수집하여 데이터를 관리하는 통합 시스템으로의 확대가 용이하며 이러한 상수도 원격검침시스템은 누수 및 독거노인 등의 생활보호대상자의 안전을 확인하는 기초 정보로도 활용할 수 있다.

  • PDF

Automatic Extraction and Clustering of Concepts for Domain Ontology Construction (도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링)

  • Jung, Hyun-Ki;Kim, Yu-Seop
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF