• Title/Summary/Keyword: 데이터 수요

Search Result 40,014, Processing Time 0.056 seconds

Ordered Indexing Technique for Storing XML Data Using Relational Databases (관계형 데이터베이스 기반 색인을 이용한 XML 테이터의 저장 기법)

  • 손대준;정병수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.205-207
    • /
    • 2004
  • 인터넷의 급속한 발전으로 인해 다양한 종류의 데이터들이 증가하게 되었으며 이러한 데이터의 표현과 데이터 교환을 위해 XML이 사실상의 표준으로 빠르게 자리 잡아 가고 있다. XML문서를 데이터로 저장 시 오랜 기간에 걸쳐서 성숙된 RDBMS를 사용하여 XML데이터를 RDBMS로 저장 시 발생할 수 있는 단편화 방지와 XML질의의 효과적인 질의 처리에 대한 많은 연구들이 제안되었다. 본 논문에서는 XML 문서를 관계형 데이터베이스 스키마로 저장 시 발생할 수 XML문서내의 엘리먼트의 관계에 대한 정보를 저장하기 위해서 추가적으로 발생하는 정보의 수를 줄이고 엘리먼트간의 관계를 효과적으로 저장할 수 있는 방법에 대해서 연구한다.

  • PDF

A study on strategic use of MyData: Focused in Financial Services (금융 마이데이터의 전략적 활용에 관한 사례 연구)

  • Lee, Ju-Hee
    • Journal of Digital Convergence
    • /
    • v.20 no.3
    • /
    • pp.181-189
    • /
    • 2022
  • The purpose of this study is to investigate the innovation of business model and the effectiveness of the data-driven model. the main concepts and policies related to the data economy are reviewed, and implications are drawn through the analysis of data-based convergence service creation cases. This study identified the existing data-driven business model of the creation of MyData service industry in the financial industry and concept of the data economy. According to the empirical analysis result, this study confirmed that t considering the mobile environment and consumer acceptance of data portability, the ripple effect of the implementation of My Data on the financial industry is expected to be significant.

PC용 데이터 수집 소프트웨어 개발

  • 박영필
    • Journal of the KSME
    • /
    • v.28 no.2
    • /
    • pp.123-129
    • /
    • 1988
  • 공학분야에서 널리 사용되고 있는 신호처리 및 해석의 기본이 되는 범용 데이터 수집 소프트웨 어의 기본적인 사항 및 그 개발예에 대해 언급하여 보았다. 데이터 수집장치 및 그를 제어하는 소프트웨어는 신호처리 및 해석을 통하여 국외에서 개발된 시스템보다는 훨씬 저렴한 가격으로 국내에서 개발될 수 있으며 국내에서 쉽게 구할 수 있는 것들로 데이터 수집 시스템 구성이 가 능함을 보였다. 또한 국내 개발 시, 시스템의 개조 및 성능향상이 용이하므로 점차적으로 그 성능 및 정확도를 향상시켜나갈 수 있으며 사용자의 목적에 따른 기능변경이 수월하다는 장점이 있겠다. 이러한 데이터 수집 소프트웨어의 개발시 그 성능을 크게 좌우하는 것은 A/D변환기 및 관련 하드웨어의 성능과 이를 직접 제어하는 기계어 Routine의 수행속도 및 능률이라는 점을 들 수 있겠다. 왜냐하면 데이터 수집기능 및 온라인 처리가 필요한 디지틀 오실로스코프 기능과 같은 일을 수행하는 소프트웨어는 하드웨어와 밀접한 관계가 있으며, 전체 수집 시스템의 성능에 둘 다 큰 영향을 미치게 되기 때문이다. 이러한 것은 하드웨어설계자와 프로그램 작성자와의 충분한 토의 및 상호 기능개선에 의해 해결되어 데이터 수집 시스템의 성능이 크게 향상되어질 수 있으며, 전자기술의 발전으로 인해 하드웨어의 성능이 크게 향상되고 이에 따른 소프트웨어의 개선이 진행됨에 의해 보다 나은 데이터 수집 시스템의 개발이 가능해지리라 사료된다.

  • PDF

Min-Max Hash for Similarity Measurement based on Multiset (Min-Max Hash를 활용한 다중 집합 기반의 유사도 측정)

  • Yoon, Jin-Uk;Kim, Byoungwook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.36-39
    • /
    • 2019
  • 데이터 마이닝에서 클러스터링은 서로 유사한 특징을 갖는 데이터들을 동일한 클래스로 분류하는 방법이다. 클러스터링에는 다양한 방법이 존재하지만 대표적으로 집합으로 표현된 데이터들의 유사도를 측정하기 위해서는 자카드 유사도(Jaccard Similarity)를 이용한다. 자카드 유사도는 서로 다른 집합 간의 공통된 부분을 상대적으로 평가하여 유사도를 측정하는 방법이다. 그러나 최근에는 데이터를 저장할 수 있는 기술과 매체의 발전으로 표현할 수 있는 데이터의 영역과 범위는 발전되고 있기 때문에 많은 연산과 시간의 비용이 발생하게 된다. 이를 해결하기 위해서 두 데이터의 표본의 유사도를 통해 실제 데이터들의 유사도를 추정할 수 있는 Min-Hash 가 제안되었다. 본 논문에서는 이를 활용하여 집합의 영역을 다중 집합(Multiset)으로 확장하여 중복되는 값을 가질 수 있는 두 데이터 간의 유사도를 효율적으로 추정할 수 있는 Min-Max Hash 를 제안한다.

Natural language sensitivity analysis using RNN (순환신경망(RNN)을 통한 자연어 감성 분석)

  • Hur Tai-sung;Jeon Se Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.473-474
    • /
    • 2023
  • 본 논문에서는 딥러닝 기법 중 하나인 순환신경망(RNN)을 활용하여 자연어를 처리할 수 있는 모델 개발에 대하여 연구를 진행하였다. 다양한 주제에 대한 사용자들의 의견을 확보할 수 있는 유튜브 플랫픔을 활용하여 데이터를 확보하였으며, 감성 분류를 진행하는 만큼 학습 데이터셋으로는 네이버 영화 리뷰 데이터셋을 활용하였다. 사용자는 직접 데이터 파일을 삽입하거나 혹은 유튜브 댓글과 같이 데이터를 외부에서 확보하여 감성을 분석할 수 있으며, 자연어 속 등장하는 단어의 빈도수를 종합하여 해당 데이터들 속 키워드는 무엇인지를 분석할 수 있도록 하였다. 나아가 종합 데이터 분석 관리 플랫폼을 제작하기 위하여 해당 데이터를 데이터베이스에 저장하고GUI 프로그램을 통하여 접근 및 관리가 가능하도록 하였다.

  • PDF

A Simulator for Performance Evaluation of Historical Data Compression Algorithm (이력 데이터 압축 알고리즘의 성능평가를 위한 시뮬레이터)

  • Yoo, Min-Hyung;Kim, Ho-Young;Han, Sang-Hyuck;Kim, Young-Kuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.182-184
    • /
    • 2012
  • 산업분야에서 이용되는 이력 데이터는 압력, 부피, 온도, 볼트, 전류, 전압 등 각종 제어기나 센서에서 발생하는 입력 정보를 일정 시간 간격으로 수집되는 데이터로, 데이터의 값이 일정하거나 값의 폭이 좁고, 많게는 수만 개의 포인트가 실시간으로 수집, 저장되어지는 대용량의 데이터라는 특징이 있다. 이러한 특성을 지닌 이력 데이터는 이력의 모든 데이터를 저장하지 않고, 전체를 대표하는 데이터의 일부만을 저장함으로써 이력 데이터의 효율적인 관리와 공간효율을 극대화시킬 수 있다. 이러한 이력 데이터를 효과적으로 관리하고, 보관하기 위해 이력 데이터 압축 알고리즘에 대한 개발과 연구가 진행 중이다. 그러나 이미 알려져 있는 이력 데이터 압축 알고리즘과 개발하고 있는 알고리즘의 성능에 대한 평가를 할 수 있는 시뮬레이터는 개인이나 소규모 집단만을 위해 만들어지거나, 공개되지 않고 있어 사용하기에 제한적이다. 이에 이력 데이터 압축 성능평가를 위한 시뮬레이터인 HDCS(Historical Data Compression Simulator)를 설계하고 구현하고자 한다.

EUS SVMs: Ensemble of Under-Sampled SVMs for Data Imbalance Problems (데이터 불균형 해결을 위한 Under-Sampling 기반 앙상블 SVMs)

  • Gang Pil-Seong;Jo Seong-Jun
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2006.05a
    • /
    • pp.291-298
    • /
    • 2006
  • 패턴인식 문제에서 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극히 많거나 적으면 데이터 불균형이 발생했다고 한다. Support Vector Machine(SVM)은 다른 기계 학습 알고리즘들과 마찬가지로 학습에 사용되는 데이터의 범주간 비율이 거의 비슷하다는 가정 하에서 학습을 하고 예측 결과를 도출하게 된다. 그러나 실제 문제에서는 데이터의 불균형이 발생하는 경우가 매우 빈번하며, 이러한 경우에는 모델의 성능이 매우 저하되는 문제점이 발생한다. 본 논문에서는 실제로 데이터 불균형이 SVM의 분류 결과에 어떠한 영향을 미치는지를 2차원 인공 데이터를 통하여 알아본다. 그리고 이러한 데이터 불균형을 해소하기 위하여 Under-Sampling 기반 앙상블 SVM을 제안하였다. 제안된 방법을 두 가지 인공 데이터에 적용하여 본 결과, 제안된 방법은 데이터 불균형을 해소하기 위해 사용되는 기존의 방법들에 비하여 소수 범주에 속하는 데이터의 수가 매우 적고 데이터의 불균형이 매우 심한 경우에도 높은 성능과 안정성을 갖는 효과적인 방법이라는 것이 입증되었다.

  • PDF

Real-time data analysis technique using large data compression based spark (스파크 기반의 대용량 데이터 압축을 이용한 실시간 데이터 분석 기법)

  • Park, Soo-Yong;Shin, Yong-Tae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.545-546
    • /
    • 2020
  • 스파크는 데이터 분석을 위한 오픈소스 툴이다. 스파크에서는 실시간 데이터 분석을 위하여 스파크 스트리밍이라는 기술을 제공한다. 스파크 스트리밍은 데이터 소스가 분석서버로 데이터 스트림을 전송한다. 이때 전송하는 데이터의 크기가 커질 경우 전송과정에서 지연이 발생할 수 있다. 제안하는 기법은 전송하고자 하는 데이터의 크기가 클 때 허프만 인코딩을 이용하여 데이터를 압축하여 전송시키므로 지연시간을 줄일 수 있다.

  • PDF

A study on DID metadata processing method according to distance learning data weight (원격교육 학습데이터 가중치에 따른 DID 메타데이터 처리방법 연구)

  • Youn-A Min
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.567-568
    • /
    • 2023
  • 본 논문에서는 블록체인 기반 DID기술을 이용하여 원격교육에서 발생하는 학습데이터를 효율적으로 관리하기 위한 방법으로, 학습데이터 가중치를 고려한 DID 메타데이터관리방법을 제안하였다. 메타데이터의 식별자에 대하여 특정위치로 데이터 가중치를 검색하도록 하고 해당 가중치에 따라 처리방법을 다양화 할 수 있다. 본문에서는 블록체인의 Zero Knowledge Proof 방식 처리에 차별화를 두어 메타데이터를 처리하였으며 데이터 처리속도 및 데이터관리에 효율성높일 수 있다.

  • PDF

Automatic payload data dump for the LEO satellite (저궤도위성 탑재체 데이터 자동 전송)

  • Chae, Dong-Seok;Yang, Seung-Eun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.641-642
    • /
    • 2011
  • 저궤도 위성은 지상과의 접축시간이 극히 제한되어 있어 위성에서 생성된 원격측정 데이터들을 위성의 대용량 메모리에 저장하였다가 지상과의 접촉시간에 저장된 데이터를 지상으로 전송하는 방식으로 운영된다. 위성에 저장할 수 있는 전체 데이터 크기는 대용량 메모리의 크기와 지상과의 통신 가용시간에 따라 제한을 받게 된다. 대용량 메모리 저장용량과 다운링크 버짓을 만족해야 하므로 일반적으로 각 탑재체로부터 수신하여 위성에 저장되는 원격측정 데이터들은 종류별로 일정한 주기를 가지게 되고 그 크기도 고정되어 있다. 그리고 각 데이터 종류별로 저장여부를 지상명령으로 조절할 수 있도록 되어 있다. 그러나 생성되는 데이터가 일정하지 않고 비주기성을 갖는 경우 데이터량을 예측할 수 없으므로 지상명령으로 데이터 저장여부를 제어하는 것은 거의 불가능하다. 이러한 경우에 생성되는 데이터량을 모니터링하면서 데이터를 전송할 수 있는 자동화된 데이터 통신 방식이 요구된다. 본 논문은 저궤도 위성 탑재체에서 비주기적으로 생성되는 데이터를 자동으로 전송받기 위한 데이터 자동 전송기능과 시험 결과에 대해서 기술하였다.