• 제목/요약/키워드: 데이터문제

검색결과 9,175건 처리시간 0.038초

Faster Data Transfer using Optimized Intermediate Node (최적성능노드 경유 고속전송 방안 연구)

  • Woojin seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.130-132
    • /
    • 2024
  • 본 논문에서는 과학 빅데이터를 위한 고속 데이터 전송 방식을 제안한다. 최근의 과학연구는 이전보다 훨씬 더 많은 양의 데이터를 요구하지만, 잘 알려진 네트워킹 문제인 라스트마일 문제로 인해 여전히 데이터를 수신하는 데 시간이 오래 걸린다. 과학 빅데이터 전송시 라스트마일 문제로 인한 패킷 손실에 대해 더 나은 방법을 제안한다. 제안하는 방법은 원격 전송에 최적화된 중간 서버를 사용하고 종단간 네트워크 경로에서 라스트마일을 분리한다. 전송 측정을 통해 향상된 성능을 확인한다.

A Study on the Effective Approaches to Big Data Planning (효과적인 빅데이터분석 기획 접근법에 대한 융합적 고찰)

  • Namn, Su Hyeon;Noh, Kyoo-Sung
    • Journal of Digital Convergence
    • /
    • 제13권1호
    • /
    • pp.227-235
    • /
    • 2015
  • Big data analysis is a means of organizational problem solving. For an effective problem solving, approaches to problem solving should take into account the factors such as characteristics of problem, types and availability of data, data analytic capability, and technical capability. In this article we propose three approaches: logical top-down, data driven bottom-up, and prototyping for overcoming undefined problem circumstances. In particular we look into the relationship of creative problem solving with the bottom-up approach. Based on the organizational data governance and data analytic capability, we also derive strategic issues concerning the sourcing of big data analysis.

A Case Study of Data Editing for the Korean Housing Price Survey (주택가격동향조사를 위한 데이터편집 사례연구)

  • Park, Jin-Woo;Park, Hyun-Joo;Kim, Jin-Eok
    • Survey Research
    • /
    • 제6권1호
    • /
    • pp.83-98
    • /
    • 2005
  • Large scale survey database may contain some erroneous data or missing data. Incomplete or erroneous data may be produced in the process of data collection or data capture. Since erroneous data can cause some bias and inconsistency, data editing, which is the procedure for detecting and adjusting individual errors in data records, is a very important work in statistical survey. In this paper, we introduce an editing process for the housing price survey to enhance discussions on that topic. We explain how to decide some appropriate edit rules and show some related data. Furthermore, we describe input editing procedures which is appropriate for on-line survey and how to find and eliminate erroneous data through output editing.

  • PDF

A study on Utilization of Big Data Based on the Personal Information Protection Act (개인정보보호법에 기반한 빅데이터 활용 방안 연구)

  • Kim, Byung-Chul
    • Journal of Digital Convergence
    • /
    • 제12권12호
    • /
    • pp.87-92
    • /
    • 2014
  • We have noted a possibility of big data as a solution of social problem and pending issue. At the same time big data has a problem of privacy. Big data and privacy were in conflict. In this paper we pointed out that issue and propose a planning of big data based on privacy using case study of advanced country.

Design and Implementation of a Generic Classification System Based on Incremental Learning Technology (점진적 학습 기술 기반 범용적인 분류기 구조설계 방법의 설계 및 구현)

  • Min, Byung-Won;Oh, Yong-Sun
    • Proceedings of the Korea Contents Association Conference
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.425-426
    • /
    • 2019
  • 전통적인 마이닝 기법은 다양한 디지털 매체와 센서 등에서 생산되는 빅데이터를 처리하기 어려울 뿐 아니라 신규 데이터 누적시 전체 데이터를 재분석 해야하는 비효율성과 대용량의 문서를 학습함에 있어 메모리부족 문제, 학습 소요시간 문제 등이 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 자질축소 기법에 의존하지 않고 대량의 문서를 자유롭게 학습하고 부분적인 자질 추가 변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법을 설계 및 구현하였다. 점진적 학습 모듈은 일반적인 학습 방법이 데이터의 추가 및 변동시마다 모든 데이터를 재학습하는 데 반해, 기존의 학습 결과에 증분된 데이터만 재처리 없이 추가적으로 학습한다. 재학습을 위해 사용자는 작업 수행 중 자원 관리를 통해 기존에 처리된 데이터를 자유롭게 가져와서 새로운 데이터와 병합이 가능하다. 이러한 점직적 학습 효율성은 빅데이터 기반 데이터 처리에 주요한 특성인 데이터 생산 속도를 극복하기 위한 좋은 대안이 될 수 있음을 확인하였다.

  • PDF

Data Association and Its Applications to Intelligent Systems: A Review (데이터 연관 문제와 지능시스템에서의 응용: 리뷰)

  • Oh, Song-Hwai
    • Journal of the Institute of Electronics Engineers of Korea SC
    • /
    • 제49권3호
    • /
    • pp.1-11
    • /
    • 2012
  • Data association plays an important role in intelligent systems. This paper presents the Bayesian formulation of data association and its applications to intelligent systems. We first describe the Bayesian formulation of data association developed for solving multi-target tracking problems in a cluttered environment. Then we review applications of data association in intelligent systems, including surveillance using wireless sensor networks, identity management for air traffic control, camera network localization, and multi-sensor fusion.

데이터 퓨전 : 개념, 문제, 대안

  • 한상훈;하덕주;최종후
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.277-281
    • /
    • 2004
  • 최근 마케팅 현업에서 마이크로 마케팅(Micro Marketing)이 마케팅 기법의 화두로 등장하면서 데이터 퓨전(Data Fusion) 또는 데이터 인리치먼트(Data Enrichment)가 각광받는 영역으로 등장하고 있다. 본 연구에서는 데이터 퓨전의 개념과 그를 둘러싸고 있는 통계적 문제와 그 대안에 대하여 논의한다.

  • PDF

Design of Virtual Schema using Information Integeration Search System based on XML (XML기반의 가상 스키마를 이용한 정보 통합 검색시스템 설계)

  • 문석재;정계동;국윤규;최영근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2004
  • XML을 기반으로 한 시스템간의 통합하는 과정에서 발생하는 데이터 정의 이질성 문제, 데이터 표현의 이질성 문제, 유사표준의 중복 개발 등이 야기되므로, 이에 대한 대비책이 필요하다. 따라서 분산된 이 기종 시스템들마다 각기 구조화된 데이터베이스틀 통합하는 과정에 발생하는 시스템간의 불일치 문제를 해결할 수 있는 방법이 메타데이터를 이용하는 것이다. 본 논문에서는 이질적이면서도 분산되어 있는 정보 저장소로부터 메타데이터틀 수집하고. 이를 통합된 메타데이터 베이스로 구축하여, 분산된 데이터베이스에 대한 검색정보 및 데이터 트랜잭션을 할 수 있도록 제안한다. 정보 통합 방법으로는 메타데이터를 기반으로 한 가상 스키마를 이용한다. 스키마 이질성과 데이터 이질성 해결하기 위한 방법으로 메타데이터 가상 스키마를 설계하였다. 메타데이터 가상 스키마 기반으로 한 정보 통합은 XML 뷰어 어인 XDR을 기반으로 한다. 이는 XMVS 템플릿으로 분해하여, 통합 처리 할 수 있는 XML기반의 가상 스키마를 이용한 정보 통합 검색시스템을 설계 제안한다.

  • PDF

Development of Hadoop-based Illegal Parking Data Management and Analysis System (하둡 기반 불법 주·정차 데이터 관리 및 분석 시스템 개발)

  • Jang, Jinsoo;Song, Youngho;Baek, Na-Eun;Chang, Jae-Woo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.167-170
    • /
    • 2017
  • 자동차 보급 증가로 인한 주차 공간 부족 문제는 불법 주정차 차량 발생의 원인이 되어, 교통 체증을 야기하는 심각한 사회문제가 되었다. 따라서 각 지방자치단체에서는 불법 주정차 문제 해결을 위한 법안을 마련하기 위해 노력하고 있으며, 불법 주정차문제를 해결하기 위한 연구가 진행되고 있다. 한편, 정보통신의 발달에 의해 데이터의 양이 매우 빠른 속도로 증가하고 있으며, 아울러 공공 데이터의 양도 매우 빠른 속도로 증가하고 있다. 따라서 공공 빅데이터를 효율적으로 처리하기 위한 연구가 필요하다. 그러나 현재 공공 빅데이터 관리 및 분석을 수행하기 위한 효율적인 시스템을 구축하는 데는 아직 미흡한 실정이다. 따라서 본 논문에서는 불법 주정차 데이터와 같은 공공데이터를 효율적으로 분석하고 효과적인 주 정차 단속을 위한 하둡 기반 불법 주 정차 데이터 관리 및 분석 시스템을 제안한다.

  • PDF

Pattern Classification using Fuzzy Suppot Vector machine (퍼지 써포트 벡터 머신을 이용한 패턴 분류)

  • Lee, Sun-Young;Kim, Sung-Soo
    • Proceedings of the KIEE Conference
    • /
    • 대한전기학회 2004년도 하계학술대회 논문집 D
    • /
    • pp.2540-2542
    • /
    • 2004
  • 일반적으로 support vector machine (SVM)은 입력 데이터를 두개의 다른 클래스로 구별하는 결정면을 학습을 통하여 구한다. 특히 비분류 문제, 비선형 분류 문제들과 같은 두-클래스 문제를 해결하기 위해 데이터를 고차원의 특정 공간에서 다룬다. 많은 응용분야에서, 각 입력 데이터들은 이 두개의 클래스 중의 하나로 완전히 정의되지 않을 수도 있다. 이러한 문제를 해결하기 위해 우리는 본 논문에서 FSVM(fuzzy support vector machine)을 적용한다. 각 입력 데이터에 퍼지 멤버십(fuzzy membership)을 적용하여 결정면의 학습과정에 입력 데이터들이 다른 기여 (contribution)를 할 수 있게 한다. 본 논문에서는 기준 데이터 집합에 대해 제안된 방법을 실험하고, FSVM이 기존의 SVM보다 더 나음을 보인다.

  • PDF