• 제목/요약/키워드: 데이터통합기법

검색결과 712건 처리시간 0.027초

지방자치단체 통합 데이터 활용성 분석 : 데이터마이닝 기법을 활용하여 (Analysis of the Utilization of Integrated Data on Local Governments: Using Data Mining Techniques)

  • 임광혁
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.115-116
    • /
    • 2017
  • 자체별 또는 연도별과 같은 공통 요소를 통한 교차 분석이 가능하도록 통합 DB를 설계함으로써 다면적인 연구 분석을 위한 프레임워크를 구축하는 데 중점을 두어야 한다. 본 연구는 지자체 통합 데이터베이스에 구축되고 있는 지자체 통합 데이터의 활용성 검증을 위하여, 데이터마이닝 기법을 적용하여 지자체 통합 데이터를 분석하고자 한다. 데이터마이닝 기법을 적용하기 위해서 데이터의 추출, 적재, 변환의 과정을 수행하고, 이렇게 준비된 데이터를 실제 데이터마이닝 기법을 이용하여 분석하고 결과를 검증하는 과정을 수행하면서 지자체 통합 데이터의 활용성을 검증하고자 한다.

  • PDF

이종 시스템 통합을 위한 데이터 관리 기법 모델링 (Data management Scheme modeling for Heterogeneous system integration)

  • 강인성;이홍철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.436-439
    • /
    • 2010
  • 본 논문에서는 Ubiquitous Computing 환경 하에서 이종 시스템 간의 통합을 위한 데이터 관리 기법 모델을 제안하였다. 이종 시스템 간의 통합이 이루어지면 방대한 양의 데이터를 모든 시스템이 공유해야 하기 때문에 무분별한 데이터의 중복과 저장으로 인해 프로세스의 데이터 처리 성능 및 데이터 무결성을 보장받지 못 하는 등의 문제점이 발생한다. 이를 보완하기 위해 Minimal cost Spanning tree의 원리를 적용하여 시스템 통합에 따른 데이터 처리 및 무결성 문제 해결을 위한 메커니즘을 제시하고자 한다.

  • PDF

Geometry PIG 데이터 분석을 위한 통합 가시화 기법 (Integrated Visualization Techniques for Analyzing Geometry PIG Data)

  • 김복동;구상옥;권혁돈;정승대;정순기
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1107-1112
    • /
    • 2006
  • Geometry PIG (Pipeline Inspection Gauge)는 배관 내에 삽입되어 내부를 흐르는 매체에 의해서 추진되는 장치로서 배관의 기하학적 형상을 파악하기 위해 사용된다. Geometry PIG는 여러 종류의 센서를 지니고 배관 내부를 주행 하면서 탑재된 저장장치에 빠른 샘플링 속도로 데이터를 저장하기 때문에 획득된 많은 양의 데이터를 분석하기 위한 가시화 기법이 필요하다. 본 논문에서는 데이터의 특성을 고려하여 다양한 가시화 기법들의 스키마를 정의하고, 이러한 가시화 기법들을 이용해 geometry PIG 데이터 분석을 위한 통합된 가시화 기법을 제안한다. 통합된 가시화 기법은 각 가시화 기법들을 사용자가 원하는 형태로 배치하며 사용자가 원하는 시점에서 데이터를 파악할 수 있도록 가시화 기법에 따른 동기화와 사용자 인터페이스를 지원한다.

  • PDF

공간 데이터 웨어하우스에서 GML 데이터의 효율적인 적재를 위한 데이터 통합 기법 (GML Data Integration Method for Load Processing of Spatial Data Warehouse)

  • 전병윤;이동욱;유병섭;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.27-30
    • /
    • 2006
  • GIS 분야에서 데이터 교환의 표준으로 OGC(Open Geospatial Consortium)에서 GML(Geography Markup Language)이 제안되어 웹 어플리케이션이나 공간 데이터 교환에서 사용이 일반화 되어가고 있다. 또한, 공간 데이터를 효과적으로 수집하여 의사결정을 지원하기 위한 시스템인 공간 데이터 웨어하우스에서도 GML 데이터를 추출하여 소스 데이터로 활용하는 것이 요구되고 있다. 하지만 GML 은 반구조형식(semi-structured)의 데이터 형식을 가진다. 따라서 기존 구조적인 데이터와는 추출하는 방식이 다르므로 GML 의 특징에 맞는 공간 데이터 추출이 수행되어야 한다. 본 논문에서는 공간 데이터 웨어하우스에서 GML 기반의 공간 데이터 소스를 추출할 때, 중복되는 공간 객체를 하나의 표현으로 통합하여 효율적으로 적재하는 기법을 제안한다. 이는 GQuery를 이용하여 GML 데이터를 추출한 후, GML 스키마를 메타데이터에서 관리하는 스키마 정보와 비교하여 공간 데이터 웨어하우스에 통합된 공간 데이터를 제공하는 기법이다. 성능평가에서는 기존의 GML 데이터를 추출하는 기법과 제안기법과의 비교를 통하여 제안 기법의 기존 기법에 비해 평균적으로 약 9.95%의 성능향상을 보였다.

  • PDF

메타데이터 레지스트리 기반의 XML 스키마 생성 기법 (XML Schema Generating Technique based on Metadata Registry)

  • 이태웅;권주흠;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2002
  • 데이터베이스 개발에 있어서 다른 도구에 의한 다양한 스키마의 생성은 데이터베이스간의 통합을 어렵게 만들고 있다. 이러한 이질적 문제를 해결하고자 메타데이터 레지스트리를 이용한 방안이 활발히 연구되고 있다. 메타데이터 레지스트리(Metadata Registry)는 공유와 전달 목적으로 한 메타데이터를 표준화시킨 것이다. 이는 정보 통합 측면에 대하여 로컬 스키마를 공유화된 메타데이터를 가지고 생성함으로써 글로벌 스키마로의 통합이 가능하다. 따라서 이러한 메타데이터를 기반으로 하여 공유할 수 있는 로컬스키마의 작성 기법이 필요하다. 본 논문에서 메타데이터 레지스트리를 이용하여 XML 스키마를 생성하는 방안을 제안한다. 메타데이터를 XML 스키마로 변환하는 규칙을 제시하고 이를 기반으로 한 XML 스키마 생성 시스템을 설계하였다.

  • PDF

실체 뷰 기법을 이응한 대규모 전자 카탈로그 시스템 (A Large Electric Catalog System using Materialized Views)

  • 권일혁;최현화;김수현;문강식;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.285-292
    • /
    • 2001
  • 대규모 전자 카탈로그 시스템은 통한 데이터베이스 기술의 대표적인 응용분야로서 최근 전자상거래 분야의 발달로 그 수요가 증대되고 있고 있다. 본 연구에서는 수 천개 이상의 공급자와 수요자를 고려한 대규모 전자 카탈로그 시스템용 통합 데이터베이스의 구조와 관리 기법들에 대해 기술한다. 통합 데이터베이스의 구축은 스키마 통합과 데이터 통합의 두 단계로 구성된다. 스키마 통합은 지역 스키마를 주어진 전역 스키마로 변환하며, 개별 지역 데이터베이스의 스키마와 표현 능력이 다른 것을 고려했다. 데이터 통합의 경우에는 실체 뷰 기법을 사용하며, 각 데이터의 식별자 처리와 함께, 지역 데이터베이스에서 갱신된 부분만을 가져오는 기법을 구현한다.

  • PDF

XML 문서의 효율적인 경로 통합 기법 (An Efficient Path Combining Strategy of XML Document)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2005
  • XML은 비즈니스 메시징, 웹사이트 정보 통합, 그리고 카탈로그 통합 등의 분야에서 다양한 데이터를 표현하기 위한 포맷으로 급격하게 성장했다. 그러나 XML 데이터의 형태가 고정되어 있지 않기 때문에 전통적인 질의 방법이 항상 정확한 결과를 보여주지는 않는다. 또한 객체 지향 DBMS가 이 영역에 적합한지의 여부는 아직 명확하지 않다. 따라서 XML 데이터를 효율적으로 검색하기 위해 기존의 관계형 DBMS와 연계하여 구조 유사성을 기반으로 하는 검색 기법이 연구되고 있다. 그 중 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스를 이용한 검색 시스템은 다른 XML 문서 검색 시스템보다 훨씬 빠른 수행 속도를 보여주지만, 3차원의 메모리 구조를 사용하여 많은 저장공간을 필요로 하는 단점이 있다. 본 논문에서는 XML 문서를 저장할 때 경로들 사이의 유사성을 이용하여 XML 데이터의 경로를 통합하는 기법에 대해 소개한다. 이렇게 통합된 경로를 이용하여 생성하는 3차원 비트맵 인덱스는 그 크기가 상당히 줄어들게 되고, 기존의 연구에서 보여주었던 문제점들을 해결하게 되었다.

  • PDF

고품질 데이터를 지원하는 교통데이터 웨어하우스 구축 기법 (An Integrated Framework for Data Quality Management of Traffic Data Warehouses)

  • 황재일;박승용;나연묵
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권4호
    • /
    • pp.89-95
    • /
    • 2008
  • 본 논문에서는 교통데이터 웨어 하우스에서 데이터 품질 관리를 위한 통합기법을 제안한다. 고속도로 교통관리시스템(FTMS)과 우회도로 교통정보시스템(ARTIS) 으로부터 대용량 교통데이터를 수집하여 데이터 웨어하우스를 구축하기 위한 방안을 기술하고, 다양한 분석을 위한 고품질 교통데이터를 제공하기 위한 통합 데이터 품질관리 기법을 제안하고 구현 평가한다. 제안된 통합 데이터 품질관리 기법을 활용하면 연구자들에게 검증된 고품질 교통데이터를 제공할 수 있고, 데이터처리와 평가를 위한 별도의 비용을 절감할 수 있을 것으로 기대된다.

  • PDF

통합 RFID 미들웨어의 응답시간 개선을 위한 효과적인 캐쉬 구조 설계 (An Efficient Cache Mechanism for Improving Response Times in Integrated RFID Middleware)

  • 김정길;이준환;박경랑;김신덕
    • 정보처리학회논문지A
    • /
    • 제15A권1호
    • /
    • pp.17-26
    • /
    • 2008
  • 본 논문에서는 WSN(wireless sensor networks)과 RFID(radio frequency identification) 시스템을 통합하여 이용할 수 있는 통합 RFID 미들웨어에서의 효과적인 캐슁 기법을 제시한다. 통합 RFID 미들웨어가 운영되는 환경은 연결된 RFID리더로부터 대규모의 데이터가 입력되고, 다수의 무선 센서로부터 끊임없이 데이터가 입력되는 상황을 가정하고 있으며 또한 특정 목적을 위해 과거에 센서로부터 입력되어 분산 저장되어 있는 히스토리 데이터도 활용될 수 있음을 가정하고 있다. 따라서 캐슁 기능을 구비한 특정 미들웨어 레이어에서 센서 노드로부터 수신되는 연속 데이터와 분산 저장되어 있는 히스토리 데이터에 대한 신속한 질의 및 응답을 위한 효율적 데이터 처리가 절실히 요구된다. 이를 위하여 본 논문에서 제안되는 캐슁 기법은 기존의 캐슁 기법 기반으로 통합 RFID 미들웨어에 특화하여 데이터 처리의 효율을 높이기 위하여 두가지 방법을 제시하고 있으며, 이는 처리 데이터의 유형에 따라 DSC(data stream cache)와 HDC(history data cache) 로 구분된다. 제안된 캐슁 기법은 다양한 파라미터를 이용한 실험을 통하여 신속한 질의 및 응답이 이루어짐을 보여주고 있다.

멀티 뷰 기법 리뷰: 이해와 응용 (Multi-view learning review: understanding methods and their application)

  • 배강일;이영섭;임창원
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.41-68
    • /
    • 2019
  • 멀티 뷰 기법은 데이터를 다양한 관점에서 보려는 접근 방법이며 데이터의 다양한 정보를 통합하여 사용하려는 시도이다. 최근 많은 연구가 진행되고 있는 멀티 뷰 기법에서는 단일 뷰 만을 이용하여 모형을 학습시켰을 때 보다 좋은 성과를 보인 경우가 많았다. 멀티 뷰 기법에서 딥 러닝 기법의 도입으로 이미지, 텍스트, 음성, 영상 등 다양한 분야에서 좋은 성과를 보였다. 본 연구에서는 멀티 뷰 기법이 인간 행동 인식, 의학, 정보 검색, 표정 인식 분야에서 직면한 여러 가지 문제들을 어떻게 해결하고 있는지 소개하였다. 또한 전통적인 멀티 뷰 기법들을 데이터 차원, 분류기 차원, 표현 간의 통합으로 분류하여 멀티 뷰 기법의 데이터 통합 원리를 리뷰 하였다. 마지막으로 딥 러닝 기법 중 가장 범용적으로 사용되고 있는 CNN, RNN, RBM, Autoencoder, GAN 등이 멀티 뷰 기법에 어떻게 응용되고 있는지를 살펴보았다. 이때 CNN, RNN 기반 학습 모형을 지도학습 기법으로, RBM, Autoencoder, GAN 기반 학습 모형을 비지도 학습 기법으로 분류하여 이 방법들이 대한 이해를 돕고자 하였다.