• Title/Summary/Keyword: 데이터통합기법

Search Result 712, Processing Time 0.029 seconds

Mapping System based on Indexing for Integrating Distributed Data (분산 데이터 통합을 위한 색인기반의 매핑 시스템)

  • 설진안;김운용;정계동;최영근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.436-438
    • /
    • 2003
  • 분산된 데이터는 이질적인 시스템 환경으로 인하여 공유하기 어렵고. 데이터의 형식 및 데이터 모델이 서로 다르게 정의되어 사용함으로서 통합하기 또한 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해 분산된 데이터를 XML문서로 변환한다. 또한 색인기법으로 문서의 구조 및 컨텐츠 정보를 추출하여 서로 다르게 정의된 의미정보를 데이터 사전과 비교하여 표준문서로 통할할 수 있는 색인 기반의 매핑 시스템에 대해 기술한다. 제안된 매핑 시스템은 DOM이나 SAX와 같은 표준 인터페이스를 사용하여 XML문서를 통합하는 것보다 효율적으로 통합할 수 있다.

  • PDF

A Hand-off Scheme via Foreign Agent in Wired/Wireless Mobile IP Network (유무선 통합망 이동 IP에서 외부 에이젼트를 통한 핸드오프 기법)

  • 정준영;신용태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.655-657
    • /
    • 1999
  • 본 논문에서는 유무선 통합망 이동 IP상에서 실시간 데이터 전송의 향상을 위한 핸드오프 기법을 소개한다. 즉, 외부 에이전트에서 이동노드로 전송되는 PDU가 이동 노드의 이동성에 의해 이동 노드로 전달되지 못하는 경우가 발생한다면 실시간 데이터는 이동 노드로 전달되지 못하고 잃어버리게 된다. 이동 노드는 이동한 새로운 외부 에이전트에 등록을 하고 인터넷 호스트로부터 데이터를 받을 수 있는 환경이 구축되기 전까지 데이터 통신이 불가능하다. 그러므로 기존의 기법으로는 실시간 데이터 통신을 할 경우 이동 노드의 이동성을 지원할 수 없다. 이에 대한 해결책으로 외부 에이전트가 유선망과 무선망을 연계하고 이동노드가 이동하며 실시간 데이터 통신을 하는 경우, 이동 노드가 현재 등록된 외부 에이전트에게 이동하게 될 외부 에이전트를 알려주는 능동적 방법에 의해 이동 노드의 이동성을 지원하며 실시간 데이터 통신이 가능할 수 있도록 하는 핸드 오프 기법을 제안한다.

  • PDF

A Web-Based Multimedia Dictionary System Supporting Media Synchronization (미디어 동기화를 지원하는 웹기반 멀티미디어 전자사전 시스템)

  • Choi, Yong-Jun;Hwang, Do-Sam
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.8
    • /
    • pp.1145-1161
    • /
    • 2004
  • The purpose of this research is to establish a method for the construction of a multimedia electronic dictionary system by integrating the media data available from linguistic resources on the Internet. As the result of this study, existing text-oriented electronic dictionary systems can be developed into multimedia lexical systems with greater efficiency and effectiveness. A method is proposed to integrate the media data of linguistic resources on the Internet by a web browser. In the proposed method, a web browser carries out all the work related to integration of media data, and it does not need a dedicated server system. The system constructed by our web browser environment integrates text, image, and voice sources, and also can produce moving pictures. Each media is associated with the meaning of data so that the data integration and movement may be specified in the associations. SMIL documents are generated by analyzing the meaning of each data unit and they are executed in a web browser. The proposed system can be operated without a dedicated server system. And also, the system saves storage space by sharing the each media data distributed on the Internet, and makes it easier to update data.

  • PDF

Integrating Classification Method using PCM Algorithm and Bayesian Method (PCM 알고리즘과 베이시안 분류의 통합기법)

  • 전영준;김진일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.790-792
    • /
    • 2004
  • 본 논문은 PCM(Possibilistic C-Means) 알고리즘과 베이시안 분류 알고리즘을 통합한 고해상도 위성영상의 효과적인 분류방법을 제안하였다. 제안된 알고리즘은 학습데이터를 참고로 하여 PCM 알고리즘을 반복적인 과정 없이 수행한다. 각 분류항목별로 분류된 데이터에서 평균내부거리 내부에 해당되는 데이터들을 선정하여 각 항목별 비율을 구한 후 베이시안 분류기법의 사전확률로 적용하여 분류를 수행한다 PCM 알고리즘은 각 데이터와 특정 클러스터와의 거리에 소속도를 부여하는 퍼지 C-Means 알고리즘과 달리 소속도를 각 데이터와 클러스터 중심간의 절대거리에 의존하는 방법으로 퍼지 C-Means 알고리즘이 가지는 상대성 문제를 해결하였다. 제안된 분류 기법을 고해상도 다중분광 데이터인 IKONOS 위성영상에 적용하여 분류를 수행한 후 최대우도 분류기법과 비교한다.

  • PDF

Non Duplicated Extract Method of Heterogeneous Data Sources for Efficient Spatial Data Load in Spatial Data Warehouse (공간 데이터웨어하우스에서 효율적인 공간 데이터 적재를 위한 이기종 데이터 소스의 비중복 추출기법)

  • Lee, Dong-Wook;Baek, Sung-Ha;Kim, Gyoung-Bae;Bae, Hae-Young
    • Journal of Korea Spatial Information System Society
    • /
    • v.11 no.2
    • /
    • pp.143-150
    • /
    • 2009
  • Spatial data warehouses are a system managing manufactured data through ETL step with extracted spatial data from spatial DBMS or various data sources. In load period, duplicated spatial data in the same subject are not useful in extracted spatial data dislike aspatial data and waste the storage space by the feature of spatial data. Also, in case of extracting source data on heterogeneous system, as those have different spatial type and schema, the spatial extract method is required for them. Processing a step matching address about extracted spatial data using a standard Geocoding DB, the exiting methods load formal data set. However, the methods cause the comparison operation of extracted data with Geocoding DB, and according to integrate spatial data by subject it has problems which do not consider duplicated data among heterogeneous spatial DBMS. This paper proposes efficient extracting method to integrate update query extracted from heterogeneous source systems in data warehouse constructer. The method eliminates unnecessary extracting operation cost to choose related update queries like insertion or deletion on queries generated from loading to current point. Also, we eliminate and integrate extracted spatial data using update query in source spatial DBMS. The proposed method can reduce wasting storage space caused by duplicate storage and support rapidly analyzing spatial data by loading integrated data per loading point.

  • PDF

Design and Implementation of a Web-Service based Bio-Informatics System using GO knowledge-base (온톨로지를 이용한 웹서비스 기반 바이오 정보 시스템의 설계 및 구현)

  • Park, Yong-Il;Park, Sung-Su;Lee, Jong-Keun;Hong, Dong-Wan;Yoon, Jee-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.31-34
    • /
    • 2005
  • 최근 국, 내외에서 생물정보학 데이터베이스 구축이 활발히 진행되어 왔고, 각 바이오 정보 시스템의 데이터 통합 연구가 진행 중이다. 대표적인 바이오 데이터베이스 시스템인 GenBank, DDBJ, EBML 등은 같은 의미의 데이터라 하더라도 각 시스템의 내부 데이터 구조 및 데이터 표현 형식이 상이하여 통합에 어려움이 따른다. 이를 해결하기 위해 통합 데이터 형식을 지원하는 웹 서비스 기반 데이터 통합 방식이 제안되고 있다. 현재 국내 웹 서비스 기반의 바이오 정보 제공 사이트들은 SOAP을 이용한 단순 메시지 전달 기법으로 초보적인 단계라 할 수 있다. 본 논문에서는 SOAP을 이용한 단순한 메시지 전달 기법만이 아닌 레지스트리 서버 검색을 통해 서비스 제공자를 찾고, WSDL문서를 분석한 후 사용자에게 검색 메소드를 제공함으로써 빠르고 정확한 서비스를 제공하여 기존에 구축된 시스템의 단점을 보완한다. 또한 상이한 스키마로 이루어진 데이터들을 효과적으로 통합하기 위해 온톨로지를 이용한 웹 서비스 기반 바이오 정보 시스템을 제안하고 구현한다.

  • PDF

A Study on the Data Fusion for Data Enrichment (데이터 보강을 위한 데이터 통합기법에 관한 연구)

  • 정성석;김순영;김현진
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.3
    • /
    • pp.605-617
    • /
    • 2004
  • One of the best important thing in data mining process is the quality of data used. When we perform the mining on data with excellent quality, the potential value of data mining can be improved. In this paper, we propose the data fusion technique for data enrichment that one phase can improve data quality in KDD process. We attempted to add k-NN technique to the regression technique, to improve performance of fusion technique through reduction of the loss of information. Simulations were performed to compare the proposed data fusion technique with the regression technique. As a result, the newly proposed data fusion technique is characterized with low MSE in continuous fusion variables.

Text segmentation using concept hierarchy tree (계층적 개념 트리를 이용한 문서 분할 기법)

  • 이병희;최익규;박승규;김인구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.166-168
    • /
    • 2003
  • 문서 분할 기법은 문서 내에 존재하는 다양한 주제들을 자동적으로 추출하는 기법이다. 이 분야의 연구는 크게 사전적 관계에 근거한 기법과 통계적 데이터에 근거한 기법으로 나누어져 연구되어 왔다. 사전적 관계에 의한 기법은 단어들의 사전적 의미와 관계에 근거한 기법이고 통계적 데이터에 의한 기법은 주로 단어들의 분포를 이용한 기법이다. 여기에는 몇가지 문제점이 있는데 사전적 관계에 근거한 경우에는 분산된 주제들을 통합하여 추출하기 어렵고. 통계적 데이터에 근거한 기법은 정확한 주제의 개수를 찾기 어렵다는 점이다. 본 논문에서는 계층적 개념 트리를 이용하여 보다 정확한 개수의 주제들을 찾아낼 수 있는 문서 분할 기법에 대해 소개 하고자 한다.

  • PDF

Effective Synchronization of Replicated Data in Information Appliance Environment (정보가전 환경에서 중복된 데이터의 효과적인 동기화)

  • Kang, Yeong-Ho;Jang, Woo-Seog;Noh, Gary;Jung, Byung-Dae;Son, Sung-Yong;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1795-1798
    • /
    • 2002
  • 정보가전 환경은 정보가전들 간의 홈 네트워크론 기반으로 한 상호 정보 교환을 통하여 사용자에게 보다 진보적인 홈 서비스를 제공한다. 정보가전 환경에서는 서로 다른 두 정보가전 내에 동일한 데이터가 중복되는 상황이 발생 가능하므로, 이러한 중복된 데이터의 일관성을 유지시켜 주기 위한 동기화 기능의 지원이 요구된다. 본 논문에서는 정보가전 환경에서 중복된 데이터의 일관성을 유지시키기 위한 효과적인 동기화 기법을 제안하였다. 제안하는 동기화 기법은 네트워크 전송량과 데이터 저장공간을 최소화함으로써 통합 데이터 관리 아키텍춰에서 좋은 성능을 발휘할 수 있다는 것이 큰 장점이다. 또한, 이 동기화 기법은 중앙집중방식의 통합 데이터 관리가 불가능한 현재의 환경과 이것이 가능하게 될 미래의 환경에 모두 적용할 수 있다.

  • PDF

Comprehensive Classfication and Resolution of schema conflicts on XML Schema Integration (XML Schema를 이용한 스키마 통합에서 충돌 문제의 포괄적 분류와 해결)

  • Park, Hyun-Mi;Park, Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.184-186
    • /
    • 2002
  • 웹을 통해 얻을 수 있는 데이터의 양이 방대해 지면서, 이질적이고 분산된 웹 상의 데이터들을 통합하여 이용하려는 요구가 커지고 있다. 데이터의 통합은, 각 데이터의 스키마를 통합하여 단일화된 스키마를 만들고 통합된 스키마에 질의를 하여 원하는 결과를 얻는 것으로 이를 수 있다. 이러한 스키마 통합의 필요성은 인터넷 환경이 보편화되고 정보의 양이 방대해 지면서 웹 데이터를 대상으로 하여 더욱 커지게 되었다. 본 논문에서는 XML의 새로운 스키마 언어인 XML Schema를 이용한 스키마 통합시에 발생하는 스키마 충돌의 포괄적인 분류와, 이때 발생하는 충돌을 해결하고 통합 스키마를 작성하기 위한 기법을 제안한다.

  • PDF