• 제목/요약/키워드: 데이터통합기법

검색결과 719건 처리시간 0.027초

Fact constellation 스키마와 트리 기반 XML 모델을 적용한 실험실 레벨의 단백질 데이터 통합 기법 (An Approach for Integrated Modeling of Protein Data using a Fact Constellation Schema and a Tree based XML Model)

  • 박성희;이영화;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.519-532
    • /
    • 2004
  • 유전자 및 단백질간의 복잡한 상호작용에 의해 기능이 결정되는 생명정보 데이터의 특성으로 인하여 생명정보 데이터 분석을 위해서는 이질적인 데이터를 통합적으로 분석할 수 있는 통합시스템이 요구된다. 따라서 이 논문에서는 생물학 실험실 레벨에서 단백질 구조 관련 데이터를 통합할 수 있도록 XML 모델기반에 웨어하우스 미디에이터 통합시스템을 제안한다. 제안 시스템은 fact constellation 모델을 기반하여 이질적인 소스에 대한 통합 모델링을 진행하고 통합 스키마를 XML 스키마로 변환하여 유지한다. 또한 통합 데이터베이스에 포함된 소스 데이터의 변경 및 출처에 대한 추적 관리를 위해 데이터의 점진적 갱신방법과 서열에 대한 버전관리를 이용한다. 실제로 이 시스템을 단백질 구조(PDB), 서열(Swiss-Prot)과 도메인 분류데이터(CATH) 통합에 적용한 통합 모델링 과정을 보여준다.

GSN 기반 DB통합 모델에서의 data value 이질성 해결 기법 (A Data Value Heterogeneity Solving Method In A GSN Based DataBase Integration Model)

  • 홍종하;박성공;이종옥;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.331-333
    • /
    • 2001
  • 분산되고 이질적인 환경에서의 정보 소스들을 통합하려는 노력은 끊임 없이 계속되어 왔다. 이질적인 다중 정보소스로부터 추출된 정보를 통합하는 도구를 개발하는 것은 인터넷 기반에서 다양한 정보들을 실시간으로 사용할 수 있다는 측면에서 아주 흥미로운 일이다. 이러한 도구를 개발하는데 있어서의 주된 문제점은 서로 다른 정보소스에 존재하지만 실제적으로는 같은 실세계의 개념을 가지고 있는 정보를 어떻게 효과적으로 표현할 것인가 하는 것이다. 이러한 의미적 이질성을 해결하기 위해서 WordNet이나 Common Thesaurus 등을 이용한 개념 기반의 접근방법이 많이 제안되었다. 하지만 이들은 스키마 이질성을 해결하는 방법을 제시 할 뿐, 데이터의 이질성을 해결 하는 방법은 보여주지 않는다. 본 논문에서는 GSN(Global Semantic Network)을 이용해서 스키마 이질성을 해결해야 데이터베이스 시스템에서 발생하는 데이터 이질성의 예를 제시하고 이러한 데이터 이질성을 해결할 수 있는 기법을 제안한다.

  • PDF

SOA 기반 서비스 사이의 오류 데이터 정제 서비스 개발 (Developing dirty data cleansing service between SOA-based services)

  • 지은미;최병주;이정원
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.829-840
    • /
    • 2007
  • 현재까지 오류 데이터를 정제하는 기법은 여러 소스로부터 대량의 데이터를 통합하여 데이터베이스에 저장되어 있는 데이터의 품질을 관리함으로써 의미 있는 정보를 추출하기 위함이었다. 급변하는 비즈니스 환경과 무한경쟁 사회에서 지속적으로 생존하려면 환경 변화에 빠르게 대처해야 한다. 최근 시스템의 요구사항이 복잡해짐에 따라 대규모의 분산 시스템을 통합 구축하기 위한 서비스 기반 구조 (Service Oriented Architecture)로 확산되고 있으며, 여기에서도 각 서비스간의 데이터 정제기법을 통한 신뢰성 있는 데이터 교환이 필수적이다. 따라서 본 논문에서는 서비스들이 하나의 시스템으로 통합되는 과정에서 이벤트를 통해 서비스 간에 전송되는 XML데이터의 품질 관리를 수행하여, 이미 통합되어 저장된 데이터베이스 데이터의 오류를 탐지하여 정제하는 것이 아니라 상호 작용하는 서비스간의 데이터 정제에 초점을 두고 SOA를 기반으로 하는 오류 데이터 정제 서비스를 개발한다.

실시간 클라이언트-서버 DBMS에서 효율적인 트랜잭션 처리를 위한 낙관적 캐쉬 일관성 유지 및 동시성 제어 (Optimistic Cache Consistency and Concurrency Control for Efficient Transaction Processing in a Real-Time Client-Server DBMS)

  • 김영성;강현철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권6호
    • /
    • pp.735-751
    • /
    • 1999
  • 클라이언트-서버 DBMS에 대한 기존의 연구는 클라이언트 데이터 캐슁이 캐쉬 일관성 유지에 드는 오버헤드에도 불구하고 시스템의 성능향상에 유용함을 보여주었다 본 논문에서는 시간적 제약을 가지는 실시간 트랜잭션을 처리하는데 있어서도 클라이언트 데이터 캐슁이 실시간 트랜잭션의 마감시간 충족률을 높이는데 유용하다는 것을 보였다. 기존실시간 데이터베이스 시스템에서 동시성 제어 기법과 실시간 트랜잭션 스케쥴링 기법을 통합한 것처럼 , 캐쉬 일관성 유지 및 동시성 제어 기법과 실시간 트랜잭션 스케쥴링 기법을 통합한 낙관적 알고리즘을 제시하고 클라이너트 데이터 캐슁을 지원하지 않는 경우와 그 성능을 비교하였다. 성능 평가 결과데이타의 지역성이 낮은 작업부하에서는 , 클라이언트 캐쉬의 이용으로 인해 마감시간을 어긴 실시간 트랜잭션의 비율 감소가 크지 않았지만(10%이하), 데이터의 지역성이 높은 작업부하에서는 그 감소폭이 컸다. HOTCOLD 작업부하의 경우 클라이언트의 수가 50, 트랜잭션의 데이터 변경률이 20% 일 때 마감시간을 어긴 실시간 트랜잭션의 비율이 약 47%감소하였다.

멀티미디어 데이터 검색을 위한 스키마 설계 및 시스템 구현 (Schema Design and Implementation for Multimedia Data Retrieval)

  • 노승민;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.490-492
    • /
    • 2002
  • 본 논문에서는 효과적인 멀티미디어 데이터 검색을 위하여 기존의 주석과 내용 기반 검색 기법을 보완한 새로운 멀티미디어 데이터 검색 기법과 멀티미디어 데이터 모델을 사용한 통합 멀티미디어 검색 및 주석 시스템을 제안한다. 데이터 모델로는 MPEG-7 표준에 정의 되어있는 멀티미디어 기술 구조(MDS)와 기술 정의 언어인 XML Schema를 사용하였다. 이러한 모델을 기반으로 멀티미디어 데이터를 XML의 계층구조를 이용하여 주석 처리하고 다양한 방법을 통하여 검색을 할 수 있는 멀티미디어 검색 시스템을 구현하여, 실제 실험을 통하여 성능을 평가하였다.

  • PDF

공간 데이터웨어하우스에서 통합된 다차원 개념 계층 지원을 위한 데이터 큐브 색인 (Data Cude Index to Support Integrated Multi-dimensional Concept Hierarchies in Spatial Data Warehouse)

  • 이동욱;백성하;김경배;배해영
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1386-1396
    • /
    • 2009
  • 공간 데이터 웨어하우스에서 의사 결정 지원을 위한 공간 데이터 큐브는 크기가 방대하기 때문에 이를 효율적으로 관리하고 질의 처리의 수행 속도를 높이기 위한 공간 데이터 큐브 색인 기법이 요구된다. 제안된 데이터 큐브 색인 기법들 중 Hierarchical Dwarf는 사실 테이블의 튜플 필드 값의 중복을 이용하여 큐브를 압축하여 저장 비용과 질의응답 속도 면에서는 우수하지만 공간 차원을 지원하지 않으며, OLAP-favored Search 기법은 R-tree기반으로 공간 차원에 대한 계층적 집계 값을 제공하고 공간 OLAP 연산을 지원하지만 공간 및 비공간 차원들을 통합한 의사결정을 지원하지 못한다. 본 논문에서는 통합된 다차원 개념 계층지원을 위한 데이터 큐브 색인을 제안한다. 이는 개념 계층에 대한 정보와 사실 테이블에 지장된 튜플들을 참조하여 각각의 차원에 대해 생성된 개념 계층 트리들이 연결되어 통합된 색인이다. 이 때, 중복되는 개념계층 트리가 존재할 경우 이를 공유함으로써 저장 비용을 줄인다. 특히 제안 기법은 공간 및 비공간 차원이 통합된 개념 계층 트리들을 사용하므로, 공간 및 비공간 차원에 대한 OLAP 연산 비용이 감소한다.

  • PDF

데이터 기반 설계기법 도입에 따른 원전 건설관리체계 개선방향 고찰 (A Study on Improvement of Nuclear Power Plant Construction System According to Data-centric Design Technique Introduction in Korea)

  • 임병기;변수진
    • 에너지공학
    • /
    • 제25권1호
    • /
    • pp.108-112
    • /
    • 2016
  • 본 연구에서는 국내 원전 산업의 데이터 기반 설계기법 전환을 위하여 관련 문헌을 조사하고 데이터 기반 설계기술에 대한 개념을 정립하였다. 또한 국내외 원전 산업 기술동향 분석을 통해 데이터 기반 설계통합시스템 Framework 개발 및 관련 주요기능을 도출하였다. 국내 원전 건설 시 최신 설계통합시스템 적용에 따라 이를 활용하는 제작사, 시공사 및 발주자의 업무수행 방식 또한 전면적인 전환을 위한 원전 건설단계별 업무프로세스 개선방향을 도출하였다. 이는 기자재 3D 모델 통합, 3D CAD 모델생성, 시공검토 Simulation 등 모델기반 현장설계 수행이 가능하며, 현장설계에서 발생하는 모든 설계도면 및 관련 정보가 데이터 기반 3D CAD 시스템으로 통합관리가 가능하여 이를 운영단계에 이관하여 O&M 단계에서 데이터 기반 운영체계가 가능함에 따라 발전소 안전 운영에 향상이 기대된다.

m-유형 공간객체를 위한 $R^m$-tree기반의 mk-최근접질의 처리기법 (mkNN Query Processing Method based on $R^m$-tree for Spatial Objects with m-types)

  • 장동주;안수연;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.45-48
    • /
    • 2011
  • 본 논문에서는 다양한 타입의 위치기반 데이터들을 하나의 R-tree로 통합합 $R^m$-tree의 구조와 이 $R^m$-tree를 이용하여 질의 포인트로부터 각 타입에서 k개의 가까운 위치기반 데이터를 찾는 mkNN(multi-type k nearest neighbor) 질의 처리기법을 제안하였다. 특히, 다양한 타입의 위치기반 데이터들을 각 타입별로 독립된 R-tree로 유지하지 않고, 하나의 $R^m$-tree로 통합하여 관리함으로써 mkNN 질의 처리시 같은 레벨의 공간의 반복탐색을 줄일 수 있도록 고안하였다. 그리고 각 타입 t에 대한 위치데이터를 관리하는 부가적인 타입정보 자료구조로서 위치정보를 담은 TMBR, 데이터 개수정보를 담은 $I_t$-entry를 새로이 고안하여 mkNN질의 처리시 효율적인 휠터링(filtering)과 검색과정이 이루어지도록 하였다.

문서중심 XML 문서를 위한 데이터 모델 (Data Model for Document-Centric XML Document)

  • 김연희;김성완;신판섭;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.25-27
    • /
    • 2001
  • 웹 상의 데이터 표현 및 교환의 새로운 표준으로 인식되어 점차 그 교류의 앙이 중가하고 있는 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 데이터중심 문서의 특성이 두드러지는 XML 문서룬 대상으로 하는 것이 대두분이였다. 그러나 효과적인 XML 문서의 저장 및 검색을 위해서는 XML 문서의 실제 사용 목적이나 그 특성에 따라 XML 문서를 분류하여 각 특성에 맞는 저장, 접근 및 검색 기법을 개발하고 이를 통합한 XML 문서 저장 시스템의 개발이 요구된다. 따라서 본 논문에서는 통합 시스템 개발에서, 인간 이해 중심의 문서적 특성을 가지는 문서중심 문서를 위한 데이더 모델을 제안한다. 제안된 데이터 모델은 루트 노드가 존재하는 방향성과 순서가 있는 그래프 형태를 지원하며, XML 문서의 주요 구성 요소를 지원하는 여러 타입의 노드와 다양한 노드 사이의 관계를 표현하는 링크로 구성되어 XML 문서가 가지는 의미와 구조적 특징이 잗 표현되도록 하였다. 또한 모델링 후 손실되는 정보가 거의 없기 때문에, 다시 XML 문서로 변환하면 원래 XML 문서 그대로 복원되는 장점이 있어 문서중심 문서의 저장 및 검색을 위한 전용XML 저장 시스템에 적합한 데이터 모델이다.

  • PDF

Contextual LSTM 기반 변분 오토인코더를 이용한 이동 경로 예측 (Trajectory Prediction by Using Contextual LSTM based Variational AutoEncoder)

  • 조광호;차재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.587-590
    • /
    • 2020
  • 스마트폰, GPS 장비, 위치 기반 소셜네트워크의 발달로 방대한 이동 경로 데이터 수집이 가능하게 됐다. 이를 통해 다양한 분야에서 GPS 데이터를 가지고 사람의 이동성을 분석하고 POI를 예측하는 기회가 많아졌다. 실생활에서 사람의 이동성은 다양한 상황에 영향을 받지만, 실제 GPS 데이터는 위치, 시간 정보의 수준이다. 따라서 다양한 상황을 내재하는 정보가 사람의 이동성 분석과 POI 예측에 필요하다. 본 논문에서는 POI의 순위, 사용자의 POI 활동, 카테고리 선호도 같은 맥락적 특징을 이용하여 이에 관련된 상황에 맞는 POI 시퀀스를 예측하는 Contextual LSTM 기반 딥러닝 기법을 제안한다. Contextual LSTM은 사람의 이동성에 영향을 주는 시퀀스의 맥락적 특징을 모델에 통합하기 위해 LSTM을 확장한다. 제안된 기법은 HITS 알고리즘과 여러 제약조건 기반으로 추출한 맥락적 특징별로 딥 러닝 모델에 통합하여 각각 POI 시퀀스를 검출했으며, 다양한 맥락적 특징에 대해서 공공 데이터와 수집한 데이터로 평가하였다.