• 제목/요약/키워드: metadata processing technique

검색결과 31건 처리시간 0.025초

인터넷 데이터웨어하우스 구축을 위한 메타데이터 스키마 충돌 제어 (Control of metadata schema conflicts for internet datawarehouse)

  • 김병곤
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.499-507
    • /
    • 2007
  • 인터넷을 통한 웹서비스에 대한 사용자들의 요구가 증가하고 다양해지면서 정보들을 수집하고 통합하여 특정집단 또는 일반인들의 의사결정을 지원하기 위한 인터넷 데이터웨어하우스에 대한 중요성이 갈수록 증대되고 있다. 초기의 인터넷 데이터웨어하우스는 기존의 데이터베이스와 XML을 이용한 형태로 연구되었으나, 정보 표현상의 한계로 인하여 점차 RDFS와 같은 메타데이터 스키마를 이용한 시스템 형태로 변화하고 있다. 인터넷의 특성상 분산된 시스템 환경에서 서로 상이한 메타데이터 스키마들을 통합과 저장이 중요한 요소이다. 그러나, 서로 상이한 스키마간에는 충돌할 수 있는 요소들이 존재하므로 지역 스키마들 간에 발생할 수 있는 의미적, 구조적 충돌을 감지하고 고려하여 저장이나 질의 처리 등에서 완벽한 처리가 가능하도록 시스템을 구성하여야 한다. 본 논문에서는 이와 같이 분산된 환경에서 지역 메타데이터 스키마들 간의 통합시 충돌이 발생하는 경우를 분석하고, 이에 따른 충돌 해결 기법을 제시하여 완벽한 스키마 통합이 가능하도록 한다.

  • PDF

디지털 포렌식을 위한 데이터베이스 블록 크기의 탐지 기법 (Detecting Methods of the Database Block Size for Digital Forensics)

  • 김선경;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.123-128
    • /
    • 2020
  • 디지털 기기 사용이 일반화되면서 수사 과정에서 물적 증거 수집을 위해 디지털 포렌식 기법을 사용한다. 이 중 파일 포렌식 기법은 삭제된 파일을 복구하는 것으로, 여러 개의 파일로 구성된 데이터베이스가 삭제되어도 복구할 수 있다. 그러나 데이터베이스에서 레코드가 삭제된 경우는 파일 복구를 하여도 수정된 레코드 내용이 복원되지 않는다. 이에 삭제된 레코드를 복구하는 기법인 데이터베이스 포렌식이 필요하다. 데이터베이스 포렌식은 데이터베이스 설정 파일로부터 메타데이터를 획득하고, 데이터 파일에서 삭제된 레코드를 복구한다. 그러나 데이터베이스에서 블록 크기와 같은 데이터베이스 메타데이터를 획득하지 못하면 레코드 복구가 어렵다. 본 논문에서는 데이터베이스 메타데이터인 블록 크기를 탐지하기 위한 세 가지 방법을 제안한다. 첫 번째 기법은 블록에 존재하는 빈공간의 최대 크기를 이용하며, 두 번째 기법은 블록이 나타나는 위치를 이용한다. 세 번째 기법은 두 번째 기법보다 더 빠르게 블록 크기를 찾을 수 있도록 개선한다. 실험 결과는 세 가지 탐지 기법 모두 세 종류의 DBMS의 블록 크기를 정확하게 찾을 수 있음을 보인다.

HFS+ 저널 파일 파싱 알고리즘을 이용한 삭제된 파일 복구 기법 향상 방안 (A Study to Improve Recovery Ratio of Deleted File Using the Parsing Algorithm of the HFS + Journal File)

  • 방승규;전상준;김도현;이상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권12호
    • /
    • pp.463-470
    • /
    • 2016
  • 최근 MAC 시스템의 점유율 증가로 MAC 기반 디지털 포렌식 기술의 필요성이 증대되고 있다. 디지털 포렌식 분석 과정에서 시스템 사용자가 의도적으로 증거를 삭제한 경우, 시스템에서 삭제된 파일을 복구하여 혐의를 입증하기도 한다. 이를 위해 파일시스템으로부터 삭제된 파일을 복구하기 위한 연구가 꾸준히 이루어져 왔으며, MAC 기반 파일시스템인 HFS+ 또한 이에 대한 연구가 수행되어왔다. HFS+의 운영 및 구조적 특성상 파일이 삭제되면 해당 파일의 메타데이터가 다른 파일 또는 폴더의 메타데이터에 의해 삭제되기 때문에 주로 시그니처를 활용한 카빙 기법이 사용되어왔다. 하지만 File Content가 파일시스템 상에 분할되어 저장되는 경우, 카빙 기법 또한 파일의 일부분만을 복구하거나 파일 전체를 복구할 수 없었다. 본 논문에서는 HFS+ 저널을 이용한 삭제된 파일의 복구 기법에 대해 소개한다. 이는 기존 연구를 통해 제안된 기법으로 HFS+ 저널에 남아있는 메타데이터를 이용하여 삭제된 파일을 복구하는 기법이다. 하지만 해당 기법은 특정 파일이 복구 대상에서 배제되기 때문에 이에 대한 개선의 여지가 남아있다. 본 연구에서는 HFS+ 저널을 상세히 분석할 수 있는 알고리즘을 제시한다. 또한 해당 알고리즘을 기반으로 추출한 메타데이터를 통해 복구 대상에서 배제되는 파일 없이 삭제된 파일을 복구할 수 있음을 실험을 통해 입증한다.

PDF 파일의 페이지단위 복구 기법 (A Recovery Technique of PDF File in the Unit of Page)

  • 장지원;방승규;한재혁;이상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권1호
    • /
    • pp.25-30
    • /
    • 2017
  • 안티 포렌식 기법 중 하나인 데이터 삭제 기법은 그 행위의 단순함에 비해 포렌식 분석 관점에서의 그 영향력은 상당하다. 학계에서는 데이터 삭제 기법에 대응하여 지속적으로 삭제된 파일 복구 기법에 대해 연구하였으며, 대표적으로 파일시스템 기반 파일 복구 기법과 파일 포맷 기반 복구 기법이 존재한다. 파일이 삭제되고 난 후 해당 파일의 메타데이터가 파일시스템 상에 존재한다면, 이를 이용하여 손쉽게 파일을 복구할 수 있으나, 메타데이터가 존재하지 않는 경우엔 시그니처 기반 카빙 기법을 이용하여 파일을 복구하거나 파일 포맷에 기반한 복구기법을 적용해야 한다. 이때 파일 포맷에 기반한 복구기법은 파일 구조에 대한 분석과 복구 가능한 기법이 제시되어야 한다. 본 논문은 PDF 파일의 구조적 특성에 기반한 삭제된 PDF 파일의 페이지 단위 복구 기법을 제시한다. 해당 기법은 PDF 파일의 1개 페이지를 구성하는 Page Object의 태그 값을 이용한다. 각 태그 값을 일종의 시그니쳐로서 활용하여 Object를 추출하며, 추출된 Object들을 분석하여 PDF파일의 메타데이터를 재조합한 후 페이지 단위로 재구성한다. 페이지 단위로 복구한다는 것은 삭제된 PDF 파일이 온전하지 않더라도 PDF 파일을 구성했던 일부 페이지라도 복구할 수 있음을 의미한다. 해당 기법을 이용하면 온전하지 않은 상태의 PDF파일에 대한 복구가 가능하다. 이는 디지털 포렌식 분석 관점에서 기존보다 더 많은 데이터를 복구하는데 활용될 수 있다.

A Study on a Distributed Data Fabric-based Platform in a Multi-Cloud Environment

  • Moon, Seok-Jae;Kang, Seong-Beom;Park, Byung-Joon
    • International Journal of Advanced Culture Technology
    • /
    • 제9권3호
    • /
    • pp.321-326
    • /
    • 2021
  • In a multi-cloud environment, it is necessary to minimize physical movement for efficient interoperability of distributed source data without building a data warehouse or data lake. And there is a need for a data platform that can easily access data anywhere in a multi-cloud environment. In this paper, we propose a new platform based on data fabric centered on a distributed platform suitable for cloud environments that overcomes the limitations of legacy systems. This platform applies the knowledge graph database technique to the physical linkage of source data for interoperability of distributed data. And by integrating all data into one scalable platform in a multi-cloud environment, it uses the holochain technique so that companies can easily access and move data with security and authority guaranteed regardless of where the data is stored. The knowledge graph database mitigates the problem of heterogeneous conflicts of data interoperability in a decentralized environment, and Holochain accelerates the memory and security processing process on traditional blockchains. In this way, data access and sharing of more distributed data interoperability becomes flexible, and metadata matching flexibility is effectively handled.

자연어 처리의 개체명 인식을 통한 기록집합체의 메타데이터 추출 방안 (A method for metadata extraction from a collection of records using Named Entity Recognition in Natural Language Processing)

  • 송치호
    • 한국기록관리학회지
    • /
    • 제24권2호
    • /
    • pp.65-88
    • /
    • 2024
  • 본 연구는 인공지능의 하위분야인 자연어 처리(NLP)의 개체명 인식(NER)을 통하여 기록에 내재된 메타데이터 값과 기술 정보를 추출하는 방안에 대한 시험적 연구이다. 연구 대상은 1960~1970년대에 생산된 구로공단 수기 기록물(약 1,200 쪽, 8만여 단어)을 대상으로 하였다. 디지털화를 포함하는 전처리 과정과 함께 기록 텍스트에 대해서 구글의 BERT 언어모델에 기반하여 구현되어 공개된 언어 API를 사용하여 개체명을 인식하였다. 그 결과로 구로공단의 과거 기록에 포함된 173개의 인명과 314개의 조직 및 기관 개체명을 추출할 수 있었고, 이는 기록의 내용에 대한 직접적인 검색어로 사용될 수 있다고 기대된다. 그리고 자연어 처리의 이론적 방법론을 반·비정형의 텍스트로 이루어진 실제 기록물에 적용할 때 발생하는 문제점을 파악하여 해결 방안과 고려해야 할 시사점을 제시했다.

회의 문서의 관계성 메타데이터에 기반한 동적 엔터티 표현 기법 (A Presentation Technique of Dynamic Entities Based on Relative Metadata of Meeting Documents)

  • 류한석;이병철;김진우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.1397-1400
    • /
    • 2006
  • 지식 근로자들은 회의 문서 작업 및 활용에 상당한 시간을 할애하고 있다. 하지만 문서들의 관계를 고려하지 않은 메타데이터의 처리와 기존의 계층적인 네비게이션 방식은 사용자가 한 눈에 여러 문서들의 메타데이터 관계를 파악하기가 어려웠다. 하지만 본 논문에서는 회의 문서의 관계성 메타데이터를 평면적으로 펼쳐 조회할 수 있도록 프로젝트, 회의, 작업 문서들의 관계에 기반한 동적 엔터티 표현 기법을 제안한다. 이를 통해 사용자는 메타데이터의 계층에 대한 내용을 전혀 이해하고 있지 않아도 관련된 정보를 한 눈에 확인 할 수 있게 된다.

  • PDF

의미적 멀티미디어 메타데이터 생성을 위한 MPEG-7 기술기반 주석도구의 개발 (Development of MPEG-7 Description-based Annotation Tool for Production of Semantic Multimedia Metadata)

  • 안형근;고재진
    • 정보처리학회논문지D
    • /
    • 제14D권1호
    • /
    • pp.35-44
    • /
    • 2007
  • 최근 멀티미디어 데이터의 급격한 양적 팽창은 원하는 데이터를 빠르고 정확하게 검색해야 한다는 새로운 과제를 안겨주었다. 이러한 효율적 검색을 위해서 가장 중요한 기반이 되는 것이 바로 멀티미디어 데이터의 적절한 표현이다. 국제 표준으로 제정된 MPEG-7은 바로 이러한 이유로 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본 논문에서 메타데이터 생성을 위한 새로운 접근법을 제안한다. 사용자는 주어진 멀티미디어 컨텐츠를 작은 단위들로 분해를 하고, 분해된 단위들에 시간, 위치 둥과 같은 추가적인 기본정보뿐만 아니라 MPEG-7표준을 따르는 사건, 관계 등과 같은 분류정보를 쉽게 주석할 수 있다. 이 주석의 목적은 자동적으로 의미기술을 만들기 위한 것이고, 이 의미기술에서 노드들은 사건들이고, 링크는 그들 사이의 관계인 하나의 그래프이다. 마지막으로 제안된 기법을 기반으로 의미기술을 위한 주석도구(SMAT)를 구현하였고, 실제 실험을 통하여 성능을 평가하였다. 최종적으로, 제안 도구는 재사용성과 확장성의 두 개의 중요한 타당의 특징이 있다고 말할 수 있다.

다중 이기종 센서를 보유한 Nano-Q+ 기반 센서네트워크에서 메타데이타 라우팅 테이블을 이용한 질의 최적화 (Query Optimization with Metadata Routing Tables on Nano-Q+ Sensor Network with Multiple Heterogeneous Sensors)

  • 남영광;최귀자;이병대;곽광웅;이광용;마평수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권1호
    • /
    • pp.13-21
    • /
    • 2008
  • 일반적으로 센서노드간의 데이타통신은 내부처리나 센싱 작업보다 더 많은 에너지 소모를 요구한다. 본 논문에서는, 내용인지(context-aware) 라우팅 테이블(routing table)을 이용하여 인접한 노드간의 질의 송수신을 위해 필요한 패킷 송신 수를 줄여 질의 최적화를 수행하는 새로운 아이디어를 제안한다. 내용인지 라우팅 테이블에는 현재 노드로부터 도달 가능한 하위노드에서 측정할 수 있는 센서의 종류에 관한 정보가 저장되어 있다. 내용인지 라우팅 정보를 이용하여 각 노드는 자식노드에게 불필요한 질의 송신이나 결과 전달을 차단함으로써 불필요한 패킷 송신의 수를 줄일 수 있다. 본 논문에서 제안한 방법을 바탕으로 한 시뮬레이션에서 최대 약 80%의 성능 효과를 보였다.

6 자유도 전방위 몰입형 비디오의 압축 코덱 개발 및 성능 분석 (Toward 6 Degree-of-Freedom Video Coding Technique and Performance Analysis)

  • 박현수;박상효;강제원
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1035-1052
    • /
    • 2019
  • 최근 몰입형 비디오의 수요가 점차 늘어남에 따라 국제 표준 단체인 MPEG-I에서 전방위 몰입형 비디오의 처리 기술이 활발하게 개발 중이다. 전방위 몰입형 비디오는 사용자 시점의 자유도가 증가함에 따라 비디오 신호의 크기가 급격히 증가하여 효과적인 압축 기술이 필수적이다. 더욱이 사용자의 움직임에 따른 보다 자유로운 시점 변환을 지원하는 6 자유도 (6-Degree-of_Freedom, 6DoF) 비디오의 압축을 위해서는 보다 우수한 부호화 효율을 제공하는 코덱의 개발이 필요하다. 본 논문에서는 ISO/IEC 23090 Part 7 (Metadata for Immersive Media (Video))에서 진행 중인 몰입형 비디오의 압축 표준 프로젝트의 테스트 모델인 TMIV (Test Model for Immersive Video)에 기존 적용된 High Efficiency Video Coding (HEVC)를 최근 차세대 비디오 압축 표준 개발 중인 Versatile Video Coding (VVC)로 대체하여 성능 분석을 수행하고, VVC의 툴 분석으로부터 디블로킹 필터를 TMIV의 패치 아틀라스에 선택적으로 적용하는 것이 부호화 효율을 증대시킬 수 있음을 보인다. VVC 기반의 6 DoF 비디오 코덱의 성능 평가는 본 논문이 최초로 그에 따른 향후 6DoF지원 몰입형 비디오 표준 개발 방향을 제시한다. TMIV의 두 가지 작동 모드인 MIV (Metadata for Immersive Video) 모드와 MIV 시점 모드에서 공통 실험 조건에 명시된 일곱 가지 시퀀스에 대해 전체적으로 실험을 진행하였다. 기존 HEVC를 VVC로 대체함으로써 MIV 모드 방식에서 33.8%, MIV 시점 모드에서 30.2%의 Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다. 이외에도 3차원 비디오의 인지 화질 평가를 위하여 사용하는 평가 지표로 IV-PSNR (Immersive Video PSNR)와 MSSIM (Mean Structural Similarity)를 이용하여 성능을 평가하였다.