• 제목/요약/키워드: Extraction Metadata

검색결과 41건 처리시간 0.024초

기업간 비즈니스 프로세스의 통합적 등록저장을 위한 메타데이터 스키마 설계 (Metadata Schema Design for Integrated Registry of B2B Business Processes)

  • 김종우;김형도
    • 한국전자거래학회지
    • /
    • 제12권2호
    • /
    • pp.195-217
    • /
    • 2007
  • B2B 등록저장소는 효율적인 기업간 전자거래의 지원을 위해서 거래 기업 또는 잠재적 거래 기업들이 거래 관계를 맺는데 필요한 정보들을 등록하고 검색할 수 있는 공간을 제공한다. 비즈니스 프로세스는 B2B 등록저장소의 주요한 콘텐츠 중에 하나인데, 비즈니스 프로세스가 가지는 복잡성과 동적인 특성으로 인해서 표현의 복잡성이 높다. 또한 현재 ebXML BPSS, WSBPEL, BPMN 등 다양한 표현 방식들이 경쟁하고 있다. 본 논문에서는 B2B 등록저장소에 다양한 표현 방식으로 표현된 비즈니스 프로세스 정의를 체계적으로 등록하기 위한 메타데이터 스키마를 제시한다. 제시된 메타데이터 스키마는 다양한 형식으로 표현된 비즈니스 프로세스 정의를 등록할 수 있도록 확장성을 가지며, 재활용의 수준을 전체 비즈니스 프로세스 수준에서 비즈니스 프로세스의 구성요소 수준으로 확대하도록 설계되었다. 제시된 메타데이터 스키마의 유용성을 확인하기 위하여, 대표적인 XML 기반의 비즈니스 프로세스 정의 언어인 ebXML BPSS과 WSBPEL로 표현된 비즈니스 프로세스의 메타데이터 추출을 예시적으로 설명한다.

  • PDF

미디어 초개인화 추천을 위한 YCrCb 컬러 모델 분석을 통한 영상의 메타데이터 추출에 대한 연구 (A Research on Image Metadata Extraction through YCrCb Color Model Analysis for Media Hyper-personalization Recommendation)

  • 박효경;용성중;유연휘;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.277-280
    • /
    • 2021
  • 최근 높은 접근성을 기반으로 다양한 콘텐츠가 양산됨에 따라 미디어 콘텐츠 시장이 더욱 활성화되고 있다. 사용자들은 취향에 맞는 콘텐츠를 찾고자 하며, 각 플랫폼에서 콘텐츠의 개인화 추천을 위해 경쟁하고 있다. 효율적인 추천시스템을 위해서는 양질의 메타데이터가 필요하다. 기존의 플랫폼들은 영상의 메타데이터를 사용자가 직접 입력하는 방식을 취하고 있다. 이는 많은 양의 데이터를 처리하는 데에 시간과 비용을 낭비하게 할 것이다. 본 논문에서는 미디어 초개인화 추천을 위해서 영화예고편을 바탕으로, 영상의 YCrCb 컬러 모델을 기반으로 키프레임을 추출하고, 인공지능의 지도학습을 통해 영화 장르를 구별하고 추후 메타데이터 생성을 위한 활용방안을 제안하고자 한다.

  • PDF

전자문서관리시스템의 공문서 영구보존을 위한 메타데이터 요소 설정에 관한 연구 (A study on Extraction of Metadata Elements for long-Term Preserving Official Document in EDMS)

  • 유정림
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.125-132
    • /
    • 2005
  • 본 연구는 공공기관에서 생산되는 기록물로서 가장 일반적이고 대표적인 공문서의 장기보존과 접근을 위한 상호운용성을 갖춘 보존 메타데이터 요소를 설정하는데 그 목적이 있다. 구체적으로는 기록물관리 표준인 ISO 15489에서 제안하는 메타데이터 요소와 우리나라의 메타데이터 요소의 비교분석을 통해 전자문서관리시스템의 최고 핵심인 공문서의 보존 메타데이터 항목을 연구하였다. 이는 향후 우리나라 환경에 적합한 표준화된 기록물 보존 메타데이터를 구축하는데 유용한 기초 자료로 활용할 수 있을 것이다.

  • PDF

태그 서열 위치와 경사 부스팅을 활용한 한국어 웹 본문 추출 (Korean Web Content Extraction using Tag Rank Position and Gradient Boosting)

  • 모종훈;유재명
    • 정보과학회 논문지
    • /
    • 제44권6호
    • /
    • pp.581-586
    • /
    • 2017
  • 웹 문서를 자동으로 수집하면 대량의 정보를 손쉽게 모을 수 있다. 이러한 정보 수집 과정을 위해 웹 문서에서 메뉴, 광고 등 불필요한 정보를 제거하고 본문을 자동으로 추출할 필요가 있다. 특히 한국어 웹문서는 영어권과 달리 메타데이터가 포함된 경우가 드물고 디자인이 복잡하여 한국어 웹에 맞는 자동 본문 추출 방법이 필요하다. 기존의 본문 추출 방법은 주로 본문 블록의 문자적, 구조적 특성을 활용한다. 시각적 특성을 처리하기 위해서는 렌더링, 이미지 처리 등에 많은 계산이 필요하기 때문이다. 이 논문에서는 HTML에서 태그 위치를 준-시각적 특성으로 활용한 새로운 본문 추출 방법을 제시한다. 태그 위치는 텍스트의 길이에 따라 가변적이기 때문에 태그 서열 위치라는 특성을 개발하였고, 이를 경사 부스팅과 함께 이용하면 정확한 본문 추출이 가능함을 보인다. 본 논문의 연구 결과는 텍스트 분석에 필요한 양질의 문서 자료를 다양한 형태의 웹페이지에서 자동으로 수집하는 데에 쓰일 수 있다.

DBMS의 웹서비스를 이용한 학습객체 메타데이터 추출 및 통합에 관한 연구 (A Study on the Extraction and Integration of Learning Object Meta-data using Web Service of Databases)

  • 최현종
    • 정보교육학회논문지
    • /
    • 제7권2호
    • /
    • pp.199-206
    • /
    • 2003
  • XML은 데이터 관리와 표현의 유연성으로 인해 웹의 새로운 개발 도구로 자리를 잡아가고 있으며, 컴퓨터 교육에서는 학습객체라는 많은 웹 컨텐츠들을 통합하는 도구로도 사용되고 있다. 하지만 학습객체를 통합하고 관리하는 온라인 학습 시스템을 구현하기에 앞서, 구현 시스템에서 학습객체를 처리하기 위한 메타데이터를 어떻게 저장하고 추출 및 통합하느냐의 연구가 선행되어져야 한다. 따라서 본 연구에서는 3-tier 방식의 온라인 학습 시스템과 메타데이터가 저장된 데이터베이스 서버를 구현할 때 필요한 메타데이터 추출방법의 하나로 DBMS의 웹서비스를 이용하는 방법을 제안하고자 한다. 제안된 방법의 효율성 측정을 위해 MS SQL Server 2000과 Oracle 9i를 대상으로 30여개의 샘플 메타데이터를 저장하고, 이를 추출하는 응답시간을 측정해 보았다. 이 방법을 사용하기 위해서는 추출된 메타데이터를 DOM/SAX 와 같은 XML 처리 파서가 필요하지만, 측정된 결과 비교적 빠른 응답시간을 보여 데이터베이스에 저장된 메타데이터를 추출하고 통합하는 한 방법으로 충분히 사용할 수 있다는 결과를 얻었다.

  • PDF

자연어 처리의 개체명 인식을 통한 기록집합체의 메타데이터 추출 방안 (A method for metadata extraction from a collection of records using Named Entity Recognition in Natural Language Processing)

  • 송치호
    • 한국기록관리학회지
    • /
    • 제24권2호
    • /
    • pp.65-88
    • /
    • 2024
  • 본 연구는 인공지능의 하위분야인 자연어 처리(NLP)의 개체명 인식(NER)을 통하여 기록에 내재된 메타데이터 값과 기술 정보를 추출하는 방안에 대한 시험적 연구이다. 연구 대상은 1960~1970년대에 생산된 구로공단 수기 기록물(약 1,200 쪽, 8만여 단어)을 대상으로 하였다. 디지털화를 포함하는 전처리 과정과 함께 기록 텍스트에 대해서 구글의 BERT 언어모델에 기반하여 구현되어 공개된 언어 API를 사용하여 개체명을 인식하였다. 그 결과로 구로공단의 과거 기록에 포함된 173개의 인명과 314개의 조직 및 기관 개체명을 추출할 수 있었고, 이는 기록의 내용에 대한 직접적인 검색어로 사용될 수 있다고 기대된다. 그리고 자연어 처리의 이론적 방법론을 반·비정형의 텍스트로 이루어진 실제 기록물에 적용할 때 발생하는 문제점을 파악하여 해결 방안과 고려해야 할 시사점을 제시했다.

Research of Vehicle Navigation Based Video-GIS

  • Feng, Jiang-Fan;Zhu, Guan-Yu;Liu, Zhao-Hong;Li, Yan
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.39-44
    • /
    • 2009
  • In order to make the effect of the navigation system more direct, the paper proposes a thought of vehicle navigation system based on Video-GIS. A semantic framework has been defined whose core is focused on the integration and interaction of video and spatial information, which supports full content retrieval based on multimodal metadata extraction and fusion, and supports kinds of wireless access mode. Furthermore, requirements of prototype system are discussed. Then the design and implementation of framework are discussed. Next, describe the key ideas and technologies involved. Finally, we point out its future research trend.

  • PDF

협업적 제품 거래 환경에서 STEP 기반의 제품정보 추출 시스템 (Product Information Extraction System Based on STEP in CPC Environment)

  • 김준형;박상호;김현
    • 대한기계학회:학술대회논문집
    • /
    • 대한기계학회 2003년도 추계학술대회
    • /
    • pp.1840-1845
    • /
    • 2003
  • Collaborative product commerce (CPC) supports a collaboration that a global enterprise and customer related to life cycle of product share product information and a collaboration process for the collaboration, and integrating applications. In this paper, we use common data schema in order to solve a interoperability problem about shared product information between enterprises. And we map to common data schema from each other different data format. Therefore we implement CPC Adaptor in order to integrate distributed product information.

  • PDF

웹에서 축출된 정보를 이용한 축구 경기의 시맨틱 인덱싱 (Semantic Indexing for Soccer Videos Using Web-Extracted Information)

  • ;김명훈;설상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.41-45
    • /
    • 2007
  • The rapid growing of video content production leads to the necessity of developing more complex indexing systems in order to efficiently allow searching, retrieval and presentation of the desired segments of videos. This paper presents a method for indexing soccer video through automatic extraction of information from internet. The proposed paper defines a metadata structure to formally represent the knowledge of soccer matches and provides an automatic method to extract semantic information from web-sites. This approach improves the capability to extract more reliable and richer semantic Information for soccer videos. Experimental results demonstrate that the proposed method provides an efficient performance.

  • PDF

협업적 제품 거래 환경에서 STEP 기반의 제품정보 추출 시스템 (Product Information Extraction System Based on STEP in CPC Environment)

  • 박상호;김준형;김현
    • 대한기계학회논문집A
    • /
    • 제28권5호
    • /
    • pp.648-653
    • /
    • 2004
  • Collaborative product commerce (CPC) supports a collaboration that a global enterprise and customer related to lift cycle of product share product information and a collaboration process for the collaboration, and integrating applications. In this paper, we use common data schema in order to solve a interoperability problem about shared product information between enterprises. And we map to common data schema from each other different data format. Therefore we implement CPC Adaptor in order to integrate distributed product information.