• Title/Summary/Keyword: XML 색인

Search Result 110, Processing Time 0.024 seconds

Design and Implementation of a SGML/XML Document Retrieval System (SGML/XML 검색 시스템의 설케 및 구현)

  • Ko, Seung-Kyu;Cho, Seung-Ki;Choy, Yoon-Chul;Koh, Kyun
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.99-102
    • /
    • 2000
  • 이기종 간의 문서 교환 표준으로 제안되 SGML은 문서의 구조정보를 표현할 수 있는 장점으로 인해 CALS(Commerce At Light Speed), EC(Electronic Commerce), EDI(Electronic Data Interchange), 전자 도서관(Digital Library) 등 여러 분야에서 사용되고 있다. 이렇게 SGML이 여러 분야에서 사용됨에 따라 많은 SGML 문서 중에서 원하는 문서를 효율적으로 찾아줄 수 있는 검색 시스템의 필요성이 증가하고 있다. 이에 본 연구실에서는 기본적인 구조 검색을 지원하는 SGML 문서 관리시스템을 기개발하였다. 그러나 이 시스템은 구조 검색을 효과적으로 지원하기 못하기 때문에 본 연구에서는 구조 검색의 기능을 정의하고, 이를 지원하는 새로운 구조 질의어를 정의하였다. 또한 이러한 구조 검색을 효과적으로 지원하기 위한 구조 색인을 정의하였다. 그리고 구조 검색 방식으로 세가지 방식을 각각 구현 및 실험하여 그 중에서 성능이 뛰어난 절충식을 이용하여 검색 시스템을 구현하였다.

  • PDF

A Study on the Selection of National e-Document Format (국가 전자 공문서 포맷 선정에 관한 소고)

  • Ahn, Seung-Hwan;Nam, Young-Joon
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2004.08a
    • /
    • pp.49-54
    • /
    • 2004
  • 본 연구에서는 전자문서 생성과 보관을 위한 전자자원 형식을 설정할 때 필요한 고려사항을 제안하였다. 이는 전자정부구현을 통한 국가정보와 지식의 공유환경 개발에 기본 요체이다. 조사결과, 국가전자문서 형식은 활용을 위한 기준과 보존을 위한 기준으로 구분된다. 전자의 경우, 고려사항은 문서 변환과 문서 암호화, 데이터 객체 관리, 색인 생성, 워터마크, 국가 XML과 연동하는 표준 데이터기술, 메타데이터 관리 등이 포함된다. 후자의 경우, 고려 사항은 문서 암호화와 디지털 저작물 관리요소, 파일 사이즈(압축 효율) 등이 포함된다. 활용과 보존적 측면에서 공동으로 고려할 것은 행정자치부에서 권고하는 행정기관의 전자문서시스템 규격${\lrcorner}$ , ${\ulcorner}$행정기관간 전자문서유통 표준${\lrcorner}$ , ${\ulcorner}$전자문서시스템과 행정정보시스템간 연계표준${\lrcorner}$ 이다.

  • PDF

Real-time highlight indexing of live broadcast soccer game (축구 경기의 실시간 하이라이트 색인기법)

  • 김명훈;김혁만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.199-201
    • /
    • 2004
  • 디지털 방송 환경의 메타데이타 서비스 중에서도 가장 혁신적인 것이 하이라이트(highlight)메타데이타 서비스이다. 하이라이트 메타데이타를 생성하기 위해서 시각율동을 이용한 샷경계 검출 알고리즘을 사용해 스포츠 경기의 하이라이트 시간구간을 결정하고, 하이라이트 표시기에서 하이라이트를 설명하는 간단한 주제어를 부가한다. 그리고 하이라이트 템플릿을 이용해 계층구조를 생성하고 하이라이트에 부가된 하이라이트 주제어에 따라 계층 구조의 적절한 위치에 삽입하고. 하이라이트 계층구조는 MPEG-7 표준 스키마에 따라 xml로 서술한다 하이라이트 메타데이타 서비스를 받는 시청자들은 매우 짧은 시간에 이미 방영된 스포츠 경기의 중요 장면들을 모두 볼 수 있다.

  • PDF

A Study on dynamic RSS channel generator development to support Selective Dissemination of information Service (SDI 서비스를 위한 동적 RSS 채널 생성기 개발)

  • Hyun, mi-hwan;Lee, sang-gi;Yoo, su-hyeon;Yae, yong-hee
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.720-725
    • /
    • 2009
  • SDI(Selective Dissemination of Information) is on demand service to inform to the user applies a service after inputting a search strategy, when new information is obtained. This Paper propose the ways to develope the dynamic RSS channel generator for supporting SDI service. The RSS which is a kind of syndication technology enables a part or the whole of the content which it provides from web site to be able to be used in different service. It is protocol to summarize and share various contents on web site. Also, the users register the channel RSS to the RSS aggregator system and recommend it. It can drive to share of knowledge between researchers.

  • PDF

Design and Implementation of Information Service System using the EPC on RFID Tag (전자 태그 기반 전자 상품 코드를 이용한 정보 서비스 시스템의 설계 및 구현)

  • Lee, Seung-ju;Lee, Myeong-Hwan;Yun, Yeo-Chang;Kim, Tae-Won;Park, Jong-ho;Shin, Young-hark
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1136-1139
    • /
    • 2012
  • 본 연구에서는 EPCIS(전자상품코드 정보 서비스) 시스템의 요구사항인 추상화, 고성능, 확장성, 상호 운용성을 기반으로 EPCIS 시스템의 구조를 설계하고 구현한다. EPCIS 시스템의 추상화를 위해 기존에 존재하는 다양한 데이터 베이스 시스템과 상호 운용을 위한 공통 인터페이스를 구현하고 내부적으로 확장 질의 인터페이스, 공통 질의 언어를 가진다. 연속 질의 처리 시간을 감소 시키고 중복된 결과를 효과적으로 처리하기 위한 연속 질의 처리 모듈을 구현한다. 또한 RFID(전자 태그)의 이력 추적 질의의 고성능을 지원하기 위해 RFID 환경에 최적화된 색인 기술과 질의 처리를 위한 구성 요소(Component)를 추가하여 EPCIS 시스템의 고성능 질의 처리를 가능하게 한다. 또한 확장성을 위해 저장소(EPCIS Repository) 관리자를 구현하여 비즈니스 이벤트의 메타 데이터의 스키마를 정의하여 새로운 종류의 비즈니스 이벤트를 쉽게 등록하고 사용할 수 있도록 하였다. 또한 기업의 응용 시스템과 협력 기업간에 정보 교환을 위해서 EPC 글로벌에서 제시하는 웹 서비스를 지원하며 표준 데이터 형식인 확장성 생성 언어(XML)를 사용한다.

Design and Implementation of a Structure and Content-based Multimedia Document Retrieval System (구조 및 내용-기반 멀티미디어 문서검색 시스템의 설계 및 구현)

  • Jin, Du-Seok;Lee, Jeong-Jae;Chang, Jae-Woo
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.11
    • /
    • pp.3341-3355
    • /
    • 2000
  • 최근 멀티미디어 문서의 개수가 기하 급수적으로 증가함에 따라, 사용자가 요구하는 멀티미디어 문서를 보다 효과적으로 저장 및 검색할 수 있는 멀티미디어 문서 검색 시스템을 개발하는 것이 필요하다. 본 논문에서는 XML로 정의된 문서를 문서 구조 및 이미지 내용을 기반으로 보다 효율적으로 검색할 수 있는 시스템을 설계 및 구현한다. 효율적인 구조-기반 검색을 지원하기 위해서 구조 인덱스를 o2store 저장 시스템을 사용하여 구현한다. 아울러 내용-기반 검색을 지원하기 위해서 X-트리에 기반한 효율적인 고차원 색인구조를 구현한다. 마지막으로 구현된 멀티미디어 문서검색 시스템을 검색시간, 저장시간, 부가 저장 공간의 관점에서 성능평가를 수행한다.

  • PDF

A Study of Development on technique for document & image unite (웹 기반 영상과 문서의 자동결합기법에 관한 연구)

  • Na, Jong-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.187-190
    • /
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

  • PDF

Automatic Summary Method of Linguistic Educational Video Using Multiple Visual Features (다중 비주얼 특징을 이용한 어학 교육 비디오의 자동 요약 방법)

  • Han Hee-Jun;Kim Cheon-Seog;Choo Jin-Ho;Ro Yong-Man
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.10
    • /
    • pp.1452-1463
    • /
    • 2004
  • The requirement of automatic video summary is increasing as bi-directional broadcasting contents and various user requests and preferences for the bi -directional broadcast environment are increasing. Automatic video summary is needed for an efficient management and usage of many contents in service provider as well. In this paper, we propose a method to generate a content-based summary of linguistic educational videos automatically. First, shot-boundaries and keyframes are generated from linguistic educational video and then multiple(low-level) visual features are extracted. Next, the semantic parts (Explanation part, Dialog part, Text-based part) of the linguistic educational video are generated using extracted visual features. Lastly the XMI- document describing summary information is made based on HieraTchical Summary architecture oi MPEG-7 MDS (Multimedia I)escription Scheme). Experimental results show that our proposed algorithm provides reasonable performance for automatic summary of linguistic educational videos. We verified that the proposed method is useful ior video summary system to provide various services as well as management of educational contents.

  • PDF

GWB: An integrated software system for Managing and Analyzing Genomic Sequences (GWB: 유전자 서열 데이터의 관리와 분석을 위한 통합 소프트웨어 시스템)

  • Kim In-Cheol;Jin Hoon
    • Journal of Internet Computing and Services
    • /
    • v.5 no.5
    • /
    • pp.1-15
    • /
    • 2004
  • In this paper, we explain the design and implementation of GWB(Gene WorkBench), which is a web-based, integrated system for efficiently managing and analyzing genomic sequences, Most existing software systems handling genomic sequences rarely provide both managing facilities and analyzing facilities. The analysis programs also tend to be unit programs that include just single or some part of the required functions. Moreover, these programs are widely distributed over Internet and require different execution environments. As lots of manual and conversion works are required for using these programs together, many life science researchers suffer great inconveniences. in order to overcome the problems of existing systems and provide a more convenient one for helping genomic researches in effective ways, this paper integrates both managing facilities and analyzing facilities into a single system called GWB. Most important issues regarding the design of GWB are how to integrate many different analysis programs into a single software system, and how to provide data or databases of different formats required to run these programs. In order to address these issues, GWB integrates different analysis programs byusing common input/output interfaces called wrappers, suggests a common format of genomic sequence data, organizes local databases consisting of a relational database and an indexed sequential file, and provides facilities for converting data among several well-known different formats and exporting local databases into XML files.

  • PDF

A study on the improving and constructing the content for the Sijo database in the Period of Modern Enlightenment (계몽기·근대시조 DB의 개선 및 콘텐츠화 방안 연구)

  • Chang, Chung-Soo
    • Sijohaknonchong
    • /
    • v.44
    • /
    • pp.105-138
    • /
    • 2016
  • Recently with the research function, "XML Digital collection of Sijo Texts in the Period of Modern Enlightenment" DB data is being provided through the Korean Research Memory (http://www.krm.or.kr) and the foundation for the constructing the contents of Sijo Texts in the Period of Modern Enlightenment has been laid. In this paper, by reviewing the characteristics and problems of Digital collection of Sijo Texts in the Period of Modern Enlightenment and searching for the improvement, I tried to find a way to make it into the content. This database has the primary meaning in the integrating and glancing at the vast amounts of Sijo in the Period of Modern Enlightenment to reaching 12,500 pieces. In addition, it is the first Sijo data base which is provide the variety of search features according to literature, name of poet, title of work, original text, per period, and etc. However, this database has the limits to verifying the overall aspects of the Sijo in the Period of Modern Enlightenment. The title and original text, which is written in the archaic word or Chinese character, could not be searched, because the standard type text of modern language is not formatted. And also the works and the individual Sijo works released after 1945 were missing in the database. It is inconvenient to extract the datum according to the poet, because poets are marked in the various ways such as one's real name, nom de plume and etc. To solve this kind of problems and improve the utilization of the database, I proposed the providing the standard type text of modern language, giving the index terms about content, providing the information on the work format and etc. Furthermore, if the Sijo database in the Period of Modern Enlightenment which is prepared the character of the Sijo Culture Information System could be built, it could be connected with the academic, educational contents. For the specific plan, I suggested as follow, - learning support materials for the Modern history and the national territory recognition on the Modern Age - source materials for studying indigenous animals and plants characters creating the commercial characters - applicability as the Sijo learning tool such as Sijo Game.

  • PDF