• Title/Summary/Keyword: Web-based Retrieval

Search Result 459, Processing Time 0.021 seconds

XML을 위한 효율적인 저장구조 및 인덱싱 기법설계 (Design of Efficient Storage Structure and Indexing Mechanism for XML Documents)

  • 신판섭
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.87-100
    • /
    • 2004
  • 최근에 인터넷의 급속한 발전과 더불어 대량의 정보를 효과적으로 표현 및 교환할 수 있는 새로운 데이터 표준으로 XML (extensible Markup Language)이 제안되었으며, XML 문서에 대한 저장과 인덱싱에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 실시간 XML 문서 처리에 효율적인 주기억장치 기반의 XML 전용 저장 시스템을 설계하고, 사용자 질의에 포함된 엘리먼트 타입 정보를 이용하여 XML 문서트리에 대한 순회를 최소화시킬 수 있는 구조적 검색 기법을 설계한다 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조와, 링크 정보를 가지고 있는 XML 문서의 질의 처리를 위해 XLink 표준을 준수하여 테이블 형식의 링크 정보 인덱스 구조를 설계한다.

  • PDF

이미지와 문서 분석을 통한 개인 정보 자동 검색 시스템 (Auto Detection System of Personal Information based on Images and Document Analysis)

  • 조정현;안철웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.183-192
    • /
    • 2015
  • 본 논문에서는 통신 판매사에서 사용하는 문서와 이미지 파일에서 개인 정보의 유출을 방지할 수 있는 개인 정보 자동 검색(PIAD, Personal Information Auto Detection) 시스템을 제안한다. 제안하는 시스템은 개인 정보를 포함하는 신분증과 계약서 이미지를 자동으로 검색하고 그 결과를 사용자에게 전달하고, 문서상의 개인 정보 또한 검출할 수 있다. 본 시스템은 빠르고 정확한 검색을 위하여 선별 과정과 분석 과정으로 나뉘고, 분석 과정은 SURF, 침식과 팽창, FindContours 알고리즘들을 사용한다. 제안하는 PIAD 시스템은 272장의 입력 이미지들 중 267장을 선별 및 검출함으로써 98% 이상의 정확도를 보였다.

XML 문서의 구조와 내용을 고려한 유사도 측정 (Similarity Measure based on XML Document's Structure and Contents)

  • 김우생
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1043-1050
    • /
    • 2008
  • XML(Extensible Markup Language)은 인터넷 상에서 데이터 표현과 교환을 위한 표준으로 자리 잡고 있다. 웹의 발전과 함께 XML문서들이 정보 검색, 문서 관리, 데이터 마이닝 등의 응용에서 폭 넓게 사용되면서 구조적으로 정보가 풍부한 이러한 문서들을 자동으로 처리하고 검색하는 기술들이 요구되고 있다. 본 연구에서는 XML 문서 의 구조와 내용을 고려하여 유사한 문서들을 검색하는 새로운 방법을 제안한다. XML 문서의 구조적 유사성은 간단한 스트링 매칭 기법으로 찾고, 문서 내용의 유사성은 문서 요소(element)들의 이름과 경로를 고려한 가중치를 통해 찾는 방법으로 전체의 시간 복잡도는 비교되는 두 문서의 크기에 선형적으로 비례한다.

  • PDF

MPEG-7 시각 정보 기술자와 텍스트 정보를 이용한 내용 기반 웹 이미지 검색 시스템 (A Content based Web Image Retrieval System using MPEG-7 Visual Descriptors and Textual Information)

  • 박주현;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.232-234
    • /
    • 2006
  • 인터넷 기술의 발달과 디지털 카메라와 같은 디지털 미디어 생산 장비의 발달로 WWW에 이미지 데이터의 양이 급격하게 늘어나면서 웹 이미지에 대한 효율적인 검색에 대한 요구가 증가하고 있다. 본 논문에서는 사용자의 다양한 검색 요구를 만족시킬 수 있도록 기존의 텍스트 기반의 검색과 시각 정보 기반의 검색을 병합하여 수행할 수 있는 웹 이미지 검색 시스템을 설계하고 구현한다. 제안한 웹 이미지 검색 시스템은 웹 이미지 수집 및 검색정보 추출 도구. 검색 서버. 그리고 검색 클라이언트로 구성된다. 웹 이미지 수집 및 검색 정보 추출 도구는 웹에서 이미지를 수집하여 이미지가 속해있는 웹 문서 구조를 이용하여 적절한 키워드를 선택하며 시각 정보 기반의 검색을 지원하기 위해 MPEG-7 시각 정보 기술자(1)를 추출한다. 빠른 검색을 위해 추출된 텍스트 정보는 상용 데이터베이스에 저장되며 MPEG-7 시각 정보 기술자는 고차원 데이터 색인 방법인 HBI (Hierarchical Bitmap Index)(2)를 사용하여 색인 정보를 만들어 사용한다. 검색 클라이언트는 사용자가 각 검색 요소에 가중치를 부여하여 검색 할 수 있도록 하며 원하는 검색 결과를 얻을 때까지 반복하여 검색할 수 있는 연관 피드백 과정도 포함한다.

  • PDF

철학 디지털 지식 자원의 효과적인 구축 방향에 대한 연구 (A Study of Effective Creating Methods of Philosophy Digital Knowledge Resources)

  • 최병일;정현숙
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.39-51
    • /
    • 2005
  • 철학의 연구는 과거의 연구 성과에 대한 지식을 축적하고 이를 재구성한 다음 새롭게 해석하는 과정이다. 철학 디지털 지식 자원은 연구 성과의 축적 및 검색을 지원함으로써 철학 연구에 있어서 필수 불가결한 요소가 되었다. 본 논문에서는 국내외 철학 디지털 지식 자원의 구축 현황에 대한 조사 결과를 소개하고 이들 철학 디지털 지식 자원이 가지는 문제점과 개선 방안에 대해 서술한다. 또한 온톨로지 데이터 모델인 토픽맵을 기반으로 철학 온톨로지를 구축함으로써 철학 지식의 계층적 및 연관적 관계 정의와 의미 기반 지식 검색이 가능함을 보인다.

  • PDF

분산 시각미디어 검색 프레임워크를 위한 모니터링 시스템 (The Monitoring System for Semantic Web based Visual Media Retrieval Framework)

  • 심준용;김세창;원재훈;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.178-180
    • /
    • 2006
  • 기존의 Ontology를 이용한 이미지 검색 시스템이나. 간단한 구조를 가진 메타데이터 기반의 분산 이미지 검색 시스템들의 단정들을 극복하기 위해 다양한 이미지 제공자들의 자율성을 보장하면서, 시맨틱 기반의 이미지 검색을 지원하는 분산 시각미디어 검색 프레임워크가 제안되었다. 하지만 제안된 프레임워크에서는 Visual Media Data를 제공하는 Provider와 클라이언트의 Query를 처리해서 Provider에게 전달하는 Broker 사이의 연결 상태에 대한 신뢰성이 보장되지 않았고, 다수의 클라이언트 접속에 의해 발생하는 Broker 내부 컴포넌트들의 Overhead 문제를 효과적으로 해결할 수 없었다. 본 논문에서는 기존의 프레임워크에 Monitoring 시스템을 도입하여 Broker 내부 컴포넌트들의 수행시간을 측정하여 저장함으로써, 다수의 클라이언트 요구에 의해서 Overhead가 발생하는 컴포넌트들을 Monitoring 할 수 있고, Provider의 연결 상태를 정기적으로 확인하여 Broker 내부에 등록되어 있는 Provider의 도메인 리스트를 서버 상태가 확인된 리스트로 업데이트 시켜줌으로써 연결 상태에 대한 신뢰성을 제공할 수 있도록 하기 위한 Monitoring 시스템을 제안한다.

  • PDF

XML 기반 데이터 공유 Interface 설계 및 구현 (A Design and Implementation for Data Sharing Interface in based XML)

  • 김철원;김상영;박종훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.424-428
    • /
    • 2004
  • XML 문서를 저장하고 검색하는 시스템에 관련된 연구가 활발하게 이루어지고 있으며, 이러한 시스템들은 효율적으로 XML 문서를 저장하고 검색할 수 있는 기능에 중점을 둔 경우가 많다. 또한 XML 문서를 저장하기 위해서 특별히 설계된 테이블이나 저장 구조를 가지고 있어서 XML 문서의 내용뿐만 아니라 문서의 구조 정보 둥도 같이 저장할 수 있으며 이를 바탕으로 XML 문서의 내용 검색이나 구조 검색 등을 효율적으로 할 수 있도록 하고 있다. 본 논문은 기존에 사용해 왔던 여러 종류의 데이터베이스들이 갖고 있는 데이터들을 그대로 재활용하여 XML 형식으로 변환하고, 이 XML 파일을 웹에서 공유하여 여러 가지 다양한 Interface를 통해 출력 될 수 있도록 설계, 구현하였다.

  • PDF

러프셋에 기반한 정보필터링 웹에이전트 모듈 설계 (Design of Web Agents Module for Information Filtering Based on Rough Sets)

  • 김형수;이상부
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.552-556
    • /
    • 2004
  • 본 논문은 대용량의 데이터베이스 내에서 유용한 정보를 검색하기 위해 웹 기반하에 적응형 정보추출 에이전트 모듈 설계이다. 인터넷을 통한 정보 검색이 일반화됨에 따라 검색시간의 최소화를 기하면서 사용자의 요구조건에 맞는 유용한 정보 제공이 필요하다. 구축되는 지식베이스 시스템의 스키마 구성요소의 도메인이 이진 검색이 가능한 필드 도메인이 있는 가하면 그렇지 않은 불확실한 도메인도 존재한다. 최초의 대용량 지식베이스에서 사용자의 자연어 질의어에 대해 러프셋의 리턱트롤 통해 최소지식베이스를 생성한 후, 축소된 스키마의 도메인의 불확실성찬 값에 대한 연산을 처리는 퍼지합성 연산처리 모듈에 의해 소프팅 컴퓨팅이 수행토록 설계하였다.

  • PDF

An Image Retrieving Scheme Using Salient Features and Annotation Watermarking

  • Wang, Jenq-Haur;Liu, Chuan-Ming;Syu, Jhih-Siang;Chen, Yen-Lin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권1호
    • /
    • pp.213-231
    • /
    • 2014
  • Existing image search systems allow users to search images by keywords, or by example images through content-based image retrieval (CBIR). On the other hand, users might learn more relevant textual information about an image from its text captions or surrounding contexts within documents or Web pages. Without such contexts, it's difficult to extract semantic description directly from the image content. In this paper, we propose an annotation watermarking system for users to embed text descriptions, and retrieve more relevant textual information from similar images. First, tags associated with an image are converted by two-dimensional code and embedded into the image by discrete wavelet transform (DWT). Next, for images without annotations, similar images can be obtained by CBIR techniques and embedded annotations can be extracted. Specifically, we use global features such as color ratios and dominant sub-image colors for preliminary filtering. Then, local features such as Scale-Invariant Feature Transform (SIFT) descriptors are extracted for similarity matching. This design can achieve good effectiveness with reasonable processing time in practical systems. Our experimental results showed good accuracy in retrieving similar images and extracting relevant tags from similar images.

Optimized Multi Agent Personalized Search Engine

  • DishaVerma;Barjesh Kochar;Y. S. Shishodia
    • International Journal of Computer Science & Network Security
    • /
    • 제24권9호
    • /
    • pp.150-156
    • /
    • 2024
  • With the advent of personalized search engines, a myriad of approaches came into practice. With social media emergence the personalization was extended to different level. The main reason for this preference of personalized engine over traditional search was need of accurate and precise results. Due to paucity of time and patience users didn't want to surf several pages to find the result that suits them most. Personalized search engines could solve this problem effectively by understanding user through profiles and histories and thus diminishing uncertainty and ambiguity. But since several layers of personalization were added to basic search, the response time and resource requirement (for profile storage) increased manifold. So it's time to focus on optimizing the layered architectures of personalization. The paper presents a layout of the multi agent based personalized search engine that works on histories and profiles. Further to store the huge amount of data, distributed database is used at its core, so high availability, scaling, and geographic distribution are built in and easy to use. Initially results are retrieved using traditional search engine, after applying layer of personalization the results are provided to user. MongoDB is used to store profiles in flexible form thus improving the performance of the engine. Further Weighted Sum model is used to rank the pages in personalization layer.