• 제목/요약/키워드: 파일 검색

Search Result 618, Processing Time 0.04 seconds

A Fast File Search Technique Using Direct Access of Metadata Area (메타 데이터 영역의 직접 접근을 활용한 고속 파일 검색 기법)

  • Kim, Ye-Seong;Choi, Jong-Wook;Lee, Sung-Jin;Kim, Ji-Hong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.562-565
    • /
    • 2011
  • 데이터와 파일의 개수가 증가함에 따라 효율적인 파일 검색 기법에 대한 요구가 증가하고 있다. 현재까지 제안된 파일 탐색 기법은 탐색 시간이 매우 오래 걸리거나, 미리 인덱싱 과정을 거쳐야 하기 때문에 사용자가 원하는 시점에 빠르고 효율적인 파일 탐색을 제공하기 어렵다는 단점을 지닌다. 본 논문에서는 디스크의 메타 데이터 영역을 직접 접근함으로써 고속의 파일 검색을 가능하게 해주는 효율적인 검색 기법을 제안하고자 한다. 본 기법은 메타 데이터가 서로 비슷한 영역에 위치한다는 파일 시스템의 특징을 활용함으로써 디스크 내의 데이터를 고속으로 탐색하고, 이를 DB로 구성함으로써 실시간 검색을 지원한다. 또한 파일 시스템 내의 변경 사항을 빠르게 추적하여 DB를 업데이트 할 수 있다는 장점을 지닌다. 본 논문에서 제안한 검색 기법을 다수의 시스템에서 평가한 결과 기존의 기법 대비 약 20~50배의 탐색 시간 향상과 10초 미만에 실시간 검색이 가능한 상태를 구성 할 수 있음을 확인 할 수 있었다.

A P2P Flle Search System Using OAI Protocol (OAI 프로토콜을 이용한 P2P 파일 검색 시스템)

  • Im, Su-Jeong;Chang, Tae-Mu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.346-348
    • /
    • 2005
  • 최근까지 개발되어 사용되고 있는 대부분의 P2P 파일 검색 및 공유 시스템들은 파일 이름과 확장자를 이용한 단순 키워드 검색 방식을 취하고 있다. 점점 기술이 발전되고 많은 정보가 쏟아져 나오면서 많은 자료 중에서 필요한 정보를 빠르고 쉽게 찾을 수 있는 능력이 필요하게 되었다. 또한 단순히 파일 검색을 떠나 컨텐츠를 공유하고 배포하는 경우 파일의 이름만을 가지고는 파일의 역할과 내용을 알 수 없어 파일에 대한 정보를 담는 메타데이터에 관한 연구와 그 중요성이 증가하고 있는 상황이다. 본 논문에서는 P2P 파일 공유 및 검색 시스템에서 검색의 정확성과 효율성을 높일 수 있도록 메타데이터를 이용한 파일 검색 시스템을 제안한다. 이를 위해 메타데이터로 자료의 검색이 가능한 OAI 프로토콜을 이용하였고 제안한 시스템을 구현해 실험해보았다.

  • PDF

Retrieval System Using Term Reweighting (용어 가중치 재 산정을 이용한 검색 시스템)

  • 황선욱;김혜정;손기준;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.160-162
    • /
    • 2003
  • 색인 파일은 정보 검색 시스템에서 중요한 구성 요소 중에 하나이다. 스테밍을 하여 색인 파일을 구성하게 되면 파일의 크기를 줄일 수 있고 재현율을 높이는데 효과적이다. 하지만, 과도한 스테밍으로 구성이론. 색인 파일은 원형에 대한 데이터 손실을 가지고 오기 때문에 너무 많은 문서가 검색되어 사용자가 문서를 찾는데 많은 시간이 소요되고 정확률도 떨어진다. 본 논문에서는 정보 검색 시스템에서 검색의 효율성을 높이기 위해 사용하는 색인 파일을 스테밍 한 것과 스테밍 하지 않은 파일로 구성하였다. 스테밍 한 색인 파일은 질의어와 문서 사이의 유사도를 계산하기 위하여 이용되며, 스테밍 하지 않은 파일은 스테밍 했을 때 검색된 문서들 중에서 데이터 손실로 인한 잘 못된 문서 순서를 재조정해 주기 위하여 이용된다. 본 논문에서는 높은 검색 효과를 제공하는 기존의 벡터 공간 모델을 검색 성능 평가 척도 중의 하나인 R-정확률을 이용하여 비교 평가하였다. 본 논문에서 제안하는 시스템이 문서 상위 100위까지에 대하여 일반 벡터 모델 보다 최고 21%의 좋은 성능을 보였다.

  • PDF

Motion Retrieval System Based on Body Animation Markup Language (마크업 언어기반의 모션 검색 시스템)

  • 정현숙;이일병
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.461-465
    • /
    • 2002
  • 현재 모션 캡쳐 데이터는 파일 형태로 존재하며 이들 파일을 관리하기 위해서 문서관리시스템 등을 사용할 수 있다. 그러나 파일 이름만으로는 원하는 모션 데이터를 가지고 있는 모션 캡쳐파일을 검색하기 어렵다. 본 논문에서는 인체 바디 모션을 표현하는 마크업 언어인BAML(Body Animation Markup Language)을 이용하여 모션 캡쳐 파일에 모션 정보를 추가적으로 표현함으로써 모션 캡쳐 파일을 애니메이션 소프트웨어로 실행하기 전에 모션 파일 라이브러리에서 특정 모션을 가지고 있는 모션 캡쳐 데이터 파일을 검색할 수 있는 BAML+ 시스템을 제시하고자 한다. BAML+ 시스템은 모션 캡쳐 데이터의 모션명을 정의하고 모션 변형 시스템에서 모션을 검색하고 편집할 수 있는 컴포넌트들로 구성된다.

  • PDF

Effective Scheme for File Search Engine in Mobile Environments (모바일 환경에서 파일 검색 엔진을 위한 효과적인 방식)

  • Cho, Jong-Keun;Ha, Sang-Eun
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.11
    • /
    • pp.41-48
    • /
    • 2008
  • This study focuses on the modeling file search engine and suggesting modified file search schema based on weight value using file contents in order to improve the performance in terms of search accuracy and matching time. Most of the file search engines have used string matching algorithms like KMP(Knuth.Morris.Pratt), which may limit portability and fast searching time. However, this kind of algorithms don't find exactly the files what you want. Hence, the file search engine based on weight value using file contents is proposed here in order to optimize the performance for mobile environments. The Comparison with previous research shows that the proposed schema provides better.

Design of Efficient P2P Based File Search Algorithm (효율적인 P2P 기반 파일 검색 알고리즘 설계)

  • Baek, Seung-Jae;Ahn, Jin-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.454-456
    • /
    • 2005
  • 최근에 파일 공유 애플리케이션을 개발하는데 있어 클라이언트-서버(client-sewer) 모델의 문제점을 해결하기 위해 피어-투-피어(peer-to-peer) 모델이 각광 받고 있다. 대표적일 P2P 기반 파일 공유 시스템으로 넵스터, 그누텔라등이 있다. 그러나 이 시스템들은 각각 중앙 집중적 제어, 혹은 브로드캐스팅에 의한 과도한 네트워크 트래픽 발생 등 확장성 문제를 발생시킨다. 이런 문제점을 해결하기 위해 울트라피어 및 동적 라우팅 기법을 사용하지만 여전히 rare 파일에 대한 높은 응답시간과 검색의 낮은 신뢰성 문제점들을 해결할 수 없다. 본 논문에서는 popular 파일과 rare 파일에 대한 검색을 구분하여 popular 파일을 기존의 그누텔라 검색 방법을 사용하고 rare 파일 검색을 제안하는 새로운 DHT 알고리즘을 사용하도록 한다. 특히 제안하는 DHT 알고리즘은 기존의 DHT 알고리즘들과 달리 일반 노드가 아닌 울트라피어들만으로 구성함으로서 검색 비용, 노드 조인과 리브 비용, 핑거 테이블의 엔트리 수를 매우 줄임으로서 효과적이고 확장적이라 할 수 있다.

  • PDF

Design and Implementation of TV Serial Drama Retrieval System Based on Synopsis (줄거리에 기반한 TV시리즈물 검색 시스템의 설계 및 구현)

  • Cho, Jin-Pyo;Chun, Young-Woo;Kim, Yu-Seop;Ko, Young-Woong
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1256-1261
    • /
    • 2006
  • 본 논문은 스토리에 기반하여 여러 편의 드라마 동영상 파일 중에서 사용자가 찾고자 하는 파일을 찾아주는 검색 시스템의 설계 및 구현에 대하여 기술한다. 기존의 동영상 검색 방식은 제목 및 주연 배우와 같이 제한적인 검색어에 의한 검색을 제공하고 있으나, 대부분의 드라마 파일은 영화 또는 다른 동영상 파일과 달리 여러 회로 나누어져 있기 때문에 기존의 주연 배우나 제목과 같은 정보만을 가지고 사용자가 원하는 파일을 검색하기 어렵다. 본 논문에서는 드라마의 제작사에서 제공하는 각 회당 스토리를 기본적인 불리안 모델과 결합시켜 사용자가 원하는 회차를 검색하는데 유용한 시스템을 설계 및 구현하였다. 본 논문에서 제시한 방식의 유용성을 보이기 위하여 실제 서비스 되고 있는 드라마를 대상으로 실험을 하였으며, 실험결과 높은 검색 능력을 보이고 있다.

  • PDF

STEER Inverted File Structure for Dynamic Document Insertion/Deletion (문서의 동적 삽입 삭제를 위한 STEER 역파일 구조)

  • 김남일;박영찬;주종철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.174-176
    • /
    • 1998
  • 역파일 구조(inverted file structure)는 검색 속도가 빠르기 때문에 정보검색 시스템의 색인정보 하부 저장구조로 널리 이용되지만 문서의 동적 삭제는 어려운 형태이다. 본 논문에서는 기존역파일 구조에 문서마다 색인어의 포스팅 레코드를 기록한 목록을 유지함으로써 문서의 동적 삭제가 용이하고, 위치정보를 포스팅 레코드에서 분리하여 위치 검색이 효율적인 역파일 구조를 설계한다. 설계된 역파일 구조는 STEER(Structured Entity Element Retrieval) 정보검색 시스템에서 구현되었다.

  • PDF

File Content Retrieval Program Using HashMap-based Trie (HashMap 기반의 트라이를 이용한 파일 내용 검색 프로그램)

  • Kim, Sung Wan;Lee, Woosoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.01a
    • /
    • pp.467-468
    • /
    • 2014
  • 본 논문에서는 파일 내용 기반 검색 프로그램을 설계하고 구현하였다. 역 인덱스 구조를 이용하여 설계하였으며 별도의 정보 검색 라이브러리 사용 없이 구현하였다. 인덱스 파일은 트라이 자료 구조를 직접 설계 및 구현 하였으며 자바 언어의 HashMap 구조를 중첩 형태로 구현하였다. 개발 시스템의 유용성을 테스트하기 위해 GRE 단어집에 수록된 약 3,300개의 단어를 사용하여 임의 생성한 텍스트 파일 집합을 사용하였다.

  • PDF