• 제목/요약/키워드: 파일 검색

검색결과 618건 처리시간 0.035초

메타 데이터 영역의 직접 접근을 활용한 고속 파일 검색 기법 (A Fast File Search Technique Using Direct Access of Metadata Area)

  • 김예성;최종욱;이성진;김지홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.562-565
    • /
    • 2011
  • 데이터와 파일의 개수가 증가함에 따라 효율적인 파일 검색 기법에 대한 요구가 증가하고 있다. 현재까지 제안된 파일 탐색 기법은 탐색 시간이 매우 오래 걸리거나, 미리 인덱싱 과정을 거쳐야 하기 때문에 사용자가 원하는 시점에 빠르고 효율적인 파일 탐색을 제공하기 어렵다는 단점을 지닌다. 본 논문에서는 디스크의 메타 데이터 영역을 직접 접근함으로써 고속의 파일 검색을 가능하게 해주는 효율적인 검색 기법을 제안하고자 한다. 본 기법은 메타 데이터가 서로 비슷한 영역에 위치한다는 파일 시스템의 특징을 활용함으로써 디스크 내의 데이터를 고속으로 탐색하고, 이를 DB로 구성함으로써 실시간 검색을 지원한다. 또한 파일 시스템 내의 변경 사항을 빠르게 추적하여 DB를 업데이트 할 수 있다는 장점을 지닌다. 본 논문에서 제안한 검색 기법을 다수의 시스템에서 평가한 결과 기존의 기법 대비 약 20~50배의 탐색 시간 향상과 10초 미만에 실시간 검색이 가능한 상태를 구성 할 수 있음을 확인 할 수 있었다.

OAI 프로토콜을 이용한 P2P 파일 검색 시스템 (A P2P Flle Search System Using OAI Protocol)

  • 임수정;장태무
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.346-348
    • /
    • 2005
  • 최근까지 개발되어 사용되고 있는 대부분의 P2P 파일 검색 및 공유 시스템들은 파일 이름과 확장자를 이용한 단순 키워드 검색 방식을 취하고 있다. 점점 기술이 발전되고 많은 정보가 쏟아져 나오면서 많은 자료 중에서 필요한 정보를 빠르고 쉽게 찾을 수 있는 능력이 필요하게 되었다. 또한 단순히 파일 검색을 떠나 컨텐츠를 공유하고 배포하는 경우 파일의 이름만을 가지고는 파일의 역할과 내용을 알 수 없어 파일에 대한 정보를 담는 메타데이터에 관한 연구와 그 중요성이 증가하고 있는 상황이다. 본 논문에서는 P2P 파일 공유 및 검색 시스템에서 검색의 정확성과 효율성을 높일 수 있도록 메타데이터를 이용한 파일 검색 시스템을 제안한다. 이를 위해 메타데이터로 자료의 검색이 가능한 OAI 프로토콜을 이용하였고 제안한 시스템을 구현해 실험해보았다.

  • PDF

용어 가중치 재 산정을 이용한 검색 시스템 (Retrieval System Using Term Reweighting)

  • 황선욱;김혜정;손기준;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.160-162
    • /
    • 2003
  • 색인 파일은 정보 검색 시스템에서 중요한 구성 요소 중에 하나이다. 스테밍을 하여 색인 파일을 구성하게 되면 파일의 크기를 줄일 수 있고 재현율을 높이는데 효과적이다. 하지만, 과도한 스테밍으로 구성이론. 색인 파일은 원형에 대한 데이터 손실을 가지고 오기 때문에 너무 많은 문서가 검색되어 사용자가 문서를 찾는데 많은 시간이 소요되고 정확률도 떨어진다. 본 논문에서는 정보 검색 시스템에서 검색의 효율성을 높이기 위해 사용하는 색인 파일을 스테밍 한 것과 스테밍 하지 않은 파일로 구성하였다. 스테밍 한 색인 파일은 질의어와 문서 사이의 유사도를 계산하기 위하여 이용되며, 스테밍 하지 않은 파일은 스테밍 했을 때 검색된 문서들 중에서 데이터 손실로 인한 잘 못된 문서 순서를 재조정해 주기 위하여 이용된다. 본 논문에서는 높은 검색 효과를 제공하는 기존의 벡터 공간 모델을 검색 성능 평가 척도 중의 하나인 R-정확률을 이용하여 비교 평가하였다. 본 논문에서 제안하는 시스템이 문서 상위 100위까지에 대하여 일반 벡터 모델 보다 최고 21%의 좋은 성능을 보였다.

  • PDF

마크업 언어기반의 모션 검색 시스템 (Motion Retrieval System Based on Body Animation Markup Language)

  • 정현숙;이일병
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.461-465
    • /
    • 2002
  • 현재 모션 캡쳐 데이터는 파일 형태로 존재하며 이들 파일을 관리하기 위해서 문서관리시스템 등을 사용할 수 있다. 그러나 파일 이름만으로는 원하는 모션 데이터를 가지고 있는 모션 캡쳐파일을 검색하기 어렵다. 본 논문에서는 인체 바디 모션을 표현하는 마크업 언어인BAML(Body Animation Markup Language)을 이용하여 모션 캡쳐 파일에 모션 정보를 추가적으로 표현함으로써 모션 캡쳐 파일을 애니메이션 소프트웨어로 실행하기 전에 모션 파일 라이브러리에서 특정 모션을 가지고 있는 모션 캡쳐 데이터 파일을 검색할 수 있는 BAML+ 시스템을 제시하고자 한다. BAML+ 시스템은 모션 캡쳐 데이터의 모션명을 정의하고 모션 변형 시스템에서 모션을 검색하고 편집할 수 있는 컴포넌트들로 구성된다.

  • PDF

파일조직 방법에 따른 검색성능의 비교연구 (An Experimental Study on the Retrieval Performance of File Organization Methods)

  • 송미련
    • 정보관리학회지
    • /
    • 제3권1호
    • /
    • pp.17-39
    • /
    • 1986
  • 정보검색시스템에 대한 관심이 날로 증대하고 또 온라인 정보검색시스템의 발달로 이용자는 더욱 효과적이고 빠른 탐색을 기대하게 되었다. 여기서 중대한 문제의 하나가 파일조직방법의 선택이다. 본 논문에서는 파일조직방법이 검색성능에 영향을 미칠 것이라는 가설하에 여러가지 파일조직방법 충 도치파일과 클러스터파일을 선택하여 그에 따른 검색성능을 비교하였다.

  • PDF

모바일 환경에서 파일 검색 엔진을 위한 효과적인 방식 (Effective Scheme for File Search Engine in Mobile Environments)

  • 조종근;하상은
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.41-48
    • /
    • 2008
  • 본 논문에서는 파일 검색 엔진에 대해 모델링하고, 파일 검색의 정확도와 속도 향상을 위해 파일내의 내용들을 이용한 가중치 값 기반의 파일 검색 방식을 제안한다. 대부분의 파일 검색 엔진들은 빠른 검색 속도의 한계로 KMP와 같은 스트링 매칭 알고리즘을 사용해 왔다. 그러나, 이런 종류의 알고리즘들은 사용자가 원하는 파일들을 정확하게 찾아 주지는 못한다. 따라서, 모바일 환경에서 파일내의 내용들을 이용한 가중치 값 기반의 검색 엔진을 제안하고, 기존 방법들과 비교를 통해 제안한 방법의 우수한 성능을 증명한다.

효율적인 P2P 기반 파일 검색 알고리즘 설계 (Design of Efficient P2P Based File Search Algorithm)

  • 백승재;안진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.454-456
    • /
    • 2005
  • 최근에 파일 공유 애플리케이션을 개발하는데 있어 클라이언트-서버(client-sewer) 모델의 문제점을 해결하기 위해 피어-투-피어(peer-to-peer) 모델이 각광 받고 있다. 대표적일 P2P 기반 파일 공유 시스템으로 넵스터, 그누텔라등이 있다. 그러나 이 시스템들은 각각 중앙 집중적 제어, 혹은 브로드캐스팅에 의한 과도한 네트워크 트래픽 발생 등 확장성 문제를 발생시킨다. 이런 문제점을 해결하기 위해 울트라피어 및 동적 라우팅 기법을 사용하지만 여전히 rare 파일에 대한 높은 응답시간과 검색의 낮은 신뢰성 문제점들을 해결할 수 없다. 본 논문에서는 popular 파일과 rare 파일에 대한 검색을 구분하여 popular 파일을 기존의 그누텔라 검색 방법을 사용하고 rare 파일 검색을 제안하는 새로운 DHT 알고리즘을 사용하도록 한다. 특히 제안하는 DHT 알고리즘은 기존의 DHT 알고리즘들과 달리 일반 노드가 아닌 울트라피어들만으로 구성함으로서 검색 비용, 노드 조인과 리브 비용, 핑거 테이블의 엔트리 수를 매우 줄임으로서 효과적이고 확장적이라 할 수 있다.

  • PDF

줄거리에 기반한 TV시리즈물 검색 시스템의 설계 및 구현 (Design and Implementation of TV Serial Drama Retrieval System Based on Synopsis)

  • 조진표;천영우;김유섭;고영웅
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1256-1261
    • /
    • 2006
  • 본 논문은 스토리에 기반하여 여러 편의 드라마 동영상 파일 중에서 사용자가 찾고자 하는 파일을 찾아주는 검색 시스템의 설계 및 구현에 대하여 기술한다. 기존의 동영상 검색 방식은 제목 및 주연 배우와 같이 제한적인 검색어에 의한 검색을 제공하고 있으나, 대부분의 드라마 파일은 영화 또는 다른 동영상 파일과 달리 여러 회로 나누어져 있기 때문에 기존의 주연 배우나 제목과 같은 정보만을 가지고 사용자가 원하는 파일을 검색하기 어렵다. 본 논문에서는 드라마의 제작사에서 제공하는 각 회당 스토리를 기본적인 불리안 모델과 결합시켜 사용자가 원하는 회차를 검색하는데 유용한 시스템을 설계 및 구현하였다. 본 논문에서 제시한 방식의 유용성을 보이기 위하여 실제 서비스 되고 있는 드라마를 대상으로 실험을 하였으며, 실험결과 높은 검색 능력을 보이고 있다.

  • PDF

문서의 동적 삽입 삭제를 위한 STEER 역파일 구조 (STEER Inverted File Structure for Dynamic Document Insertion/Deletion)

  • 김남일;박영찬;주종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.174-176
    • /
    • 1998
  • 역파일 구조(inverted file structure)는 검색 속도가 빠르기 때문에 정보검색 시스템의 색인정보 하부 저장구조로 널리 이용되지만 문서의 동적 삭제는 어려운 형태이다. 본 논문에서는 기존역파일 구조에 문서마다 색인어의 포스팅 레코드를 기록한 목록을 유지함으로써 문서의 동적 삭제가 용이하고, 위치정보를 포스팅 레코드에서 분리하여 위치 검색이 효율적인 역파일 구조를 설계한다. 설계된 역파일 구조는 STEER(Structured Entity Element Retrieval) 정보검색 시스템에서 구현되었다.

  • PDF

HashMap 기반의 트라이를 이용한 파일 내용 검색 프로그램 (File Content Retrieval Program Using HashMap-based Trie)

  • 김성완;이우순
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.467-468
    • /
    • 2014
  • 본 논문에서는 파일 내용 기반 검색 프로그램을 설계하고 구현하였다. 역 인덱스 구조를 이용하여 설계하였으며 별도의 정보 검색 라이브러리 사용 없이 구현하였다. 인덱스 파일은 트라이 자료 구조를 직접 설계 및 구현 하였으며 자바 언어의 HashMap 구조를 중첩 형태로 구현하였다. 개발 시스템의 유용성을 테스트하기 위해 GRE 단어집에 수록된 약 3,300개의 단어를 사용하여 임의 생성한 텍스트 파일 집합을 사용하였다.

  • PDF