• 제목/요약/키워드: 파일 내용 검색

검색결과 81건 처리시간 0.033초

HashMap 기반의 트라이를 이용한 파일 내용 검색 프로그램 (File Content Retrieval Program Using HashMap-based Trie)

  • 김성완;이우순
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.467-468
    • /
    • 2014
  • 본 논문에서는 파일 내용 기반 검색 프로그램을 설계하고 구현하였다. 역 인덱스 구조를 이용하여 설계하였으며 별도의 정보 검색 라이브러리 사용 없이 구현하였다. 인덱스 파일은 트라이 자료 구조를 직접 설계 및 구현 하였으며 자바 언어의 HashMap 구조를 중첩 형태로 구현하였다. 개발 시스템의 유용성을 테스트하기 위해 GRE 단어집에 수록된 약 3,300개의 단어를 사용하여 임의 생성한 텍스트 파일 집합을 사용하였다.

  • PDF

모바일 환경에서 파일 검색 엔진을 위한 효과적인 방식 (Effective Scheme for File Search Engine in Mobile Environments)

  • 조종근;하상은
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.41-48
    • /
    • 2008
  • 본 논문에서는 파일 검색 엔진에 대해 모델링하고, 파일 검색의 정확도와 속도 향상을 위해 파일내의 내용들을 이용한 가중치 값 기반의 파일 검색 방식을 제안한다. 대부분의 파일 검색 엔진들은 빠른 검색 속도의 한계로 KMP와 같은 스트링 매칭 알고리즘을 사용해 왔다. 그러나, 이런 종류의 알고리즘들은 사용자가 원하는 파일들을 정확하게 찾아 주지는 못한다. 따라서, 모바일 환경에서 파일내의 내용들을 이용한 가중치 값 기반의 검색 엔진을 제안하고, 기존 방법들과 비교를 통해 제안한 방법의 우수한 성능을 증명한다.

OAI 프로토콜을 이용한 P2P 파일 검색 시스템 (A P2P Flle Search System Using OAI Protocol)

  • 임수정;장태무
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.346-348
    • /
    • 2005
  • 최근까지 개발되어 사용되고 있는 대부분의 P2P 파일 검색 및 공유 시스템들은 파일 이름과 확장자를 이용한 단순 키워드 검색 방식을 취하고 있다. 점점 기술이 발전되고 많은 정보가 쏟아져 나오면서 많은 자료 중에서 필요한 정보를 빠르고 쉽게 찾을 수 있는 능력이 필요하게 되었다. 또한 단순히 파일 검색을 떠나 컨텐츠를 공유하고 배포하는 경우 파일의 이름만을 가지고는 파일의 역할과 내용을 알 수 없어 파일에 대한 정보를 담는 메타데이터에 관한 연구와 그 중요성이 증가하고 있는 상황이다. 본 논문에서는 P2P 파일 공유 및 검색 시스템에서 검색의 정확성과 효율성을 높일 수 있도록 메타데이터를 이용한 파일 검색 시스템을 제안한다. 이를 위해 메타데이터로 자료의 검색이 가능한 OAI 프로토콜을 이용하였고 제안한 시스템을 구현해 실험해보았다.

  • PDF

Query By Humming 응용을 위한 MIDI 파일에서의 자동 멜로디 트랙 선택 방법 (An Automative Melody Track Selection in MIDI Files for Query By Humming(QBH) Application)

  • 김무정;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.405-408
    • /
    • 2011
  • 기존의 작곡가, 곡명 등의 질의어로 대표될 수 있는 메타 데이터 기반 음악 검색은 음악 데이터의 양이 급증함에 따라 탐색 근거가 되는 사항을 모를 경우 사용자의 요구를 충족시켜 줄 수 없는 단점을 가지고 있다 [1]. 반면 음악의 내용을 기반으로 한 검색의 경우 이러한 제약에서 보다 자유로울 수 있다. 내용 기반 검색[2]의 연구에 있어서 음악 데이터로부터 사용자의 질의를 처리해주기 위한 멜로디를 추출해주는 것이 중요한 문제가 되는데, 데이터의 추출과 편집이 용이한 MIDI 파일이 많이 사용되고 있다. 본 논문에서는 사용자의 질의를 바탕으로 한 QBH system상에서의 음악 데이터 구축을 위해 MIDI파일에서 추출해 낼 수 있는 특징들을 이용해 MIDI파일의 멜로디 트랙 멜로디 트랙과 반주 트랙을 자동으로 구분하는 것을 목적으로, MIDI트랙에서 추출해서 이용할 수 있는 특징들에 대해 알아보고 그에 따른 간단한 분류 알고리즘의 제안과 실험 결과에 대해 소개한다.

시맨틱 웹과 MPEG-7 메타데이타를 이용한 비디오 검색 시스템 (Video Search System using Semantic Web and MPEG-7 Metadata)

  • 이성우;한종형;안철범;나연묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.165-168
    • /
    • 2006
  • 본 논문에서는 시맨틱 웹을 위한 마크업 언어인 RDF와 MPEG-7 표준을 따르는 XML 문서를 이용하여 구축된 비디오 검색 시스템에 대한 연구결과를 기술한다. 본 논문에서 제안된 시스템은 RDF를 통해 비디오 파일에 대한 정보를 웹 자원의 관점으로 정의/저장한다. 또한 비디오에 대한 내용기반 검색을 위해 비디오를 구성하는 중요 프레임들을 추출하여 그림 파일로 저장하는 한편 각 프레임에 대한 정보를 MPEG-7 표준에 따라 XML 형태로 저장한다. 이렇게 구축된 정보들을 바탕으로 비디오 검색 엔진은 사용자의 질의요청을 수행한다. 본 논문에서 제안하는 비디오 검색 시스템은 비디오에 대한 다양한 검색은 물론 비디오에 대한 내용기반 검색이 가능한 장점을 가진다.

  • PDF

타일 정렬을 이용한 이미지 검색 알고리즘 (Image Search Algorithm with Tile Alignment)

  • 박웅;전호윤;신종우;전명재;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.712-714
    • /
    • 2004
  • 인터넷상의 대부분 이미지 검색엔진들은 이미지의 실제 내용보다는 이미지 파일명이나 부가적인 색인과 같은 문자 정보에 의존하여 이미지 검색을 하고 있다. 한편 이미지의 색상 정보를 비교에 사용하는 RGB 히스토그램 방법은 수행시간은 짧지만 형태는 고려하지 않기 때문에 높은 정확도는 기대하기 어렵다. 본 논문에서는 이미지의 실제 내용을 비교하여 비정형의 복잡한 물체를 검색하는 새로운 이미지 검색 알고리즘을 제안한다. 제안하는 알고리즘은 이미지의 색상과 형태 정보를 담은 타일 서열을 local alignment 알고리즘으로 정렬하여 이미지 검색을 한다 비정형 물체인 음식 사진을 사용한 실험에서 기존의 방법 RGB 히스토그램을 이용한 방법보다 월등히 향상된 정확도를 나타내었다.

  • PDF

XML 문서를 위한 구조 및 내용기반 문서검색 시스템 설계 및 구현 (Design and implementation of a structure-and content-based document retrieval system for XML documents)

  • 이정재;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.93-95
    • /
    • 1999
  • 최근 XML 문서에 대한 활용이 늘어나면서 이들 문서에 대한 저장 및 검색에 대한 요구가 증가하고 있다. XML문서는 SGML(Standard Generalized Markup Language) 문서가 가지고 있는 다양한 기능들과 구조적인 표현 능력, 그리고 사용의 용이성 등의 장점을 지닌 언어로 1996년 웹의 문서 표준으로 제안되었다. 따라서 XML 문서의 특성을 반영한 문서 검색시스템에 대한 요구가 시급한 상태이며, 기존의 시스템의 경우 구조 및 내용-기반 멀티미디어 문서검색을 효과적으로 지원하지 못하고 있다. 본 논문에서는 XML 문서의 구조정보 및 내용정보를 효과적으로 검색할 수 있는 XML 문서 저장 시스템을 설계 및 구현한다. 구현하는 시스템은 구조-기반 검색을 위해 o2store위에 역파일 인덱스를 구축하고 내용-기반 검색을 위해 X-tree를 사용한다. 또한 검색 인터페이스를 JAVA로 구현하여 효율적인 검색이 이루어지도록 한다.

  • PDF

대용량 멀티미디어 데이터의 내용 기반 검색을 위한 고확장 지원 색인 기법 (A Scalable Index for Content-based Retrieval of Large Scale Multimedia Data)

  • 최현화;이미영;이규철
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.726-730
    • /
    • 2009
  • 카메라 기술의 발전 및 사용자 중심의 인터넷 패러다임인 웹 2.0을 토대로 멀티미디어 데이터가 급증하면서, 멀티미디어 검색은 인터넷 서비스로서 그 중요성이 날로 증가되고 있다. 현재 멀티미디어 검색은 단순한 키워드(keyword) 검색에 의존하고 있는 실정으로, 정보 검색의 정확도 및 사용자의 만족도를 충족시키기 위해서는 내용 기반 검색 지원이 필요하다. 본 논문에서는 대용량의 멀티미디어 데이터의 내용 기반 검색을 지원하기 위하여, 데이터의 분포에 따른 다중 길이의 시그니처를 기반으로 한 새로운 분산 인덱스 구조를 제안한다. 제안하는 인덱스 구조는 고차원 데이터의 클러스터링에 따라 데이터의 분포를 분석하여 서로 다른 요약 파일을 분산 생성하고, 이를 기반으로 유사 검색을 병렬로 수행할 수 있도록 설계되었다. 그리하여, 클러스터 환경 하에서 고차원 데이터의 분산 저장이 용이하고, 각 노드들은 서로 다른 시그니처 파일을 기반으로 검색을 병렬 수행함으로써 효율적인 검색을 지원한다.

  • PDF

클러스터링 및 연속적 I/O를 이용한 이미지 데이터 검색 연구 (A study on the searching of images via clustering and sequential I/O)

  • 김진옥
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.106-108
    • /
    • 2002
  • 본 연구에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사할 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제시한다. 이 연구에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속주인 파일 I/O를 사용하여 클러스터를 찾는 데용을 최소화한다 클러스터인덱싱 접근은 트리 유사 구조와 임의 I/O를 사용한 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보이며 연속적 I/O를 통해 검색 미용을 낮춘다.

  • PDF

음악 추천 시스템에서 대표 선율을 이용한 내용 기반 필터링 기법 (Content-Based Filtering Using Representative Melody in Music Recommendation System)

  • 원재용;구경이;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.229-231
    • /
    • 2004
  • 내용 기반 음악 검색 시스템은 사용자가 원하는 음악에 대해 사전 정보를 모르더라도 곡의 일부로 질의를 함으로써 원하는 결과를 얻을 수 있게 한다. 그러나 내용 기반 음악 검색 시스템은 사용자의 질의에 대해 결과에 대한 순위만을 제공할 뿐 사용자의 취향이나 선호도와 같은 개인 정보를 고려하지 않기 때문에 사용자가 충분히 만족할만한 정보를 제공받지 못해 사용자의 만족도가 떨어진다. 이를 해결하기 위해 본 논문에서는 대표 선율을 이용하여 유사한 곡들로 클러스터링을 수행하고 내용 기반 검색 시 질의가 속하는 클러스터를 찾고 해당 클러스터 안에서 거리함수를 통해 질의와 유사한 곡들을 선별한다. 선별된 곡들과 사용자의 프로파일을 통해 음악 취향을 고려할 수 있는 내용 기반음악 필터링 기법을 적용하여 사용자의 만족을 증가시키는 결과를 제공한다.

  • PDF