• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.022초

디지털 도서관 환경에서의 정보 검색을 위한 자연어 문서 및 질의 처리기에 관한 연구 (A Study on Natural Language Document and Query Processor for Information Retrieval in Digital Library)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권12호
    • /
    • pp.1601-1608
    • /
    • 2001
  • 디지털 도서관은 자연어 문서와 멀티미디어 자료에 대한 정보 검색 엔진을 필요로 하는 가장 중요한 데이터베이스 시스템이다. 이 논문은 자연어 처리 기법의 정보 검색 엔진과 브라우저에 대한 설계와 실험 결과를 소개한다. 자연어 문서에 대한 정보 검색 과정은 어휘 분석, 구문 분석, 스테밍, 주제어 색인 등의 계산학적 처리를 포함한다. 많은 이미지와 이미지의 제목, 그리고 자연어로 기술된 설명 문서를 포함하는 실험적인 데이터베이스 ‘Earth and Space Science’를 통해서 자연어 문서 분석에 기반하는 정보 검색 기능을 실험하였다. 또한 디지털 도서관 환경에서의 멀티미디어 정보 검색 내용 기반의 이미지 검색 엔진과 병행하는 정보 검색 시스템으로서의 가능성을 보여준다.

  • PDF

서브블록 프로세싱을 이용한 정지영상에서의 얼굴 검출 기법 (Detecting Faces on Still Images using Sub-block Processing)

  • 유채곤
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.417-420
    • /
    • 2006
  • 본 논문에서는 임의의 배경을 가진 컬러 정지 영상 내에 존재하는 얼굴을 검출하기 위한 방법을 제안한다. 제안 방법은 영상의 배경, 얼굴의 수, 크기, 각도, 피부색상, 그리고 조명에 대하여 불변적인 특정을 가지며, 컬러 클러스터링, 컬러 스캐닝, 서브 블록 프로세싱, 얼굴 영역 검출, 그리고 얼굴 검증과정으로 구성된다. 제안 방법은 사전 트레이닝 단계나 추가적인 데이터베이스를 필요로 하지 않는다. 본 논문의 제안방법은 보안 분야, 동영상과 정지영상의 색인, 그리고 기타 자동화된 컴퓨터비전 분야에 적용될 수 있을 것이다.

GDCS : 센서네트워크를 위한 에너지 효율적인 그리드 기반 데이터 중심 저장 시스템 (GDCS : Energy Efficient Grid based Data Centric Storage for Sensor Networks)

  • 신재룡;유재수;송석일
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.98-105
    • /
    • 2009
  • 이 논문에서는 동적으로 작업부하의 변화에 대응하는 새로운 데이터 중심 스토리지를 제안한다. 제안하는 데이터 중심 스토리지는 가상의 다중 레벨 그리드를 기반으로 구성되며 동적으로 핫스폿 영역의 부하를 분산할 수 있다. 또한, 제안하는 데이터 중심 스토리지는 기존의 GPSR (Greedy PerimeterStateless Routing)과 같은 라우팅 기법을 적용하여 수집한 데이터를 특정 센서 노드에 저장할 수 있다. 시뮬레이션을 수행하여 기존에 제안된 데이터 중심 스토리지에 비해 데이터를 저장하는데 소요되는 에너지를 크게 줄일 수 있음을 보인다. 그리고, 제안하는 방법을 실제 센서 네트워크용 운영체제를 기반으로 구현하고 시뮬레이션 도구를 이용해서 실행한 후 제안하는 방법이 부하를 효과적으로 분산할 수 있음을 보인다.

한글 문장의 자동 띄어쓰기를 위한 어절 블록 양방향 알고리즘 (Eojeol-Block Bidirectional Algorithm for Automatic Word Spacing of Hangul Sentences)

  • 강승식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.441-447
    • /
    • 2000
  • 자동 띄어쓰기는 띄어쓰기가 무시된 한글 문서의 자동색인이나 문자인식 시스템에서 줄바꿈 문자에 대한 공백 삽입 문제 등을 해결하는데 필요하다. 이러한 문서에서 공백이 삽입될 위치를 자동으로 찾아주는 자동 띄어쓰기 알고리즘으로 문장 분할 기법과 양방향 최장일치법을 이용한 어절 인식 방법을 제안한다. 문장 분할은 한글의 음절 특성을 이용하여 어절 경계가 비교적 명확한 어절 블록을 추출하는 것이며, 형태소 분석기를 이용한 양방향 최장일치법에 의해 어절 블록에 나타난 각 어절들을 인식한다. 4,500여 어절로 구성된 두 가지 유형의 문장 집합에 대하여 제안한 방법의 띄어쓰기 정확도를 평가한 결과 '공백 재현율'이 97.3%, '어절 재현율'이 93.2%로 나타났다.

  • PDF

자동정보검색을 위한 한글 시소러스 브라우저 구축에 관한 연구 (A Study of Designing the Han-Guel Thesaurus Browser for Automatic Information Retrieval)

  • 서휘
    • 한국도서관정보학회지
    • /
    • 제31권2호
    • /
    • pp.279-302
    • /
    • 2000
  • 본 연구는 질의어의 표현, 새성, 확장, 탐색식의 구성, 피드백 탐색 등 정보 탐색의 전과정을 지동으로 수행할 수 있는 한글 시소러스 브라우저 기반 자동정보검색 시스템을 구현하기 위해 시도되었다. 구현 시스템은 Delphi 4.0(PASCAL)으로 프로그래밍 되었으며, 자동색인, 클러스터링 기법, 시소러스의 구축과 표현, 자동정보겸색이 가능하도록 구성되었다. 구현된 시스템의 평가결과는 새로운 알고리즘에 의해 구축된 시소러스 브라우저가 정보검색에 있어서 시소러스의 구축의 용이성, 이용의 편리성, 검색 속도, 검색의 적합성 수준에서 우수힘을 입증하고 있다.

  • PDF

시멘틱 검색시스템 구축을 위한 요구사항 분석 및 설계에 관한 연구 (A Study on Analysis of Requirements and Design of IR System for Semantic-based Information Retrieval)

  • 김용
    • 한국비블리아학회지
    • /
    • 제23권1호
    • /
    • pp.91-111
    • /
    • 2012
  • 웹 정보의 폭발적인 성장과 함께, 단순히 한 두 개의 키워드의 입력에 따른 검색은 너무 많은 검색결과를 가져오게 되기 때문에 전통적인 정보검색기법은 이용자들에게 있어서 만족할 수 없는 결과를 제공하고 있다. 본 연구에서는 정보에 대한 의미를 기반으로 정보검색의 질적 향상을 위한 기술의 개발을 목표로 하고 있다. 이를 위하여 시멘틱 웹 기술에서 요구되는 시멘틱 기반 검색에 대한 최근의 연구동향 및 기술을 분석하여 시멘틱 기반 검색시스템에서 요구사항을 파악하고, 지능형 검색시스템의 아키텍처, 시멘틱 검색 서비스 개발 과정과 핵심기술 등을 살펴보았다. 분석결과와 함께, 시멘틱 기반 정보검색 시스템의 전체적인 아키텍처에 대한 설계 및 요구사항을 제안하였다.

멀티 플랫폼 환경에서 효율적인 공간 연산을 위한 객체의 근사 표현 기법 (Approximation Methods for Efficient Spatial Operations in Multiplatform Environments)

  • 강구안;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.453-456
    • /
    • 2003
  • 빠른 질의 처리를 요구하는 공간 데이터베이스 시스템은 주로 최소경계사각형을 이용한 여과단계를 수행한 후 후보 객체에 대해 정제 단계를 수행한다. 대부분의 공간 연산은 빠른 여과 단계를 요구하지만, 처리 능력이 떨어지는 단말기에서는 여과율을 높여 정제 단계의 수행 횟수를 줄이는 것이 필수적이다. 그리고 메모리 용량이 부족한 모바일 단말기는 최소경계사각형을 간략히 표현해야 한다. 이 논문에서는 멀티 플랫폼 환경에서 공간 연산의 효율적인 여과 단계를 위한 공간 객체의 다양한 근사 표현 방법을 제안한다. 또한 2차원 공간 색인의 80%이상을 차지하는 최소 경계 사각형 정보를 압축하기 위한 방법을 제안한다. 그리고 표현 용량과 여과 효율 및 여과 처리 속도 측면에서 각 방법의 장단점을 분석한다.

  • PDF

P2P 환경에서의 객체 기반의 데이터 모델링 (An Object-based Data Modeling on P2P Environments)

  • 노재금;구태완;이성룡;정연진;이광모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.959-962
    • /
    • 2003
  • P2P(Peer to Peer)개념으로는 순수 P2P와 변형 P2P 구조가 있다. 순수 P2P 구조는 정보공유에서 연결성을 장점으로 하는 Gnutella의 형태를 응용한 형태가 많이 사용되고 있지만 정보의 검색 및 제공에 있어 수많은 트래픽이 발생하게 된다. 이와 달리 변형 P2P 구조들 중 서버의 역할을 최소화한 인덱스 서버 모델이 존재하는데 이 모델은 사용자에게 효율적이고 빠른 검색과 색인을 제공하기 위해 기존의 서버/클라이언트 형태를 취하고 있다. 본 논문에서는 질의 기법의 보편적인 방법인 JDBC(Java Database Connectivity)를 이용한 직접적인 질의 방법이 아닌 객체 지향 프로그래밍 환경에서 효율적인 질의 방법인 JDO(Java Data Object)를 이용하여 객체 기반의 데이터 모델링을 제안하며 이를 이용하여 인덱스 서버 개념을 적용한 파일 공유 시스템(File Sharing System Using Data Modeling based on Object:FSUDMO)을 제안한다.

  • PDF

어절 분석 기반 형태소 분석 시스템 개발에 관한 연구 (A Study on the Development of a Practical Morphological Analysis System Based on Word Analysis)

  • 조현양;최성필;최재황
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.105-124
    • /
    • 2001
  • 본 연구에서는 정보검색시스템의 성능향상을 위하여 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절 분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화 그리고 형태소의 정확한 분석을 위한 한국어 어절 분석 시스템을 개발하였다. 본 연구에서 개발된 시스템은 어절 분석 속도를 높일 수 있는 최적의 알고리즘을 구현하였으며, 모듈화된 하부 시스템의 유기적이고 효율적인 결합에 중점을 두로 각 모듈별 성능 및 속도 검증이 가능하도록 하였다. 또한, 재귀적 복협명사 분석을 탈피하여 시스템 부하를 줄이고 다층적 수사 패턴 인식에 기반한 수사 형태소 분석 시스템을 개발하였다. 개발된 어절 분석 시스템을 이용하여 색인 시스템을 구성하고 이를 기반으로 실험을 하였다.

  • PDF

현재 및 미래 위치 처리를 위한 TPR-tree의 점진적 재구성 기법 (Incremental reorganization Policy of TPR-tree for Querying Predictive Positions)

  • 박동윤;김동현;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2003년도 추계학술대회
    • /
    • pp.147-152
    • /
    • 2003
  • TPR-tree는 이동체의 위치 데이터에 대해 현재 및 미래 위치 질의를 지원하기 위하여 시간 함수 기반의 경계사각형(Sounding Rectangle)으로 이동체를 색인한다. 경계사각형의 각 축은 가장 빠른 속도로 이동하는 이동체의 속도 값을 이용하여 시간에 따라 확장한다. 경계사각형 영역의 확장으로 중복(overlap)이 심화되고 사장영역(dead space)이 커지는 문제가 있다. 따라서 시간이 지날수록 영역질의 시 성능이 떨어진다. 이 논문에서는 시간이 지남에 따라 발생하는 노드간의 심한 중복과 사장영역을 줄이기 위해 중복이 심한 두 개의 단말노드를 강제 합병하고 재분할하는 강제 합병 정책과 이동체의 삭제가 발생한 노드의 모든 이동체들을 강제적으로 재삽입하는 삭제노드 강제 재삽입 정책과 삭제가 발생한 노드와 중복되는 노드들의 이동체들을 강제적으로 재삽입하는 중복 노드 강제 재삽입 정책을 이용한다. 강제 합병 정책과 삭제 노드 강제 재삽입 정책, 그리고 중복 노드 강제 재삽입은 TPR-tree의 구조를 점진적으로 재구성하기 때문에 이동체의 현재 분포를 고려하여 색인 구조를 동적으로 개선하는 장점을 가진다.

  • PDF