• 제목/요약/키워드: 색인 구성

검색결과 969건 처리시간 0.033초

통계적기법에 의한 한글자동색인의 연구 (A Study on Automatic Indexing of Korean Texts based on Statistical Criteria)

  • 우동진
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.47-86
    • /
    • 1987
  • 본 연구는 한글자동색인에 관한 연구로 한국전자통신연구소의 DOCUMENT Data Base로부터 299개 문헌의 제목과 초록을 무작위로 추출하여 단어분리를 시도하고, 분리된 단어군, 인식어를 제외한 단어군, 인식어와 불용어를 제외한 단어군, 그리고 인식어와 불용어를 제외하고 복합어를 구성하여 포함한 단어군 등 4개의 시험군을 설정한 후, 파오의 전환점 산출기과 스파크죤스의 역문헌 가중기법, 살톤의 문헌분리 가중기법을 적용하여 색인어를 선정하고 이를 비교 평가하여 한글문헌의 자동색인 방안을 모색하였다.

  • PDF

디지털 음악정보 검색 시스템의 설계 (Design of a Retrieval System for Digital Music Information)

  • 지정규;오해석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.425-437
    • /
    • 1997
  • 본 논문은 디지털 도서관에서 임의의 음악정보를 효율적으로 검색하기 위한 시스템을 제안한다. 종래의 전형적인 음악정보 검색 항목인 제목이나 작곡자 또는 주제를 입력하는 것이 아니라, 사용자가 음악 데이터베이스로부터 검색하고자 하는 음악의 일부를 마이크를 통해서 노래한다. 그러면 입력된 선율에 대한 음 신호를 처리하여 음표정보를 인식하고, 이를 바탕으로 음정곡선을 생성하여 이를 탐색 패턴으로 사용한다. 동요를 대상으로 하여 음악 데이터베이스를 생성할 때는 각각의 곡에서 추출한 음정곡선을 이용하여 색인과 메타 데이터를 생성하는데, 색인은 유사 탐색을 용이하게 하기 위해서 Trie 구조를 사용한다. 탐색패턴을 이용해서 메타 데이터를 탐색할 때는 동적 프로그래밍 방법을 이용하여 유사 탐색을 함으로써 노래의 어느 마리를 부르더라도 쉽게 후보곡을 검색할 수 있도록 한다. 통상음악의 첫째 동기를 부르는 경우가 많기 때문에 첫째 악절로 구성한 색인을 먼저 탐색토록하고, 색인에서 탐색을 실패한 경우(음악의 첫째 동기 이후를 부른 경우)에 메타 데이터를 이용한 유사 음표열 탐색을 하도록 하여 효율적인 검색이 되도록 하였다.

  • PDF

한국어 형태소 분석기 CBKMA와 색인어 추출기 CBKMA/IX (A Korean Morphological Analyzer CBKMA and A Index Word Extractor CBKMA/IX)

  • 김남철;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.50-59
    • /
    • 1999
  • 본 논문은 한국어 형태소 분석기 CBKMA와 이 CBKMA를 이용한 색인어 추출기 CBKMA/IX를 소개하고, 각각의 특징들에 대해서 설명한다. CBKMA는 음절 정보를 이용하는 분석 알고리즘과, 효율적인 사전구성을 이용한 형태소 분석기로서, 과다한 분석 후보의 생성을 줄임으로써 처리 속도를 향상시켰다. 수행시 필요로 하는 컴퓨터 자원은 Main Memory 약 4Mb정도로, 작은 규모의 시스템에서도 수행이 가능한 특징을 갖는다. CBKMA/IX는 CBKMA의 형태소 분석 기능을 이용하는 색인어 자동 추출기로서, 처리 속도 향상을 위하여 대분류 수준의 품사 태그만을 이용한다. 또한 CBKMA의 분석 기능에 색인어 추출을 위해 불용어 사전, 사용자 키워드 사전 처리 부분과, 복합명사와 미등록어 분석 부분 및 한자어, 일본어 등에 대한 처리를 강화시켰다. 특히 비소설류 자료의 분석시 좋은 성능을 발휘한다.

  • PDF

P2P 시스템에서의 다중 노드 전역 디렉토리 기반 색인 순차 검색 기법 (Indexed-Sequential Search Approach on Multi-Node Global Directory in Peer-to-Peer Systems)

  • 강인성;최성진;이화민;백맹순;황종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.193-195
    • /
    • 2004
  • 저렴한 비용으로 기존의 클라이언트 서버 시스템을 대체할 수 있는 P2P 시스템에서 서로 공유하고자 하는 파일의 리스트를 얼마나 빠르고 효과적으로 검색하느냐는 시스템 성능을 좌우하는 중요한 항목 중 하나이다. 그러나 기존의 P2P 시스템에서의 검색 기법들은 목적 파일들에 대한 검색 시간의 단축과 키워드 검색이라는 두 가지 설계 목표 중 어느 한 쪽에만 치중하여 설계됨으로써 종합적인 검색 기능이 요구되는 실제 시스템에 적용되기에는 매우 불완전하다. 본 논문에서는 P2P 시스템에 참여하여 파일을 공유하고자 하는 노드들의 모든 공유파일 목록을 하나의 전역 디렉토리로 구성하고 이를 이진 값의 순서대로 저장함으로써 높은 검색 속도로 키워드 검색 기능을 제공하는 다중 노드 전역 디렉토리 기반 색인 순차 검색 기법을 제안한다. 제안된 기법은 높은 겅색 속도와 키워드 검색을 지원함으로써 P2P 시스템의 검색 속도 성능 개선과 사용자 편의성을 제공한다.

  • PDF

카메라를 사용한 성단의 H-R도 작성 및 교육적 활용

  • 김형근;박서연;박주하;홍경수;송인옥
    • 천문학회보
    • /
    • 제37권2호
    • /
    • pp.96.2-96.2
    • /
    • 2012
  • 우리는 DSLR 카메라의 RGB 소자를 일종의 필터로 활용하여 성단의 H-R도를 얻었다. 일반적으로 성단의 H-R도는 U, B, V, R, I-대역 필터를 사용하여 얻는다. 필터가 장착된 CCD 카메라 장비는 고가이거나 교육적으로 활용하기에는 수월하지 않아서 학교 또는 국/공립/사립 천문대에서의 교육적 활용에 제한적인 측면이 있다. 이 연구에서 우리는 학생들이 사용하기 쉬운 DSLR 카메라로 성단의 H-R도를 구현하는 방법을 제시하여 천문학 교육에 활용하고자 한다. 우리는 DSLR 카메라의 RGB 소자를 사용하여 M45 성단의 B-G 색지수를 얻고, 이를 이미 알려진 M45의 구성원의 B-V 색지수와 비교하여 선형적인 관계를 알아내었다. 우리는 DSLR 카메라의 B-G 색지수로 H-R도를 성공적으로 작성할 수 있었다. 별의 색-온도 관계와 항성 진화 실험학습에 소형망원경과 DSLR 카메라가 천문학 교육에 활용되기를 기대한다.

  • PDF

색채 감정 척도의 개발과 활용에 관한 연구 (Study on the development of Color Sensibility Scale and its application)

  • 황상민;김경인
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.295-301
    • /
    • 1999
  • 본 연구에서는 특정 대상에 대한 사람들의 심리적인 색채반응을 측정할 수 있는 색채감성척도(PCS)를 개발하고 이것을 색채 감성 이미지의 평가에 어떻게 이용하는가를 보여주고자 한다. 색채심리에 기초한 색채감성척도(PCS)는 NCS와 ISCC-NBS 색명법에 의거한 색상과 톤의 개념으로 구성되었으며 기본형과 상세형의 두 가지가 개발 되었다. 표준화된 색채감성척도는 각 사람들마다 다르게 나타나는 색에 관한 이미지나 색에 대한 심리적인 선호반응을 객관적으로 측정할 수 있는 척도로 활용될 수 있다. 본 연구에서는 선호색, 선호의상색, 선호 화장품 색을 나타내는데 PCS가 어떻게 활용되는가를 보여주었다. PCS를 이용한 색채 감성 이미지는 Color Image Palette를 이용하여 각각의 특성을 비교할 수 있도록 제시되기도 하였다. 색채 경험에 대한 광학적이거나 물리적인 속성이 아닌 심리적인 특성을 평가하고 서로 다른 집단의 반응을 비교 평가하는데 PCS와 유용한 도구가 될 것이다.

  • PDF

효율적인 물류정보 서비스를 위한 XML 중심의 물류데이터 색인 및 검색

  • 백대원;조이현;백억종;권혁철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.264-270
    • /
    • 2005
  • 다양한 XML 데이터를 통합 관리하고, 여러 애플리케이션에 정보를 제공하는 웹 서비스 기반의 정보시 스템에서는 체계적이고 효과적인 XML 데이터의 저장 및 검색을 요구한다. 특히, 물류 분야의 정보시스 템에서는 다양한 물류 객체의 정보를 저장하고 관리 하여야 하며, 여러 애플리케이션의 물류 정보 요청에 지능적인 XML 데이터 검색으로 대처할 수 있어야 한다. XML은 데이터를 구조적으로 표현하고, 체계적인 정보 전달을 위해 많은 분야에서 이용하고 있다. XML 데이터는 데이터 구조적 형식을 정의하는 태그와 해당 값으로 구성되어 있다. 각각의 데이터 구조를 가지는 다양한 물류 데이터의 통합 관리 및 검색서비스를 위해서는 XML 데이터의 섹인이 매우 중요하다. 본 논문에서는 웹 서비스 기반의 물류정보 시스템에서 효율적인 정보 검색서비스 제공을 위한 XML 데이터 색인 기법을 제안한다. 또한, 다양한 물류데이터의 효율적인 통합 관리 및 검색을 위한 온톨로지의 적용을 제안한다.

  • PDF

구조적 문서의 효율적인 검색을 위한 자료 구조와 알고리즘 설계 (Design of Data Structures and Algorithms for Efficient Retrieval of Structured Documents)

  • 김영자;정채영;김현주;배종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.60-62
    • /
    • 1999
  • SGML이나 XML과 같은 마크업 언어를 사용하여 생성된 구조적 문서에 대한 검색 시스템은 문서의 임의의 부분에 대한 검색을 지원한다. 문서의 구조에 바탕을 둔 다양한 유형의 사용자 질의를 처리하기 위해서는 색인에 필요한 메모리량이 커지게 된다. 색인에 필요한 메모리양을 줄이기 위해, 색인된 노드의 ID에서 찾고자 하는 노드의 ID를 계산할 수 있어야 한다. 그러나 이 경우 각 노드에 ID가 고정되기 때문에 문서의 갱신이 발생할 때 많은 부분이 수정되어야 하기 때문에 갱신에 필요한 오버헤드가 커지게 된다. 본 논문에서는 전체문서인스턴스트리 구조를 제안하고, 이를 기반으로 하여 노드의 ID를 구성함으로서, 색인과 검색의 효율성을 유지하면서 자료의 추가나 삭제등의 갱신이 발생할 때, 갱신의 파장을 최소화시킬 수 있는 색인구조와 질의처리 알고리즘을 제시한다.

  • PDF

적응형 웹 사이트를 위한 웹 로그 마이닝 (Web Log Mining for Adaptive Web Sites)

  • 고경자;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.325-328
    • /
    • 2001
  • 본 논문에서는 웹 사이트에 접근하는 이용자의 패턴을 분석하여 정보 제공이 보다 용이한 구조로 자동 개선시켜 나가는 적응형 웹 사이트의 구현 방안을 제시한다. 특히, 본 연구에서는 기존 웹 사이트의 구조를 가능한 파괴하지 않는 범위 내에서 웹 사이트론 변경하고자 이용자의 접근 패턴상 연관성은 높으나 접근 경로가 긴 문서들을 추출하여 색인 페이지를 추가 생성한다. 이를 위하여, 먼저 대용량의 웹 서버 로그 데이터를 대상으로 하이퍼 링크 구조에 따라 필터링된 최후 전진 문서만을 가지고 데이터 시퀀스를 구성한다. 이러한 데이터 시퀀스에 새로운 순차 접근 패턴 탐색 알고리즘인 TPA를 적용함으로써 웹 문서간 충분한 지지도를 갖는 연관성 있는 문서들의 시퀀스를 구한다. 이와같은 빈발 시퀀스들에 대한 색인 페이지를 추가로 생성시켜주는 서비스를 통하여 이용자들의 효과적인 정보 접근을 지원할 수 있는 웹 사이트로의 변경이 가능하다.

  • PDF

계층적 군집화를 이용한 근사 단어 필터링 기법 (Proximate Word Filtering by Hierarchical Clustering)

  • 김성환;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1101-1104
    • /
    • 2012
  • 단어 필터링은 유해정보를 차단위한 기본적인 기능이다. 그러나 악의적인 사용자는 필터링 시스템을 우회하기 위하여 금지 단어에 의도적인 변형을 가한다. 이에 대응하기 위해 일정 오류를 허용하여 필터링을 수행하는 근사 단어 필터링이 있다. 근사 단어를 검색하기 위한 문자열 색인 방법으로는 주로 기준 단어(Pivot)을 이용한 유클리드 공간에의 사상을 이용하는데, 이는 단어 필터링에 응용하기에는 근본적인 구조상의 한계점이 있다. 본 논문에서는 필터링 대상이 되는 단어 집합 내에서 군집화를 수행하여 계층적인 자료구조를 구성하고, 단어 필터링을 위한 필터링 질의(Filtering query)를 정의한 뒤 그에 적합한 탐색 상의 적용에 관하여 설명한다. 실험 결과 기존의 기준 단어(Pivot)을 이용한 색인 기법에 비하여 16.9%~26.6%의 탐색 속도 향상을 확인할 수 있었다.