• 제목/요약/키워드: 색인화

검색결과 272건 처리시간 0.025초

이질적 색인어의 가중치 합에 기반한 수식 검색 시스템 (An Equation Retrieval System Based on Weighted Sum of Heterogenous Indexing Terms)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.745-750
    • /
    • 2010
  • 다양한 수식을 포함하는 수학 문서들을 효과적으로 검색하기 위해서는 수식 인지 검색 엔진이 필요하다. 본 논문에서는 구조적으로 유사한 수식들을 효과적으로 찾아주는 수식 검색 시스템을 제안한다. 제안 시스템은 MathML 수식들을 연산자, 변수, 그리고 수식 구조와 같은 3가지 형태의 이질적 색인어로 분리하고 독립적으로 색인한다. 사용자가 MathML 수식을 입력하면 제안 시스템은 이질적인 색인어들을 위한 3가지 언어모델들의 가중치 합을 이용하여 수식들을 검색하고 순위화한다. 244,824개의 MathML 수식을 대상으로 한 실험에서 제안 시스템은 비공개 테스트에서 53%의 1순위 정확률, 공개 테스트에서 63%의 1순위 정확률을 보였다.

순환도메인을 기반으로 하는 PR-화일의 구현 및 성능 평가 (The Implementation Performance Evaluation of PR-File Based on Circular ar Domain)

  • 김흥기;황부현
    • 한국정보처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.63-76
    • /
    • 1996
  • 본 논문에서 우리는 공간객체를 취급하는 새로운 동적 공간색인구조인 PR-화 일과 계층별 공간국부성 측도인 변형된 계층분산을 제안한다. 다차원 검색공간이 순환 도메 인을 갖는다는 가정하에서, PR-화일은 공간적으로 이웃하는 객체들을 결집시키기 위해 변형된 계층분산을 이용한다. PR-화일의 삽입과 분할 알고리즘은 객체의 분포 형태에 관계없이 낮은 계층분산값을갖는 색인을 유지시킨다. 실험 결과에 의하면, PR-화일은 낮은 계층분산값을 갖는 색인을 사용함으로써 객체의 검색시 적중율을 높이며, 버켓의 용량이 커질수록 버켓 이용율을 향상시키는 특성을 보인다.

  • PDF

자동분류 알고리즘을 이용한 지능형 정보검색시스템 구축에 관한 연구 (A Study of Designing the Intelligent Information Retrieval System by Automatic Classification Algorithm)

  • 서휘
    • 한국도서관정보학회지
    • /
    • 제39권4호
    • /
    • pp.283-304
    • /
    • 2008
  • 본 연구의 목적은 이용자의 탐색 행태, 시스템의 정보 구축 행태를 기반으로 초기 질의어의 범주에 해당하는 연관 용어들(해당 용어의 지식구조와 관련된 연관 용어들)을 학습기능을 통해 자동으로 제시해 줄 수 있는 지능형 검색 시스템을 구현하는 것이다. 이를 위해 학습을 통해 전문가 수준의 색인어를 추출할 수 있는 지능형자동색인 알고리즘, 자동분류에 관련한 클러스터링 알고리즘과 문서 범주화 알고리즘 그리고 범주 표현 알고리즘에 대한 이론적 연구를 수행하였으며, 이들 이론적 연구를 근거로 비용과 시간적인 측면에서 그리고 재현율과 정도율이란 측면에서 우수한 성능을 발휘할 수 있는 지능형검색시스템을 구현하였다.

  • PDF

MapReduce 환경에서의 실시간 LBS를 위한 이동궤적 데이터 색인 및 검색 시스템 설계 (Design of Trajectory Data Indexing and Query Processing for Real-Time LBS in MapReduce Environments)

  • 정재화
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권3호
    • /
    • pp.313-321
    • /
    • 2013
  • 최근 모바일 스마트 기기의 보급으로 스마트 기기에 탑재된 다양한 센서에서 수집되는 대량이 데이터를 분석하여 처리하는 빅 데이터의 시대는 위치기반 서비스(LBSs: Location-Based Services)에 까지 확대대고 있다. 이동궤적에 대한 데이터도 초 대용량으로 증가하고 있다. 초 대용량 이동궤적 데이터 처리를 위해서는 클라우드 컴퓨팅 기술 및 맵리듀스와 같은 병행처리 플랫폼에 대한 연구가 필요하다. 최근 대용량 데이터의 병렬처리를 위해 맵리듀스 기반의 연구는 진행되고 있으나, 일괄처리 및 키-값 데이터 구조에 적합한 맵리듀스는 실시간 LBS에 적용에 적합하지 않다. 따라서 본 연구는 맵리듀스 특성을 면밀히 분석하고 실시간적 서비스에 적합하도록 모듈 단위로 효율적인 색인 기법 및 검색에 대한 시스템 설계를 제시한다.

이동객체궤적에 대한 효율적인 최근접 이웃 검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.418-421
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인 구조를 생성하고 이 색인 구조를 이용하여 최근접 이웃 검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

  • PDF

데이터 스칼라십: 데이터 저널과 데이터 리포지토리를 중심으로 (Data Scholarship: Data Journals and Data Repositories)

  • 박형주
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.443-451
    • /
    • 2024
  • 본 연구는 데이터 스칼라십을 이해하기 위하여 데이터 논문으로 색인되는 저널의 지적 구조를 분석 및 시각화하고 데이터 리포지토리의 운영을 비교하였다. 동료 평가(peer review) 유형을 살펴보고, 공동 출현 분석(co-occurence analysis) 및 네트워크 분석(network analysis)을 실시하였다. WoS에 데이터 논문으로 색인되는 상위 10위 저널은 전통적인 유형과 데이터 논문 유형을 혼재해서 발간하고 있었다. DCI에 색인되는 데이터 리포지토리는 대부분 북미 및 유럽 국가에서 운영하고 있다. 국내의 데이터 리포지토리는 대부분 연구원에서 운영하고 있다. 본 연구의 결과는 데이터 저널, 데이터 리포지토리 등 데이터 스칼라십의 관행을 이해하는 데 도움이 되기를 바란다.

형용사 시소러스 설계에 관한 연구 (Design of Adjective Thesaurus)

  • 유명희;최석두
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.197-204
    • /
    • 2002
  • 형용사는 감성 및 감정검색을 위한 색인에서 주로 사용된다. 이를 위해서는 형용사의 개념관계를 파악하고 표현하는 것이 중요한 일이다. 본 연구에서는 형용사의 개념관계를 표현하기 위하여 형용사의 특성, 관련 개념구조를 고찰하고, 아울러 구조화, 관계, 표시방법, 배열 등을 고려하여 형용사 시소러스를 설계하였다.

  • PDF

이동 객체의 현재 위치 색인 기법 (On Indexing Method for Current Positions of Moving Objects)

  • 박현규;강성탁;김명호;민경욱
    • 한국공간정보시스템학회 논문지
    • /
    • 제5권1호
    • /
    • pp.65-74
    • /
    • 2003
  • 위치 기반 서비스는 이동 통신 단말기의 위치를 GPS 등을 이용하여 실시간 위치 정보와 관련된 정보를 제공하는 응용 서비스로서 이동 통신망의 고도화에 따라 교통, 물류, 전자 상거래 등의 분야에서 시공간 데이터베이스의 주요한 응용 영역으로 부각되고 있다. 속도와 이동 방향과 같은 궤적 정보가 제공되지 않는 이동 통신 환경에서 지속적으로 변화하는 이동 객체의 위치를 효율적으로 색인하는 방법으로 본 논문에서는 A-Quadtree를 제시한다. A-Quadtree는 2차원 위치 정보를 실시간 갱신을 지원하는 구조로서 객체 식별자에 대한 색인과 통합하여.Net 콤포넌트로서 구현함으로써 다양한 플랫폼에 적용이 가능하도록 하였다. 또한 실험을 통하여 A-Quadtree는 기존의 다차원 색인 구조보다 갱신과 검색 성능이 효율적임을 보인다.

  • PDF

비디오 서버에서 온톨로지를 이용한 의미기반 장면 검색 (Semantic-based Scene Retrieval Using Ontologies for Video Server)

  • 정민영;박성한
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.32-37
    • /
    • 2008
  • 최근 멀티미디어 정보의 양이 빠른 속도로 증가함에 따라 비디오 자료에 대한 효율적 관리는 매우 중요한 의미를 가지게 되었다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있어 신속하고 효율적으로 비디오 검색을 하기 위해서는 정확한 특징 정보를 추출하여 비디오 색인 구조를 구축해야 한다. 비디오 색인 구조는 전통의 데이터베이스와는 다른 모델링 방법과 검색 방법을 사용한다. 따라서 비디오 색인 구조에서 검색의 속도와 정확도를 향상시키기 위해서는 새로운 비디오 색인 구조가 필요하다. 본 논문에서는 의미적으로 비디오를 장면단위로 검색할 수 있는 비디오 온톨로지 시스템을 제안한다. 비디오 온톨로지 시스템은 장면의 내용에 대한 키워드를 구조화 시킨 장면이름 온톨로지와 장면이 가지는 특징 정보에 대한 정보를 가지는 장면 모델 온톨로지로 구성된다. 장면 이름 온톨로지는 색인된 내용에 대한 의미적 검색이 가능하도록 단어들을 트리구조로 저장된다. 그리고 장면 모델 온톨로지는 색상, 모양, 재질과 같은 저수준 정보와 객체, 이벤트 같은 고수준 정보의 의미적 차이를 극복해 줌으로써 의미기반 검색이 가능하게 해준다.

개혁신학과 복음주의에 관한 계량서지학적 비교 연구 (A Comparative Study using Bibliometric Analysis Method on the Reformed Theology and Evangelicalism)

  • 유영준;이재윤
    • 한국비블리아학회지
    • /
    • 제29권3호
    • /
    • pp.41-63
    • /
    • 2018
  • 이 연구에서는 개혁신학과 복음주의, 중립적인 신학적 입장을 가지는 학술지와 색인어, 저자를 대상으로 계량서지학적 분석 방법을 적용하였다. 구체적인 분석방법은 평균 연결 군집화, 이웃중심성 척도, 프로파일 코사인 유사도를 활용하여 세 가지 결과를 제시하였다. 특히 저자 간 관계를 분석할 때에는 저자 사이에 핵심 공유 색인어를 파악해서 연구 주제를 해석하는 새로운 시도를 해보았다. 학술지 분석에서는 9개 학술지가 크게 개혁신학과 복음주의의 두 개 군집으로 나뉘어졌지만, 개혁신학을 지향하는 장로교단 학술지인 장신논단만 복음주의 군집에 속하였다. 두 군집의 색인어 분석에서도 개혁신학과 복음주의가 두 군집을 대표하는 주요어로 나타났다. 저자 분석에서는 9개의 군집이 산출되었다. 이중에서 4개의 군집에는 주로 개혁신학을 연구하는 장로교단 신학자들이 포함되었으며, 5개 군집에는 장로교단에 소속되지 않은 신학자들이 주로 포함되었다. 따라서 학술지와 색인어, 저자에 대한 계량서지학적 분석 모두에서 일관되게 개혁신학 군집과 복음주의 군집을 도출하였다.