• Title/Summary/Keyword: 색인화

Search Result 272, Processing Time 0.03 seconds

Design of a Korean Intelligent Information Retrieval System (우리말 정보 자료를 처리하는 지능형 정보 검색 시스템의 설계)

  • 정영미
    • Journal of the Korean Society for information Management
    • /
    • v.8 no.2
    • /
    • pp.3-31
    • /
    • 1991
  • A prototype model of intelligent information retrieval system is presented with the definition of intelligent information retrieval. An intelligent information retrieval system for Korean documents was designed, and the system was implemented with Turbo Prolog 2.0 and Turbo Pascal 5.5. The characteristics of the system include natural language interface, user modeling, automatic indexing by case relationship, and multiple retrieval techniques.

  • PDF

A System for the Decomposition of Text Block into Words (텍스트 영역에 대한 단어 단위 분할 시스템)

  • Jeong, Chang-Boo;Kwag, Hee-Kue;Jeong, Seon-Hwa;Kim, Soo-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.293-296
    • /
    • 2000
  • 본 논문에서는 주제어 인식에 기반한 문서영상의 검색 및 색인 시스템에 적용하기 위한 단어 단위 분한 시스템을 제안한다. 제안 시스템은 영상 전처리, 문서 구조 분석을 통해 추출된 텍스트 영역을 입력으로 단어 단위 분할을 수행하는데, 텍스트 영역에 대해 텍스트 라인을 분할하고 분할된 텍스트 라인을 단어 단위로 분할하는 계층적 접근 방법을 사용한다. 텍스트라인 분할은 수평 방향 투영 프로파일을 적용하여 분할 지점을 구한다. 그리고 단어 분할은 연결요소들을 추출한 후 연결요소간의 gap 정보를 구하고, gap 군집화 기법을 사용하여 단어 단위 분한 지점을 구한다. 이때 단어 단위 분할의 성능을 저하시키는 특수기호에 대해서는 휴리스틱 정보를 이용하여 검출한다. 제안 시스템의 성능 평가는 50개의 텍스트 영역에 적용하여 99.83%의 정확도를 얻을 수 있었다.

  • PDF

Object and Cell Clustering Algorithms of the Fixed Grid File (고정 그리드 파일의 객체 및 셀 클러스터링 알고리즘)

  • Jo, Dae-Su;Yu, Jin-Yeong;Hong, Bong-Hui
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.69-85
    • /
    • 2001
  • 공간 데이터베이스에서 효율적으로 공간 질의를 처리하기 위해서는 클러스터링을 통해서 이스크 접근 비용을 줄이는 것이 필요하다. 이 논문은 공간 지역성에 기반을 둔 여러 가지 클러스터링 알고리즘을 제안하고 실험을 통해 제안한 클러스터링 알고리즘의 성능을 평가하였다. 이 논문에서 제안하는 클러스터링 알고리즘은 객체 클러스터링 알고리즘과 셀 클러스터링 알고리즘으로 나뉜다. 객체 클러스터링 알고리즘은 정규 준할 공간 색인 구조에서 영역 분할 선과 겹치는 객체들의 저장 위치를 결정하는데 사용된다. 셀 클러스터링 알고리즘은 클러스터를 만들기 위해 정규 분할된 영역들을 그룹화하는데 사용된다. 실험결과 객체 클러스터링 알고리즘에서는 객체간의 거리를 이용한 경우에 대체로 좋은 성능을 보였지만, 버퍼 크기가 커지거나 데이터가 희박한 영역의 질의에 있어서는 알고리즘 별로 성능의 차이는 거의 없었다. 셀 클러스터링 알고리즘에 대한 실험에서는 이 논문에서 제안한 클러스터링 알고리즘은 N-순서화 기법에 의한 클러스터링 알고리즘에 비해 우수한 성능을 보였다. 특히 중복 참조도를 이용한 경우와 셀의 무게 중심간 거리를 이용한 방법이 가장 우수하였다.

  • PDF

Alleviating Semantic Term Mismatches in Korean Information Retrieval (한국어 정보 검색에서 의미적 용어 불일치 완화 방안)

  • Yun, Bo-Hyun;Park, Sung-Jin;Kang, Hyun-Kyu
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.12
    • /
    • pp.3874-3884
    • /
    • 2000
  • An information retrieval system has to retrieve all and only documents which are relevant to a user query, even if index terms and query terms are not matched exactly. However, term mismatches between index terms and qucry terms have been a serious obstacle to the enhancement of retrieval performance. In this paper, we discuss automatic term normalization between words in text corpora and their application to a Korean information retrieval system. We perform two types of term normalizations to alleviate semantic term mismatches: equivalence class and co-occurrence cluster. First, transliterations, spelling errors, and synonyms are normalized into equivalence classes bv using contextual similarity. Second, context-based terms are normalized by using a combination of mutual information and word context to establish word similarities. Next, unsupervised clustering is done by using K-means algorithm and co-occurrence clusters are identified. In this paper, these normalized term products are used in the query expansion to alleviate semantic tem1 mismatches. In other words, we utilize two kinds of tcrm normalizations, equivalence class and co-occurrence cluster, to expand user's queries with new tcrms, in an attempt to make user's queries more comprehensive (adding transliterations) or more specific (adding spc'Cializationsl. For query expansion, we employ two complementary methods: term suggestion and term relevance feedback. The experimental results show that our proposed system can alleviatl' semantic term mismatches and can also provide the appropriate similarity measurements. As a result, we know that our system can improve the rctrieval efficiency of the information retrieval system.

  • PDF

A Multi-dimensional Range Query Processing using Space Filling Curves (공간 순서화 곡선을 이용한 다차원 영역 질의 처리)

  • Back, Hyun;Won, Jung-Im;Yoon, Jee-Hee
    • Journal of Korea Spatial Information System Society
    • /
    • v.8 no.2 s.17
    • /
    • pp.13-38
    • /
    • 2006
  • Range query is one of the most important operations for spatial objects, it retrieves all spatial objects that overlap a given query region in multi-dimensional space. The DOT(DOuble Transformation) is known as an efficient indexing methods, it transforms the MBR of a spatial object into a single numeric value using a space filling curve, and stores the value in a $B^+$-tree. The DOT index is possible to be employed as a primary index for spatial objects. However, the range query processing based on the DOT index requires much overhead for spatial transformations to get the query region in the final space. Also, the detailed range query processing method for 2-dimensional spatial objects has not been studied yet in this paper, we propose an efficient multi-dimensional range query processing technique based on the DOT index. The proposed technique exploits the regularities in the moving patterns of space filling curves to divide a query region into a set of maximal sub-legions within which space filling curves traverse without interruption. Such division reduces the number of spatial transformations required to perform the range query and thus improves the performance of range query processing. A visual simulator is developed to show the evaluation method and the performance of our technique.

  • PDF

Analysis of SCI Journals Cited by Korean Journals in the Computer field

  • Kim, Byungkyu;You, Beom-Jong;Kang, Ji-Hoon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.24 no.11
    • /
    • pp.79-86
    • /
    • 2019
  • It is very important to analyze and provide information resources for research output produced in the computer field, the core science of the 4th Industrial Revolution. In this paper, SCI journals cited from domestic journals in the computer field were identified and the citation rankings and their co-citation networks were generated, analyzed, mapped and visualized. For this, the bibliographic and citation index information from 2015 to 2017 in the KSCD were used as the basis data, and the co-citation method and network centrality analysis were used. As a result of this study, the number of citations and the citation ranks of SCI journals and papers cited by korean journals in the computer field were analyzed, and peak time(2 years), half-life(6.6 years), and immediacy citation rate(2.4%) were measured by citation age analysis. As a result of network centrality analysis, Three network centralities(degree, betweenness, closeness) of the cited SCI journals were calculated, and the ranking of journals by each network centrality was measured, and the relationship between the subject classifications of the cited SCI journals was visualized through the mapping of the network.

논문·특허 분석 기반 이종 분야 공통기술 식별을 통한 융복합연구 전략수립 연구: 핵융합·가속기 공통부품 국산화 전략수립을 중심으로

  • Kim, Yu-Bin;Jang, Han-Su;Choe, Won-Jae;Hwang, Seong-Ha;Do, Hyeon-Su;Kim, Tae-Yun
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2015.05a
    • /
    • pp.241-254
    • /
    • 2015
  • 최근 연구개발(R&D) 관련 연구 주체 간 융복합 연구를 통한 신규 사업 발굴의 관심이 높아지고 있다. 이로 인해 융복합 신규 사업을 발굴하고 기획하는 것이 매우 중요해지고 있으며, 관련하여 이종 분야 간 융복합 분야 발굴을 위한 다양한 방법이 시도되고 있다. 본 논문은 논문 특허 정보 분석을 통해 기존 방법 대비 빠르게 공통 기술을 식별하고, 식별된 결과를 활용한 융복합 연구 전략 수립의 과정을 핵융합 가속기 공통 부품국산화 추진 전략 사례 연구를 통해 제시하고자 한다. 먼저 양 분야 간 어떤 기술들이 공통적으로 다루어지고 있는지를 논문 특허 분석으로 식별하기 위해 핵융합 가속기 분야를 중심으로 WoS(Web of Science) 논문 DB를 활용하여 두 분야 간 공통적으로 출현하는 색인(Index) 빈도수 분석 및 Thomson Innovation을 활용한 신규성(Novelty) 중심의 특허 분석을 수행하여 공통 기술을 식별하는 방법론을 제시하였다. 이렇게 도출된 공통기술 분야는 기술과 관련 산업체의 사상(寫像, mapping) 과정에 활용하여 국산화 추진 후보를 선별하였고, 기술경쟁력, 기술성숙도 등의 기술성 평가 수행으로 국산화 추진을 위한 최종 전략 분야를 선정하여 핵융합 가속기 공통기술 기반의 융복합 연구의 전략 수립 전 과정을 제시하였다.

  • PDF

A Mathematical Equation Retrieval System Based on Formula Patterns Expressed in Korean (한글화된 수식 패턴을 이용한 수학식 검색 시스템)

  • Kim, Shin-Il;Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.233-236
    • /
    • 2011
  • 일반적인 문서에 대한 정보 검색 연구는 활발히 진행되고 있으며, 일상 생활 속에서도 대중화되어 많이 사용되고 있다. 이에 따라 음성, 이미지 검색 등 특정 분야의 검색에 대한 연구도 활발히 진행되고 있지만, 수학식 검색에 대한 연구는 비교적으로 미비한 실정이다. 수학식 검색과 관련된 연구들은 대부분 MathML (Mathematical Markup Language), TeX 등으로 작성된 수학식을 대상으로 진행되었지만, 특정 언어나 별개의 수학 입력 툴들을 이용한 검색 방법은 일반 사용자들이 사용하기에는 쉽지 않다는 단점이 있다. 그래서, 본 논문에서는 일반 문서 검색과 마찬가지로, 수학식을 읽듯이 한글을 입력했을 때 색인어 추출 방법 및 검색 방법에 대해 제안한다. 실험을 위해서 수학 문제집에 나오는 1,432개의 수학식을 한글화 시켰고, 한글화된 결과에 대해 패턴 등을 추출하여 MRR (Mean Reciprocal Rank), $Rel_{EQ}$@N(Relevance evaluation at N)로 평가하였다. 100개의 한글 질의어에 대해 MRR@5로 계산된 수학식 검색 결과가 약 0.6 정도 되는 것을 확인할 수 있었고, 학습 데이터에 포함되지 않은 질의수학식 5개에 대해 $Rel_{EQ}$@5로 계산했을 때 평균 60% 의 정확률을 보였다.

Identification and Characterization of Aeromonas hydrophila Producing Nitrification Capability (질산화 작용이 있는 Aeromonas hydrophila의 동정 및 특성)

  • 엄미나;장재철;유영희;지의상
    • The Korean Journal of Food And Nutrition
    • /
    • v.13 no.6
    • /
    • pp.611-618
    • /
    • 2000
  • For the purpose of the isolation of microorganisms which have the capability of nitrification, we isolated the microorganisms in 6 samples collected from the stream of Kyonggi area. 60 strains were isolated. The selected strain were identified as a Aeromonas hydrophila based on the data obtained from the morphological, biochemical and cultural characteristics defined experiments. Among them Aeromonas hydrophila (AH-1), (AH-3) , (AH-4), (AH-6) showed the highest nitrification capability. All isolates were resistant to amoxillin, ampicillin, cephalothin and ticarcillin. Optimum culture conditions of isolates were 37$^{\circ}C$ and 1${\times}$10$\^$8/ cells/ml for 4 hours in the nitrate medium.

  • PDF

A Study on the Development of a Practical Morphological Analysis System Based on Word Analysis (어절 분석 기반 형태소 분석 시스템 개발에 관한 연구)

  • 조현양;최성필;최재황
    • Journal of the Korean Society for information Management
    • /
    • v.18 no.2
    • /
    • pp.105-124
    • /
    • 2001
  • The purpose of this study is to develop a Korean word analysis system, which can improve performance of IRS, based on various methods of word analysis. In this study we focused on maximizing the speed of Korean word analysis, modulizing each functional system and analyzing Korean morpheme precisely. The system, developed in this study, implemented optimal algorithm to increase the speed of word analysis and to verify speed and performance of each subsystem. In addition, the numeral analysis processing was achieved to reduce a system burden by avoiding recursive analysis of compound nouns, based on numeral pattern recognition.

  • PDF