• Title/Summary/Keyword: 분류별 검색

Search Result 307, Processing Time 0.026 seconds

A Hypertext Categorization Model Exploiting Link and Incrementally Available Category Information (점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 모델)

  • Oh, Hyo-Jung;Lim, Jeong-Mook;Lee, Mann-Ho;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.89-96
    • /
    • 1999
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 하이퍼링크는 문서간의 관계를 나타내는 유용한 정보로서 링크를 통해 연결된 두 문서는 내용적으로 관련이 있어 검색에 도움을 준다는 것은 이미 밝혀진바 있다. 본 논문에서는 이러한 과거 연구를 바탕으로 새로운 문서 분류 모델을 제안하는데, 이 모델의 주안점은 대상 문서와 링크로 연결된 이웃 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 문서의 범주를 결정한다. 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이 모델은 이웃한 문서의 범주가 미리 할당되어 있지 않은 경우 용어 기반 분류 방법으로 가용 범주를 할당하고, 이렇게 할당된 분류 정보가 다시 새로운 문서의 범주를 결정할 때 사용됨으로써, 문서 집합 전체의 분류가 점진적으로 이루어지며 그 정확도를 더해 나가는 효과를 가져올 수 있다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRI-Kyemong) 자료를 대상으로 실험한 결과 18.5%의 성능 향상을 얻었다.

  • PDF

The System of customized Travel Information based on Ontology (온톨로지를 이용한 맞춤형 여행정보 시스템)

  • Cho Mi-Young;Choi Chang;Kim Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.187-189
    • /
    • 2006
  • 본 논문에서는 지능형 여행 정보 제공을 위해 제주여행 온톨로지를 구축하여 사용자별 맞춤형 여행정보 제공 및 검색을 위한 시스템을 제안하고자 한다. 기존의 일반 검색이 제한된 정보에 대한 키워드 매칭이 라면, 온톨로지 기반 검색은 키워드 검색, 사전에 의한 확장 검색, 지식입력에 의한 검색이 모두 가능하여 좀 더 지능적 검색이라 할 수 있겠다. 이러한 온톨로지 검색의 장정으로는 속성값, 분류, 메타 정보 등 관련된 여행정보를 모두 활용할 수 있다는 것과. 유사어 활용이 가능하다는 것이다. 또한 검색 어휘의 역할에 따른 차등적인 가중치값 등을 적용하여 Many-Answers-Problem 해결할 수 있다. 즉, 가장 관련 있는 정보를 상위에 랭크시켜 사용자의 체감 정확률을 향상시킬 수 있다.

  • PDF

A Study on the Development of an Independent Movement Collection Classification System: Focus on the Gonghun Digital Archive (독립 운동 컬렉션 분류 체계 개발에 관한 연구 - 공훈전자사료관을 중심으로 -)

  • Oh, Jung Hee;Chung, Yeon Kyoung
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.18 no.4
    • /
    • pp.99-124
    • /
    • 2018
  • This study suggests the development of a classification system for the Independent Movement Records of the Ministry of Patriots and Veterans Affairs based on the collection of Gonghun Digital Archive based on sources, subjects, and media types. First, the classification system by source is organized by hierarchy, and the records classified by source are classified into the second category based on the related keyword. Then, the records are classified into 17 media types. Finally, it is described in the citation order of "source-subject-media type." In addition, a meaningful collection using inductive methods based on the subject words is derived. Finally, Gonghun Digital Archive collections are categorized by media types, sources, and subjects so that users can easily find the records. The result of this study is a classification system to support records retrieval of an independent movement collection, and it will become a basis for expanding the accessibility of the user and the service of independent movement records.

A Study on Search Query Topics and Types using Topic Modeling and Principal Components Analysis (토픽모델링 및 주성분 분석 기반 검색 질의 유형 분류 연구)

  • Kang, Hyun-Ah;Lim, Heui-Seok
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.6
    • /
    • pp.223-234
    • /
    • 2021
  • Recent advances in the 4th Industrial Revolution have accelerated the change of the shopping behavior from offline to online. Search queries show customers' information needs most intensively in online shopping. However, there are not many search query research in the field of search, and most of the prior research in the field of search query research has been studied on a limited topic and data-based basis based on researchers' qualitative judgment. To this end, this study defines the type of search query with data-based quantitative methodology by applying machine learning to search research query field to define the 15 topics of search query by conducting topic modeling based on search query and clicked document information. Furthermore, we present a new classification system of new search query types representing searching behavior characteristics by extracting key variables through principal component analysis and analyzing. The results of this study are expected to contribute to the establishment of effective search services and the development of search systems.

Image Retrieval Using Color feature and GLCM and Direction in Wavelet Transform Domain (Wavelet 변환 영역에서 칼라 정보와 GLCM 및 방향성을 이용한 영상 검색)

  • 이정봉
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2002.05a
    • /
    • pp.585-589
    • /
    • 2002
  • In this paper, hierarchical retrieval system based on efficient feature extraction is proposed. In order to retrieval the image with robustness for geometrical transformation such as translation, scaling, and rotation. After performing the 2-level wavelet transform on image, We extract moment in low-level subband which was subdivided into subimages and texture feature, contrast of GLCM(Gray Level Co-occurrence Matrix). At first we retrieve the candidate images in database by the ones of image. To perform a more accurate image retrieval, the edge information on the high-level subband was subdivided horizontally, vertically and diagonally. And then, the energy rate of edge per direction was determined and used to compare the energy rate of edge between images for higher accuracy.

  • PDF

Design and Implementation of an Index Manager for SGML Information Retrieval (SGML 정보검색을 위한 인덱스 관리자의 설계 및 구현)

  • Jang, Jae-U;Lee, Hui-Ju;Son, Jeong-Han;Sim, Bu-Seong;Ju, Jong-Cheol
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.2
    • /
    • pp.135-146
    • /
    • 1999
  • SGML 정보검색을 위한 인텍스 관리자는 SGML 정보 표현의 기본 단위인 엘리먼트 단위의 검색과 문서의 논리적인 구조에 기반한 검색을 지원해야 하면 아울러, 우수한 검색 시간과 낮은 부가 저장 공간을 보장하여야한다. 이러한 요구사항을 만족시키기 위해 본 논문에서는 SGML 정보검색을 위한 사용자 질의 형태별로 분류하여 이를 토대로 SGML 정보검색 인덱스 관리자를 설계한다. 아울러 인덱스 관리자를 UNIX 운영체제하에서 표준 C 언어를 가지고 02 Store 하부저장 시스템을 이용하여 구현한다. 마지막으로 저장 시간, 삭제시간, 검색 시간, 부가 저장 공간 측면에서 구현된 인덱스 관리자의 성능 평가를 수행한다.

A Study on Traffic Research Retrieval Method using Large Capacity Analysis System (대용량 분석 시스템을 이용한 교통 연구 검색 방법론에 관한 연구)

  • Bae, Jin-Ah;Youn, Cheong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.577-580
    • /
    • 2018
  • 지난 몇 년간 우리는 소셜 검색에 몰두하여 연관검색 및 소비자의 만족을 위해 빅데이터 분석을 하였다. 최근에는 빅데이터 분석이라는 흐름에 맞춰 기업 및 기관별 본연의 정보를 통합하여 효율적인 검색을 할 수 있도록 하는 솔루션을 대거 도입하고 있다. 또한 기업 및 기관에서 가지고 있는 정보는 기존 비정형 데이터로 방대하여 기존의 방법이나 도구로 수집 및 저장 분석이 어려운 실정이다. 이에 공공기관 및 민간기업 등에서는 키워드 중심의 다양한 검색엔진을 개발하거나 도입하고 있으며, 정보 분류의 확대, 메타데이터의 활용, 태그정보의 제공, 개인 맞춤형 서비스 등 고객의 만족도를 제고하기 위한 다양한 방법을 시도하고 있다. 본 연구에서는 기관의 교통 연구와 관련한 일련의 작업 중 행정문서, 연구정보, 유관기관 게시물 등의 통합 빅데이터를 가지고 검색시스템을 구현하였다. 이와 더불어 사용자 사전 및 동의어 사전을 통한 검색 키워드를 데이터베이스에 저장하여 검색 효율성을 제고하는 방안을 제시한다.

Design Pattern Base4 Component Classification and Retrieval using E-SARM (설계 패턴 기반 컴포넌트 분류와 E-SARM을 이용한 검색)

  • Kim, Gui-Jung;Han, Jung-Soo;Song, Young-Jae
    • The KIPS Transactions:PartD
    • /
    • v.11D no.5
    • /
    • pp.1133-1142
    • /
    • 2004
  • This paper proposes a method to classify and retrieve components in repository using the idea of domain orientation for the successful reuse of components. A design pattern was applied to existing systems and a component classification method is suggested here to compare the structural similarity between each component in relevant domain and criterion patterns. Classifying reusable components by their functionality and then depicting their structures with a diagram can increase component reusability and portability between platforms. Efficiency of component reuse can be raised because the most appropriate component to query and similar candidate components are provided in priority by use of-SARM algorithm.

Information management system development of construction material based on international data attribute (국제 데이터 속성 기반 건설자재 정보관리 시스템 구축)

  • Choong-Han Han
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.645-648
    • /
    • 2008
  • 최근 건설 분야의 정보화 기술이 발달함에 따라 건설생애(Life Cycle) 과정에서 파생되는 방대한 양의 정보를 수집·가공·축적·제공 하는 시스템이 급증하는 추세이다. 특히, 건설공사의 주요요소인 자재 정보를 제공하는 Web 기반 온라인 시스템만 현재 110여개 이상으로 토목·건축·설비·소방 분야에 이르기까지 매우 다양하다. 그러나 이러한 시스템에서 제공 중인 정보가 표준화 및 정형화 되지 않아 건설현장 실무자들의 정보 획득에 있어 많은 어려움을 겪고 있다. 이에 본 연구에서는 정형화되고 표준화된 건설자재정보를 제공하기 위해 건설자재 분류체계를 정의하고 건설자재 속성정보를 정형화하여 자재별 분류체계검색, 통합검색, 카테고리검색 뿐만 아니라 전자카탈로그로 변환 및 생성이 가능한 건설자재정보 관리 시스템을 설계 및 구현 하였다.

The Search of Image Outline Using 3D Viewpoint Change (3차원 시점 변화를 활용한 이미지 외곽라인 검색 제안)

  • Kim, Sungkon
    • The Journal of the Convergence on Culture Technology
    • /
    • v.5 no.3
    • /
    • pp.283-288
    • /
    • 2019
  • We propose a method to search for similar images by using outline lines and viewpoints. In the first test, the three-dimensional image, which can't control the motion, has lower search accuracy than the static flat image. For the cause analysis, six specific tropical fish data were selected. We made a 3D graphics of tropical fishes of each kind, and we made 144 image outline lines with 12 stage viewpoints of top, bottom, left and right. Tropical fish by type were collected and sorted by time of search through similar search. Studies have shown that there are many unique viewpoints for each species of tropical fish. To increase the accuracy of the search, a User Interface was created to select the user's point of view. When the user selects the viewpoint of the image, a method of showing the result in consideration of the range of the related viewpoint is proposed.