• Title/Summary/Keyword: 검색 형태 분석

Search Result 532, Processing Time 0.026 seconds

Image Retrieval using Gray Scale Histogram Refinement and Corner Shape (코너 형태와 그레이스케일 히스토그램을 정제를 이용한 영상검색)

  • Jeong, Il-Hoe;Riaz, Muhammad;Park, Jong-An
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.380-383
    • /
    • 2008
  • 본 논문은 단순한 키워드 검색에서 발생하는 오차를 줄이기 위해 이미지의 코너정보와 그레이스케일 히스토그램 정제를 이용한 영상 검색 시스템을 구현하고자 한다. 먼저 원하는 이미지의 특정을 추출하는 단계와 추출된 특징을 분석하는 단계, 확보된 정보를 데이터베이스로부터 검색하는 단계, 그 결과 안에서의 그레이스케일 히스토그램 정제 방법으로 다시 재검색하는 단계, 마지막으로 정확한 정보 추출단계를 거치게 된다. 구현 알고리즘은 검색 단계에 있어서 크게 2단계로 나눠진다. 먼저 이미지를 에지로 변환 코너정보를 추출하는 단계, 코너 점의 픽셀을 3*3으로 나누어 RGB중의 픽셀의 합을 하는 단계, 그 코너 값을 데이터베이스와 비교하는 단계, 최대 500개까지의 추출된 이미지를 데이터베이스에 저장되는 단계로 이루어지며 다음 단계는 원 이미지를 그레이스케일로 변환 등질화하는 단계, 히스토그램 정보 획득하는 단계, 8*8 개의 빈으로 나누어 최대 색상정보 값을 추출하는 단계, 그리고 최대 색상정보 영역을 1단계 결과 값과 비교하여 정확한 검색을 얻는 단계로 구성되며 시뮬레이션 결과는 우수한 정확도를 보여 주고 있다.

  • PDF

Vector Space Model for Patent Information Retrieval System (특허정보 검색을 위한 벡터스페이스 검색모텔의 적용)

  • 원상훈;노태길;손기준;박정희;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.516-518
    • /
    • 2003
  • 본 논문은 특허 문서에 맞게 벡터스페이스 모델을 적용하여 특허정보 검색기를 구현한다. 기존의 상용 특허 검색 시스템의 문제점을 제시하고, 특허 문헌의 특징을 분석하여, 이를 반영한 특허 문헌 검색등의 벡터 스페이스 모델을 제시한다. 하나의 특허 문서는 서로 상이한 특성을 지닌 텍스트와 데이터의 조합으로 이루어져 있다. 따라서 이를 하나의 벡터로 표현하는 것이 용이하지 않다. 이에 대해 본 연구에서는 내용 필드들을 특성에 따라 둘 이상의 벡터로 표현하고, 수치 및 고유명 필드는 불린검색형태로 처리되는 혼합형 벡터 모델을 제안한다. 각 필드의 특징에 맞게 색인어를 추출하며, 텍스트 필드의 색인어률 벡터로 표현하는 과정에서는 잘 알려진 TF-IDF 가중치를 사용하되, 특허 문서가 IPC 특허 분류 기준에 따라 완전 분류되어 있는 문서라는 특징을 이용, 보다 정확한 가중치를 부여한다. 실험과 성능평가를 통하여 제안한 특허 모델의 유용성을 보인다.

  • PDF

Learning Web-Document Characteristics Using Evolutionary Computation (진화연산을 이용한 웹 문서의 특성 학습)

  • Kim, Sun;Jang, Byung-Tak
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.43-46
    • /
    • 2000
  • 대용량의 문서를 대상으로 한 정보 검색은 인터넷과 WWW이 대중화되면서 웹 분서로 확장되었다. 기존의 문서는 주로 텍스트만으로 구성되는데 반해 웹 문서는 HTML을 기반으로 문서가 작성된다. HTML은 문서의 형태를 이루게 하는 여러 종류의 태그들로 구성되어 있고 문서 작성자는 이를 이용, 자기 의도를 홈페이지에 반영한다. 따라서 태그 정보의 학습은 검색 효율을 향상시키는데 도움을 줄 수 있다. 본 논문에서는 이러한 HTML의 태그 특성을 이용해 검색 효율을 향상하는 방법을 제시한다. 제시된 방법은 진화 알고리즘을 사용하여 질의와 검색결과를 담고 있는 데이터를 학습한다. 학습을 통해 얻어지는 결고는 각 태그에 대한 가중치 정보들이며, 이는 검색엔진의 문서 가중치 정보로 사용된다. TREC 데이터를 사용하여 실험 하였으며 태그 정보를 이용함에 따른 검색 성능 변화를 비교 분석하였다.

  • PDF

Long-tail Query Expansion using Extractive and Generative Methods (롱테일 질의 확장을 위한 추출 및 생성 기반 모델)

  • Kim, Lae-Seon;Kim, Seong-soon;Jang, Heon-Seok;Park, Seok-Won;Kang, In-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.267-273
    • /
    • 2020
  • 검색 엔진에 입력되는 질의 중 입력 빈도는 낮지만 상대적으로 길이가 긴 질의를 롱테일 질의라고 일컫는다. 롱테일 질의가 전체 검색 로그에서 차지하는 비중은 높은 반면, 그 형태가 매우 다양하고 검색 의도가 상세하며 개별 질의의 양은 충분하지 않은 경우가 많기 때문에 해당 질의에 대한 적절한 검색어를 추천하는 것은 어려운 문제다. 본 논문에서는 롱테일 질의 입력 시 적절한 검색어 추천을 제공하기 위하여 질의-문서 클릭 정보를 활용한 추출기반 모델 및 Seq2seq와 GPT-2 기반 생성모델을 활용한 질의 확장 방법론을 제안한다. 실험 및 결과 분석을 통하여 제안 방법이 기존에 대응하지 못했던 롱테일 질의를 자연스럽게 확장할 수 있음을 보였다. 본 연구 결과를 실제 서비스에 접목함으로써 사용자의 검색 편리성을 증대하는 동시에, 언어 모델링 기반 질의 확장에 대한 가능성을 확인하였다.

  • PDF

A Study on the Characteristics of Integrated Search Services in Public Libraries in Korea: Focusing on the Integrated Libraries of Local Autonomous Entities of Seoul City (우리나라 공공도서관의 통합검색 서비스 특성에 관한 연구: 서울시 자치구 통합도서관을 중심으로)

  • Soo-Sang Lee
    • Journal of the Korean Society for information Management
    • /
    • v.40 no.3
    • /
    • pp.1-23
    • /
    • 2023
  • The purpose of this study is to analyze the characteristics of the integrated search services for integrated libraries operated by local governments in Korea. The target of analysis was integrated libraries operated by 25 local governments in Seoul, and the analysis elements were selected from service functions in 12 areas related to integrated search. The results of the study are as follows. First, the integrated library is an association of public libraries and small libraries in autonomous districts and provides integrated search services. The provided integrated search service function, types of bibliographic information, and facets are not diverse. Second, the records in the search results were mostly item types, not title types. Third, enrichment information supplementing book information consists of book introductions, related information, book-related keywords, and loan-related information. Fourth, integrated search shows the form of integrated OPAC based on integrated catalog DB rather than discovery-type search. It concentrates on providing an integrated search for catalog DBs distributed in public libraries or small libraries in the autonomous district. Fifth, most integrated libraries provide similar service types. Based on these results, improvement plans were proposed for domestic public libraries to expect discovery-type integrated search services.

The Search of Image Outline Using 3D Viewpoint Change (3차원 시점 변화를 활용한 이미지 외곽라인 검색 제안)

  • Kim, Sungkon
    • The Journal of the Convergence on Culture Technology
    • /
    • v.5 no.3
    • /
    • pp.283-288
    • /
    • 2019
  • We propose a method to search for similar images by using outline lines and viewpoints. In the first test, the three-dimensional image, which can't control the motion, has lower search accuracy than the static flat image. For the cause analysis, six specific tropical fish data were selected. We made a 3D graphics of tropical fishes of each kind, and we made 144 image outline lines with 12 stage viewpoints of top, bottom, left and right. Tropical fish by type were collected and sorted by time of search through similar search. Studies have shown that there are many unique viewpoints for each species of tropical fish. To increase the accuracy of the search, a User Interface was created to select the user's point of view. When the user selects the viewpoint of the image, a method of showing the result in consideration of the range of the related viewpoint is proposed.

A Study on Extraction for Korean Information Retrieval System (한국어 정보검색을 위한 색인어 추출방법에 관한 연구)

  • Choi, Soon-Woo;Kim, Sang-Bum;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.73-80
    • /
    • 2003
  • 본 논문에서는 색인 방법에 따른 한국어 정보검색시스템의 성능차이를 살펴보고 이를 분석하여 보다 검색성능을 높이기 위한 색인어 추출방법을 제안한다. 이를 위해 기존의 대표적인 색인법이라 할 수 있는 명사단위 색인법, 형태소 단위 색인법, 바이그램 단위 색인법, 어절단위 색인법에 대하여 실험을 통한 비교분석을 하였고, 질의별 분석을 통해 검색성능에 영향을 주는 요소들을 찾아내었다. 그 결과 빈칸, 면사분해, 명사, 동사, 형용사, 숫자등을 포함한 실질 형태소, 형식형태소의 제거, 외래어 등 추정명사의 분해 및 발음확장, 후방 단음절 명사로 구성된 복합명사의 분해, 의미를 변절시키는 바이그램 제거, 분해된 명사 수에 따른 복합명사 첨가 및 제거 등이 그 요소임을 확인할 수 있었다. 이를 토대로 각 색인법의 장점을 살려 색인 및 검색을 수행하여 보았다. 제안하는 방법은 동일한 실험집합에서 일관성 있은 성능향상을 가져다 줌을 알 수 있었다.

  • PDF

Analysis of Characteristics and Patterns of Tags in Digitized Cultural Heritage (디지털화 문화유산 태그의 패턴 및 특성 분석)

  • Kim, Seong-Hee;Lee, Hyung-Mi
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.20 no.3
    • /
    • pp.171-185
    • /
    • 2009
  • This study analyzed the characteristics and patterns of tags in cultural heritage collections. Works of art were assembled to be tagged, 100 taggers were deployed, and tagging encourged. The gathered tags were analyzed in terms of general patterns, tagging's functions, and usefulness for information access. The results can be used to improve the access of works of art.

Human Search Patterns on Product Comparison Service (제품 비교 웹서비스의 고객 검색 패턴에 대한 연구)

  • Lee, Hong-Hee;Lee, Choog-Kwon;Yoo, Sang-Jin
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.14 no.3
    • /
    • pp.98-105
    • /
    • 2009
  • It is important for firms to help customers find the products or information they need in order to increase sales and promote return visits to their websites. Hence, the presentation of product information is very important in e-commerce websites. In this research, we study how disposition styles can influence browsing patterns. The test results show that people are inclined to use feature information paths in the vertical disposition style and product information paths in the horizontal disposition style. With vertical disposition, users are more likely to follow feature information paths which may help them focus on comparisons across products.

A Study on Device Discovery for Web-based Multi Screen Environment (웹 기반 멀티스크린 환경을 위한 장치 검색 방안 연구)

  • Jun, Su-Yong;Kim, Geun-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.377-378
    • /
    • 2017
  • 유비쿼터스 환경에서 네트워크에 연결된 디바이스들이 연계하여 멀티스크린 서비스를 제공하기 위해서는 네트워크에 연결된 디바이스에서 사용가능한 서비스 유/무, 활성 상태, 서비스 상세 정보를 수집하는 디바이스 검색기술은 수집한 정보를 토대로 디바이스간 통신을 통해 서비스 상태의 공유/변경을 위해 필요하다. 본 논문에서는 유럽의 MediaScape 프로젝트의 웹 기반 디바이스 검색 기술을 분석하였으며 웹 브라우저에 구현되지 않은 블루투스 서비스 검색 기능을 안드로이드폰과 PC용 네이티브 어플리케이션의 형태로 RESTful 서버로 구현하여 웹 브라우저의 에이전트와 통신을 통해 웹 브라우저에서 장치 내 디바이스의 서비스 검색을 할 수 환경을 제공한다.