• Title/Summary/Keyword: 검색기

Search Result 1,067, Processing Time 0.033 seconds

A Study on the Types of Online Shopping Queries using Topic Modeling and Principal Components Analysis (토픽모델링과 주성분 분석을 활용한 온라인 쇼핑 검색 질의 유형 분류)

  • Kang, Hyeonah;Lim, Heuiseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.765-768
    • /
    • 2020
  • 검색 질의 연구 분야의 대부분 선행 연구는 검색 질의 주제 분류에 집중되어 있으며 질의 자체에 대한 연구자의 정성적인 판단으로 분석되었다. 이는 검색 이후 클릭 된 문서를 고려하지 않고 진행되었다는 점과 분석 주제 및 활용 데이터가 제한적이라는 것에 한계가 있다. 이에 본 연구는 국내 대형 온라인쇼핑몰의 1년간의 검색로그를 활용하여 검색 질의와 검색 이후 조회한 문서명 정보를 기반으로 토픽모델링을 수행하여 검색 질의 주제를 정의하였다. 또한 검색 행동특성에 따른 주제별 성격을 정의하기 위하여 주성분 분석을 통해 주요 변수 추출 후 각 주제별 검색 행동특성을 분석하였다. 본 연구 결과는 효과적인 검색 서비스 구축 및 검색 시스템 개발에 기여 할 것으로 기대된다. 향후 연구로는 텍스트 분류기 모델링 실험을 통해 자동 분류 시스템을 구현할 수 있을 것이다.

Landmark recognition through image searcher (이미지 검색기를 통한 랜드마크 인식)

  • Gi-Duk Kim;Geun-Hoo Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.313-315
    • /
    • 2024
  • 본 논문에서는 이미지 검색기를 통한 랜드마크 인식 방법을 제안한다. 특정 랜드마크 데이터세트에서 라벨링을 하지 않은 비지도 학습을 통해서 이미지에서 랜드마크의 클래스 분류를 위한 특징을 추출한다. 학습된 모델을 랜드마크 데이터세트인 Paris6k 데이터세트와 Oxford5k 데이터세트에 적용하여 랜드마크 인식 정확도를 확인하였다. 성능과 속도를 강화하기 위해 이미지 특징 추출 모델로 ResNet 대신에 YOLO에서 사용된 CSPDarknet-53을 사용하여 모델의 크기를 줄이고 랜드마크 인식 정확도를 높였다. 그리고 모델로부터 추출된 특징의 수를 줄여 이미지 검색 시 소요되는 시간을 감소시켰다. 학습된 모델로 rOxford5k 데이터 세트에 적용 시 mAP 80.37, rParis6k에서 mAP 89.07을 얻었다.

  • PDF

Development of an Integrated Retrieval System on Distributed KRISTAL-2002 Systems with Metadata Information (메타데이터 정보를 이용한 분산 KRISTAL-2002 시스템의 통합 검색 시스템 개발)

  • Choe Gui-ja;Kim Jae-Gon;Seo Jung-Hyun;Cho Han-Hyung;Lee Min-Ho;Jung Chang-Hu;Park Dong-In;Nam Young-Kwang
    • The KIPS Transactions:PartD
    • /
    • v.12D no.1 s.97
    • /
    • pp.135-150
    • /
    • 2005
  • In this paper, we propose an integrated information retrieval system for distributed multiple KRISTAL-2002 systems by using the metadata information. This system integrates current systems for different areas or systems for the same area with the different schemas so that the users can get the answers by once from the whole systems. The proposed system composes of the Source Server Manager(SSM) supporting the mapping between the integrated metadata database and source server, the Integrated Metadata Manager(ISM) for registering and managing the metadata and schema mapping, the Distributed Query Processor (DQP) for processing the user query into the source server query, the Distributed Data Set Integrated Manager(DDSIM) for transforming the total retrieval results by merging to the HTML format, and the integrated retrieval engine for managing the query results. It is assumed that the integrated metadata follows ISO/IEC 11179 metadata registration procedure with the metadata registry system which is a subsystem of the proposed system. There are two kinds of queries for users; the basic query and the detailed query. The users may select the databases or organizations for results by their own choices before giving the queries. The proposed system has been developed over KRISTAL-2002 systems with $Visual C^{++}\;and\;C^{++}-CGI$ and tested and verified with the six database systems.

Dense Retrieval using Pretrained RoBERTa with Augmented Query (증강된 질문을 이용한 RoBERTa 기반 Dense Passage Retrieval)

  • Jun-Bum Park;Beomseok Hong;Wonseok Choi;Youngsub Han;Byoung-Ki Jeon;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.141-145
    • /
    • 2022
  • 다중 문서 기반 대화 시스템에서 응답 시스템은 올바른 답변을 생성하기 위해서 여러 개의 문서 중 질문과 가장 관련 있는 문서를 검색하는 것부터 시작해야 한다. DialDoc 2022 Shared Task[1]를 비롯한 최근의 연구들은 대화 시스템의 문서 검색 과정을 위해 Dense Passage Retrieval(DPR)[2] 모델을 사용하고 있으며 검색기의 성능 개선을 위해 Re-ranking과 Hard negative sampling 같은 방법들이 연구되고 있다. 본 논문에서는 문서에 기반하는 대화 데이터의 양이 적거나 제한될 경우, 주어진 데이터를 효율적으로 활용해 보고자 검색기를 생성 모델을 이용하여 문서의 엔티티를 기반으로 질문을 생성하고 기존 데이터에 증강하는 방법을 제시했으며 실험의 결과로 MRR metric의 경우 0.96 ~ 1.56의 성능 향상을, R@1 metric의 경우 1.2 ~ 1.57의 성능 향상을 확인하였다.

  • PDF

Design and implementation of workbench for spoken language data acquisition (음성 언어 자료 확보를 위한 Workbench의 설계 및 구현)

  • 김태환
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.375-379
    • /
    • 1998
  • 음성 언어 자료의 확보 및 활용을 위해서는 다양한 소프트웨어의 도움이 필요하다. 본 논문에서는 본 연구실에서 설계 및 개발한 PC용 Workbench에 대하여 기술한다. Workbench는 음성 언어 자료의 확보를 위한 텍스트 처리 모듈들과 음성 데이터의 처리를 위한 신호처리 모듈들로 구성되어 있다. Workbench에 포함된 모듈로는 텍스트를 자동 읽기 변환하는 철자 음운 변환기, 발성 목록 선정 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 다단계 레이블링 시스템, 텍스트에서 원하는 음운 환경을 포함하고 있는 문자열을 다양한 조건으로 검색할 수 있는 음운 환경 검색기를 포함하고 있다.

  • PDF

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF

Design and Implementation of Lok-up Table for Pre-scaling in Very-High Radix Divider (높은 자릿수 나눗셈 연산기에서의 영역변환상수를 위한 검색테이블 설계 및 구현)

  • 이병석;송문식;이정아
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.3-5
    • /
    • 1999
  • 나눗셈 알고리즘은 다른 덧셈이나 곱셈 알고리즘에 비해 복잡하고, 수행 빈도수가 적다는 이유로 그동안 고속 나눗셈의 하드웨어 연구는 활발하지 않았다. 그러나 멀티미디어의 발전 및 고성능의 그래픽 랜더링을 위한 보다 빠른 부동소수점연산기(FPU)가 필요하게 되었으며, 이에 따라서 고속의 나눗셈 연산기의 필요성이 증가하게 되었다. 특히, 전체의 수행 시간 향상을 위해서라도 고속 나눗셈 연산기의 중용성은 더욱 부각되고 있다. 그러나 고속 나눗셈 연산기는 연산 속도와 크기라는 서로 상반되는 요소를 가지고 있다. 즉, 연산 속도가 빠르면 크기는 늘어나고, 크기를 줄이면 연산 속도는 늦어지게 된다. 본 논문은 높은 자릿수(Very-High Radix) 나눗셈 알고리즘에서 영역변환상수를 구하는 방법으로 연산이 아닌 검색테이블(Look-up Table)을 이용한다. 그리고 검색테이블의 크기를 줄이는 방법으로 영역변환상수의 범위 분석 및 캐리 저장형을 이용한 검색테이블 분할 방법을 이용하였다. 전체적으로는 영역변환상수를 구하는 연산주기가 필요없게 되므로 나눗셈 연산기의 영역 크기의 변화가 적으면서 연산 속도는 빨라졌음을 알 수 있다.

  • PDF

The Design and Implementation of XML Based ADL Model Management (XML기반 ADL 모델 관리기 설계 및 구현)

  • Cho Yonghan;Kang Mina;Seung Hyonwoo;Jeon Taewoong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.1-3
    • /
    • 2005
  • 최근 소프트웨어 재사용과 소프트웨어의 응용범위가 넓어짐에 따라 잘 정의된 아키텍처를 기반으로 개발된 컴포넌트 소프트웨어 개발(CBD . Component-Based Development)방식의 채택이 빠르게 확산되고 있다. 이러한 컴포넌트 소프트웨어 개발 방식이 빠르게 확산되면서 아키텍처를 정확하게 기술, 분석, 정제할 수 있는 능력 또한 점차 중요시 되고 있다. 아키텍처를 정확하게 기술, 분석 정제하기 위해서는 아키텍처 기술 언어(ADL)의 사용이 필요하다. 또한 ADL로 기술된 모델 정보들을 서로 다른 ADL지원도구들이 공유할 수 있도록 ADL 모델 관리기의 개발이 필요하다. 본 논문에서는 ADL 모델 관리기의 구성요소를 기술하여. ADL 모델 정보를 XML형태로 변환하는 변환기의 변환 과정을 설명하고, XML 형태로 변환된 ADL 모델 정보들을 저장하는 저장소 구조를 각각 기술하고, 검색기의 검색 과정 및 검색 결과를 보여준다.

  • PDF

XML & 구조문서 정보 검색

  • Jo, Yeong-Hwan;Lee, Sang-Gi
    • Digital Contents
    • /
    • no.6 s.73
    • /
    • pp.106-109
    • /
    • 1999
  • 한국정보검색위원회에서는 위원간의 의욕 고취와 새로운 검색 및 데이터베이스 관련기술 보급을 위해 매월 연구발표회를 개최하고 있다. 본 코너에서는 주제논문을 게재함으로써 정보검색과 관련된 정보를 제공하기 위해 마련된 것이다.

  • PDF

A Study on Technique for Image Quality Enhancement to Maximize Container Inspection Efficiency (컨테이너 검사 효율 극대화를 위한 화질 향상 기법 연구)

  • Lee, Chang-Ho;Shin, Ji-Hye;Kim, Jang-Oh;Jung, Young-Jin;Min, Byung-In
    • Journal of radiological science and technology
    • /
    • v.40 no.4
    • /
    • pp.639-646
    • /
    • 2017
  • The purpose of this study is to present the algorithm to minimize the image noise caused by deterioration of high X-ray container inspection equipment and the faulty detection sensors, and to improvement quality of the container inspection images using MATLAB Toolbox. The daily checking images for the container inspection were used with the subject images and the noise caused by the horizontal and vertical images was evaluated with Root Mean Square (RMS) method, which is the most basic evaluation method of digital radiation image. Also, quality of the improved images was evaluated compared to quality of the orignal images. As a result, all RMS value of the improved images was lower then the original images by a mean of 13.5% in the horizontal images and 18.2% in the vertical images respectively. Also so did RMS value of the improved container images, by a mean of 13.4% in the horizontal images and 19.1% in the vertical images respectively. These findings can be verified objectively and visually and they would help the reading process of the container images be effective in Korea Customs Service.