• Title/Summary/Keyword: 검색어

Search Result 1,258, Processing Time 0.03 seconds

Finding Correlated Keyword b Analyzing User's Implicit Feedback (사용자 선호도 분석을 통한 검색어 조합 추출)

  • Chul-Woo Shim;Eun Ju Lee;Ung-Mo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.229-232
    • /
    • 2008
  • 웹 정보량이 급속히 늘어나면서 원하는 정보를 효율적으로 찾는 검색 기술의 중요성이 커지고 있다. 검색의 정확성을 높이기 위해서는 검색 질의어와 함께 사용자의 환경, 검색 만족도와 같은 다양한 정보가 필요하다. 사용자의 명시적 피드백을 요구하는 것은 거부감을 줄 수 있으므로 사용자의 잠재적 피드백과 연관 검색어 분석을 통해 검색 질의어를 확장하는 연구가 이뤄지고 있다. 그러나 이러한 검색어 확장과 검색 정확성 사이의 상관관계에 대한 분석이 없어 연관 검색어를 정량적으로 평가할 수 없었다. 본 논문에서는 사용자가 검색 질의어를 변경하면서 검색을 반복하는 과정을 사용자의 잠재적 피드백의 하나로 보고 사용자 만족도를 반영하는 페이지 방문 시간과 함께 분석하여 연속적으로 입력된 검색어가 검색 결과 순위와 사용자 만족도에 미치는 영향을 분석하는 방법을 제안하였다. 마우스 클릭 정보 분석을 통하여 사용자의 검색 만족도를 정량화하였고 특정 주제어에서 관련 검색어가 확장되어 가는 과정은 트리 구조로 표현하였다. 이를 통해 하나의 주제어와 관련해 연속적으로 입력된 검색어 집합으로부터 연관검색어를 추출하고 검색 결과의 정확성을 높일 수 있으며 제안된 트리 구조를 다양한 방향으로 분석하여 검색어, 검색 결과, 사용자 만족도, 배경 지식 등 단순 검색어 분석에서는 나타나지 않는 다양한 정보를 얻을 수 있다.

Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea (검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로)

  • Park, Soyeon
    • Journal of the Korean Society for information Management
    • /
    • v.30 no.2
    • /
    • pp.297-315
    • /
    • 2013
  • This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.

ARMS : Association Rule for sMall Set (검색어의 연관법칙)

  • 문상준;최재걸
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.10-12
    • /
    • 2004
  • 검색엔진에 사용자가 입력한 검색어를 분석하면 상호 연관이 있는 검색어들을 찾아낼 수 있다. 검색어들간의 상호 연관성을 찾기 위해서 데이타 마이닝 분야의 연관법칙을 위한 알고리즘을 적용하였다. 그러나 이 알고리즘들은 모두 일정 횟수 이상 검색된 검색어간의 연관법칙에 집중되어 있어서 일정 횟수 이상 검색되지 않은 검색어들은 버려진다. 이 연구에서는 이런 검색어들을 스몰 셋(small set)이라고 정의하고 스몰 셋의 연관법칙을 찾기 위한 방법을 제시한다. 실험결과는 이 연구에 제시한 방법이 효과적으로 동작하는 것을 입증해준다.

  • PDF

An Information Retrieval System for IT Terminologies Using a Main Memory DBMS (메인 메모리 DBMS를 이용한 정보기술 전문용어 검색 시스템)

  • 강옥선;경원현;조완섭
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.311-322
    • /
    • 2001
  • 대부분의 일반 정보 검색 시스템은 색인어를 통해 이루어지는데 이런 경우 사용자는 원하는 정보를 얻기 위해 데이터베이스에 저장된 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 필요한 색인어를 정확하게 입력하기는 어렵고 특히 원하는 정보가 전문분야의 것일 때는 더욱 그러하다. 따라서 특정 분야의 용어들을 중심으로 전문용어를 관리할 수 있는 시스템의 개발이 요구되고 있다. 정보기술 분야도 빠르게 성장하고 있는 전문분야의 하나로 사용되는 대부분의 단어가 영어이고 한글 표기 또한 다양하여 많은 사용자들이 원하는 정보를 정확하게 찾지 못하고 있다. 이렇듯 단어간의 형태적인 불일치로 인해 생기는 정보 검색의 문제를 해결하고 검색어의 범위를 확장하기 위해 만든 것이 전문용어 검색 시스템이다. 정보 검색시 사용자가 입력한 검색어뿐만 아니라 동의어나 상위어, 하위어까지 검색하여 질의를 확장함으로써 검색 효율을 높일 수 있다. 또한 객체-관계형 데이터베이스로 설계하여 검색이 용이하고, 새로운 단어의 확장이 용이하도록 그 구조를 설계하였다. 제안한 시스템은 메인 메모리 DBMS 를 이용하여 전자상거래와 같이 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다.

  • PDF

Improving the performance of natural language information retrieval system by using non-keyword search methods. (자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선)

  • Lee, Seung-Ryul;Kang, Hyun-Kyu;Park, Se-Young;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.374-377
    • /
    • 1994
  • 본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

  • PDF

Natural language based Information Retrieval System considering the focus of the question (의문의 초점을 고려한 자연어 기반의 정보검색 시스템)

  • Park, Hong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

A Study on Providing Relative Keyword using The Social Network Analysis Technique in Academic Database (학술DB에서 SNA(Social Network Analysis) 기법을 이용한 연관검색어 제공방안 연구)

  • Kim, Kyoung-Yong;Seo, Jung-Yun;Seon, Choong-Nyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.79-82
    • /
    • 2011
  • 본 논문은 다양한 주제 분야의 연구 성과물을 제공하는 학술DB에서 주제어(Keyword) 정보를 바탕으로 SNA(Social Network Analysis)기법을 적용해 검색어와 연관도가 높은 연관검색어를 제공하는 것을 그 목적으로 한다. 이를 위해 주제어들 간의 가중치(Weight)를 계산한 뒤 Ego Network 분석을 통해 검색어와 연관된 연관주제어를 추출하고 이를 기존 학술DB에서 제공한 연관검색어와 비교 정리하였다. 그리고 정리된 결과를 연관규칙 마이닝기법, 유사계수를 적용해 연관도측면에서 비교 평가하였다.

  • PDF

'Hot Search Keyword' Rank-Change Prediction (인기 검색어의 순위 변화 예측)

  • Kim, Dohyeong;Kang, Byeong Ho;Lee, Sungyoung
    • Journal of KIISE
    • /
    • v.44 no.8
    • /
    • pp.782-790
    • /
    • 2017
  • The service, 'Hot Search Keywords', provides a list of the most hot search terms of different web services such as Naver or Daum. The service, bases the changes in rank of a specific search keyword on changes in its users' interest. This paper introduces a temporal modelling framework for predicting the rank change of hot search keywords using past rank data and machine learning. Past rank data shows that more than 70% of hot search keywords tend to disappear and reappear later. The authors processed missing rank value, using deletion, dummy variables, mean substitution, and expectation maximization. It is however crucial to calculate the optimal window size of the past rank data. We proposed an optimal window size selection approach based on the minimum amount of time a topic within the same or a differing context disappeared. The experiments were conducted with four different machine-learning techniques using the Naver, Daum, and Nate 'Hot Search Keywords' datasets, which were collected for 2 years.

A Study on The Retrieval Effectiveness of Newspaper Database using Search Thesaurus. (탐색시소러스를 이용한 신문기사 전문데이터베이스의 검색효율에 관한 연구.)

  • 이성욱;사공철
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.3-6
    • /
    • 1994
  • 본 연구에서는 전문데이터베이스의 자연어 검색에 있어서 탐색시소러스의 검색효율과 퍼지시소러스 관련어 확장검색의 검색효율을 측정하였다. 한국경제신문사 ECONET의 기사 데이터베이스를 대상으로 질문의 기본 탐색어를 계층어와 관련어로 확장검색한 결과 탐색시소러스를 이용한 관련어 확장검색과 종합검색이 정확률은 저하시키지 앓고 재현율을 향상시켰다.

  • PDF

A Retrieval System Using the Automatic Transition of the English-Adopted Words into Transliterations (영어외래어의 음역어 자동변환을 이용한 검색 시스템)

  • Lee, Mi-Ran;Kim, Yang-Taek;Jeun, Hong-Tee;Youn, Sung-Dae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1073-1076
    • /
    • 2002
  • 정보 검색시 질의어가 외래어일 경우에 검색의 재현율은 급격하게 감소된다. 이는 외래어에서 나오는 음역어의 불일치와 영어외래어, 한글음역어는 같은 색인으로 처리가 되지 않기 때문이다. 따라서 본 논문에서는 영어외래어를 한글음역어로 자동 변환시키고, 자동 변환시에는 영어음소에 해당하는 발음값을 한글음소로 모두 변환시킨 다음 조합하였다. 조합된 음역어들은 다시 동치부류 DB에 저장되어, 질의어 검색시 검색어가 동치부류 색인어로 확장되어 검색된다. 제안한 검색시스템의 성능을 평가하기 위해서 재현율을 측정하였다.

  • PDF