• Title/Summary/Keyword: Web Search Query

Search Result 198, Processing Time 0.028 seconds

사례기반 추론을 이용한 지능형 웹 검색 에이전트의 설계 및 구현 (Design and Implementation of Intelligent Web Search Agent using Case Based Reasoning)

  • 하창승;류길수
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.20-29
    • /
    • 2003
  • 웹에서 정보의 양이 급속히 증대됨에 따라 자신에게 맞는 정보를 찾는데 더 많은 시간을 투자하고 있다. 이러한 문제를 해결하기 위해서는 검색에이전트가 사용자의 선호도나 검색 목적에 따라 개인화된 검색기능을 제공하여야한다. 따라서 검색에이전트가 이러한 기능을 제공하기 위해 본 연구에서는 사용자가 과거에 검색과 관련된 경험적 지식을 축적하고 이 지식을 이용하여 새로운 질의어가 주어졌을 때 가장 관련성이 높은 카테고리 그룹을 결정하는 유사도 평가 방법을 통해 각 개인의 검색성향을 통계적으로 고려한 사례기반 추론기법을 제안한다. 사례기반 추론기법과 다른 일반검색 방법이 함께 적용된 검색엔진에서 실시한 성능 평가는 사례기반 추론기법이 일반 검색 방법에 비해 정확률에서 우수한 결과를 보였다.

  • PDF

A Novel Approach for Accessing Semantic Data by Translating RESTful/JSON Commands into SPARQL Messages

  • Nguyen, Khiem Minh;Nguyen, Hai Thanh;Huynh, Hiep Xuan
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권3호
    • /
    • pp.222-229
    • /
    • 2016
  • Linked Data is a powerful technology for storing and publishing the structures of data. It is helpful for web applications because of its usefulness through semantic query data. However, using Linked Data is not easy for ordinary users who lack knowledge about the structure of data or the query syntax of Linked Data. For that problem, we propose a translator component that is used for translating RESTful/JSON request messages into SPARQL commands based on ontology - a metadata that describes the structure of data. Clients do not need to worry about the structure of stored data or SPARQL, a kind of query language used for querying linked data that not many people know, when they insert a new instance or query for all instances of any specific class with those complex structure data. In addition, the translator component has the search function that can find a set of data from multiple classes based on finding the shortest paths between the target classes - the original set that user provide, and target classes- the users want to get. This translator component will be applied for any dynamic ontological structure as well as automatically generate a SPARQL command based on users' request message.

Survey of Automatic Query Expansion for Arabic Text Retrieval

  • Farhan, Yasir Hadi;Noah, Shahrul Azman Mohd;Mohd, Masnizah
    • Journal of Information Science Theory and Practice
    • /
    • 제8권4호
    • /
    • pp.67-86
    • /
    • 2020
  • Information need has been one of the main motivations for a person using a search engine. Queries can represent very different information needs. Ironically, a query can be a poor representation of the information need because the user can find it difficult to express the information need. Query Expansion (QE) is being popularly used to address this limitation. While QE can be considered as a language-independent technique, recent findings have shown that in certain cases, language plays an important role. Arabic is a language with a particularly large vocabulary rich in words with synonymous shades of meaning and has high morphological complexity. This paper, therefore, provides a review on QE for Arabic information retrieval, the intention being to identify the recent state-of-the-art of this burgeoning area. In this review, we primarily discuss statistical QE approaches that include document analysis, search, browse log analyses, and web knowledge analyses, in addition to the semantic QE approaches, which use semantic knowledge structures to extract meaningful word relationships. Finally, our conclusion is that QE regarding the Arabic language is subjected to additional investigation and research due to the intricate nature of this language.

적응형 사용자 프로파일기법과 검색 결과에 대한 실시간 필터링을 이용한 개인화 정보검색 시스템 (PIRS : Personalized Information Retrieval System using Adaptive User Profiling and Real-time Filtering for Search Results)

  • 전호철;최중민
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.21-41
    • /
    • 2010
  • 본 논문은 다양한 사용자의 개인적 검색요구를 충족시키지 못하는 기존 검색시스템의 문제점을 해결하기 위해 사용자의 묵시적 피드백을 이용한 적응형 사용자 기호정보 기반의 개인화 검색을 실현하고, 검색결과에 대한 실시간 필터링을 통해 사용자에게 적합한 검색 결과를 제공하는 시스템을 제안한다. 기존의 검색 시스템들은 검색의도의 불확실성 때문에 사용자의 검색실패율이 높다. 검색 의도의 불확실성은 동일한 사용자가 "java"와 같은 다의어에 대해 동일한 질의어를 사용하더라도 다른 검색 결과를 원할 수 있다는 것이며, 단어의 수가 적을수록 불확실성은 가중될 것이다. 실시간 필터링은 사용자의 도메인 지정여부에 따라 주어진 도메인에 해당하는 웹문서들만 추출하거나, 적절한 도메인을 추론하고 해당하는 웹문서들만 검색 결과로 보여주는 것으로, 일반적인 디렉토리 검색과 유사하지만 모든 웹문서에 대해 이루어진다는 것과 실시간으로 분류된다는 것이 다르다. 실시간 필터링을 개인화에 활용함으로써 검색 결과의 수를 줄이고 검색만족도를 개선했다. 본 논문에서 생성한 기호정보파일은 계층적 구조로 이루어지며, 상황정보의 반영이 가능하기 때문에 의도의 불확실성을 해결 할 수 있다. 또한 사용자의 도메인별 웹문서 검색 동작을 효과적으로 추적(track) 할 수 있으며, 사용자의 기호 변화를 적절하게 알아낼 수 있다. 각 사용자 식별을 위해 IP address를 사용했으며, 기호정보파일은 사용자의 검색 행동에 대한 관찰을 기반으로 지속적으로 갱신된다. 또한 사용자의 검색결과에 대한 행동 관찰을 통해, 사용자 기호를 인지하고, 기호정보를 동적으로 반영했으며, 검색결과에 대한 만족도를 측정했다. 기호정보파일과 반영비율은 사용자가 검색을 수행할 때 시스템에 의해 생성되거나 갱신된다. 실험결과 적응형 사용자 기호정보파일과 실시간 필터링을 함께 사용함으로써, 상위 10개의 검색결과 중 평균 4.7개의 결과들에 대해 만족하는 것으로 나타났으며, 이는 구글의 결과에 비해 약 23.2% 향상된 만족도를 나타내었다.

심층 웹 문서 수집을 위한 크롤링 알고리즘 설계 (Crawling Algorithm Design for Deep Web Document Collection)

  • 원동현;강윤정;박혁규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.367-369
    • /
    • 2022
  • 웹 기술이 발전함에 따라 웹은 사용자의 요구에 맞는 맞춤 정보들을 제공하게 된다. 클릭 이벤트나 사용자의 질의어에 따라 정보가 제공되며 검색엔진으로는 검색이 어려운 정보가 제공되는 웹 서비스를 심층웹이라 한다. 이러한 심층웹은 표면웹보다 많은 정보를 포함하고 있지만, 방문 당시의 정보를 수집하는 일반적인 크롤링으로는 정보 수집이 어렵다. 심층웹은 javascript와 같은 스크립트언어를 브라우저에서 실행함으로 서버의 정보를 사용자에게 제공한다. 본 논문에서는 심층웹 수집을 위해 스크립트를 분석하여 동적으로 변화되는 웹사이트의 탐색 및 정보 수집이 가능한 알고리즘을 제안한다. 본 논문에서는 실험을 위해 질병관리청의 게시판의 스크립트를 분석하였다.

  • PDF

질의 언어 및 복잡성이 대학생의 웹 정보탐색에 미치는 영향에 관한 연구 (Exploring the Effects of Task Language and Complexity in College Students' Web Searching)

  • 심원식;안혜연;변제연
    • 한국문헌정보학회지
    • /
    • 제49권2호
    • /
    • pp.51-73
    • /
    • 2015
  • 인터넷은 20-30년 전에는 상상할 수 없었던 엄청난 양의 정보에 대한 즉각적인 접근을 가능하게 하고 있다. 하지만 정보를 표현한 언어가 다양한 국가의 언어로 제공됨으로 이용자는 인터넷상에서 제공되는 컨텐츠를 온전히 사용하기 위해 반드시 외국어에 대한 이해를 수반해야 한다. 2015년 한 통계에 따르면 전 세계 웹사이트의 약 55%가 영어로 제작되어 있다고 한다. 따라서 정보탐색에 있어 웹 컨텐츠의 절반 이상에서 사용되고 있는 영어의 중요성을 간과할 수 없는 것이다. 본 연구는 인터넷을 활용한 정보문제 해결에 있어 검색 질의의 언어와 질의문의 복잡성이 검색 성과에 어떤 영향을 미치는지 살펴보고자 하였다. 실험은 서울 시내 종합사립대학교에 재학 중인 30명의 학생들을 대상으로 실시하였다. 연구자는 피험자들에게 각각 총 8개의 검색과제를 무선방식으로 제공하였다. 이들 과제는 각각 4개씩의 한글과 영어로 된 질의로, 이는 다시 같은 수의 단순 질의와 복합 질의로 나누어진다. 실험 결과 단순 질의와 복합 질의 간 검색에 소요된 시간, 검색 횟수, 정답률에 있어 통계적으로 유의미한 차이를 보였다. 하지만 질의 언어가 검색 성과 지표에는 영향을 미치지 않는 것으로 나타났다. 또 학생들의 영어구사수준 역시 검색성과에 영향을 미치지 않았다. 그러나 검색과 관련된 다른 지표(검색 언어의 사용 및 검색엔진 선택)에 있어서는 검색 언어와 검색 복잡성이 영향을 미치는 것으로 나타났다.

접미사 배열을 이용한 JSON 데이터의 경로 기반 검색에 대한 연구 (A Study of Path-based Retrieval for JSON Data Using Suffix Arrays)

  • 김성완
    • 창의정보문화연구
    • /
    • 제7권3호
    • /
    • pp.157-165
    • /
    • 2021
  • 웹, 모바일, IoT 등의 기술을 활용한 다양한 어플리케이션 서비스의 활용과 이에 따른 대용량 데이터 관리의 필요성이 확대됨에 따라 효율적인 데이터 표현 및 교환 방법과 데이터에 대한 질의 처리의 중요성이 증가하고 있다. 간결함을 특징으로 갖는 JSON은 웹 상의 표준 데이터 표현 및 교환 언어인 XML를 대신하여 데이터 교환 및 대용량 데이터 저장의 포맷으로 다양한 영역에서 활용되고 있다. 이는 JSON으로 표현된 대량의 데이터를 효과적으로 접근 및 검색하기 위한 인덱싱 및 질의 처리 기법의 개발이 중요함을 의미한다. 이에 본 논문에서는 계층적 구조를 특징으로 가지는 JSON 데이터를 트리 형태로 모델링 하고 경로 개념을 이용한 인덱싱 및 질의 처리 방안을 제안한다. 특히, 텍스트 검색에서 널리 사용되는 접미사 배열을 활용한 인덱스 구조를 설계하였으며 이를 활용하여 단순 및 복합 경로 기반의 JSON 데이터 질의 처리 방안들을 소개하였다.

시맨틱웹을 활용한 초등학교 학습자료 검색시스템 (An Elementary Educational Contents Retrieval System Using Semantic Web)

  • 이희경;전우천
    • 정보처리학회논문지A
    • /
    • 제13A권6호
    • /
    • pp.545-554
    • /
    • 2006
  • 웹의 활용이 보편화 되면서 웹을 통한 자료의 검색이 증가하고 있으나, 웹상의 방대한 자료 중에서 학습자가 꼭 필요한 학습자료를 찾는 것은 쉬운 일이 아니다. 검색엔진을 이용할 경우 원하는 정보를 어느 정도 찾을 수 있으나 검색어 일치방식에 의존하는 현재의 검색엔진의 특성상 결과가 만족스럽지 못한 경우가 많다. 또한 검색 결과 중에서 연관이 없는 정보를 필터링하기 위해 사용자가 많은 시간을 낭비하기도 한다. 본 연구에서는 웹 자원의 의미정보를 구조화하여 정보의 효율적인 검색, 통합, 재사용을 가능하도록 하는 시맨틱 웹(Semantic Web)기술을 활용하여 초등학교 학습자료에 적합한 온톨로지(Ontology)를 제안하고, 의미적 연관관계를 통해 학습내용에 접근할 수 있도록 초등학교의 역사분야 학습 내용에 관한 온톨로지를 구축하였다. 또한 이를 기반으로 학습자료를 검색할 수 있는 시스템을 설계하고 구현하였다. 본 검색시스템의 특징은 다음과 같다. 첫째, 학습자료와 연관된 사용자 질의어를 보다 상세하게 입력받아 검색결과를 얻는다. 둘째, 사용자 질의어를 바탕으로 학습자료 온톨로지에 질의하여 검색어가 포함된 결과 및 검색어와 연관된 정보를 검색결과로 얻는다. 셋째, 질의어와 연관된 내용을 함께 제시함으로써 학습의 효율을 높일 수 있다.

온톨로지를 이용한 웹문서의 시맨틱 검색 (Semantic search of web documents using ontology)

  • 오성균;김병곤
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.603-612
    • /
    • 2014
  • 사용자들에게 좀 더 정확하고 편리한 검색결과를 제공하기 위하여 정보의 구조적인 특징 등을 사용하는 시맨틱 검색의 개념이 널리 연구되고 있다. 이를 위하여, 최근의 정보검색분야와 데이터구축 분야의 연구에서는 데이터의 구조적인 표현과 검색 메카니즘을 구현하기 위하여 온톨로지를 강조하고 있다. 본 연구에서는 웹 환경에서의 검색 정확도와 만족도를 향상시키기 위하여 온톨로지를 이용한 시맨틱 검색 방법을 제안한다. 온톨로지와 KB(KnowledgeBase)를 이용하여 검색 대상을 키워드간의 관계를 유추한 사실(fact)과 관계키워드들을 지니는 웹문서들로 크게 나누고 이들을 서로 유기적으로 검색을 진행하는 시맨틱 검색 질의 처리기법을 제안하였다. 또한 결과에 대한 사용자의 검색 만족도를 높이기 위하여 결과 문서와 사실에 대한 랭킹 방법을 제안하였다. 실험을 통하여 주어진 식의 값을 달리하여 랭킹을 올바로 구현하는 요소로 키워드의 빈도와 온톨로지상의 클래스 레벨이 영향을 미치는 것을 확인 할 수 있었고, 이를 통하여 적합한 형태의 계수 값을 제시하였다.

위키피디아 기반의 의미 연관성을 이용한 태깅된 웹 이미지의 검색순위 조정 (Tagged Web Image Retrieval Re-ranking with Wikipedia-based Semantic Relatedness)

  • 이성재;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1491-1499
    • /
    • 2011
  • 오늘날 이미지, 동영상과 같은 멀티미디어 데이터를 웹 공간에 저장하고 검색할 때, 태그를 이용하는 추세는 보편화되어 있다. 본 논문에서는 태깅된 웹 이미지의 검색에서 태그들의 의미적 중요도를 계산하고, 이를 이용하여 검색 순위를 조정하는 시도를 소개한다. 일반적으로 웹상에 저장된 대부분의 사진 이미지들은 실제로는 중요하지 않지만 사용자의 주관적인 판단으로 추가된 태그들을 다수 포함하고 있으며, 이들은 태그의 단순 비교방식으로 이미지를 검색할 때 정확도를 떨어트리는 주요 원인이 된다. 따라서 어떤 이미지에 붙은 수많은 태그들 중에서 의미적으로 보다 중요한 태그들을 찾아내어 검색에 이용한다면 더욱 만족스러운 검색 결과를 얻을 수 있다. 본 논문에서는 위키피디아 기반의 의미 연관성을 활용하여 검색어 또는 다른 태그들과의 의미 연관성이 높은 태그를 해당 이미지의 대표 태그로 판단하고 이를 이용하여 검색 순위를 조정하는 방법을 제안한다. 실험 결과, 방대한 온라인 백과사전인 위키피디아를 이용하여 계산된 의미적 연관성을 이용함으로써 기존의 연구에 비해 향상된 결과를 얻을 수 있었다.