• 제목/요약/키워드: web query

검색결과 544건 처리시간 0.02초

Automatic Generation of Machine Readable Context Annotations for SPARQL Results

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권10호
    • /
    • pp.1-10
    • /
    • 2016
  • In this paper, we propose an approach to generate machine readable context annotations for SPARQL Results. According to W3C Recommendations, the retrieved data from RDF or OWL data sources are represented in tabular form, in which each cell's data is described by only type and value. The simple query result form is generally useful, but it is not sufficient to explain the semantics of the data in query results. To explain the meaning of the data, appropriate annotations must be added to the query results. In this paper, we generate the annotations from the basic graph patterns in user's queries. We could also manipulate the original queries to complete the annotations. The generated annotations are represented using the RDFa syntax in our study. The RDFa expressions in HTML are machine-understandable. We believe that our work will improve the trustworthiness of query results and contribute to distribute the data to meet the vision of the Semantic Web.

질의기반 사용자 프로파일을 이용하는 개인화 웹 검색 (Personalized Web Search using Query based User Profile)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.690-696
    • /
    • 2016
  • 사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

지식베이스에 기반한 다언어 문서 검색 (Cross-Lingual Text Retrieval Based on a Knowledge Base)

  • 최명복;조준
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.21-32
    • /
    • 2010
  • 웹과 같은 일반 영역을 대상으로 문서를 검색할 때 사용자의 질의 구성은 정보검색 효과에 큰 영향을 준다. 본 논문에서는 일반 사용자들이 웹에서 다언어 문서 검색을 효과적으로 수행할 수 있도록 다언어 지식베이스 기반의 지능형 정보검색 방법을 제안한다. 지식베이스로부터 추론된 지식은 사용자의 연상 작용을 도와 질의를 용이하고 정확하게 구성하여 효과적인 다언어 정보검색을 수행할 수 있도록 한다. 본 논문에서는 이러한 지식베이스 기반의 질의 변경 알고리즘을 개발하고 이를 한국어와 영어 웹 문서를 대상으로 실험하였다. 실험 결과 제안된 질의 변경 알고리즘은 다언어 문서 검색에서 지식베이스를 사용하지 않은 경우에 비해 매우 효과적임을 알 수 있었다.

웹 사용자 누적 사용정보 기반의 키워드 검색 모델 (A Keyword Search Model based on the Collected Information of Web Users)

  • 윤성희
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.777-782
    • /
    • 2012
  • 본 논문은 웹 검색 시스템의 사용자 질의에 대한 키워드 색인 기반의 검색 과정에서 적합 문서를 선별하기 위해 검색 키워드의 의미정보와 사용자의 누적 사용정보를 사용하여 검색 성능을 향상시키는 방법을 소개한다. 검색 키워드 의미 정보를 이용하는 검색 방법은 검색 결과로서 의미적으로 무관한 많은 문서들을 배제할 수 있고, 사용자의 누적된 사용정보는 관심사에 중심을 둔 검색문서들을 상위에 제시할 수 있다. 검색 키워드의 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류하며, 사용자의 정답 문서 참조 행위에 대한 누적 정보를 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.

시맨틱 웹 문서를 위한 관계형 저장 스키마 설계 및 질의 처리 기법 (Design of Relational Storage Schema and Query Processing for Semantic Web Documents)

  • 이순미
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.35-45
    • /
    • 2009
  • 최근 들어 온톨로지 문서의 활용이 증가하고 있는 추세 속에서 시맨틱 정보를 효율적으로 검색하기 위해서는 온톨로지 데이터를 효과적으로 저장 및 질의 처리를 할 수 있는 관리 시스템이 필요하다. 본 논문에서는 W3C에서 제안한 온톨로지 언어인 RDF/RDFS를 기반으로 하는 시맨틱 웹 문서를 관계형 데이터베이스에 저장하고 효율적으로 검색하기 위한 저장 스키마를 제안한다. 특별히 제안한 저장스키마는 계층 정보를 효과적으로 검색할 수 있도록 설계하여 질의 처리의 효율성을 증가시킨다. 또한 본 논문에서는 RQL 시맨틱 질의를 SQL로 변환하여 질의를 처리하는 메카니즘을 기술하며 MS-ACCESS를 사용하여 데이터베이스를 구축 및 구현한다. 구현 결과를 통하여 트리플 모델에 기반한 데이터 질의 뿐 만 아니라 스키마나 계층정보에 대한 질의도 간단하게 SQL로 변환됨을 알 수 있다.

한국 청년실업률 예측 모형에서 네이버와 구글 검색 정보의 유용성 분석 (Comparative Usefulness of Naver and Google Search Information in Predictive Models for Youth Unemployment Rate in Korea)

  • 정재운
    • 디지털융복합연구
    • /
    • 제16권8호
    • /
    • pp.169-179
    • /
    • 2018
  • 최근 고급 예측모형 연구에 웹 검색 정보가 활용되고 있다. 세계 웹 검색시장에서 구글이 절대적 우위를 점하고 있지만, 국내 웹 검색시장에서는 네이버가 절대적 우위를 보이고 있다. 이러한 특성을 토대로 본 연구는 예측모형을 활용하여 구글과 네이버의 한국어 검색 정보에 대한 유용성을 비교해 보고자 한다. 이를 위해 ARIMA 모형을 활용하여 세 가지의 한국 청년실업률 예측 시계열 모형을 개발하였다. 모형1은 한국 청년실업률 데이터만 사용하였으며, 모형2와 3은 모형1에 네이버와 구글의 검색어 정보를 각각 추가하였다. 모형 훈련기간에서는 모형1보다 모형2와 3이 더 우수한 예측력을 보였다. 모형2와 3은 서로 다른 검색어 정보와 상관관계를 보였으며, 예측기간 1과 2에서 모형3이 가장 좋은 성능을 보였다. 예측기간 2에서는 모형 3만 유의미한 예측결과를 나타내었다. 이 비교 연구는 네이버와 구글 검색엔진을 이용한 한국어 웹 검색 정보의 유용성을 이해하는 데 도움을 준다.

예제 이미지와 사용자 스케치 질의에 의한 웹 기반 이미지 검색 시스템 (Web based Image Retrieval system using User Sketch and Example Image Queries)

  • 황병곤
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.26-31
    • /
    • 2004
  • 최근에 웹의 폭발적 사용의 증가에 따라, WWW에서 많은 정보를 좀 더 손쉽게 획득할 수 있다. 본 논문에서 H에서 웹 에이전트를 사용하여 이미지를 검색하는 일반적인 내용기반 이미지 검색 시스템을 제안한다. 웹 에이전트는 웹 상에서 HTML문서에 나타나는 텍스트 중 이미지 이름이나 링크에 붙어 있는 이미지를 의미하는 텍스트를 추출한다. 제안된 시스템은 웹 브라우저에서 사용자의 스케치와 예제 이미지 질의를 이용하여 데이터베이스에 있는 이미지를 검색하는 방법을 제시하여 실험결과를 통해서 질의 효율성을 나타내었다.

  • PDF

AN EFFICIENT DENSITY BASED ANT COLONY APPROACH ON WEB DOCUMENT CLUSTERING

  • M. REKA
    • Journal of applied mathematics & informatics
    • /
    • 제41권6호
    • /
    • pp.1327-1339
    • /
    • 2023
  • World Wide Web (WWW) use has been increasing recently due to users needing more information. Lately, there has been a growing trend in the document information available to end users through the internet. The web's document search process is essential to find relevant documents for user queries.As the number of general web pages increases, it becomes increasingly challenging for users to find records that are appropriate to their interests. However, using existing Document Information Retrieval (DIR) approaches is time-consuming for large document collections. To alleviate the problem, this novel presents Spatial Clustering Ranking Pattern (SCRP) based Density Ant Colony Information Retrieval (DACIR) for user queries based DIR. The proposed first stage is the Term Frequency Weight (TFW) technique to identify the query weightage-based frequency. Based on the weight score, they are grouped and ranked using the proposed Spatial Clustering Ranking Pattern (SCRP) technique. Finally, based on ranking, select the most relevant information retrieves the document using DACIR algorithm.The proposed method outperforms traditional information retrieval methods regarding the quality of returned objects while performing significantly better in run time.

RDF 문서의 저장소와 RDQL 질의 처리기의 설계 및 구현 (Design and Implementation of RDF Storage and RDQL Query Processor)

  • 정호영;김정민;정준원;김종남;임동혁;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.363-371
    • /
    • 2006
  • 컴퓨터의 발전에도 불구하고 수많은 전자 문서가 범람하는 현재와 같은 상황에서 원하는 정보를 얻기는 더욱 어려워지고 있다. 이와 같은 상황에서 데이타를 얼마나 빠르게 처리하는지 보다 얼마나 의미 있는 정보를 얻을 수 있는지가 중요한 문제가 되고 있다. 이에 웹 자원에 대해 지식기반의 메타 데이타를 기술하고 이를 이용한 지능적인 정보 처리를 목적으로 하는 것이 시멘틱 웹이다. 또한 시멘틱 웹이 발전함에 따라 웹 자원 못지 않게 지식자원에 대한 중요성도 커질 수밖에 없다. 본 논문에서는 웹 자원에 대해 지식구조를 기술하여 지능적인 정보 처리를 목적으로 하는 RDF에 대해 관계형 데이타베이스 모델을 설계하고 저장 시스템을 통해 의미 있는 질의를 처리할 수 있는 질의 처리기를 설계 및 구축하여 효율적인 메타 데이타의 저장, 관리 및 질의를 지원하고자 한다. 저장을 위한 모델은 관계형 모델을 사용함으로써 객체형 모델이나 메모리 모델을 사용하는 한계점을 극복할 수 있을 것이다.

질의어 패턴 자동분석을 통한 커뮤니티 기반 개인화 검색 (Personalized Search based on Community through Automatic Analysis of Query Patterns)

  • 박건우;이상훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.321-326
    • /
    • 2009
  • 기존의 웹 검색 엔진들은 사용자의 검색 의도를 충분히 반영하지 못하기 때문에 사용자가 원하는 정확한 정보를 찾기가 어렵다. 따라서 최근에는 개인의 검색 패턴을 분석하여 검색에 반영함으로써 검색 결과에 대한 만족도를 높이기 위한 많은 연구들이 진행되고 있다. 이러한 개인화 검색을 통해 사용자는 방대한 웹상의 정보들 중 자신의 검색 의도에 보다 적합하고 정확한 정보를 획득할 수 있다. 본 논문에서는 웹 사용자들의 질의어 사용 빈도수(Frequency)에 대한 랭킹 정보를 통해 최근 주요 관심사(Interest)를 파악하고, 주요 관심사 별로 형성된 커뮤니티(Community)를 기반으로 수행되는 개인화 검색 방안을 제안한다. 실험결과 질의어 빈도수, 관심사 및 커뮤니티를 검색에 반영할 경우 개인의 검색 의도에 보다 적합한 검색 결과가 제공되는 것을 확인할 수 있다.