• 제목/요약/키워드: web query

검색결과 544건 처리시간 0.023초

시맨틱 웹 기반의 분산 시스템을 위한 질의 변환 및 인덱싱 기법 (Query Rewriting and Indexing Schemes for Distributed Systems based on the Semantic Web)

  • 채광주;김연희;임해철
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.718-722
    • /
    • 2008
  • 시맨틱 웹의 기반이 되는 온톨로지는 기술 언어로 OWL이 발표되면서, 웹 리소스의 의미를 더욱 다양하게 기술할 수 있는 강한 표현력을 갖추어 가고 있다. 그리고, 시맨틱 웹의 개념이 널리 인식되면서 정보의 양이 더욱 많아지고 온톨로지가 지역적으로 분산되어 구축됨에 따라, 분산 환경에서 원하는 데이타를 포함하고 있는 지역 저장소를 빠르게 검색하는 것이 전체 시스템의 성능에 중요한 영향을 미치게 되었다. 따라서 본 논문에서는 첫째, 분산된 온톨로지 환경에서 사용자가 원하는 데이타가 위치하고 있는 지역 저장소를 빠르게 검색하기 위한 인덱스 구조를 제안한다. 둘째, 분산 환경을 지원할 수 있는 OWL의 다양한 표현을 이용하여 질의를 확장하기 위한 질의 변환 기법을 제안한다. 본 논문에서 제안한 기법을 통해 OWL의 다양한 표현을 활용하는 것이 가능하고, 시맨틱 웹 환경의 모든 질의 유형에 대해 데이타가 존재하는 지역 저장소를 빠르게 파악할 수 있다.

Document Classification Model Using Web Documents for Balancing Training Corpus Size per Category

  • Park, So-Young;Chang, Juno;Kihl, Taesuk
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.268-273
    • /
    • 2013
  • In this paper, we propose a document classification model using Web documents as a part of the training corpus in order to resolve the imbalance of the training corpus size per category. For the purpose of retrieving the Web documents closely related to each category, the proposed document classification model calculates the matching score between word features and each category, and generates a Web search query by combining the higher-ranked word features and the category title. Then, the proposed document classification model sends each combined query to the open application programming interface of the Web search engine, and receives the snippet results retrieved from the Web search engine. Finally, the proposed document classification model adds these snippet results as Web documents to the training corpus. Experimental results show that the method that considers the balance of the training corpus size per category exhibits better performance in some categories with small training sets.

OWL 온톨로지 사용을 위한 SPARQL 쿼리 툴 (SPARQL Query Tool for Using OWL Ontology)

  • 조대웅;최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.21-30
    • /
    • 2009
  • 시맨틱 웹에서는 RDF, RDFS, OWL과 같은 온톨로지 구축 언어를 이용하여 웹 리소스의 메타데이터를 정의한다. 이러한 시맨틱 웹 기술을 이용한 연구는 에이전트를 기반으로 한 온톨로지의 개념에 대한 관계 및 트리플을 추출하기 위한 목적으로 진행되고 있다. 하지만 에이전트 기반의 온톨로지의 개념에 대한 관계 및 트리플의 추출은 에이전트의 특성상 한정된 쿼리 문을 작성하게 된다. 이는 온톨로지 안의 다른 개념에 대한 관계 및 트리플을 추출하고자 할 때는 유연성이 떨어진다. 온톨로지 정보 자체에 대한 유연성 있는 정보 검색을 하기 위해서는 표준 온톨로지 언어에 접근 및 표준 쿼리 언어의 이용이 가능한 쿼리 툴이 필요 하다. 본 논문에서는 OWL 온톨로지에 HTTP 프로토콜을 이용하여 접근이 가능하고, 쿼리를 할 수 있는 SPARQL 쿼리 툴을 제안한다. 툴에 의해 생성되는 쿼리 결과는 SOAP 메시지 형태로 변환 출력함으로써 웹 서비스를 이용한 접근도 가능하다.

국내 웹 이용자의 검색 행태 추이 분석 (Trends of Search Behavior of Korean Web Users)

  • 박소연;이준호
    • 한국문헌정보학회지
    • /
    • 제39권2호
    • /
    • pp.147-160
    • /
    • 2005
  • 본 연구에서는 1년이라는 장기간에 걸쳐 네이버에 입력된 검색 질의들의 표본과 각 질의에 대한 클릭 로그에 근거하여 국내 웹 이용자의 검색 행태 추이를 분석하였다. 질의의 형태에 대한 조사 결과, 계절별, 주중과 주말 요일별 질의 형태의 분포에 있어서 유의한 차이가 있는 것으로 나타났다. 또한 웹 이용자들이 입력한 질의의 주제 역시 계절별, 주중과 주말, 요일별로 변화하는 것으로 나타났다. 반면 1년 동안을 전체적으로 살펴볼 때 사이트 검색과 내용 검색의 비율 그리고 주제의 비율이 큰 변화 없이 일정한 상태를 유지하였다. 본 연구의 결과는 인터넷 검색 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

Non-SQL 질의 데이터 서버 아키텍처 (An Architecture for Data Server of Non SQL Query)

  • K. H., Kwon;Chakra, Balayar;S. H., Cheon
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.406-408
    • /
    • 2004
  • To develop enterprise architecture based distributed application needs consideration of various factors such as division of role between web-designer and software developer, defining entity and its usage, database connection and transaction processing. This paper presents DONSL(Data Server of Non SQL-Query) architecture that provides solution to above aspects through web-tier object modeling guaranteeing efficient transaction processing and performance between web-tier and 08MS through simplified usage of query logic property.

  • PDF

클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석 (An Analysis of Query Types and Topics Submitted to Navel)

  • 박소연;이준호;김지승
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.265-278
    • /
    • 2005
  • 웹 검색 분야의 대부분의 선행 연구들은 검색 질의를 살펴본 연구자의 판단에 근거하여 질의의 주제를 분석하였다. 그러나 웹 검색 질의의 주제 분야가 방대하고 다양하여서 이용자가 검색 결과에서 실제로 조회한 문서를 모르는 상태에서 연구자의 판단에 근거하여 질의의 주제를 분류하기에는 한계가 있다. 이에 본 연구에서는 1년 동안 네이버 이용자들이 입력한 질의를 기록한 질의로그와 질의에 대한 검색 결과에서 이용자가 조회한 문서를 기록한 클릭 로그에 근거하여 국내 웹 검색 질의의 형태 및 주제를 분석하였다. 질의를 형태별로 분류한 결과 사이트 검색 질의가 내용 검색 질의보다 많은 것으로 나타났다. 또한 이용자들이 전반적으로 가장 많이 검색한 주제는 컴퓨터/인터넷. 엔터테인먼트, 쇼핑, 게임. 교육 순으로 나타났다. 본 연구의 결과는 인터넷 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

Multitier 웹 어플리케이션 환경에서 악의적인 SQL Query 탐지를 위한 HTTP Request - SQL Query 매핑 기법 (HTTP Request - SQL Query Mapping Scheme for Malicious SQL Query Detection in Multitier Web Applications)

  • 서영웅;박승영
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.1-12
    • /
    • 2017
  • 지속적으로 증가하는 인터넷 서비스 요구사항을 만족하기 위하여 인터넷 서비스를 제공하는 시스템은 웹 서버와 DB(database) 서버로 구성된 multitier 구조로 변화되어왔다. 이러한 multitier 웹 어플리케이션 환경에서 기존의 IDS(intrusion detection system)는 웹 서버와 DB 서버에서 misused traffic pattern들이나 signature들을 매칭하여 이미 알려진 공격을 검출하고 해당 접속을 차단하는 방식으로 동작한다. 하지만 이러한 방식의 IDS는 정상적인 HTTP(hypertext transfer protocol) request를 이용하여 악의적으로 DB 서버의 내용의 변조를 시도하는 attacker의 공격을 DB 서버단에서 제대로 검출하지 못한다. 그 이유는 DB 서버는 웹 서버로부터 받은 SQL(structured query language) query가 어떤 사용자의 HTTP request에 의해 발생한 것인지 알지 못하는 상태에서 처리하며, 웹 서버는 SQL query 처리 결과 중 어떤 것이 악의적으로 DB 서버 변조를 시도한 SQL query에 의한 결과인지 알 수 없기 때문이다. 이런 공격을 검출하기 위해서는 HTTP request와 SQL query 사이의 상호작용관계를 명확히 파악하고, 이를 이용하여 악의적인 SQL query를 발생시킨 사용자를 추적해야 한다. 이를 위해서는 해당 시스템의 소스코드를 분석하거나 application logic을 완벽하게 파악해야 하므로 현실적으로 불가능하다. 본 논문에서는 웹 서버와 DB 서버에서 제공하는 로그만을 이용하여 모든 HTTP request와 SQL query간의 mapping 관계를 찾아내고, 이를 이용하여 특정 SQL query를 발생시킨 HTTP request를 추정하는 기법을 제안한다. 모의실험을 통하여 94%의 정확도로 HTTP request를 추정할 수 있음을 확인하였다.

Creating Method for Multi-Size Web View Based on Query Restructuring Rules

  • Shin, Sang-Gyu;Kim, Tai-Suk
    • 한국멀티미디어학회논문지
    • /
    • 제11권12호
    • /
    • pp.1758-1764
    • /
    • 2008
  • In this paper, we propose query restructure method which realizes not only to present the result from database in Web page but also to adapt user's browsing environments. Recently, wireless PDA (Personal Digital Assistant) and portable phone and terminals equipped with Web browser become very popular. Various browsers would be required to create the HTML which adapt to the user's browsing environment. We propose an adaptive data presentation system which is an extension of SQL which creates HTML pages dynamically adapting to the size of screen. In our proposed method, the three basic rules for the layout conversion are provided and applying these rules, an efficient layout conversion technique optimized to user environment is proposed. Moreover, we propose a standard for converting layouts and a layout optimization for adaptive conversion of layouts.

  • PDF

계층적 캐시 기법을 이용한 대용량 웹 검색 질의 처리 시스템의 구현 (Implementation of a Large-scale Web Query Processing System Using the Multi-level Cache Scheme)

  • 임성채
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.669-679
    • /
    • 2008
  • 웹을 이용한 정보 공개 및 검색이 확대됨에 따라 웹 검색 엔진도 지속적인 주목을 받고 있다. 이에 따라 웹 검색 엔진의 다양한 기술적 문제를 해결하고자 하는 연구가 있었음에도 웹 검색 엔진의 질의 처리 시스템에 대한 기술적 내용은 잘 다뤄지지 않았다. 질의 처리 시스템의 경우 소프트웨어 아키텍처나 운영 기법을 고안하기 어렵기 때문에 본 논문에서는 구현된 상용 시스템을 바탕으로 관련 기술을 소개하고자 한다. 구현된 질의 처리 시스템은 6,500 만개 웹 문서를 색인하여 일 500만개 이상의 사용자 질의 요청을 수행하는 큰 규모의 시스템이다. 구현한 시스템은 질의 처리 결과를 재사용하기 위해 계층적 캐시 기법을 적용했으며, 저장된 캐시 데이타는 4계층으로 구성된 데이타 저장소에 분산 저장되는 것이 특징이다. 계층적 캐시 기법을 통해 질의 처리 용량을 400% 정도로 향상 시킬 수 있었으며 이를 통해 서버 구축비용을 70% 정도 절감할 수 있었다.

질의유형에 기반한 웹 검색의 성능 향상 (Improving the Performance of Web Search using Query Types)

  • 강인호;안동언
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.537-544
    • /
    • 2004
  • 인터넷의 발달로 인해 웹에서 얻을 수 있는 정보의 종류와 수는 급진적으로 증가하고 있다. 이에 따라 사용자가 요구하는 정보는 문서뿐만 아니라 사이트 그리고 서비스 단위로 확장되고 있다. 기존의 연구에서 웹 검색을 위해 사용되었던 정보들과 이들의 일률적인 결합형태는 다양한 사용자의 요구를 만족시키기 어렵다. 보다 좋은 결과를 얻기 위해서는 검색에 사용하는 정보의 특성을 분석하고, 질의에 따른 알맞은 정보의 사용이 필요하다. 본 연구에서는 사용자 질의유형에 따른 정보들의 유용성을 살펴보고 적절한 사용법을 분석한다. 그리고 차츰 대두되고 있는 서비스 검색을 위한 서비스 링크정보를 제안한다.