• 제목/요약/키워드: web query

검색결과 544건 처리시간 0.024초

OWL 질의 처리를 위한 시그너처 기반 최적화 기법 (An Optimization Technique based on Signatures for OWL Query Processing)

  • 임동혁;정호영;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.585-592
    • /
    • 2005
  • 시맨틱 웹은 차세대 웹으로 연구되고 있으며 시맨틱 웹 상에서는 사람이 아닌 컴퓨터가 이해할 수 있는 정보를 처리해야 한다. 이러한 웹 자원의 내용을 기술하기 위해 온톨로지(Ontology)들을 이용한다. 이러한 온톨로지 중에 현재 W3C에서 제안한 OWL이 부각되고 있다. OWL을 처리하는 데이타 베이스에서 데이타는 그래프 형태로 저장되어 그래프 탐색을 통해 질의 처리를 수행한다. 본 논문에서는 OWL 데이타를 효율적으로 처리하기 위하여 시그니처를 이용한 최적화 기법을 제안한다. 논문에서 제안한 최적화 기법은 질의 수행 시 각 노드의 탐색 회수를 줄여 질의 수행을 빠르게 할 수 있게 한다.

질의 로그 분석을 통한 네이버 이용자의 검색 형태 연구 (Information Seeking Behavior of the NAVER Users via Query Log Analysis)

  • 이준호;박소연;권혁성
    • 정보관리학회지
    • /
    • 제20권2호
    • /
    • pp.27-41
    • /
    • 2003
  • 이용자와 검색 서비스 시스템의 모든 검색 과정을 기록한 질의 로그는 이용자의 실제 검색 행위를 사실적으로 반영한다. 따라서, 웹 검색 이용자들의 검색 행태를 이해하기위하여 웹 검색 서비스 시스템이 생성한 질의 로그를 분석하는 방법이 널리 사용되고 있다. 본 연구는 네이버 이용자의 웹 검색 행태를 파악하기 위하여 기존의 질의 로그 분석 방법론을 보완하여 제시한다. 또한, 본 연구는 통합 검색, 디텍토리 검색, 웹 문서 검색과 같은 다양한 검색 유형에 대하여 일주일 동안 생성된 질의 로그를 분석함으로써 네이버 웹 검색 이용자들의 전반적인 검색 행태를 파악하였다. 본 연구의 결과는 보다 효과적인 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

웹문서 검색을 위한 온톨로지 버전 제어 (Ontology Version Control for Web Document Search)

  • 김병곤
    • 디지털산업정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.39-48
    • /
    • 2013
  • Ontology has an important role in semantic web to construct and query semantic data. When system make changes to ontologies, questions arise about versioning of these changes. Applying this changes on a dynamic environment is even more important. To apply these changes, change specification method is needed. Early studies show RDF-based syntax for the operations between old and new ontologies. When several ontology versions can be used for some query, if possible, using possible newest version ontology with prospective use is best way to process the query. Prospective use of ontology means using a newer version of an ontology with a data source that conforms to a more recent ontology. In this paper, for prospective use of ontology version, structure of change specification of class and property through several ontology versions is proposed. From this, efficient adaptive ontology version selection for a query can be possible. Algorithm for structure of version transition representation is proposed and simulation results show possible newest version number for queries.

한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축 (Analyzing of Hangul Search Query Spelling Error Patterns and Developing Query Spelling Correction System Based on User Logs)

  • 전희원;다니엘 흥;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.15-21
    • /
    • 2010
  • 본 논문은 검색 서비스 기능 중에 빼놓을 수 없는 기능인 한글 검색 질의어(query) 교정 시스템을 '야후!'에서 구축하며 분석한 한글 오타 패턴 그리고 사용자 로그를 기반으로 설계한 질의어 교정 서비스에 대한 설명을 하고 있다. 이 교정 서비스는 현재 '야후! 코리아'에 적용되어 있으며, 한글을 고려한 키스트 로크를 기반으로 한 설계 방식 그리고 동적으로 에러모델을 구축하는 방법을 소개하고 있으며 또한 구축된 모델의 성능을 다른 검색 서비스와 비교한 결과를 소개한다.

  • PDF

대용량 데이터 처리를 위한 고속 분산 인메모리 플랫폼 기반 재귀적 질의 알고리즘들의 구현 및 비교분석 (A Comparative Analysis of Recursive Query Algorithm Implementations based on High Performance Distributed In-Memory Big Data Processing Platforms)

  • 강민서;김재성;이재길
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.621-626
    • /
    • 2016
  • 재귀적 질의 알고리즘은 소셜네트워크 서비스의 도달가능 질의와 같은 많은 응용프로그램에 사용된다. 하지만 최근에 소셜네트워크 서비스의 규모가 커짐에 따라 그래프 데이터의 크기 또한 커지고 있다. 따라서 재귀적 질의 알고리즘을 싱글 머신에서 가동하는 것이 거의 불가능해졌다. 본 논문에서는 이러한 문제점을 해결하기 위해서 고속 분산 인메모리 플랫폼인 스파크와 트위스터에서 재귀적 질의 알고리즘을 구현하였다. 구현된 알고리즘은 아마존 EC2 머신 50대에서 Real-world 데이터 셋인 LiveJournal과 ClueWeb으로 실험하였다. 실험결과 상대적으로 노드 수는 적고 평균 차수(degree)는 높은 LiveJournal 데이터 셋에서는 스파크에서 구현된 재귀적 알고리즘의 성능이 트위스터의 것보다 좋았다. 그리고 상대적으로 노드 수는 많고 평균 차수는 낮은 ClueWeb 데이터 셋에서는 트위스터에서 구현된 재귀적 알고리즘의 성능이 스파크의 것보다 좋았다.

Natural Language Query Framework on the Semantic Web

  • 김진성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.189-192
    • /
    • 2007
  • This study proposes a Natural Language Query Framework (NLQF) on the semantic web to support the intelligent deduction at semantic level. A large number of former researches are focused on the knowledge representation on the semantic web. However, to revitalize the intelligent agent (IA)-based automated e-business contract with human customers, there is a need for semantic level approach to the web information. To enable accessing web information at semantic level, this paper discusses the pattern of complex natural language processing at first, and then the semantic web-based natural language inference in e-business environment. The NL-based approach could help the IAs on the web to communicate with customers and other IAs with more natural interface than traditional HTML-based web information. Therefore, our proposed NLQF will be used in semantic web-based intelligent e-business contracts between customers and IAs.

  • PDF

웹검색 행태 연구 - 사용자가 스스로 쿼리를 뭉치는 방법으로 - (Web Search Behavior Analysis Based on the Self-bundling Query Method)

  • 이중식
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.209-228
    • /
    • 2011
  • 검색이 편재화 되고 있다. 사용자들은 PC를 너머 스마트폰과 스마트TV에서도 검색을 일상적으로 사용하고 있다. 따라서 사용자의 검색행태도 진화 중이다. 하지만 검색행태 연구는 서버의 트랜잭션 로그(transaction log)를 기반으로 하거나 사용자 로그(user log)를 관찰하는 경우에도 개별 쿼리(query instance)를 분석단위로 삼기에 여러 매체와 여러 시간을 가로지르는 검색 행태를 분석하기에 부족하다. 본 연구에서는 사용자가 직접 덩어리 지운 쿼리 뭉치(bundled query)를 살펴보아 시간과 매체를 가로지르며 궁금증을 해결해 나가는 사용자의 검색행동을 분석해 보았다. 연구를 위해 사용자 PC에 웹로그 캐처를 설치하고, 취합된 웹검색 기록을 사용자들이 직접 덩어리 지워 같은 궁금증을 가진 뭉치를 만들도록 하였다. 또한 각 뭉치에 대한 설문을 통해 검색의 동기, 계기, 만족도 및 검색 후 활동을 조사하였다. 사용자에 의해 만들어진 뭉치는 전화 인터뷰를 통해 검증하였고 맥락을 확인하였다. 뭉치를 통한 인터뷰는 검색 당시의 기억을 떠올리는 힌트로 작용하여 사용자의 검색 회상을 생생하게 하였다. 분석 결과 사용자들은 하루에 평균 4.75개의 검색 뭉치를 발생시키고, 각각의 검색 뭉치는 평균 2.75개의 쿼리로 구성되어 있음을 확인할 수 있었다. 또한 뭉치 내 쿼리의 발전을 '쿼리의 정교화'와 '주제의 정교화'라는 상위 범주 아래 9개의 패턴으로 확인하였다.

캐쉬메카니즘을 이용한 시맨틱 스키마 데이터 처리 (Semantic schema data processing using cache mechanism)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.89-97
    • /
    • 2011
  • 네크워크상의 분산되어 있는 정보를 접근하는 온톨로지와 같은 시맨틱 웹 정보 시스템에서는 효율적인 질의 처리를 위하여 질의 응답 시간을 줄여주는 향상된 캐쉬 메카니즘을 필요로 한다. 특히, P2P 네트워크 시스템은 웹 환경의 기본적인 하부 구조를 이루고 있으며, 질의가 발생하면, 소스 피어(Peer)로의 데이터 전송량을 줄이는 문제가 효율적인 질의 처리의 중요한 부분이다. 전통적인 데이터베이스 캐쉬 메카니즘으로부터 현재의 웹 환경에 적합한 질의 메카니즘들이 연구되어 왔으며, 질의 처리 결과를 캐쉬하는 것은 입력 질의 요구를 빠른 시간에 바로 사용자에게 전달할 수 있다. 웹 환경에서는 시맨틱 캐싱 방법이 연구되어 왔으며, 이는 캐쉬를 의미적인 영역들로 이루어진 공간으로 관리하는 개념이며, 논리적인 캐싱 단위가 질의와 질의 결과이므로 웹 환경에서 적합한 개념이다. 본 연구에서는 온톨로지와 같은 시맨틱 웹 정보가 클러스터 단위로 여러 피어에 분산되어 있는 경우에 캐쉬 메카니즘을 이용하여 효율적인 질의 처리가 이루어지도록 하는 방법을 제시한다. 특히, 캐쉬를 유지하고 처리하는 방법으로 스키마를 이용한 캐쉬 데이터 필터링 방법과 온톨로지와 질의 결과의 유사도를 측정하여 캐쉬 대체 영역 선택에 사용하는 방법을 제시한다.

LTSA 기반의 질의 응답 학습 도구 개발 (A Development of Query-Answer Learning Tool based on LTSA)

  • 김행곤;김정수
    • 정보처리학회논문지A
    • /
    • 제10A권3호
    • /
    • pp.269-278
    • /
    • 2003
  • 웹 기반 교육의 대중화로 학습 보조 도구를 이용한 다양한 웹 학습 방법들이 제시되고 있으며 또한 이틀 시스템의 운용 환경, 컨텐츠명세 그리고 활용 등의 상호 운용성 지원을 위한 표준화에 대한 연구가 국제표준기관 등을 통해 활발히 이루어지고 있다. 특히 e-learning 개발 환경을 위한 Learning Technology Standard Architecture(LTSA)를 기능별 5계층을 IEEK에서 제정하였다. 이 LTSA의 학습 보조 도구 표준화 영역에서 학습과정 피드백을 제공하는 질의 응답 학습 방법에 대한 표준규약기능을 명세하지 않고 있다. 본 논문에서는 국제표준화 기술인 ITSA 시스템 구성중 제 3계층을 기반한 질의 응답 학습 도구에 대해 연구한다. 데이터 중심으로 작성된 LTSA 컴포넌트를 객체지향 또는 컴포넌트 패라다임으로 재 정의하는 모델을 제안하고 기존의 Loaming Object Meatdata(LOM)을 참조하여 질의 응답 메타 데이터인 Query Answer Metadata(QAM)를 서술한다. 이들 재정의 모델과 QAM을 통합한 Query Answer Learning Tool(QALT)를 분석, 설계하여 프로토타이핑시스템으로 구현한다. 이를 통해 웹 기반 교육의 효율성 및 관련 도구 개발의 품질 및 생산성 효율을 가진다.

e-비즈니스 레지스트리 통합 질의 시스템 설계 및 구현 (Design and Implementation of Integrated Query System for e-Business Registries)

  • 김계용;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제10권1호
    • /
    • pp.127-146
    • /
    • 2003
  • With the spread of Internet, e-business using Internet technology is being actively developed and operated. Currently, on behalf of the international e-business framework, International standard such as ebXML and Web Service is being advanced. We are able to publish and search business information through ebXML and Web Service and then actual trading between partners is accomplished. By the way, it is Registry that play an important part in e-business. Registry is an e-business infrastructure for enabling building, deploying, and the discovery of business Information. We can do e-business through Registries dynamically and share the resources. Representatives of Registry are ebXML and UDDI used as an international standard. We will meet with some problems when using Registries. ebXML Is focused on B2B collaborations and Web Service Is focused on application integrations. So we must use ebXML and Web Service characteristically, and sometimes use all at need. ebXML and Web Service contain business information by Registry specific way. So When using the services offered by ebXML and Web Service, we should access each Registry by using Registry specific tools. This thesis intended to integrate business information from ebXML Registry and UDDI Registry to accomplish e-business conveniently This thesis defined the common data model as well as integrated query language for integrated access to ebXML and Web Service along with design and implementation of the system.

  • PDF