• 제목/요약/키워드: Web search

검색결과 1,646건 처리시간 0.023초

온톨로지 기반의 사용자 의도를 고려한 맞춤형 검색 서비스 (Ontology-based User Customized Search Service Considering User Intention)

  • 김수경;김건우
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.129-143
    • /
    • 2012
  • 웹 기술의 급속한 발전은 기업들이 관리해야 하는 정보량의 폭발적인 증가를 초래하였다. 이와 더불어 보다 정확한 정보를 찾기 위한 검색 엔진 솔루션 시장의 규모도 더불어 크게 증가하였다. 하지만 대부분의 검색엔진들은 사용자의 검색 의도를 고려하지 않고 사용자가 입력한 특정 키워드를 포함하는 문서들을 반환하는 방법을 채택하고 있어, 실제 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 본 연구에서는 이러한 문제를 해결 하기 위한 중요 기술인 적합성을 만족시키기 위해 재현율과 정확율을 높일 수 있는 방법을 제안하였다. 우선 검색어의 재현율을 높일 수 있도록 유사어 관계 확장을 위한 온톨로지 스키마 모델을 제안하고 이를 기반으로 한 추론을 통해 검색어의 확장을 제시하였다. 확장된 검색어들을 이용하여 문서 검색을 하기 위한 다단계 유사도 검색 순위화 알고리즘을 제안하였다. 설계된 온톨로지 스키마와 온톨로지 저장소의 데이터를 기반으로 추론과 유사도 검색 순위화 엔진이 포함된 웹사이트 형식의 사용자 의도 적응형 검색 솔루션을 구현하였다. 구현된 검색 솔루션을 통해 다양한 검색어를 입력하여 제안 방법의 타당성을 입증하였고 사용자 의도를 고려한 맞춤형 검색 솔루션의 필요성을 설명하였다.

공간정보사업의 중복사업 검색을 위한 의미기반검색 시스템의 설계 (Design of Semantic Search System for the Search of Duplicated Geospatial Projects)

  • 박상언;임재익;강주영
    • 한국IT서비스학회지
    • /
    • 제12권3호
    • /
    • pp.389-404
    • /
    • 2013
  • Geospatial information, which is one of social overhead capital, is predicted as a core growing industry for the future. The production of geospatial information requires a huge budget, so it is very important objective of the policy for geospatial information to prevent the duplication of geospatial projects. In this paper, we proposed a semantic search system which extracts possible duplication of geospatial projects by using ontology for geospatial project administration. In order to achieve our goal, we suggested how to construct and utilize geospatial project ontology, and designed the architecture and process of the semantic search. Moreover, we showed how the suggested semantic search works with a duplicated projects search scenario. The suggested system enables a nonprofessional can easily search for duplicated projects, therefore we expect that our research contributes to effective and efficient duplication review process for geospatial projects.

XML 웹 서비스 검색 엔진의 개발 (Development of a XML Web Services Retrieval Engine)

  • 손승범;오일진;황윤영;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권4호
    • /
    • pp.121-140
    • /
    • 2006
  • UDDI (Universal Discovery Description and Integration) Registry is used for Web Services registration and search. UDDI offers the search result to the keyword-based query. UDDI supports WSDL registration but it does not supports WSDL search. So it is required that contents based search and ranking using name and description in UDDI registration information and WSDL. This paper proposes a retrieval engine considering contents of services registered in the UDDI and WSDL. It uses Vector Space Model for similarity comparison between contents of those. UDDI registry information hierarchy and WSDL hierarchy are considered during searching process. This engine suppports two discovery methods. One is Keyword-based search and the other is template-based search supporting ranking for user's query. Template-based search offers how service interfaces correspond to the query for WSDL documents. Proposed retrieval engine can offer search result more accurately than one which UDDI offers and it can retrieve WSDL which is registered in UDDI in detail.

  • PDF

Document Classification Model Using Web Documents for Balancing Training Corpus Size per Category

  • Park, So-Young;Chang, Juno;Kihl, Taesuk
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.268-273
    • /
    • 2013
  • In this paper, we propose a document classification model using Web documents as a part of the training corpus in order to resolve the imbalance of the training corpus size per category. For the purpose of retrieving the Web documents closely related to each category, the proposed document classification model calculates the matching score between word features and each category, and generates a Web search query by combining the higher-ranked word features and the category title. Then, the proposed document classification model sends each combined query to the open application programming interface of the Web search engine, and receives the snippet results retrieved from the Web search engine. Finally, the proposed document classification model adds these snippet results as Web documents to the training corpus. Experimental results show that the method that considers the balance of the training corpus size per category exhibits better performance in some categories with small training sets.

RDF 기반 시맨틱 웹 시스템 설계 (Design for RDF-based Semantic Web System)

  • 이종원;장기만;김경환;양새동;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.684-686
    • /
    • 2014
  • 현재의 웹은 점점 늘어가는 데이터로 인해 효율적인 검색과 관리가 어려워지고 있다. 이를 타개하기 위한 방법으로 차세대 웹인 시맨틱 웹 기술이 개발되고 있으나, 기존에 사용되고 있는 검색엔진들은 시맨틱 웹 기술을 도입하지 않음에도 압도적인 국내 사용률을 독점하고 있다. 이로 인해 시맨틱 웹에 대한 개발은 더뎌지고 있으며, 검색엔진을 사용하는 사용자들 역시 시맨틱 웹의 사용을 꺼려하고 있다. 본 논문에서는 현재 사용되고 있는 웹과 차세대 웹을 비교분석하며, 시맨틱 웹 기술을 사용하는 검색엔진이 기존 웹 기술을 사용하는 검색엔진에 비해 사용률이 왜 낮고, 무엇 때문에 비효율적인지 연구하였으며, RDF 기반으로 시맨틱 웹을 설계하여 효율성을 높일 해결방법을 제시한다.

  • PDF

네이버와 구글의 모바일 통합 검색 컨텐츠 평가 (Evaluation of Mobile Unified Search Contents of Naver and Google Korea)

  • 박소연
    • 한국도서관정보학회지
    • /
    • 제42권4호
    • /
    • pp.263-280
    • /
    • 2011
  • 본 연구에서는 국내 주요 검색 포털들의 전반적인 모바일 통합 검색 현황을 조사하고, 네이버와 구글의 모바일 통합 검색 컨텐츠를 분석, 평가하였다. 즉 이 연구에서는 네이버와 구글을 대상으로 검색 결과에 노출되는 문서 수, 검색 결과 문서들의 컬렉션별 분포, 작성 연도별 분포와 같은 특징을 조사하고, 문서의 적합도, 최신성, 신뢰도 등을 평가하였다. 또한 네이버의 통합웹 베스트와 통합웹, 구글의 베스트 웹문서와 웹문서의 품질을 비교하였으며, 문서의 순위와 문서의 적합도 간의 상관관계를 분석하였다. 본 연구의 결과는 향후 포털의 효과적인 모바일 통합 검색 서비스의 개발에 활용될 수 있을 것으로 기대된다.

A Hybrid Query Disambiguation Adaptive Approach for Web Information Retrieval

  • Ibrahim, Roliana;Kamal, Shahid;Ghani, Imran;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권7호
    • /
    • pp.2468-2487
    • /
    • 2015
  • In web searching, trustable and precise results are greatly affected by the inherent uncertainty in the input queries. Queries submitted to search engines are by nature ambiguous and constitute a significant proportion of the instances given to web search engines. Ambiguous queries pose real challenges for the web search engines due to versatility of information. Temporal based approaches whereas somehow reduce the uncertainty in queries but still lack to provide results according to users aspirations. Web search science has created an interest for the researchers to incorporate contextual information for resolving the uncertainty in search results. In this paper, we propose an Adaptive Disambiguation Approach (ADA) of hybrid nature that makes use of both the temporal and contextual information to improve user experience. The proposed hybrid approach presents the search results to the users based on their location and temporal information. A Java based prototype of the systems is developed and evaluated using standard dataset to determine its efficacy in terms of precision, accuracy, recall, and F1-measure. Supported by experimental results, ADA demonstrates better results along all the axes as compared to temporal based approaches.

온라인 시장에서 가격민감도에 영향을 미치는 요인에 관한 연구 (A Study on Online Consumers′Price Sensitivity)

  • 송형철
    • 한국콘텐츠학회논문지
    • /
    • 제2권3호
    • /
    • pp.59-69
    • /
    • 2002
  • 본 연구는 온라인 쇼핑몰에서 구매를 할 경우 소비자가 느끼는 가격민감도에 영향을 미치는 변수에 관하여 연구하였다. 연구 결과, 가격탐색에 영향을 미치는 변수로는 웹사이트의 신뢰, 웹사이트의 상호작용성, 지각된 위험으로 나타났다. 본 연구에서 제시된 연구가설들에 대한 실증분석 결과들은 다음과 같이 정리할 수 있다. 첫째, 소비자들이 웹사이트에 대한 신뢰가 높을수록 가격탐색이 낮아지는 것으로 나타났다. 둘째, 웹사이트에 대한 상호작용성이 높을수록 가격탐색이 낮아지는 것으로 나타났다. 셋째, 웹사이트의 정보의 깊이가 깊을수록 소비자들은 가격정보를 많이 탐색하는 것으로 나타났다. 넷째, 소비자들이 온라인 구매에 있어 지각된 위험을 많이 느끼는 것으로 나타났다. 다섯째, 제품에 대한 지식이 높을수록 가격탐색이 높은 것으로 나타났다.

  • PDF

Rate of Waste in Authority Names for the Web of Science Journals among Saudi Universities

  • Otaibi, Abdullah Al;Sawy, Yaser Mohammad Al
    • International Journal of Computer Science & Network Security
    • /
    • 제21권7호
    • /
    • pp.267-272
    • /
    • 2021
  • The current study aimed at measuring the rate of loss in search results of the actual number of publications in journals indexed by Web of Science when not using the accurate official authority name as indicated by the Ministry of Education. Conducting a search using the authority name does not always yield complete results of all existing publications. Researchers in Saudi universities tend to use up to 10 different random names of universities when searching. This interesting fact has prompted the authors of this paper to conduct a study on the search results of 30 Saudi universities using the authority name as indicated by the Ministry of Education. The statistical analyses revealed that there is a high tendency for the wrong use of authority names. Results show that 8 universities were not found in the search results. Furthermore, other universities are losing between 10 and 30% of search results that reflect the actual number of publications. Consequently, the rank of each university, as well as the general rank of Saudi universities in the Web of Science, will be affected.

문화재 정보의 온톨로지 기반 검색시스템 (Ontology-Based Information Retrieval for Cultural Assets Information)

  • 백승재;천현재;이홍철
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.229-236
    • /
    • 2005
  • 시맨틱 웹(Semantic Web)은 정보자원의 효율적 검색, 통합, 재사용을 가능하게 한다. 현재의 웹 환경에서 사용되고 있는 키워드 검색방법은 단순한 문자열 일치 방법으로 인하여 정확한 검색결과에 한계가 있다. 이에 본 연구에서는 전통적인 키워드 검색에서의 나타난 문제점들을 해결할 방안으로 의미적인 연관성을 통한 온톨로지(Ontology) 검색방법을 제안하여 더욱 정확한 검색결과를 유도해 본다. 국내 문화재를 중심으로 하여 OWL기반의 온톨로지를 구축하였고 질의, 검색 방법으로는 RDQL 질의어와 Jena API를 사용하였다. 이와 더불어 온톨로지 속성(property)데이터를 데이터베이스에 저장하여 처리하는 방안을 제시한다.

  • PDF