• 제목/요약/키워드: Search Ranking

검색결과 173건 처리시간 0.02초

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

모바일 P2P 네트워크에서 효율적인 콘텐츠 검색을 위한 데이터 배포 기법 (Data Dissemination Method for Efficient Contents Search in Mobile P2P Networks)

  • 복경수;조미림;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.37-46
    • /
    • 2012
  • 모바일 P2P 네트워크를 위해 제안된 데이터 배포 기법들은 프로파일과 일치하는 콘텐츠 검색 성능은 매우 뛰어나지만 프로파일과 일치하지 않는 콘텐츠 검색의 경우 질의 처리를 위한 추가적인 비용이 발생하기 때문에 프로파일과 일치하지 않는 콘텐츠 검색 성능 향상에 대한 추가적인 고려가 필요하다. 이러한 문제를 해결하기 위해 본 논문에서는 모바일 P2P 환경에서 효율적인 콘텐츠 검색을 위한 새로운 데이터 배포 기법을 제안한다. 제안하는 기법에서는 타임스탬프 메시지를 사용함으로써 이전 통신 경험 여부를 판단하고 이에 따른 데이터 배포를 수행한다. 또한, 제한된 메모리에 배포된 데이터를 효율적으로 저장하기 위해 랭킹 기법을 제안한다. 제안하는 랭킹 기법은 프로파일 일치여부 뿐만 아니라 주변의 배포 범위, 데이터를 배포해준 피어와의 연결성을 고려함으로서 차후의 질의 배포를 감소시킬 수 있다.

오피니언 마이닝 기술을 이용한 효율적 상품평 검색 기법 (An Efficient Search Method of Product Reviews using Opinion Mining Techniques)

  • 윤홍준;김한준;장재영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.222-226
    • /
    • 2010
  • 급속한 전자상거래의 발전으로 인하여 온라인상으로 상품을 구매하고 그에 대한 평가를 작성하는 것이 일반적인 구매 패턴이 되었다. 구매자들의 상품평은 다른 잠재적인 소비자들의 상품 구입을 이끌어내는데 큰 동기가 된다. 하지만 온라인 쇼핑몰에서는 상품평의 성질에 부합하는 순위를 부여하지 않기 때문에, 사용자가 구입 결정을 위하여 수많은 상품평에 포함된 의견들을 효과적으로 검토하기는 쉽지 않다. 일반적으로 상품평은 감정적이며 주관적인 의견을 포함하고 있다. 그래서 이러한 상품평에 순위를 부여하는 방법은 일반 웹 검색과는 달라야 한다. 본 논문에서는 오피니언 마이닝 기술을 이용하여, 사용자의 의도에 따라 상품평 데이터에 대해 순위를 결정하는 기법을 제안한다. 제안된 기법은 사용자의 검색어뿐만 아니라 상품평 내에 주관적인 의견의 포함 여부 및 감정 극성의 엔트로피 등을 고려하여 상품평의 가치를 판단하였다. 또한 실험을 통하여 제안된 기법의 우수성을 검증하였다.

PageRank 변형 알고리즘들 간의 순위 품질 평가 (Ranking Quality Evaluation of PageRank Variations)

  • 팜민득;허준석;이정훈;황규영
    • 전자공학회논문지CI
    • /
    • 제46권5호
    • /
    • pp.14-28
    • /
    • 2009
  • PageRank 알고리즘은 구글(Google)등의 검색 엔진에서 웹 페이지의 순위(rank)를 정하는 중요한 요소이다. PageRank 알고리즘의 순위 품질(ranking quality)을 향상시키기 위해 많은 변형 알고리즘들이 제안되었지만 어떤 변형 알고리즘(혹은 변형 알고리즘들간의 조합)이 가장 좋은 순위 품질을 제공하는지가 명확하지 않다. 본 논문에서는 PageRank 알고리즘의 잘 알려진 변형 알고리즘들과 그들 간의 조합들에 대해 순위 품질을 평가한다. 이를 위해, 먼저 변형 알고리즘들을 웹의 링크(link) 구조를 이용하는 링크기반 방법(Link-based approaches)과 웹의 의미 정보를 이용하는 지식기반 방법(Knowledge-based approaches)으로 분류한다. 다음으로, 이 두 가지 방법에 속하는 알고리즘들을 조합한 알고리즘들을 제안하고, 변형 알고리즘들과 그들을 조합한 알고리즘들을 구현한다. 백만 개의 웹 페이지들로 구성된 실제 데이터에 대한 실험을 통해 PageRank의 변형 알고리즘들과 그들 간의 조합들로부터 가장 좋은 순위 품질을 제공하는 알고리즘을 찾는다.

AN EFFICIENT DENSITY BASED ANT COLONY APPROACH ON WEB DOCUMENT CLUSTERING

  • M. REKA
    • Journal of applied mathematics & informatics
    • /
    • 제41권6호
    • /
    • pp.1327-1339
    • /
    • 2023
  • World Wide Web (WWW) use has been increasing recently due to users needing more information. Lately, there has been a growing trend in the document information available to end users through the internet. The web's document search process is essential to find relevant documents for user queries.As the number of general web pages increases, it becomes increasingly challenging for users to find records that are appropriate to their interests. However, using existing Document Information Retrieval (DIR) approaches is time-consuming for large document collections. To alleviate the problem, this novel presents Spatial Clustering Ranking Pattern (SCRP) based Density Ant Colony Information Retrieval (DACIR) for user queries based DIR. The proposed first stage is the Term Frequency Weight (TFW) technique to identify the query weightage-based frequency. Based on the weight score, they are grouped and ranked using the proposed Spatial Clustering Ranking Pattern (SCRP) technique. Finally, based on ranking, select the most relevant information retrieves the document using DACIR algorithm.The proposed method outperforms traditional information retrieval methods regarding the quality of returned objects while performing significantly better in run time.

웹 환경에서의 개인정보 검색기법 (A Retrieval Technique of Personal Information in a Web Environment)

  • 서영덕;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.145-151
    • /
    • 2015
  • 최근 개인정보 보호에 대한 관심이 높아지면서 웹 환경에 노출된 개인정보를 효율적으로 검색할 수 있는 시스템의 필요성이 증대되었다. 현재 웹 환경에 노출된 개인정보는 자신이 알고 있는 단편적인 단서를 이용한 검색을 통해 노출여부를 판단하고 있다. 그러나 이 방법은 검색결과의 우선순위가 개인정보의 노출도와 관계가 없어 효율적이지 못하다. 본 논문에서는 사용자 입력을 근거로 웹 환경에 노출된 사용자의 개인정보를 효율적으로 검색하고 삭제할 수 있도록 지원하는 프로세스를 제안한다. 또한 기존 검색 방법과의 비교를 통하여 검색성능의 향상 정도를 평가한다.

Known-Item Retrieval Performance of a PICO-based Medical Question Answering Engine

  • Vong, Wan-Tze;Then, Patrick Hang Hui
    • Asia pacific journal of information systems
    • /
    • 제25권4호
    • /
    • pp.686-711
    • /
    • 2015
  • The performance of a novel medical question-answering engine called CliniCluster and existing search engines, such as CQA-1.0, Google, and Google Scholar, was evaluated using known-item searching. Known-item searching is a document that has been critically appraised to be highly relevant to a therapy question. Results show that, using CliniCluster, known-items were retrieved on average at rank 2 ($MRR@10{\approx}0.50$), and most of the known-items could be identified from the top-10 document lists. In response to ill-defined questions, the known-items were ranked lower by CliniCluster and CQA-1.0, whereas for Google and Google Scholar, significant difference in ranking was not found between well- and ill-defined questions. Less than 40% of the known-items could be identified from the top-10 documents retrieved by CQA-1.0, Google, and Google Scholar. An analysis of the top-ranked documents by strength of evidence revealed that CliniCluster outperformed other search engines by providing a higher number of recent publications with the highest study design. In conclusion, the overall results support the use of CliniCluster in answering therapy questions by ranking highly relevant documents in the top positions of the search results.

Keywords and Spatial Based Indexing for Searching the Things on Web

  • Faheem, Muhammad R.;Anees, Tayyaba;Hussain, Muzammil
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권5호
    • /
    • pp.1489-1515
    • /
    • 2022
  • The number of interconnected real-world devices such as sensors, actuators, and physical devices has increased with the advancement of technology. Due to this advancement, users face difficulties searching for the location of these devices, and the central issue is the findability of Things. In the WoT environment, keyword-based and geospatial searching approaches are used to locate these devices anywhere and on the web interface. A few static methods of indexing and ranking are discussed in the literature, but they are not suitable for finding devices dynamically. The authors have proposed a mechanism for dynamic and efficient searching of the devices in this paper. Indexing and ranking approaches can improve dynamic searching in different ways. The present paper has focused on indexing for improving dynamic searching and has indexed the Things Description in Solr. This paper presents the Things Description according to the model of W3C JSON-LD along with the open-access APIs. Search efficiency can be analyzed with query response timings, and the accuracy of response timings is critical for search results. Therefore, in this paper, the authors have evaluated their approach by analyzing the search query response timings and the accuracy of their search results. This study utilized different indexing approaches such as key-words-based, spatial, and hybrid. Results indicate that response time and accuracy are better with the hybrid approach than with keyword-based and spatial indexing approaches.

인용 지표를 이용한 재순위화 및 질의 확장의 성능 평가 - 인용색인 데이터베이스를 기반으로 - (Performance Evaluation of Re-ranking and Query Expansion for Citation Metrics: Based on Citation Index Databases)

  • 이혜경;이용구
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.249-277
    • /
    • 2023
  • 본 연구의 목적은 인용 지표가 인용 색인 데이터베이스의 검색성능 향상에 기여할 가능성을 파악하는 데에 있다. 이를 위하여 본 연구는 문헌정보학 분야 10개의 질의를 Web of Science에서 검색하여 수집한 3,467건의 문헌과 2000년부터 2021년까지 SSCI 문헌정보학 분야 저널 85종에 수록된 60,734건의 문헌을 기반으로 적합성 판단을 거쳐, 검색 결과의 상위 100순위에 대한 성능 및 검색 방식과 인용 지표를 활용한 재순위화, 그리고 벡터 공간모형 검색시스템 구축 등에 따른 질의 확장 실험을 수행하였다. 그 결과 첫째, 인용 지표를 단독으로 사용한 재순위화의 성능은 Web of Science의 검색성능과 상이하였으며, 인용 지표는 Web of Science 기존 시스템에 적용되지 않는 독립적인 지표로 작용하고 있었다. 둘째, 고유 질의어 수에 질의어의 총 출현 빈도를 조합하고 인용수를 보조적으로 사용했을 때, 성능에 긍정적인 영향을 미칠 것으로 확인하였다. 셋째, 질의 확장에서는 전반적으로 벡터 공간모형 기반 검색시스템의 기본 성능 대비 성능이 향상되었다. 넷째, 이용자 적합성을 통해 질의 확장을 적용한 경우가 시스템 적합성을 적용한 경우보다 성능이 향상 되었다. 다섯째, 피인용 수를 적합 문헌과 더불어 사용하면 최상위권 내 적합 문헌에서의 순위 변동 가능성을 보여주었다.

포털사이트 실시간이슈 지속가능성 평가 (Estimating long-term sustainability of real-time issues on portal sites)

  • 정민영
    • 디지털융복합연구
    • /
    • 제17권12호
    • /
    • pp.255-260
    • /
    • 2019
  • 실시간검색어는 실시간으로 관심이 급상승하는 검색어에 대한 것으로 한정될 뿐 아니라 포털사이트마다 순위 차이가 있으므로 지속가능성을 파악하기 힘든 한계를 가지고 있다. 실시간검색어에 대한 지속가능성을 평가하는 것은 이러한 한계를 극복하고 예측가능성을 제공해준다는 측면에서 그 의미가 크다. 특히 한 달 이상 지속되는 장기 지속 검색어의 경우 사회적으로 관심이 오래 지속된 이슈로서 가치가 높다. 따라서 본 논문에서는 실시간검색어 순위에 기반한 관심도와 실시간검색어의 지속주수, 지속일수, 지속시간에 기반을 둔 지속도를 각 포털사이트 및 통합 포털사이트 별로 파악한 다음, 관심도와 지속도가 높은 것을 기준으로 지속가능성을 평가하여, 장기 지속가능성이 높은 실시간이슈를 도출하는 방법을 제시하고자 한다.