• 제목/요약/키워드: web pages

검색결과 554건 처리시간 0.026초

동적분류에 의한 주제별 웹 검색엔진의 설계 및 구현 (Design and Implementation of Web Directory Engine Using Dynamic Category Hierarchy)

  • 최범기;박선;박태수;송재원;이주홍
    • 인터넷정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.71-80
    • /
    • 2006
  • 웹 검색엔진의 검색방법에는 키워드검색방법과 주제별검색방법이 있다. 키워드검색은 재현율(recoil)이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾는 것이 어렵다. 주제별검색 역시 찾는 문서의 해당 주제가 모호하거나 주제를 정확하게 알지 못하면 문서를 찾지 못하는 경우가 있다. 즉, 검색결과의 정확율(precision)는 높으나 재현율이 떨어진다. 본 논문은 주제별검색의 문제점을 해결하기 위해서 주제와 키워드간의 관계를 퍼지논리로 정량적으로 계산하고, 이를 바탕으로 주제간의 함의(implication)관계를 유도하여 동적인 분류체계를 구성하는 새로운 웹 검색엔진을 설계하고 구현하였다. 구현된 검색엔진은 분류간의 함의관계를 유사한 하위주제로서 간주함으로써 주제별검색 결과의 재현율을 높일 수 있다.

  • PDF

웹페이지 관심도 분석에 관한 연구 (A Study On Analysis of Interestingness for Web-pages)

  • 김창근;정연홍;김일
    • 한국정보통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.687-695
    • /
    • 2007
  • 최근 인터넷 쇼핑몰 등을 통한 전자상거래가 증가하면서 웹페이지를 탐색하는 방문자의 관심도를 분석하여 개인화 등에 활용되는 예가 증가하고 있다. 웹사이트 방문자의 관심도 분석 방법으로는 클릭스트림 기반의 분석 방법이 이용되고 있지만, 이러한 기법은 인터넷 쇼핑 몰과 같이 많은 양의 정보를 제공하는 웹페이지의 경우에는 방문자가 어떠한 정보에 관심이 많은지에 대한분석이 어렵다. 웹페이지와 같이 많은 양의 정보를 제공하는 경우에 제한된 크기의 모니터로는 한 화면에 모든 정보를 표현하기가 어렵다. 따라서 웹페이지를 표현하는 웹브라우저는 이러한 표현의 한계를 극복하기 위하여 페이지 스크롤 기능을 제공하고 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 웹브라우저 내에서 스크롤바 위치와 윈도우 커서의 움직임을 주기적으로 수집하여 사용자의 관심도를 분석하는 웹페이지 관심도 분석 시스템을 제안하고 분석 및 설계하였다.

클릭스트림 데이터를 활용한 전자상거래에서 상품추천이 고객 행동에 미치는 영향 분석 (Effects of Product Recommendations on Customer Behavior in e-Commerce : An Empirical Analysis of Online Bookstore Clickstream Data)

  • 이홍주
    • 한국경영과학회지
    • /
    • 제33권3호
    • /
    • pp.59-76
    • /
    • 2008
  • Studies of recommender systems have focused on improving their performance in terms of error rates between the actual and predicted preference values. Also, many studies have been conducted to investigate the relationships between customer information processing and the characteristics of recommender systems via surveys and web-based experiments. However, the actual impact of recommendation on product pages for customer browsing behavior and decision-making in the commercial environment has not, to the best of our knowledge, been investigated with actual clickstream data. The principal objective of this research is to assess the effects of product recommendation on customer behavior in e-Commerce, using actual clickstream data. For this purpose, we utilized an online bookstore's clickstream data prior to and after the web site renovation of the store. We compared the recommendation effects on customer behavior with the data. From these comparisons, we determined that the relevant recommendations in product pages have positive relationships with the acquisition of customer attention and elaboration. Additionally, the placing of recommended items in shopping cart is positively related to suggesting the relevant recommendations. However, the frequencies at which the recommended items were purchased did not differ prior to and after the renovation of the site.

클릭스트림 데이터를 활용한 전자상거래에서 상품추천이 고객 행동에 미치는 영향 분석

  • 이홍주
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2008년도 춘계학술대회
    • /
    • pp.135-140
    • /
    • 2008
  • Studies of recommender systems have focused on improving their performance in terms of error rates between the actual and predicted preference values. Also, many studies have been conducted to investigate the relationships between customer information processing and the characteristics of recommender systems via surveys and web-based experiments. However, the actual impact of recommendation on product pages for customer browsing behavior and decision-making in the commercial environment has not, to the best of our knowledge, been investigated with actual clickstream data. The principal objective of this research is to assess the effects of product recommendation on customer behavior in e-Commerce, using actual clickstream data. For this purpose, we utilized an online bookstore's clickstream data prior to and after the web site renovation of the store. We compared the recommendation effects on customer behavior with the data. From these comparisons, we determined that the relevant recommendations in product pages have positive relationships with the acquisition of customer attention and elaboration. Additionally, the placing of recommended items in shopping cart is positively related to suggesting the relevant recommendations. However, the frequencies at which the recommended items were purchased did not differ prior to and after the renovation of the site.

  • PDF

가중치 순회로부터 빈발 순회패턴의 탐사 및 순회분할을 통한 성능향상 (Discovery of Frequent Traversal Patterns from Weighted Traversals and Performance Enhancement by Traversal Split)

  • 이성대;박휴찬
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.940-948
    • /
    • 2007
  • 실세계의 많은 문제는 그래프와 그 그래프를 순회하는 트랜잭션으로 모델링 될 수 있다. 예를 들면, 웹페이지의 연결구조는 그래프로 표현될 수 있고, 사용자의 웹페이지 방문경로는 그 그래프를 순회하는 트랜잭션으로 모델링 될 수 있다. 이와 같이 그래프를 순회하는 트랜잭션들로부터 빈발 패턴과 같이 중요한 패턴을 찾아내는 것은 의미있는 일이다. 본 논문에서는, 방향 그래프와 그 그래프를 순회하는 가중치가 있는 트랜잭션들이 주어졌을 때, 빈발한 순회패턴을 탐사하는 알고리즘을 제안한다. 또한, 이 알고리즘의 성능향상을 위하여 순회를 분할하는 방법을 제안하고 실험을 통하여 검증한다.

웹 어플리케이션 설계 환경 개발 (A Study on Environment for Web Applications Design)

  • 이미경;강병도
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.417-422
    • /
    • 2002
  • 네트워크와 인터넷의 급격한 성장과 함께 기존의 많은 소프트웨어들이 웹 기반으로 그 모습을 변화하고 있으며, 이로 인해 웹 어플리케이션의 복잡성이 증가되고 개발에 있어 많은 비용과 인력이 소요되고 있다. 하지만 아직까지 웹 어플리케이션을 위한 명확한 개발 환경이 정의되지 않았으며 대부분이 경험에 입각하여 나름대로 개발하고 있는 실정이다. 따라서 웹의 특성을 잘 반영하는 개발 환경의 구축이 무엇보다 중요시된다. 본 논문에서는 웹 환경의 특성을 파악하여 웹 어플리케이션 개발에 적합한 프로세스를 정의하고 이에 따라 모델링 할 수 있는 환경을 제시한다 또한 모델링 결과를 바탕으로 자동으로 소스코드를 생성한다. 결국 분석과 설계 단계에서 발생되는 결함을 줄여 품질을 향상하고, 개발하는데 드는 시간을 줄여 생산성을 향상함으로써 빠르게 변화하는 웹 환경에 능동적으로 대처하고자 한다.

  • PDF

웹 어플리케이션 설계 환경 개발 (A Study on Environment for Web Applications Design)

  • 이미경;강병도
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.417-422
    • /
    • 2002
  • 네트워크와 인터넷의 급격한 성장과 함께 기존의 많은 소프트웨어들이 웹 기반으로 그 모습을 변화하고 있으며, 이로 인해 웹 어플리케이션의 복잡성이 증가되고 개발에 있어 많은 비용과 인력이 소요되고 있다. 하지만 아직까지 웹 어플리케이션을 위한 명확한 개발 환경이 정의되지 않았으며 대부분이 경험에 입각하여 나름대로 개발하고 있는 실정이다. 따라서 웹의 특성을 잘 반영하는 개발 환경의 구축이 무엇보다 중요시된다. 본 논문에서는 웹 환경의 특성을 파악하여 웹 어플리케이션 개발에 적합한 프로세스를 정의하고 이에 따라 모델링 할 수 있는 환경을 제시한다. 또한 모델링 결과를 바탕으로 자동으로 소스코드를 생성한다. 결국 분석과 설계 단계에서 발생되는 결함을 줄여 품질을 향상하고, 개발하는데 드는 시간을 줄여 생산성을 향상함으로써 빠르게 변화하는 웹 환경에 능동적으로 대처하고자 한다.

  • PDF

웹 검색에 의한 대사성질환 관련 체질의학산업 현황 (The Status of Constitutional Medical Industry Related to Metabolic Diseases by Web Search)

  • 이연주;김종열
    • 사상체질의학회지
    • /
    • 제27권4호
    • /
    • pp.388-395
    • /
    • 2015
  • Objectives To grasp the trend of constitution medical industry related to the metabolic disorders by analyzing the web resource.Methods Web search with the search formula ("constitutional" or "spirit") and ("Metabolic" or "diabetes" or "high blood pressure" or "hyperlipidemia" or "obesity") for 20 years (1995.09.10 ~ 2015.09.09.) in the web portal address "Web search with the search formula ("constitutional" or "spirit") and ("Metabolic" or "diabetes" or "high blood pressure" or "hyperlipidemia" or "obesity") for 20 years (1995.09.10 ~ 2015.09.09.) in the web portal address "http://web.search.naver.com".Results In the search area of news, blogs, cafes and knowledge-in, the number of searched pages retrieved by the word "constitution" was about 1.78 million. In the news 9760 cases of "obesity", 4046 cases of "hypertension" and 3253 cases of "diabetes" were searched. In Naver Web search Korean medicine clinics related to "constitution" were 24.3%. If we multiple 25.3% to 1000, the actual number of herbal hospitals, The constitution related to Korean medicine clinics is estimated to be approximately 3160 places. Among metabolic disorders, "Overweight", "Diabetes" and "Hypertension" were most frequently searched.Conclusions Constitutional industry related to metabolic diseases is very actively created on the internet in various areas. Among metabolic diseases, obesity, diabetes, hypertension were found with high frequency.

링크 분석을 통한 비동기 웹 페이지 크롤링 알고리즘 (Asynchronous Web Crawling Algorithm)

  • 원동현;박혁규;강윤정;이민혜
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.364-366
    • /
    • 2022
  • 웹은 처리 속도가 다른 다양한 정보들을 함께 제공하기 위해 비동기식 웹 기술을 이용한다. 비동기 방식에서는 작업 완료 전에도 다른 이벤트에 응답할 수 있다는 장점이 있으나 일반적인 크롤러는 웹페이지의 방문 시점 정보를 수집함으로 비동기 방식으로 제공되는 정보를 수집하는 데 어려움이 있다. 또한 비동기식 웹 페이지는 페이지 내용이 변경되어도 웹 주소가 변하지 않는 경우도 많아 크롤링하는 데 어려움이 있다. 본 논문에서는 웹의 링크를 분석하여 비동기 방식 페이지 이동을 고려한 웹 크롤링 알고리즘을 제안한다. 제안한 알고리즘으로 비동기 방식으로 정보를 제공하는 TTA의 정보통신용어사전 정보를 수집할 수 있었다.

  • PDF

PDFindexer: Distributed PDF Indexing system using MapReduce

  • Murtazaev, JAziz;Kihm, Jang-Su;Oh, Sangyoon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제4권1호
    • /
    • pp.13-17
    • /
    • 2012
  • Indexing allows converting raw document collection into easily searchable representation. Web searching by Google or Yahoo provides subsecond response time which is made possible by efficient indexing of web-pages over the entire Web. Indexing process gets challenging when the scale gets bigger. Parallel techniques, such as MapReduce framework can assist in efficient large-scale indexing process. In this paper we propose PDFindexer, system for indexing scientific papers in PDF using MapReduce programming model. Unlike Web search engines, our target domain is scientific papers, which has pre-defined structure, such as title, abstract, sections, references. Our proposed system enables parsing scientific papers in PDF recreating their structure and performing efficient distributed indexing with MapReduce framework in a cluster of nodes. We provide the overview of the system, their components and interactions among them. We discuss some issues related with the design of the system and usage of MapReduce in parsing and indexing of large document collection.