• 제목/요약/키워드: web pages

검색결과 554건 처리시간 0.029초

하이퍼텍스트 정보 관점에서 의도적으로 왜곡된 웹 페이지의 검출에 관한 연구 (Detecting Intentionally Biased Web Pages In terms of Hypertext Information)

  • 이우기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.59-66
    • /
    • 2005
  • 웹(World Wide Web)은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다 웹에서는 일반적으로 검색엔진(Web search engine)을 통해 정보 검색을 수행하지만, 그 결과가 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 웹 페이지에 대한 평가를 조작하는 것을 의도적 조작이라고 부른다. 최근에 가장 각광을 받는 링크 기반 검색 방식에는 의도적 조작이 상대적으로 어렵지만, 링크 기반 검색 방식의 대표격인 구글의 페이지 점수법(PageRank algorithm)도 구글밤처럼 조작할 수 있는 방법이 있다 본 논문에서는 기본적으로 링크 기반 검색 방식을 기초로 웹을 하나의 유향그래프(directed graph)로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼텍스트 링크를 에지(edge)로 표현하며. 하이퍼텍스트 정보관점에서 링크 내역과 대상 페이지(target page) 사이의 유사도(similarity)를 구하고. 이것을 이용하여 페이지 점수화 (PageRank) 접근법의 전이 행렬(transition matrix)을 재구성하는 방법을 취했다 결과적으로 기존의 점수화 방법과 비교하여 효과가 $60\%$ 이상 될 수 있음을 입증했다.

  • PDF

요약파싱기법을 사용한 웹 접근성의 정적 분석 (Static Analysis of Web Accessibility Based on Abstract Parsing)

  • 김현하;도경구
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1099-1109
    • /
    • 2014
  • 웹 접근성 평가 도구는 웹 사이트가 웹 접근성 지침을 잘 지키고 있는지 검사하는 도구이다. 국내외 법과 제도가 마련된 이후 지침 준수여부를 검사하는 도구가 많이 나왔지만, 대부분 동적으로 페이지를 수집해서 분석하는 방법을 사용한다. 특히 자동화된 도구들은 페이지를 수집한 후에 분석하는데, 실행환경이나 접근권한의 문제로 수집하지 못해서 분석결과에서 빠지는 경우가 발생할 수 있다. 본 연구는 기존 방법과 달리 정적으로 분석하여 웹 접근성을 평가하는 방법을 제안한다. 정적인 분석방법은 실행 가능한 모든 경로를 고려하기 때문에 놓치는 페이지 없이 분석할 수 있다. 요약해석기법에 파싱이론을 접목한 요약파싱 기술을 사용해서 동적으로 생성될 웹 페이지의 웹 접근성을 정적으로 분석하는 도구를 개발하였다. 실험 대상 PHP 프로그램을 제안하는 연구방법으로 개발한 도구와 비교 대상 도구에서 분석한 결과를 비교해서 비교 대상 도구에서는 접근권한이나 실행경로 등의 문제로 분석하지 못하고 놓치는 웹 페이지가 있음을 확인하였다.

다양한 계층 트리 구조를 갖는 쇼핑몰 상에서의 상품평 수집을 위한 웹 크롤러 래퍼의 설계 및 구현 (Design and Implementation of Web Crawler Wrappers to Collect User Reviews on Shopping Mall with Various Hierarchical Tree Structure)

  • 강한훈;유성준;한동일
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.318-325
    • /
    • 2010
  • 본 논문에서는 다 계층 구조와 다양한 웹 언어로 구성된 한국내 쇼핑몰로부터 상품평 수집을 위한 래퍼 데이터베이스 기술 언어 및 모델을 제안한다. 기존에 제안된 래퍼 기반 웹 크롤러는 HTML 문서를 수집할 수 있고, 수집 대상으로 하는 문서의 계층 구조는 2~3계층이다. 그러나 한국형 쇼핑몰 사이트는 HTML 문서뿐만 아니라 다양한 웹 언어(JavaScript, Flash, AJAX)로 구성되어 있고, 그 계층 또한 5계층으로 이루어졌다. 웹크롤러가 이 5 계층 사이트에 있는 상품평만을 수집하려고 하면 상품평이 있는 위치를 정확히 알고 있으면 된다. 우리가 제안하는 래퍼에는 이러한 정보를 포함하고 있도록 하였고, 이러한 정보를 기술하기 위해 필요한 래퍼 데이터 기술 문법도 제안한다.

HTML 태그페턴을 이용한 웹정보추출시스템 (Web Information Extraction using HTML Tag Pattern)

  • 박병권
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2005년도 춘계학술대회 발표 논문집
    • /
    • pp.79-92
    • /
    • 2005
  • To query the vast amount of web pages which are available i]l the Internet, it is necessary to extract the encoded information in the web pages for converting it into structured data (e.g. relational data for SQL) or semistructured data (e.g. XML data for XQuery), In this paper, we propose a new web information extraction system, PIES, to convert web information into XML documents. PIES is based on a user-specified target schema and HTML tag pattern descriptions. The web information is extracted by the pattern descriptions and validated by the target schema. We designed a new language to describe extraction rules, and a new regular expression to describe HTML tag patterns. We implemented PIES and applied it to the US patent web site to evaluate its correctness. It successfully extracted more than thousands of US patent data and converted them into XML documents.

  • PDF

로컬 웹사이트의 탐색전략과 웹사이트 유형분석에 관한 연구 (A Study on the Crawling and Classification Strategy for Local Website)

  • 황인수
    • Journal of Information Technology Applications and Management
    • /
    • 제13권2호
    • /
    • pp.55-65
    • /
    • 2006
  • Since the World-Wide Web (WWW) has become a major channel for information delivery, information overload also has become a serious problem to the Internet users. Therefore, effective information searching is critical to the success of Internet services. We present an integrated search engine for searching relevant web pages on the WWW in a certain Internet domain. It supports a local search on the web sites. The spider obtains all of the web pages from the web sites through web links. It operates autonomously without any human supervision. We developed state transition diagram to control navigation and analyze link structure of each web site. We have implemented an integrated local search engine and it shows that a higher satisfaction is obtained. From the user evaluation, we also find that higher precision is obtained.

  • PDF

제주관광공사 '비짓제주' 중문 홈페이지의 로컬라이제이션 연구 -콘텐츠 선정과 번역 텍스트를 중심으로 (Localization of Chinese Version of Jeju Tourism Organization's Official Version 'Visit Jeju' - Centered on Contents Selection and Translation)

  • 홍미미
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.535-547
    • /
    • 2019
  • 웹사이트의 로컬라이제이션은 원천어 홈페이지의 콘텐츠와 텍스트를 그대로 번역하는 것보다 목적어 시장의 문화, 수요 등에 따라 조절하여 수용도를 높이는 과정이다. 본고는 로컬라이제이션의 측면에서 제주관광공사 '비짓제주' 중문 홈페이지의 로컬라이제이션 전략 및 문제점을 검토하고자 한다. 먼저 '비짓제주' 중문 홈페이지와 국문 홈페이지의 비교를 통하여 콘텐츠 선정과 번역에 있어 어떠한 로컬라이제이션 전략을 적용하고 있는지 분석한 다음에 중국 본토 관광 정보 사이트 '마펑워'와 비교하여 차이점을 찾아낸다. 이를 바탕으로 '비짓제주' 중문 웹사이트의 로컬라이제인션 전략을 정리하고 개선할 수 있는 점을 제시한다. 더 나아가 한국 웹사이트 중문 홈페이지의 개설을 위하여 제안해보고자 한다.

Development of a Web Accelerator in the Kernel

  • Park, Jong-Gyu;Lim, Han-Na;Kim, Hag-Bae
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.70.3-70
    • /
    • 2001
  • In this paper, we suggest a kernel level multi thread web accelerator (called the SCALA-AX), which significantly improves the performance of the web soerver. In comparison with a conventional proxy web cache that is generally called a caching server and a simple content-copy based system, the primary functions and goals of SCALA-AX are designed to maximize the content services of a front end web server with high performance. Specifically, the SCALA-AX runs on the kernel level of a web sorrel, based on the newest caching techniques. Moreover, the SCALA-AX supports the http 1.1 protocol and allows the dynamic pages as well as static pages to be processed.

  • PDF

국내 포털의 개별형 콘텐츠 검색 영역 데이터에 기반을 둔 효율적인 반응형 웹 디자인에 관한 연구 (Study on Efficient Responsive Web Design for Individual Search Contents of Korean Portal)

  • 임경규;조희준;이구연
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.513-522
    • /
    • 2015
  • 비약적인 모바일 기기의 기술 발전에 따라 PC 모니터부터 스마트 워치까지 다양한 형태의 디스플레이 환경이 제공되고 있다. 이에 웹 콘텐츠 생산자들은 하나의 콘텐츠를 다양한 디스플레이 환경에 최적화된 형태로 제공할 필요성을 갖게 된다. 디바이스별 콘텐츠 제작 대응은 제작 시간과 비용의 증가로 이어질 수밖에 없다. 이를 극복하기 위한 기술로서 반응형 웹이 제안되었는데, 이는 디스플레이 종류에 따라 화면의 크기가 자동으로 최적화되도록 조절되는 웹페이지를 의미한다. 국내 포털의 콘텐츠 검색 영역에서도 반응형 웹 방식이 많이 구현되고는 있으나 아직까지 PC용 또는 모바일용으로 이중으로 콘텐츠를 구현하는 경우가 많다. 이에 본 논문에서는 국내 포털의 개별형 콘텐츠 검색영역의 반응형 웹 구현 형태를 조사하고, 반응형 웹이 적용되지 않은 콘텐츠에 대하여 효율적인 새로운 UI를 제안한다.

온톨로지 기반 웹 항해 안내 시스템 (The Ontology-based Web Navigation Guidance System)

  • 정효숙;김희진;민경실;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제12권5호
    • /
    • pp.95-103
    • /
    • 2009
  • 본 논문에서는 온톨로지를 기반으로 사용자에게 의미적으로 관련된 링크를 자동적으로 제공하는 웹 항해 안내 시스템을 제안한다. 본 시스템은 각각의 웹 페이지를 온톨로지에 존재하는 특정 개념과 관련시키고, 온톨로지에 정의된 개념들 간의 관계를 고려하여 웹 페이지들 간의 새로운 링크를 생성한다. 본 시스템은 온톨로지를 기반으로 의미적 링크를 제공함으로써 웹 항해 안내를 향상시키는데 초점을 두고 있다. 본 노문에서 제안한 시스템을 이용하여 초등학교 5학년 학생들에게 웹 페이지를 탐색하면서 과제를 수행하는 실험을 한 결과 실험 집단에 속한 학생들의 방향 상실 정도, 웹 페이지의 재 방문율, 그리고 과제 수행에 소비된 시간이 통제 집단에 속한 학생들의 경우보다 작았고 과제 수행율은 실험 집단의 학생들이 통제 집단의 학생들보다 높았다. 본 논문에서 제안하는 시스템은 웹 기반 교육에서 중요한 항해 가능한 웹 사이트를 설계하는 데 도움이 되리라 기대된다.

  • PDF

VDT 환경에서 누진렌즈와 단초점렌즈 착용자의 한글 읽기능력 비교 연구 (Comparative Study of Korean Letters Legibility of Progressive Lens Wearers and Single Focus Lens Wearers under the VDT Circumstance)

  • 구혜연;김달영
    • 한국안광학회지
    • /
    • 제17권2호
    • /
    • pp.195-202
    • /
    • 2012
  • 목적: 누진렌즈의 착용이 VDT 환경에서 한글의 가독성에 미치는 영향을 연구하고자 하였다. 방법: VDT 환경에서 50명의 피검자를 대상으로 누진렌즈와 단초점렌즈를 착용시키고 웹문서를 읽으면서 지정된 글자를 찾도록 하였다. 피검자들이 웹문서를 읽는데 걸리는 시간과 지정된 글자를 찾지 못하고 누락시킨 숫자를 측정하여 가독성의 기준으로 삼았으며, 누진렌즈를 착용했을 때와 단초점렌즈를 착용했을 때의 측정 결과를, 글자 크기와 가독성, 그리고 웹문서의 너비를 변수로 하여 비교하였다. 결과: 누진렌즈를 착용하였을 때 웹문서를 읽는 시간이 통계적 유의성을 가지고 증가하였으며 찾지 못하고 놓친 숫자의 증가 또한 일부의 경우 통계적 유의성을 보였다. 글자의 크기가 작을수록, 글자 자체의 가독성이 낮을수록, 웹문서의 가로 너비가 넓을수록 누진렌즈에 의한 가독성의 저하가 심해지는 대체적인 경향성이 나타났다. 결론: 시야가 좁은 누진렌즈의 중간부는 VDT 환경에서 한글의 가독성을 저하시키는 단점을 갖는 것으로 추정된다.