• 제목/요약/키워드: web pages

검색결과 554건 처리시간 0.026초

메타 검색엔진을 위한 HTML 문서 변경 탐지기의 설계 및 구현 (Design and Implementation of an HTML Pages Modification Detector for Meta-search Engines)

  • 박상위;오정석;이상호
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.345-354
    • /
    • 2002
  • 검색엔진의 HTML문서는 수시로 변경되고 있으며, 이는 각 검색엔진의 결과 문서를 통합하여 사용자에게 제공하는 메타 검색엔진의 기능을 저하시키는 요인이 된다. 이에 대한 해결방법으로 본 논문에서는 HTML 문서의 변경을 탐지하는 HTML문서 변경 탐지기를 설계하고 구현한다. 문서 변경 탐지기는 문서 구조를 추출하기 위해 위치 정보 알고리즘과 수정된 Jaak Vilo 알고리즘을 사용하고, 그 결과로 패턴을 추출한다. 문서 변경 탐지기는 HTML문서에서 반복적으로 출현하는 구조를 표현하는 패턴을 사용한다. 또한, 문서 변경 탐지기의 정확성을 측정하기 위하여 문서 변경에 대한 전략을 세우고 이를 기반으로 실험을 수행한다.

악성사이트 검출을 위한 안전진단 스케줄링 (Security Check Scheduling for Detecting Malicious Web Sites)

  • 최재영;김성기;민병준
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권9호
    • /
    • pp.405-412
    • /
    • 2013
  • 최근의 웹은 구현 방법과 이용 패턴이 변화되면서 서로 연결되고 융합되는 형태로 변화하였다. 서비스가 진화되고 사용자 경험이 향상되었으나 다양한 출처의 검증되지 않은 웹자원들이 서로 결합되어 보안 위협이 가중되었다. 이에 웹 확장의 역기능을 억제하고 안전한 웹서비스를 제공하기 위해 확장된 대상에 대한 안전성 진단이 필요하다. 본 논문에서는 웹사이트의 안전한 운영을 위해 안전진단을 외부 링크까지 확장하여, 진단 대상을 선별하고 지속적으로 진단하여 악성페이지를 탐지하고 웹사이트의 안전성을 확보하기 위한 스케줄링 방안을 제안한다. 진단 대상의 접속 인기도, 악성사이트 의심도, 검사 노후도 등의 특징을 추출하고 이를 통해 진단 순서를 도출하여 순서에 따라 웹페이지를 수집하여 진단한다. 실험을 통해 순차적으로 반복 진단하는 것보다 순위에 따라 진단 주기를 조정하는 것이 중요도에 따라 악성페이지 탐지에 효과적임을 확인하였다.

MVC 아키텍처 인지하는 웹 앱 재구조화 (MVC Architecture-aware Restructuring of Web Apps)

  • 오재원;안우현;김태공
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2153-2166
    • /
    • 2017
  • 웹 앱에는, 서로 다른 웹 페이지를 웹브라우저에 로드할 때 동일 데이터가 반복적으로 획득되고 처리되어 화면상에 표시되는 문제가 있다. 본 논문은 이 문제를 해결하기 위해 자바 웹 앱을 재구조화하는 기법을 제안하고 평가한다. 자바 웹 앱을 MVC(Model-View-Controller) 아키텍처 관점에서 동적 분석하고 컴포지트 뷰 패턴을 활용하여 중복해서 사용되는 데이터를 식별한다. 이를 토대로 페이지 요청 시 중복 데이터가 로드되지 않도록 앱을 재구조화한다. 재구조화를 통해 MVC 아키텍처에 부합하며 성능이 향상된 웹 앱을 생성한다. 이렇게 재구조화된 웹 앱은 기존 웹 앱의 응답 시간을 데스크톱 PC, 모바일 기기에서 각각 38%, 55% 개선하였다. 아울러 오픈 소스 웹 앱을 이용한 사례 연구를 통해 제안하는 기법의 적용 가능성을 보였다.

실시간 정보 제공을 위한 웹 트랜스코딩 (Web Transcoding for Real-Time Information Providing)

  • 우찬일;신인철
    • 전자공학회논문지CI
    • /
    • 제39권2호
    • /
    • pp.54-63
    • /
    • 2002
  • 최근 들어 인터넷 접속을 위하여 웹 접근이 가능한 개인 장치들이 점점 더 이용 가능해 짐에 따라 PDA나 셀룰러 폰과 같은 휴대 장치로부터 인터넷에 접속하는 사용자들이 증가하고 있다. 그러나 웹 상의 대부분의 페이지들은 적어도 640×480의 해상도를 가지는 컬러 모니터의 데스크탑 컴퓨터에 디스플레이하기 위해 제작되어, 충분한 표현 능력을 가지고 있지 않은 휴대 장치들에 동일한 내용의 웹 컨텐츠를 다르게 표현해야 할 필요가 요구되고 있다. 따라서 웹 컨텐츠와 휴대 장치들간의 이러한 문제를 해결하기 위하여 다양한 웹 트랜스코딩 기술이 제안되고 있다. 본 논문에서는 semi-automatic 웹 트랜스코딩 방법을 사용하여 실시간 정보를 위한 웹 트랜스코딩 시스템(웹 프리즘)을 제안한다. 본 논문에서 사용한 semi-automatic 트랜스코딩 방법은 모바일 사용자들이 웹 페이지의 레이아웃이 빈번하게 바뀌지 않는 제한된 범위의 웹 페이지에 접근하기 위한 좋은 방법으로 제공되며, 또한 웹 프리즘을 데스크탑 PC에서 구현하여 실험한 결과 PDA에서 좋은 품질의 문서를 생성하였다.

Xpath에 의한 인터넷 문서의 레이아웃 추출 방법에 관한 연구 (A Study on Layout Extraction from Internet Documents Through Xpath)

  • 한광록;선복근
    • 한국콘텐츠학회논문지
    • /
    • 제5권4호
    • /
    • pp.237-244
    • /
    • 2005
  • 현재 뉴스 데이터 등 대부분의 인터넷 문서는 일정한 템플릿을 기반으로 작성되고 있으며 템플릿은 메인 데이터 이외에 인덱스, 광고, 헤더데이터 등 정보검색에 도움이 되지 않는 형태로 구성되어 있다. 이는 인터넷 문서를 정보검색의 데이터로서 사용하려고 할 때 적합한 형태가 아니다. 그러므로 다양한 정보검색 분야에서 인터넷 문서를 처리하기 위해선 광고, 페이지 인덱스 등의 부가정보를 분별해야 한다. 따라서 본 논문에서는 웹페이지의 레이아웃에 영향을 미치는 블럭 태그의 특징과 구조를 파악하고 웹페이지간의 거리를 계산하여, 웹페이지의 레이아웃을 검출하는 방법을 제안한다. 실험결과 1000개의 문서 중 640개를 분류했으며, 평균 64%의 recall 수치를 얻을 수 있었다. 이 방법을 데이터 추출, 문서요약 등의 정보검색 분야의 전처리 과정에 적용할 경우 문서의 자동화 처리 시간을 감소시키고 처리의 효율성을 높일 수 있을 것으로 기대된다.

  • PDF

REST 서비스 패턴을 이용한 매시업 클라이언트 뷰 이동 코드 생성 (Generating Mashup Client View Navigation Codes using REST Style Service Patterns)

  • 이은정
    • 정보처리학회논문지D
    • /
    • 제17D권5호
    • /
    • pp.359-370
    • /
    • 2010
  • 웹 2.0의 확산과 함께 기존의 페이지 간 이동 대신 하나의 페이지에서 여러 개의 웹서비스를 인터페이스하는 웹페이지가 많이 사용되고 있다. 이러한 클라이언트 페이지를 매시업 클라이언트라고 부르는데, 이들은 복잡하고 다양한 기능을 지원하는 제어부를 포함한다. 본 논문에서는 이동 제어의 모델 기반의 코드 생성 방법을 제시한다. 먼저 REST 서비스 패턴을 클라이언트 페이지의 뷰와 뷰 이동에 적용하는 방법을 제안하고, 각 뷰로부터 서비스 메소드 호출이나 뷰 이동이 가능한 타입 조건을 제시한다. 또한 제안된 방법을 적용하여 XForms 페이지의 코드를 자동생성하는 프로토타입 시스템을 개발하였다. 이동 설계 방법을 적용한 매시업 클라이언트 페이지 생성 시스템을 구현하였다. 개발된 자동 생성 시스템은 개발자의 관여 없이 이동 제어 기능을 포함한 클라이언트 페이지의 코드를 생성하며, 체계적인 모델과 이동 패턴에 기반하여 생성된 결과 코드가 이해하기 쉽고 간단하다. 또한 사용자가 필요한 컨트롤만을 포함하여 서비스의 개수가 많아지는 경우에도 적용할 수 있다.

웹 기반의 가상현실 3D 국악 박물관 제작 (A Web-based 3D Virtual Reality Pavilion of Korean Traditional Music)

  • 최지애;심재선;김윤상
    • 디지털산업정보학회논문지
    • /
    • 제4권1호
    • /
    • pp.65-68
    • /
    • 2008
  • In this paper, a web-based 3D virtual reality (VR) pavillion of Korean Traditional Music was implemented. The VR pavillion is used for the virtual demonstration and experience of Korean Traditional Music, which provides the information as well as multimedia experience on eight instruments to users through internet. It provides eight web-pages and one an audio-visual classroom on the instruments.

컨텍스트 기반의 웹 애플리케이션 설계 방법론 (Context-based Web Application Design)

  • 박진수
    • 한국전자거래학회지
    • /
    • 제12권2호
    • /
    • pp.111-132
    • /
    • 2007
  • 웹 기능의 향상과 웹 관련 기술의 발전, 레거시 시스템과의 통합 필요성 증대, 자주 변하는 웹 콘텐츠와 구조 등으로 인하여 웹 애플리케이션을 개발하고 관리하는 일이 과거보다 훨씬 더 복잡하게 되었다. 그러나 이러한 다양한 요인들을 고려하는 포괄적인 웹 애플리케이션 설계 방법론은 아직 존재하지 않고 있다. 따라서 본 연구에서는 이러한 요인들을 고려한 컨텍스트 기반의 웹 애플리케이션 설계 방법론을 제시하고자 한다. 본 연구에서 제시하는 방법론에서는 웹 정보를 전달하는 메커니즘에 따라 구분되는 9 종류의 웹 페이지 형태와 웹 페이지 간의 다양한 의미 관계를 정의하는 7 종류의 링크 형태 및 설계 과정 중에 사용되는 여러 종류의 컴포넌트 역할을 구별하는 소프트웨어 컴포넌트 형태 등 다양한 종류의 모델링 기법들을 소개하고 있다. 뿐만 아니라 이 방법론은 '콤펜디엄(compendium)' 이라 불리는 일단의 관련된 정보 클러스터들로 이루어진 독창적인 웹 애플리케이션 모델을 사용하고 있다. 하나의 콤펜디엄은 주제(theme), 컨텍스트 페이지, 링크 및 컴포넌트로 구성된다. 이러한 접근 방법은 모듈 방식의 설계에 유용할 뿐만 아니라 항상 변하는 웹 애플리케이션의 콘텐츠와 구조를 관리하는데도 도움이 된다. 본 연구에서 제시한 방법론은 의미적으로 응집력이 있고 구문적으로 느슨히 결합된 유연한 웹 디자인 산출물을 생성하는데 도움이 될 것이다.

  • PDF

검색엔진의 정확률 향상을 위한 질의어 의미와 사용자 반응 정보의 이용 (Using Query Word Senses and User Feedback to Improve Precision of Search Engine)

  • 윤성희
    • 정보관리학회지
    • /
    • 제26권4호
    • /
    • pp.81-92
    • /
    • 2009
  • 본 논문은 정보검색 시스템의 사용자 질의어와 색인에 기반한 검색 과정에서 나타나는 중의성 해소를 위해 질의어 의미정보와 사용자 피드백을 사용하여 검색 성능을 향상시키는 방법을 소개한다. 의미 정보를 이용하여 질의어의 중의성을 해소하는 검색 과정은 검색 결과로서 의미적으로 무관한 많은 문서들 을 배제할 수 있다. 이를 위해 검색의 색인이 되는 명사 중심의 의미범주를 기반으로 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류한다. 검색 과정에서는 사용자의 질의 의미 선택과 정답 문서에 대한 참조 행위를 웹 페이지의 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.

개인화된 웹 검색 순위 생성 (Customized Web Search Rank Provision)

  • 강영기;배준수
    • 대한산업공학회지
    • /
    • 제39권2호
    • /
    • pp.119-128
    • /
    • 2013
  • Most internet users utilize internet portal search engines, such as Naver, Daum and Google nowadays. But since the results of internet portal search engines are based on universal criteria (e.g. search frequency by region or country), they do not consider personal interests. Namely, current search engines do not provide exact search results for homonym or polysemy because they try to serve universal users. In order to solve this problem, this research determines keyword importance and weight value for each individual search characteristics by collecting and analyzing customized keyword at external database. The customized keyword weight values are integrated with search engine results (e.g. PageRank), and the search ranks are rearranged. Using 50 web pages of Goolge search results for experiment and 6 web pages for customized keyword collection, the new customized search results are proved to be 90% match. Our personalization approach is not the way that users enter preference directly, but the way that system automatically collects and analyzes personal information and then reflects them for customized search results.