• 제목/요약/키워드: web pages

검색결과 554건 처리시간 0.022초

연관 피드백과 퍼지 함의 연산자를 이용한 스니핏 추출 방법 (Snippet Extraction Method using Fuzzy Implication Operator and Relevance Feedback)

  • 박선;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.424-431
    • /
    • 2012
  • 정보 검색 시 검색엔진은 사용자에게 웹페이지 순위와 웹페이지의 요약정보를 제공한다. 이중 웹 페이지를 대표 할 수 있는 요약된 정보를 스니핏(snippet)이라한다. 스니핏은 사용자의 웹페이지 방문에 큰 영향을 준다. 정확한 방문 페이지의 정보를 모르고 단지 스니핏 만을 이용할 때에 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 검색엔진에서 지원하는 스니핏에 사용자의 의도를 정확하게 반영하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 연관 피드백과 퍼지 함의 연산자를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 연관 피드백을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 웹 페이지 사이에 퍼지 함의 연산자를 이용하여 질의와 확장된 질의의 포함관계가 반영된 스니핏을 추출함으로써 사용자의 의도를 스니핏에 더 잘 반영할 수 있다. 실험결과에서 제안방법이 다른 방법보다 스니핏 추출에 더 좋은 성능을 보인다.

웹페이지에서의 상품 데이터 추출을 위한 동적, 정적 크롤링 비교 및 활용 (Comparison and Application of Dynamic and Static Crawling for Extracting Product Data from Web Pages)

  • 김상혁;김정훈;이승대
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1277-1284
    • /
    • 2023
  • 본 논문에서는 소비자들이 편의점에서 진행 중인 행사상품에 대해 접근하기 쉬운 웹페이지를 제작하였다. 제작하는 과정에서 행사상품의 데이터를 추출하는 두 가지 크롤링 방식인 정적 크롤링과 동적 크롤링을 비교 및 활용하였다. 정적 크롤링은 홈페이지에서 정적인 데이터를 수집하는 추출 방식이고 동적 크롤링은 웹 페이지에서 동적으로 생성되는 페이지의 데이터를 수집하는 추출하는 방식이다. 두 크롤링에 대한 비교를 통해 행사상품 데이터를 추출하는 데에 있어 어떤 크롤링 방식이 더 효과적인 방식인지에 대해 연구하였다. 그 중 효과적인 정적 크롤링을 이용해 웹 페이지를 제작하였으며, 소비자들이 더 손쉽게 확인할 수 있도록 1+1, 2+1 상품들을 카테고리화 하였고 검색기능을 넣어 웹페이지를 제작하였다.

Research on the Design of a Deep Learning-Based Automatic Web Page Generation System

  • Jung-Hwan Kim;Young-beom Ko;Jihoon Choi;Hanjin Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.21-30
    • /
    • 2024
  • 본 연구는 폭증하는 디지털 비즈니스의 수요 증가를 감당하기 위하여 AI를 활용한 새로운 제작 방법을 모색하는데 목적이 있다. 이에 딥러닝과 빅데이터를 기반으로 실제 웹페이지 생성 가능 시스템을 구축하고자 하였다. 첫째, 이커머스 웹사이트 기능을 바탕으로 분류체계를 수립하였다. 둘째, 웹페이지 구성요소의 유형을 체계적으로 분류하였다. 셋째, 딥러닝이 적용가능한 웹페이지 자동생성시스템 전체를 설계하였다. 실제 데이터를 학습하여 구현된 딥러닝 모델이 기존 웹사이트를 분석하고 자동생성되도록 재설계 함으로써, 산업에서 바로 사용가능한 방안을 제안했다. 나아가 체계가 부족했던 웹사이트 레이아웃 및 특징에 대한 분류체계를 수립했다는 측면에서 의의가 있다. 이는 향후 생성형 AI 기반의 웹사이트 연구 및 산업 분야에 크게 기여할 수 있을 것이다.

웹문서 재배치 에이전트 시스템 (A Web Page Reordering Agent System)

  • 조영임;강상길;김영국
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.91-94
    • /
    • 2007
  • 구글이나 야후와 같은 정보검색엔진은 사용자에게 편리성을 제공하나 사용자로 하여금 만족감을 제공하지는 못하고 있다. 이것은 사용자에 대한 검색목표가 사용자 프로파일마다 서로 다르기 때문이다. 따라서 검색엔진으로 검색된 결과를 사용자 프로파일에 따라서 재배치하는 것은 매우 필요하다. 이 논문에서는 키워드기반 검색엔진으로 검색된 결과를 사용자 프로파일에 따라 웹문서를 재배치하는 알고리즘을 제안한다. 각 키워드에 대한 가중치는 사용자가 웹문서에 대해서 수행한 행동 즉, 다운로드, 클릭, 아무행동 안함에 따라 차등 적용하여 업데이트하여 웹문서를 리스트하여 사용자에게 제공한다.

  • PDF

인터넷 모바일 통합서비스 (Integrated Service of Internet and Mobile)

  • 박준상;최은녕;오용철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.265-267
    • /
    • 2002
  • 인터넷과 모바일 서비스는 요즘 들어 많이 사용되고 있는 서비스로써, 휴대폰을 이용한 모바일 서비스와 기존의 인터넷을 합쳐서 기존의 Web을 이용한 Internet 서비스 제공에서 벗이나 Web 뿐만 아니라 휴대폰, PDA, Phone(ARS) 등을 이용한 Multi Internet 서비스를 제공한다. 모바일과 인터넷에 제공할 정보를 하나의 데이터베이스에 통합하여 각각의 스크립 언어(Internet : ASP-Active Server Pages, Mobile : WML-Wireless Markup Language)를 이용하여 서비스를 제공하는 방식을 구현했다. 그래서 인터넷과 모바일 등 여러 가지 방법을 통해 필요한 정보를 검색 할 수 있게 됨으로서 사용자들은 자신이 원하는 방법을 이용하여 언제든지 장소에 구애받지 않고 원하는 자료를 검색할 수 있다.

  • PDF

사용자 행동 패턴과 웹 문서 구조 분석을 이용한 웹 폐이지 테스팅 방법 (A Method for Testing Web pages Using the Analysis of User Behavioral Pattern and Web Document Structures)

  • 유대승;심민석;엄정섭;이명재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.547-549
    • /
    • 2001
  • 웹 기반 시스템의 테스팅에 대한 정확성과 신뢰성을 향상시키는 것은 시스템의 질을 향상시킬 수 있고 시스템 개발 및 유지보수에 대한 비용을 현저히 줄일 수 있다. 본 논문에서는 웹 로그 분석을 통하여 테스팅 환경 설정에 필요한 정보와 사용자들에 대한 패턴 정보를 추출하였다. 그리고 웹 컨텐츠 분석을 통하여 링크 정보와 데이터베이스에 대한 접근 또는 사용자 입력을 요구하는 모듈에 대한 정보를 추출하였다. 추출한 정보를 이용하여 테스팅을 위한 시나리오 문서인 테스트 스크립트를 생성함으로써 실세계에 근접한 테스트 시뮬레이션을 구현하는 방법을 제시하였다.

  • PDF

웹 페이지에서 사용자 입력 값 변조 방지에 관한 연구 (A Study on Protecting for forgery modification of User-input on Webpage)

  • 유창훈;문종섭
    • 정보보호학회논문지
    • /
    • 제24권4호
    • /
    • pp.635-643
    • /
    • 2014
  • 인터넷을 통하여 제공되는 대부분의 웹 서비스들은 웹 브라우저를 통하여 사용자에게 제공된다. 웹 브라우저는 텍스트 형태의 웹 페이지를 서버로부터 수신하여 해석하고 사용자에게 보여준다. 웹 브라우저는 추가적으로 설치 할 수 있는 각종 기능들을 통하여 확장성을 제공한다. 하지만 추가로 설치 할 수 있는 기능들도 웹 페이지에 접근하여 내용을 위/변조 할 수 있다는 점에서 웹 브라우저를 통한 웹 서비스는 보안상 문제점을 내포할 수 있다. 웹 브라우저는 웹 페이지정보를 DOM구조의 형태로 메모리에 저장한다. 웹 페이지의 변조를 방지하기 위한 방법으로는 DOM구조의 특정 부분에 해쉬(hash)값을 적용하는 방법이 있다. 하지만 웹 페이지의 특성상 해쉬를 이용한 대응방안이 효과를 발휘할 수 없는 부분이 있다. 즉, 사용자가 직접 입력하는 부분은 정해진 입력 값이 아니기 때문에 미리 해쉬 값을 계산 해 놓을수도 없고 따라서 임의로 변조되는 것을 막을 수 없다. 본 논문에서는 웹페이지에 입력되는 사용자 입력 값의 위조나 변조를 방지 또는 탐지하는 방안을 제안한다. 제안 방법은 사용자가 키보드를 사용하여 입력하는 입력 값을 저장 해 놓았다가 웹 브라우저가 입력 값을 전송하는 순간 저장된 입력 값과 전송되는 값을 비교하여 변조 여부를 파악한다.

Propose a Static Web Standard Check Model

  • Hee-Yeon Won;Jae-Woong Kim;Young-Suk Chung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.83-89
    • /
    • 2024
  • 인터넷 익스플로러의 서비스 종료 이후 ActiveX의 사용이 종료됨에 따라 Non-ActiveX 정책이 확산되었다. Non-ActiveX 정책을 바탕으로 정해진 웹 페이지 표준 규약으로 HTML5가 채택되어 사용되고 있다. W3C(World Wide Web Consortium)에서 개발된 HTML5는 다양한 기능을 플러그인 없이 브라우저만으로 쉽게 사용할 수 있고, 기존 HTML에 비해 다양한 요소와 속성이 추가되었으며 API를 통해 더 나아진 웹 응용 환경을 제공하고 있다. 그러나 새로 추가된 기술들로부터 새로운 보안 취약점이 발견되었고, 이러한 취약점으로 인하여 공격 범위가 넓어졌다. HTML5가 적용된 웹 사이트에서 발생할 수 있는 보안 취약점을 찾기 위한 연구가 부족하다. 본 논문은 최근 5년 이내에 플러그인이 제거된 공공기관 웹 페이지를 대상으로 웹 페이지의 보안 취약점을 탐지하고 분석하여 웹 취약점을 가지는 태그 및 속성을 탐지하는 모델을 제안한다. 제안된 모델을 웹 페이지에 적용한다면 플러그인 제거 후에도 현재까지 웹 페이지의 웹 표준 준수 여부 및 취약점을 분석할 수 있어 신뢰성 있는 웹 서비스를 제공할 수 있다. 그리고 해킹 피해로 인한 금전적, 물리적 문제들을 예방하는 데 도움이 될 것으로 기대된다.

웹 상에서 객체지향 데이터 베이스와 통합 아키텍처 (An Architecture for Integrating OODBs with WWW)

  • Haeng-Kon Kim;Jeun-Geun Kang
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.247-258
    • /
    • 2001
  • 본 논문에서는 단일 웹 또는 웹 페이지간의 동적으로 커스터마이스가 가능한 시각정보를 어떻게 구성할 것인가에 대해 논하며 이 같은 동적 정보를 구성하기 위해 객체지향 데이터 베이스와 웹과의 통합 아키텍처를 제시한다. 웹 상에서 사용자 또는 시간에 따라 상이한 웹 뷰를 가진다. 본 논문에서는 다양한 구조적 변수와 구현 쟁점에 대해 논한다. 제시한 아키텍처는 소프트웨어 개발 환경과 IO-웹 시스템 등의 다양한 응용 영역에 매우 높은 융통성을 제공한다.

  • PDF

Creating Method for Multi-Size Web View Based on Query Restructuring Rules

  • Shin, Sang-Gyu;Kim, Tai-Suk
    • 한국멀티미디어학회논문지
    • /
    • 제11권12호
    • /
    • pp.1758-1764
    • /
    • 2008
  • In this paper, we propose query restructure method which realizes not only to present the result from database in Web page but also to adapt user's browsing environments. Recently, wireless PDA (Personal Digital Assistant) and portable phone and terminals equipped with Web browser become very popular. Various browsers would be required to create the HTML which adapt to the user's browsing environment. We propose an adaptive data presentation system which is an extension of SQL which creates HTML pages dynamically adapting to the size of screen. In our proposed method, the three basic rules for the layout conversion are provided and applying these rules, an efficient layout conversion technique optimized to user environment is proposed. Moreover, we propose a standard for converting layouts and a layout optimization for adaptive conversion of layouts.

  • PDF