• 제목/요약/키워드: 웹 페이지

검색결과 1,052건 처리시간 0.026초

인용분석을 이용한 인터넷 정보의 연구 (A Study of Internet using Citation Analysis)

  • 곽철완
    • 한국비블리아학회지
    • /
    • 제10권1호
    • /
    • pp.213-222
    • /
    • 1999
  • 본 연구는 특정 주제의 핵심 웹 정보원의 존재를 조사하고 그 정보원의 특징을 파악하는데 그 목적을 두었다. 웹 페이지들이 링크를 많이 한 웹 페이지는 그 분야에서 중요한 정보원으로 간주되므로. 인용분석법을 이용하여 ‘weather’분야의 링크빈도가 높은 웹 페이지를 파악하였다. 사용된 연구방법은 검색엔진을 이용하여, weather분야의 웹 페이지들을 조사한 후, 각 웹 페이지가 링크하고 있는 웹 페이지와 그 웹 페이지를 링크한 웹 페이지를 조사하였다. 7가지 웹 페이지들에 월등하게 많은 링크가 되어 있었는데. 각각 웹 페이지들의 관계성을 동시인용법을 통하여 분석한 결과. 크게 3가지 유형으로 구분되었다.

  • PDF

동적 웹 페이지 변조 점검 시스템 (Dynamic Web Page Defacement Validation System)

  • 김우년;김도환;주미리;박응기;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.475-477
    • /
    • 2004
  • 일반적으로 웹 페이지 변조 점검 시스템은 해시 코드를 이용한다. 해시 코드 방법은 웹 페이지의 민감한 변화를 즉시 찾아 낼 수 있는 장점이 있지만, 인터넷 포털이나 뉴스 사이트 등의 동적인 웹 페이지의 경우에 적용하기 어려운 단점이 있다. 본 논문에서는 인터넷 포털이나 뉴스 사이트 등과 같은 웹 페이지의 내용이 계속해서 변화하는 경우에도 적용할 수 있는 N-Gram 색인 기반의 웹 페이지 변조 점검 시스템인 웹 레이더 시스템을 제시한다. 웹 레이더 시스템은 정상적인 웹 페이지의 N-Gram 색인과 점검 시에 생성한 N-Gram 색인을 비교하여 두 인덱스의 동일 N-Gram의 발생 비율 차이를 합한 값을 N-Gram 색인 거리로 정의하고 이 값을 이용하여 웹 페이지 변조를 확인한다 본 논문에서 제시하는 웹 레이더 시스템은 구조화되지 않은 동적 웹 페이지의 변조를 원격에서 점검할 수 있다.

  • PDF

의미 구역에 기반한 관련 웹 페이지 요약 기법 (Summarizing relevant web pages based on semantic region)

  • 이시은;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.597-599
    • /
    • 2003
  • 웹 상의 정보는 여러 페이지들에 걸쳐 표현되고 있으나 대부분의 웹 브라우저는 웹 페이지 단위로 정보를 다루고 있기 때문에 사용자는 원하는 정보를 얻기 위해 여러 웹 페이지들을 방문해야 한다. 본 논문에서는 사용자의 요구에 부합되는 정보를 검색해 여러 페이지 상에 흩어져 있는 정보들에 대해 쉽게 이해할 수 있도록 컬렉션 페이지를 제공한다. 컬렉션 페이지는 검색된 웹 페이지들의 링크 관계를 제공하여 페이지들 사이에서의 정보의 구성을 알 수 있게 하고, 관련도 높은 페이지들의 주요 내용을 미리 가져와 보여 줌으로써 정보에 대한 접근성을 높인다. 이를 위해 페이지 안에서 시각적으로 구분되는 동일한 주제의 정보를 담은 블록을 의미 구역으로 정의하고 웹 페이지를 실제 정보의 단위인 의미 구역으로 나누었다. 또한 의미 구역단위의 검색으로 여러 주제의 정보를 담고 있는 웹 페이지에 대한 검색 결과의 정확성을 높인다.

  • PDF

음성인식용 웹페이지 변환을 위한 웹서비스 구현 (The Implementation of the Web Service for the Conversion of Speech-Recognition Web Page)

  • 오지영;김윤중
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1162-1169
    • /
    • 2004
  • 본 연구에서는 일반 웹페이지를 음성인식이 가능한 웹페이지로 전환하고, 이 페이지가 사용 될 수 있는 웹서비스를 구현하였다. 구현한 시스템은 웹서비스 소비자와 웹페이지를 변환하는 웹서비스 제공자, 음성인식 웹서비스 제공자로 구성되어 있다. 웹페이지 변환 웹서비스 제공자는 정규식을 이용하여 일반 웹페이지를 분석하고 음성인식용 웹페이지로 변환한다. 사용자의 음성을 분석하고 인식하는 음성인식기는 기존의 연구에서 구현된 음성인식 웹서비스 제공자를 이용하였다. 실험 결과, 웹페이지에서 태그를 분석하여 웹페이지를 변환하고 하이퍼링크를 추출하는 것을 확인할 수 있다.

  • PDF

음성 인식용 웹페이지를 위한 웹서비스 제공자의 구현 (Implementation of the Web Service Provider for the Speech Recognition Web Page)

  • 오지영;김윤중
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.257-260
    • /
    • 2003
  • 본 논문은 일반 웹페이지를 음성인식이 가능한 웹페이지로 전환하고, 이 페이지가 사용 될 수 있는 웹서비스를 구현하였다. 본 연구에서 구현한 시스템은 웹서비스 소비자와 웹서비스 제공자로 구성되어 있다. 웹서비스 소비자는 다음에 설명하는 두개의 웹서비스 제공자를 호출하는 기능과 재구성된 웹페이지외 xml 문서를 저장하는 기능, xml 문서로부터 사용자의 음성과 매핑되는 URL을 검색하는 기능을 포함하고 있다. 웹서비스 제공자는 웹페이지를 변환하는 웹서비스 제공자와 음성인식 웹서비스 제공자이다. 웹페이지 변환 웹서비스 제공자는 일반 웹페이지를 분석하여 필요한 태그를 변환하는 기능과 하이퍼링크 값인 URL을 추출하는 기능으로 구성되어 있다. 사용자의 음성을 분석하고 인식하는 음성인식기는 기존의 연구에서 구현된 음성인식 웹서비스 제공자를 이용하였다.

  • PDF

메타 태그를 이용한 자동 웹페이지 분류 시스템 (An Automatic Web Page Classification System Using Meta-Tag)

  • 김상일;김화성
    • 한국통신학회논문지
    • /
    • 제38B권4호
    • /
    • pp.291-297
    • /
    • 2013
  • 최근 월드 와이드 웹(World Wide Web)의 사용이 폭발적으로 증가함에 따라 다양한 정보를 포함하고 있는 웹 페이지들의 양도 엄청나게 증가 하였다. 따라서 웹상에 존재 하고 있는 웹페이지들에 대한 접근을 용이하게 하고, 그룹화를 통한 검색을 가능하게 하기 위해 웹 페이지 분류의 필요성이 대두 되고 있다. 웹 페이지 분류는 기존의 웹 상에 산재 되어 있는 웹페이지들을 비슷한 문서 유형 또는 같은 키워드를 사용하는 문서들의 묶음으로 구분하는 작업을 의미하며, 웹 페이지 분류 기술은 웹페이지 검색, 그룹 검색, 메일 필터링 등의 분야에 응용될 수 있는 기술이다. 하지만 웹상에 존재하는 웹페이지들을 사람이 수동적으로 분류하는 방법으로는 현재 월드 와이드 웹에 존재하는 엄청난 양의 웹페이지들을 처리할 수 없으며, 자동적인 분류 방법 역시 서로 다른 형태로 작성된 웹페이지들을 정확하게 분류할 수 없다는 문제로 인해 한계를 보이고 있다. 본 논문에서는 서로 다른 형태로 작성된 웹 문서들에 대한 부정확한 분류 문제를 해결하기위해 웹페이지에 존재하는 메타 정보를 획득하여 자동적으로 분류하는 메타 태그기반의 자동화된 웹페이지 분류 시스템을 제안하였다.

SVM을 활용한 악성 웹 페이지 분류 (Classification of Malicious Web Pages by Using SVM)

  • 황영섭;문재찬;조성제
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.77-83
    • /
    • 2012
  • 웹 페이지에서 다양한 서비스를 제공하면서 악성코드가 웹 페이지를 통해 배포되는 것도 늘어났다. 악성코드는 개인정보 유출, 시스템의 성능저하, 시스템의 좀비 피씨화 등의 피해를 입힌다. 이런 피해를 막으려면 악성코드가 있는 웹 페이지의 접근을 막아야 한다. 그런데 웹 페이지에 있는 악성코드는 난독화나 변형기법으로 위장하고 있어 기존 안티바이러스 소프트웨어가 사용하는 시그니처 방식의 접근법으로 찾아내기 어렵다. 이를 해결하기 위하여, 웹 페이지를 분석하여 악성 웹 페이지와 양성 웹 페이지를 구별하기 위한 특징을 추출하고, 기계 학습법으로 널리 사용되는 SVM을 통하여 악성 웹 페이지를 분류하는 방법을 제안한다. 제안하는 방법이 우수함을 실험을 통하여 보인다. 제안한 방법으로 악성 웹 페이지를 정확히 분류하면 웹 페이지를 통한악성코드의 배포를 막는데 이바지할 것이다.

Framework for Efficient Web Page Prediction using Deep Learning

  • Kim, Kyung-Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.165-172
    • /
    • 2020
  • 웹에서 접근하는 정보의 폭발적인 증가에 따라 사용자의 다음 웹 페이지 사용을 예측하는 문제의 중요성이 증가되었다. 사용자의 다음 웹 페이지 접근을 예측하는 방법 중 하나가 딥 러닝 기법이다. 웹 페이지 예측 절차는 데이터 전처리 과정을 통해 웹 로그 정보들을 분석하고 딥 러닝 기법을 이용하여 분석된 웹 로그 결과를 가지고 사용자가 접근할 다음 웹 페이지를 예측한다. 본 논문에서는 웹 페이지 예측을 위한 효율적인 웹 로그 전처리 작업과 분석을 위해 딥 러닝 기법을 사용하는 웹 페이지 예측 프레임워크를 제안한다. 대용량 웹 로그 정보의 전처리 작업 속도를 높이기 위하여 Hadoop 기반 맵/리듀스(MapReduce) 프로그래밍 모델을 사용한다. 또한 웹 로그 정보의 전처리 결과를 이용한 학습과 예측을 위한 딥 러닝 기반 웹 예측 시스템을 제안한다. 실험을 통해 논문에서 제안한 방법이 기존의 방법과 비교하여 성능 개선이 있다는 사실을 보였고 아울러 다음 페이지 예측의 정확성을 보였다.

포린 페이지 시스템: 웹 컨텐츠 추출 및 통합을 통한 메타 브라우징 서비스의 설계 및 구현 (Foreign Page System: Design and Implementation of Meta-Browsing Service by Web-Contents Extraction and Composing)

  • 박남훈;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1159-1162
    • /
    • 2001
  • 본 연구는 웹 컨텐츠 통합 서비스에 관한 것으로 메타 브라우저, 중계 웹 서버, 포린 페이지 저작기, 포린 페이지 저장기로 구성한다. 메타 브라우저를 통해 사용자가 웹 사이트를 탐색하면서 웹 컨텐츠를 선택하며, 포린 페이지 저작기를 통해 각 사이트의 컨텐츠들로 포린페이지를 저작한다. 중계 웹 서버에서는 포린 페이지에 사용된 컨텐츠를 주기적으로 모니터링하여 컨텐츠 변화 감지시에 해당 컨텐츠로 구성된 포린페이지도 자동으로 갱신한다. 컨텐츠 추출을 위해 뭔 문서로 태그 트리를 구성하고, 그룹 시간 관계를 정의하여 포린 페이지 재생 모델을 제시했으며, 동기화를 위해 종료 제한 시간을 예측한다. 컨텐츠 변화 탐지 및 자동 갱신을 위해 컨텐츠 태그 트리와 웹 문서의 테그 트리간 차이값을 구하여 컨텐츠 변화 감지 방법을 제시한다.

  • PDF

태그를 이용한 웹 페이지간의 유사도 측정 방법 (Measuring Web Page Similarity using Tags)

  • 강상욱;이기용;김현규;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.104-112
    • /
    • 2010
  • 소셜 북마킹(social bookmarking)은 현재 웹에서 가장 활발한 트렌드 중의 하나이다. 소셜 북마크 시스템을 통해 사용자들은 원하는 웹 페이지에 그의 주제 또는 내용을 나타내는 태그(tag)들을 부착할 수 있다. 지금까지의 연구들은 주로 이러한 정보를 웹 검색을 향상시키는 데 사용해왔다. 본 논문에서는 웹 페이지에 부착된 태그들을 사용하여 두 웹 페이지 간의 의미적 유사도를 측정하는 방법을 제안한다.웹 페이지는 다양한 종류의 멀티미디어 데이터로 구성되어 있기 때문에, 웹 페이지 내부에 포함된 데이터를 사용하여 웹 페이지 간의 유사도를 측정하는 것은 매우 어려운 일이다. 하지만 사용자들에 의해 웹 페이지에 부착된 태그들을 사용하면 웹 페이지 간의 유사도는 매우 효과적으로 측정될 수 있다. 본 논문에서는 WSET (Web Page Similarity Based on Entire Tags)라 하는, 태그에 기반하여 웹 페이지 간의 유사도를 측정하는 새로운 방법을 제안한다. 실험 결과는 제안하는 방법이 기존 방법에 비해 더 좋은 결과를 나타냄을 보였다.