• 제목/요약/키워드: Web page

검색결과 675건 처리시간 0.034초

토큰 크기 및 출현 빈도에 기반한 웹 페이지 유사도 (Web Page Similarity based on Size and Frequency of Tokens)

  • 이은주;정우성
    • 한국IT서비스학회지
    • /
    • 제11권4호
    • /
    • pp.263-275
    • /
    • 2012
  • It is becoming hard to maintain web applications because of high complexity and duplication of web pages. However, most of research about code clone is focusing on code hunks, and their target is limited to a specific language. Thus, we propose GSIM, a language-independent statistical approach to detect similar pages based on scarcity and frequency of customized tokens. The tokens, which can be obtained from pages splitted by a set of given separators, are defined as atomic elements for calculating similarity between two pages. In this paper, the domain definition for web applications and algorithms for collecting tokens, making matrics, calculating similarity are given. We also conducted experiments on open source codes for evaluation, with our GSIM tool. The results show the applicability of the proposed method and the effects of parameters such as threshold, toughness, length of tokens, on their quality and performance.

웹 문서 변경 예측 (Estimation of Web Page Change Behavior)

  • 김성진
    • 인터넷정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.149-158
    • /
    • 2007
  • 본 논문은 웹 문서의 다운로드 가능 여부와 내용 변경 여부를 예측하는 도구를 기술한다. 웹 데이터베이스 관리자는 자신이 관리하는 웹 문서 집합을 최신 상태로 유지하려고 할 때, 예측 도구를 통하여 다운로드되지 않거나 변경되지 않았을 웹 문서에 대한 불필요한 요청을 감소시킬 수 있다. 본 논문에서는 웹 문서들의 과거 변경이 미래 변경과 매우 밀접한 관련이 있음을 가정한다. 본 논문에서는 약 300만개의 웹 문서들을 2일 주기로 100일 동안 관찰하여 변경 경향을 분석하고, 관찰된 문서들의 다운로드 가능 여부와 내용 변경 여부를 예측한다. 예측 결과는 실제의 변경 사실과 비교 평가되었다.

  • PDF

링크 분석을 통한 비동기 웹 페이지 크롤링 알고리즘 (Asynchronous Web Crawling Algorithm)

  • 원동현;박혁규;강윤정;이민혜
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.364-366
    • /
    • 2022
  • 웹은 처리 속도가 다른 다양한 정보들을 함께 제공하기 위해 비동기식 웹 기술을 이용한다. 비동기 방식에서는 작업 완료 전에도 다른 이벤트에 응답할 수 있다는 장점이 있으나 일반적인 크롤러는 웹페이지의 방문 시점 정보를 수집함으로 비동기 방식으로 제공되는 정보를 수집하는 데 어려움이 있다. 또한 비동기식 웹 페이지는 페이지 내용이 변경되어도 웹 주소가 변하지 않는 경우도 많아 크롤링하는 데 어려움이 있다. 본 논문에서는 웹의 링크를 분석하여 비동기 방식 페이지 이동을 고려한 웹 크롤링 알고리즘을 제안한다. 제안한 알고리즘으로 비동기 방식으로 정보를 제공하는 TTA의 정보통신용어사전 정보를 수집할 수 있었다.

  • PDF

패션전자상거래 치수정보모델 개발 및 웹페이지 구현 (Implementation of Web-page & Development of Size Informational Model on Fashion Electronic Commerce)

  • 강명희;남윤자;최영림
    • 한국의류산업학회지
    • /
    • 제13권2호
    • /
    • pp.205-214
    • /
    • 2011
  • The purpose of this study is to develop a size information providing model which is easy recognition and utilization for customer. This study also implemented web page to apply the size-informational model. Web page implemented using Apache Web Server and JAVA client-side scripting. Research result on the actual condition of fashion electronic commerce, most of the firms are used the old named same with period of 1980. On the same named-code, they are used different sizing systems by firms or items. Size interval is used 2~5 cm, different by firms. In the size information, is provided only named-code(55, 66 etc.) or garment size, and is confusing whether the marked is body size or garment size. Many of the marked size information were wrong. The sizing system of KS K5001(2009) is not used well. These problems are increased a lose customer and firm by return, exchange, mending-cost, stock, etc. Therefore, the problems should be improved by providing correct and detailed information of size and garment, as well as standardization of sizing systems based on KS K5001.

NFC태그에 저장 가능한 마이크로 웹페이지 (A Micro-Webpage Stored in NFC Tag)

  • 최복동;은성배
    • 대한임베디드공학회논문지
    • /
    • 제7권1호
    • /
    • pp.1-7
    • /
    • 2012
  • A Smartphone has an ability accessing Internet by URL stored in NFC(Near Field Communication) Tag for storing the information of items, blogs and web pages. Because the system works through the Internet with URL, however, it needs to pay some costs like communication fee and time. If we can store the web page on the tags, we can save the communication overhead. But they have too small memory to store it. In this paper, we introduce the Micro-Webpage technology which can be stored in NFC tag or QR(Quick Response) code. To make a Micro-Webpage, we remove control tags from the web page to leave a user original content. The removed control tags are stored in our smartphone application as a template. The user content is also compressed to a smaller one by an lossless compression algorithm. When a tag is read, the stored content is decompressed and, it is combined with the template to make the original web page. We have implemented a prototype of Micro-Webpage system on Android platform and confirmed that the prototype has reasonable performance improvements in saving memory and loading web page time.

웹 2.0 전망 및 서비스 동향에 관한 연구 (A Study of Web 2.0 Trend & Service View)

  • 김성호;김흥도
    • 디지털융복합연구
    • /
    • 제5권2호
    • /
    • pp.135-154
    • /
    • 2007
  • Web 2.0 is a platform which produce various service offered data from many people and it is activity open space depend on user focused community in diversity web environment. Web 2.0 is simple link structure with web site connectivity in informations such as page to page in other words, it is meaning of developing of semantical and circumstantial connection. The core of web 2.0 is user participation. RSS, Mash-up, UCC are main service of web 2.0 which make user directly participate from center of service offer to center of user manufactured an informations and then they offer re-information to other areas, also user freely express what they want through UCC and blogger. However, recently it comes the argument of skeptic of web 2.0 problem. Thus, In this research I will try to give an right comprehension and will try to have more accurate prediction of web 2.0 with the study of open service of web which is the key of web 2.0 success in a future.

  • PDF

Web Page Fingerprinting을 위한 Web Server 구현 (Web Server Design For Web Page Fingerprinting)

  • 박수빈;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.375-379
    • /
    • 2008
  • 디지털 핑거프린팅(Digital Fingerprinting) 기술은 구매자의 정보를 인지할 수 없는 방법으로 삽입하는 방법이다. 본 논문에서는 핑거프린팅 기법을 사용하여 웹 서버에 요청이 들어온 모든 웹 페이지에 핑거프린팅 기술의 조건을 충족시키는 방법으로, 정보를 삽입하여 보여 지는 웹 페이지의 변화 없이 사용자의 IP정보를 웹 페이지에 포함시켜 전송할 수 있는 알고리즘을 제시하고 웹페이지 핑거프린팅을 해주는 서버이용의 장점을 알아보도록 한다.

  • PDF

콘텐츠 적응화 시스템에 SOP(Shared Object Page)를 도입한 개선된 캐싱 기법 (An Enhancing Caching Technique by the SOP(Shared Object Page) for Content Adaptation Systems)

  • 장서영;정호영;강수용;차재혁
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권1호
    • /
    • pp.41-50
    • /
    • 2007
  • 오늘날 우리는 인터넷에 연결된 PC뿐만 아니라, 이동형 기기인 휴대전화, 무선 인터넷을 이용하는 PDA, 노트북, 그리고 D-TV 등을 통해서도 웹서버에 접근하여 콘텐츠 형태의 정보를 얻고 있다. 본 연구에서는 이러한 환경을 지원하기 위하여 각각의 적응화된 컨텐츠를 저장하는 것을 기반으로 하며, 이를 다양한 기기를 지닌 사용자에게 활용하기 위해 페이지 정보를 지니는 메타 데이터를 적용하는 웹 캐싱 기법(SOP)를 제안한다.

  • PDF

웹 페이지에서 참조무결성 제약조건에 관한 연구 (A Study on Referential Integrity Constraint on Web Page)

  • 유남현;손철수;김원중
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.569-572
    • /
    • 2004
  • 다수의 사람들이 관리ㆍ운영하는 많은 분량의 HTML 문서들로 이루어진 웹사이트들의 경우에는 현수참조(Dangling Reference)와 오문참조(Inaccurate Contents Reference)와 같은 깨진 링크(Broken Link)를 관리하는데 많은 어려움이 따른다. 즉, HTML 페이지의 내용 중 연결구조에 관련된 부분을 변경하거나 삭제하는 경우 문서들간의 연결구조에 대한 무결성(Integrity)을 보장하기가 어렵다. 본 논문에서는 Parent 페이지와 Child 페이지에서의 무결성 제약조건(Integrity Constraint Condition)들을 조사하여 정의하고, 확장 UML로 표현하는 방법에 대해 연구하였다.

  • PDF

이동 단말을 위한 웹 기반 텍스트 요약 시스템의 설계 및 구현 (Design and Implementation of Web-based Text Summarization System for Mobile Device)

  • 차지은;천승만;박종태
    • 정보처리학회논문지C
    • /
    • 제16C권6호
    • /
    • pp.725-730
    • /
    • 2009
  • 최근에 스마트폰과 같은 소형 이동 단말기의 보급이 확산됨에 따라 이동 단말을 통한 인터넷 웹 접속이 크게 증가하고 있다. 하지만 이동 단말의 작은 화면은 한 번에 웹페이지의 전체 내용을 브라우징 하기에는 어려움이 있다. 본 논문에서 이러한 이동단말의 문제점을 해결하기 위한 웹 기반 텍스트 요약 시스템을 설계 및 구현하였다. 제안된 텍스트 요약 시스템의 특징은 문서의 구문적 특징을 크게 변화시키지 않고 다량의 텍스트가 단락 안에 존재하는 경우에 문서를 요약하여 텍스트 용량을 줄임으로써 웹 브라우징에 있어 데이터 전송량을 줄이고 빠른 접근과 불필요한 데이터의 출력을 최소화할 수 있다. 제안된 시스템의 특징을 구현을 통하여 확인하였다.