• 제목/요약/키워드: 웹 캐시

검색결과 103건 처리시간 0.023초

웹 이용 마이닝을 위한 데이터 전처리에서 사용자 구분에 관한 연구 (A Study of User Identification in Data Preprocessing for Web Usage Mining)

  • 최영환;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.118-120
    • /
    • 2001
  • 웹 이용 마이닝은 거대만 웹 데이터 저장소의 로그들을 이용하여 웹 사용자의 사용 패턴을 분석하는 데이터 마이닝 기술이다. 마이닝 기술을 적용하기 위해서는 전처리 과정 중의 사용자와 세션을 정확하게 구분해야 하는데, 표준 웹 로그 형식의 웹 로그만으로는 사용자를 완전히 구분할 수 없다. 따라서 정확한 결과를 얻기 위해 사용자와 세션을 구분할 수 있는 모듈을 웹 서버에서 제공하거나, 각각의 페이지에 적당한 실행 필드를 삽입해야 한다. 사용자와 세션을 구분하는 데는 캐시 문제, 방화벽 문제. IP(ISP)문제, 프라이버시 문제, 쿠키 문제 등 많은 문제들이 있지만, 이 문제를 해결하기 위한 명확한 방법은 아직 없다. 이 논문은 참조 로그와 에이전트 로그, 그리고 액세스 로그 등 서버측 클릭스트림 데이터만을 이용하여 사용자와 세션을 구분하는 방법을 제안한다.

  • PDF

웹 캐싱 지역 프로토콜에서 요청에 대한 효과적인 라우팅 (Efficient Request Routing in Web Caching Neighborhood Protocol)

  • 이용찬;김성천
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.721-723
    • /
    • 2001
  • 월드 와이드 웹(WWW)서비스는 상당한 지연이 발생할 것이라고 예상하는 수준까지 성장해 왔다. 이런 이유로 웹 지연시간을 줄이기 위한 기술들이 중요하게 되었다. 프록시 서버 캐시는 느린 응답시간과 네트워크 정체와 같은 문제들을 해결하기 위해서 제안되었는데 이런 프록시 서버들을 계층적으로 구성하는 방법에 대한 많은 연구가 있었다. 하지만 이런 일반적인 웹캐싱 계층 기법들은 프록시 서버들간의 통신 경로에 있어서 유연성을 제공하지 못하는 정적 구조의 기법이다. 이런 정적인 기법에서의 단점을 해결하기 위해서 캐싱 지역 프로토콜(Caching Neighborhood Protocol)이 제안되었고 이 CNP는 요청들을 협력적으로 처리하는 일련의 프록시 서버의 집합이 매 단일 요청에 대해서 바뀔 수 있고 이에 따라서 요청 처리 경로가 다양해 질 수 있기 때문에 정적 구조 기법과는 반대인 동적 구조 기법이다. 하지만 이러한 동적 웹 캐싱 계층 구조인 CNP에서는 각 웹서버를 대표하는 캐싱 대리인(Caching Representatives)에 대한 웹문서의 링크참조정보와 부하정보를 고려하지 않았기 때문에 사용자에게 빠른 응답시간을 제공하지 못하는 단점이 있다. 본 논문에서는 최근에 제안되었던 프록시 서버들을 동적 웹캐싱 계층으로 구성한 CNP와 새로 추가된 C-Rep의 상태정보를 이용해서 새로운 요청 라우팅 기법을 제안하였다. 제안한 기법은 이런 C-Rep의 상태정보를 이용하여 응답시간의 향상과 C-Rep의 부하를 분산시킬 수 있었다.

  • PDF

모바일 웹 서비스의 응답시간을 향상시키기 위한 선 서비스 후 변환 방법 (The Pre-Service and Post-Transcoding Method for Enhancing the Response Time of Mobile Web Service)

  • 강의선;박대혁;임영환
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.783-790
    • /
    • 2007
  • 모바일 단말기에 무선 웹 서비스를 제공하는 과정에서 고려해야 할 사항은 이질적인 단말기의 하드웨어 환경이다. 이는 동일 모바일 웹 페이지라 할지라도 서비스되는 단말기의 종류 및 환경에 따라 동일 컨텐츠를 다르게 표현해야 하는 문제점을 갖는다. 즉 하나의 컨텐츠에 대해 여러 버전의 컨텐츠가 변환 및 생성되어야 하고 서버에 저장되어야 함을 내포한다. 따라서 서비스 측은 컨텐츠 변환에 따른 응답 시간 지연과 다중 버전의 컨텐츠를 저장하기 위한 서버의 용량을 고려해야 한다. 본 논문에서는 모바일 웹 컨텐츠를 서비스하는 과정에서 발생할 수 있는 응답시간을 분석하였고 이를 해결하기 위한 방법으로서 선 서비스 후 변환방법을 제안한다. 선 서비스 후 변환 방법(Pre-Service and Post Transcoding)은 모바일 단말기에 최적의 질적 서비스는 제공할 수 없더라고 응답시간을 줄이기 위하여 캐시 내에서 요청 단말기 상에 재생 가능한 컨텐츠를 우선적으로 서비스 한다. 그리고 추후 질적 서비스 및 좀 더 빠른 서비스를 제공하기 위하여 요청한 컨텐츠와 연관관계를 갖는 컨텐츠를 서비스 후 변환하는 방법이다. 본 논문은 실험을 통하여 제안한 각 방법들에 대한 성능을 비교 분석하여 그 결과를 기술하였다.

SWF 파일의 URL정보 분석도구 (A Study on analysis tools in the SWF file URL)

  • 장동환;송유진;이재용
    • 한국산업정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.105-111
    • /
    • 2010
  • SWF는 벡터 그래픽 전용파일 포맷 파일로 각종 웹사이트 광고, 위젯, 게임, 교육, 동영상 등 다양한 콘텐츠 제작에 활용되고 있다. 현재 포렌식 조사 시 대부분이 웹 브라우저의 사용자 캐시정보를 토대로 조사하는 비중이 크다. 하지만 개인정보유출의 문제로 인해 Web Browser 자체에서 사용흔적을 삭제하거나 사용자들이 복구되지 않은 방법으로 그 흔적을 지워 행위를 추정할 수 없는 경우가 발생하고 있다. SWF파일은 PC사용자가 브라우저를 통해 웹사이트 방문 시 웹 캐시와 함께 특정경로에 저장되어 PC상에 남게 된다. 이런 SWF파일 내 데이터 중 액션스크립트 상에서 웹서버와 통신할 수 있게 URL 정보를 포함하고 있으며 포렌식 조사 입장에서 웹 브라우저의 History 정보 이외에 중요한 조사정보로 활용할 수 있다. 허나 포렌식 도구에서 SWF파일 내 정보를 체계적으로 분류해주는 경우는 없다. SWF파일 내 URL 정보 분석 도구를 통해 확인할 수 없었던 사용자의 웹 행위 정보를 조사할 수 있으며 신뢰할 수 있는 증거를 수집할 수 있다.

기술연재 / CDN 요소기술

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 4호통권119호
    • /
    • pp.121-125
    • /
    • 2003
  • 지난 호에 글로벌 로드밸런싱에 대해 알아보았다. 글로벌 로드밸런싱의 기본 전제는 여러 네트워크에 분포돼 있는 서버의 콘텐츠가 모두 동일하게 돼 있다는 것이다. 이번 호에서는 서버의 콘텐츠 동기화에 대해서 알아보겠다. 네트워크에 분포돼 있는 서버의 종류로는 서비스 내용에 따라 캐시서버, 웹서버, 미디어서버 등이 있는데 여기서는 이 3가지 서버의 콘텐츠 동기화 방법에 대해 기술했다

  • PDF

투명 캐시에서의 사용자 인증 시스템 구현 (Implementation of Client Authentication System on Transparency Cache)

  • 김성락;구용완
    • 정보처리학회논문지C
    • /
    • 제9C권2호
    • /
    • pp.181-188
    • /
    • 2002
  • 최근의 프록시 서버에서 사용자 인증에 의한 접근제어를 위해서는 각 사용자 브라우저마다 프록시 서버 설정을 해주어야만 하는 불편함이 있다. 본 논문에서 구현한 투명캐시에서의 사용자 인증 기술은 간단히 캐시서버 상에 인증기능 옵션을 설정함으로써 모든 사용자에게는 투명하게 인터넷을 사용할 수 있도록 하였다. 또한 관리자 측면에서는 각 사용자의 트래픽을 감시하고 보안성을 한층 강화하는 효과를 보인다. 그리고 사용자의 인터넷 사용습관을 모니터링 할 수 있어 쇼핑몰과 같은 전자상거래 분야에서 사용자의 성향에 따른 인터넷 전자 고객관계관리(eCRM) 서비스에 활용할 수 있을 것으로 기대된다 단 기술은 별도로 보안장비의 추가설치 없이 보안이 필수적인 기업 부설 연구소, 전자상거래 웹사이트, 군부대의 인터넷 환경 등에서도 적용할 수 있는 기술이라 하겠다.

웹 프락시 서버의 디스크 I/O 성능 평가 (Performance Evaluation of Disk I/O for Web Proxy Servers)

  • 심종익
    • 정보처리학회논문지C
    • /
    • 제12C권4호
    • /
    • pp.603-608
    • /
    • 2005
  • 웹 프락시 서버에서 디스크 I/O는 병목현상을 일으키는 주요 요소이다. 오늘날 대부분의 웹 프락시 서버는 범용 파일 시스템에서 실행되도록 설계되어 있다. 그러나 범용 파일 시스템은 웹 캐시 워크로드에서 대부분 차지하는 작은 파일들을 효과적으로 처리하지 못하기 때문에 전체 웹 프락시 서버의 성능을 저하시키게 한다. 본 논문에서는 범용 파일 시스템을 사용하지 않는 원시(raw) 디스크 I/O 기법이 웹 프락시 서버의 디스크 I/O 오버헤드 개선에 얼마나 영향을 미치는지 그 성능 잠재력을 평가한다. 이를 위해 웹 프락시 서버를 위한 저장관리 시스템인 BSMS(Block-structured Storage Management System)를 설계하고 Squid 소스에 적용시켜 웹 프락시 서버를 구현하였다. 다양한 실험 평가를 통해 원시 디스크 I/O 기법이 웹 프락시 서버에서 디스크 I/O의 성능을 크게 개선시키는 좋은 방법임을 보였다.

로컬서버와 웹캐싱을 이용한 전자상거래 시스템의 지연속도 개선에 관한 연구 (A Study on Latency Time Improvement of Electronic Commerce System Using Local Server and Web Cashing)

  • 윤용기;고일석;임춘성
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.555-562
    • /
    • 2002
  • 전자상거래 사용자와 대용량 멀티미디어 데이터의 증가로 인한 전자상거래 시스템의 급격한 부하 증가와 네트워크 트래픽의 증가는 클라이언트의 요청에 대한 서비스의 지연을 가져와 고객에 대한 고객만족도 감소와 기업의 경쟁력을 떨어뜨리는 요인이 되고 있다. 따라서 전자상거래 시스템의 효율적인 관리와 응답속도를 고려한 연구가 필요하다. 본 연구에서는 전자상거래 시스템의 부하 분산을 위해 캐시 기능을 가진 로컬서버 기반의 계층적 구조의 전자상거래 시스템을 설계하고 로컬 웹서버를 위한 분할된 웹캐시 알고리즘을 제안하며 실험을 통해 성능을 분석하였다.

무선 인터넷 프록시 서버 클러스터 시스템에서 라운드 로빈을 이용한 해싱 기법 (A Hashing Scheme using Round Robin in a Wireless Internet Proxy Server Cluster System)

  • 곽후근;정규식
    • 정보처리학회논문지A
    • /
    • 제13A권7호
    • /
    • pp.615-622
    • /
    • 2006
  • 무선 인터넷 프록시 서버 클러스터 환경에서의 캐싱은 인터넷 트래픽, 웹 유저의 요청 및 응답 시간을 줄여주는 효과를 가진다. 이때, 캐시의 히트율(Hit ratio)을 증가시키는 한 가지 방법은 해쉬 함수를 이용하여 동일 요청 URL을 동일 캐시에 할당하는 방법이다. 해싱을 이용한 방법의 문제점은 해쉬의 특성으로 인해 클라이언트의 요청이 일부 캐시 서버로 집중되고 전체 시스템의 성능이 일부 캐시 서버에 종속된다는 점이다. 이에 본 논문에서는 해싱과 라운드 로빈 방식의 장점을 결합하여 클라이언트의 요청을 일부 캐시 서버가 아닌 전체 캐시 서버에 균일하게 분포시키는 개선된 부하 분산 방법을 제안한다. 기존 해싱 방법에서는 요청 URL에 대한 해쉬값이 계산되면 캐시 서버가 컴파일 시간에 정적으로 할당되는 반면, 제안된 방법에서는 라운드 로빈 방법을 사용하여 실행 시간에 동적으로 할당된다. 제안된 방법은 무선 인터넷 프록시 서버 클러스터 환경에서 구현되었고, 16대의 컴퓨터를 이용하여 실험을 수행하였다. 실험 결과는 기존 해싱 방법에 비해 클라이언트의 요청을 캐시 서버들 사이로 균일하게 분포시키고, 이에 따라 전체 무선 인터넷 프록시 서버의 성능이 52%에서 112%까지 향상됨을 확인하였다.

백쉬프팅 기법을 이용한 캐쉬 유지 규약의 분석 (Analysis of a Cache Management Protocol Using a Back-shifting Approach)

  • 조성호
    • 한국콘텐츠학회논문지
    • /
    • 제5권6호
    • /
    • pp.49-56
    • /
    • 2005
  • 클라이언트-서버 컴퓨팅에서 서버의 과부하를 줄이기 위하여 각 클라이언트는 재사용을 위하여 자신만의 캐시를 유지한다. 캐시 유지 규약을 위한 비관적 접근법은 모든 잠금을 획득하기 전까지 완료될 수 없기 때문에 필요 없는 기다림을 만든다. 또한, 낙관적 접근법은 필요 없는 철회를 일으킨다. 본 논문은 이와 같은 단점을 극복할 수 있는 낙관적인 규약을 제안한다 본 논문에서는 잘 알려진 규약들과 제안하는 기법과의 정량적 성능평가를 보여준다. 성능평가는 웹의 성능분포를 나타낼 수 있는 Zipf 작업부하에서 수행되었다. 본 성능평가를 통하여 제안하는 기법이 적은 오버헤드를 가지고 좋은 성능을 나타낸다는 것을 보인다.

  • PDF