• 제목/요약/키워드: 웹 서버 클러스터

검색결과 107건 처리시간 0.023초

링크 분석에 기반한 웹 문서 중요도 평가 알고리즘의 구현 (An Implementation of the Ranking Algorithm for Web Documents based on Link Analysis)

  • 임성채
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.75-78
    • /
    • 2010
  • 웹 검색에는 기존의 정보검색(Information Retrieval) 시스템에서와 다르게 문서 간 하이퍼링크 정보를 바탕으로 각 웹 문서의 고유 중요도를 추정하는 방식이 자주 이용된다. 링크 분석에 기반한 알고리즘 중 PageRank 알고리즘은 구글의 웹 검색 서비스에 적용된 것으로 알려져 있다. 이런 PageRank 알고리즘에 따라 중요도를 계산하는 경우 색인된 웹 문서수가 증가함에 따라 계산에 필요한 CPU 자원의 사용도 함께 증가하며, 문서 수가 수 억 페이지에 달하면 하나의 서버에서는 계산을 수행할 수 없다는 문제가 있다. 본 논문에서는 이런 문제점을 해소하기 위해 여러 대의 서버를 PageRank 계산 용 클러스터로 사용할 수 있는 방법을 제시한다. 제시된 방법은 고속의 LAN을 이용하여 여러 대의 서버를 연결하고 반복적인 행렬 계산을 병렬로 수행할 수 있어 계산 시간을 단축시킬 수 있다. 이런 서버 클러스터 구현을 위해 멀티 쓰레딩 프로그램이 작성되었으며, PageRank 계산에 사용되는 행렬 데이터를 적은 양의 메모리만으로 표현 가능하도록 하였다.

  • PDF

클러스터 웹 서버 상에서 히스토그램 변환을 이용한 내용 기반 부하 분산 기법 (A Content-Aware toad Balancing Technique Based on Histogram Transformation in a Cluster Web Server)

  • 홍기호;권춘자;최황규
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.69-84
    • /
    • 2005
  • 최근 인터넷 사용자의 기하급수적 증가에 따라 저렴한 가격의 고성능 대용량 클러스터 웹 서버 시스템에 관심이 증대되고 있다. 클러스터 웹 서버 시스템은 저렴한 비용. 높은 확장성과 가용성 등의 장점과 더불어 대규모 사용자에 대한 성능의 극대화를 목적으로 연구 개발되고 있으며, 최근에는 성능 향상을 위한 내용 기반의 부하 분산 기법에 관심이 모아지고 있다. 본 논문에서는 이러한 클러스터 웹 서버 상에서 사용자의 접근 빈도와 파일의 크기를 고려하여 각 서버 노드에 부하를 균등하게 할당하는 새로운 내용 기반의 부하 분산 기법을 제안한다. 제안된 기법은 웹 서버 로그의 각 URL 항목에 해시 함수를 적용하여 얻어지는 해시 값에 그 빈도와 전송된 파일의 크기를 고려한 누적 히스토그램을 생성한다. 사용자 요청은 (해시 값-서버 노드) 매핑에 의한 히스토그램 변환 과정을 통하여 각 서버 노드에 균등하게 할당된다. 제안된 기법은 누적 히스토그램을 주기적으로 갱신함으로써 동적으로 클러스터 웹 서버 시스템의 부하를 고르게 분산시킬 수 있으며, 또한 서버 노드의 캐시를 활용함으로써 전체 클러스터 시스템의 성능을 향상시킬 수 있다. 시뮬레이션을 통한 성능 분석에서 제안된 기법은 전통적인 라운드 로빈 방법보다는 월등히 우수함을 보이고, 기존의 내용 기반 WARD 방법보다는 약 $10\%$ 정도의 우수한 성능을 나타낸다.

  • PDF

클러스터드 EJB서버환경에서의 어플리케이션 배포 방법 (The Application Deployment for Clustered E5O4 EJB Container System)

  • 노명찬;정승욱;서범수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.394-396
    • /
    • 2002
  • 본 논문에서는 고 가용성 및 신뢰성을 보장하는 클러스터드 EJB서버를 개발함에 있어 클러스터드 EJB서버환경에서 클러스터를 구성하는 각 노드에 어플리케이션(웹 컴포넌트와 EJB 컴포넌트)을 배포하는 기능, 각 노드에 배포된 어플리케이션들에 대한 동기화를 지원하는 기능 및 클러스터드 환경에서의 어플리케이션을 즉시 자동 배포하는 기능에 대해 논의한다.

  • PDF

중소형 사이트를 위한 고가용성 웹 서버 클러스터 (High Availability Web Server Cluster for Middle Web Sites)

  • 문종배;김명호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.634-636
    • /
    • 2002
  • 최근에 리눅스 가상 서버 프로젝트를 이용한 클러스터를 많이 구축하고 있다. 리눅스 가상 서버는 확장성이 뛰어날 뿐만 아니라 성능도 뛰어나다. 그러나 하나의 전면 서버가 사용자 요청을 받아서 후면 서버가 처리를 하여 사용자에게 응답을 보내는 구조이므로 하나의 전면 서버는 사용자 요청의 급격한 증가로 병목현상을 일으킬 수 있고, 이 때문에 다수의 후면 서버가 있음에도 불구하고 서비스를 할수 없는 상황이 발생하게 된다. 따라서 본 논문에서는 다수의 전면 서버를 두어 병목현상을 근본적으로 없애는 방법을 제안하였다. 모든 클러스터 노드들은 전면 서버와 후면 서버의 역할을 모두 할 수 있도록 하였고 부하량이 많지 않으면 자기 노드에서 직접 처리를 하여 사용자에게 웅답할 수 있도록 하고, 부하량이 많을 때에만 클러스터의 다른 노드들 중 부하가 가장 작은 노드를 선택하여 사용자 요청을 처리할 수 있도록 하였다. 그리고 클러스터 노드들의 부하량을 고려한 스케줄링 알고리즘을 개발하여 좀 더 효율적인 부하 분배방식을 제안하였다.

  • PDF

웹 서비스 품질 보증을 위해 CBQ 모델을 사용한 클러스터 기반 웹 서버 (Cluster-Based Web Server using CBQ Model to Guarantee Quality of Web Service)

  • 김신형;윤완오;정진하;최상방
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.172-174
    • /
    • 2002
  • 인터넷의 급속한 성장과 함께 웹을 기반으로 하는 서비스들이 더욱 확산되며 중요해지고 있다. 하지만 제한된 네트웍 환경에서 웹 트래픽의 지수적인 증가로 인해 웹 서비스의 품질 보장 문제가 대두되고 있지만 현재의 인터넷은 최선의 서비스(Best-effort service)만을 제공하며, 품질 보장형의 서비스(QoS)는 제공하지 못하고 있는 것이 현실이다. 본 논문에서는 기존에 구축되어진 웹 클러스터 모델 중에서 서버의 부하 분산을 담당하고 있는 디스패처(Dispatcher)에 대기 정렬 큐잉(Class Based Queuing)의 패킷 전송 모델을 적용하고자 한다. 제안된 모델을 통하여 클러스터 기반 웹 서비스에서 원하는 클래스의 서비스 품질을 보장할 수 있다.

  • PDF

무선 인터넷을 위한 캐시 서버 클러스터 환경에서 캐시 이용률 기반의 스케줄링 (Scheduling based on Cache Utilization in a Cache Server Cluster for Wireless Internet)

  • 곽후근;정규식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권9호
    • /
    • pp.435-444
    • /
    • 2007
  • 웹 페이지를 캐싱하는 것은 웹 하부 구조 상에서 중요한 역할을 한다. 캐싱 서비스의 효과는 제안된 대역폭을 가지는 무선 하부 구조 상에서 더욱 중요하게 여겨진다. 큰 규모의 하부 구조에서는 캐싱에서 발생할 수 있는 확장성과 요청 집중 현상(Hot-Spot) 문제를 해결하기 위해 서버들을 클러스터로 구성한다. 이에 본 논문에서는 무선 인터넷 프록시 서버 클러스터 환경에서 캐시 이용률 기반의 스케줄링 기법을 제안한다. 제안된 방법은 클라이언트의 요청을 캐시 서버 클러스터로 균일하게 분포시키고 요청 몰림 현상을 해결하기 위해 캐시 이용률을 이용하였다. 제안된 방법은 리눅스 클러스터 상에서 구현하였고, 실제로 사용되는 다양한 웹 traces들을 이용하여 실험을 수행하였다. 16대의 캐시 서버에서 수행된 실험결과는 제안된 해싱 기법이 요청 집중 현상을 해결하면서, 기존에 많이 사용되는 방법들에 비해 45%에서 114%까지 성능이 향상됨을 확인하였다.

리눅스 클러스터 웹 서버의 요청 스케줄링 기법 성능 평가 (Performance Evaluation of Request Scheduling Techniques in the Linux Cluster Web Server)

  • 이규한;이종우;이재원;김성동;채진석
    • 정보처리학회논문지A
    • /
    • 제10A권4호
    • /
    • pp.285-294
    • /
    • 2003
  • 클러스터 웹 서버에서 사용되는 요청 분배 기법에는 부하 균형 요청 분배 기법과 내용 기반 요청 분배 기법이 있다. 부하 균형 요청 분배 기법은 실제 서버들의 부하 균형을 목적으로 실제 서버를 선택하는 기법이다. 반면 내용 기반 요청 분배 기법은 캐쉬 친화적인 기법으로 요청 패킷의 내용에 따라서 실제 서버를 선택하게 된다. 이는 부하 균형보다는 각 실제 서버 내의 캐쉬 참조율을 높이는 것을 목적으로 한다. 하지만 현재 두 기법의 성능 비교에 관한 명확한 자료가 부족한 상태여서 본 논문에서는 두 기법에 관한 성능 평가 결과를 보이고자 한다. 이를 위해 우리는 리눅스 클러스터 웹 서버를 구현한 후 이 두 기법간의 성능을 비교, 분석한다. 이 비교/분석 결과를 활용할 경우 부하 상황에 따른 적절한 요청 분배 기법을 선택하는 데에 도움을 줄 수 있다는 것이 본 논문이 기여하는 바라 할 것이다.

중소형 사이트를 위한 다수의 전면 서버를 갖는 고가용성 웹 서버 클러스터 (High-Availability Web Server Cluster Employing Multiple Front-Ends for Small and Middle-sized Web Sites)

  • 문종배;김명호
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.355-364
    • /
    • 2004
  • 인터넷이 새로운 산업의 형태로 발전하면서 웹사이트에 클러스터링 기술을 많이 적용하고 있다. 고성능 하드웨어 스위치를 사용하면 성능이 우수하지만 중소형 사이트를 구성하는 데에는 비용 부담이 많이 된다. 최근에는 무료이면서 성능이 뛰어난 리눅스 가상 서버(Linux Virtual Server)를 이용한 클러스터를 많이 구축하고 있다. 그러나 리눅스 가상 서버는 하나의 전면서버를 가지는 중앙집중식 부하분배 구조이므로 사용자 요청의 급격한 증가로 병목현상을 일으킬 수 있다. 따라서 본 논문에서는 다수의 전면서버를 두어 리눅스 가상 서버의 병목현상을 없애는 방법을 제안한다. 모든 클러스터 노드들은 전면서버와 후면서버의 역할을 모두 할 수 있도록 구성한다. 서버의 부하가 많지 않으면 자기 노드에서 직접 처리하여 사용자에게 응답할 수 있도록 하고, 부하가 많은 경우 부하가 가장 작은 노드를 선택하여 사용자 요청을 전달한다 그리고 클러스터 서버들의 부하를 고려한 스케줄링 알고리즘을 제안하여 서버들 사이의 부하를 고르게 한다. 실험결과 기존 웹 서버 클러스터들은 서버의 수가 증가하면서 성능향상 폭이 감소하지만, 본 논문에서 제안한 웹 서버 클러스터는 선형적으로 증가하는 것을 보였다. 리눅스 가상 서버 환경에서 다수의 전면서버를 구성함으로써 병목현상을 없애고, 비용 부담이 없고 고성능의 중소형 사이트를 구축할 수 있다.

클러스터 웹 서버에서 컨텐츠인식 부하 분산 모델 (Content Aware Based Load Distribution in a Cluster Web Sewer)

  • 최면욱;현종웅;정인범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.421-423
    • /
    • 2003
  • 최근 클러스터 웹 서버의 로드 벨런싱으로서 L4 스위치가 널리 사용되고 있다. 전형적인 L4 스위치는 연결 요구 발생시 back-end 노드들의 부하를 평가하여 적은 부하를 갖고 있는 노드로 요청을 보내는 기능을 수행한다. 그러나 L4 스위치의 부하 분산은 사용자 연결 횟수를 이용해 분산함으로서 사용자의 다양한 컨텐츠 요청에 적절한 부하분산 스케줄링을 적용하고 있지 않다. 본 논문에서는 서버에 전송되는 컨텐츠 요구를 L4 스위치 계층에서 인식하여 부하배분에 사용하는 부하분산 모델을 제시한다.

  • PDF

콘텐츠 복제 웹 서버에서 캐처 복제를 통한 성능 향상 (Performance Improvement in the Content-Replicated Web Servers Using Cache Replication)

  • 김호중;맹승렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.454-456
    • /
    • 2003
  • 최근 웹 서비스에서 동적 콘텐츠의 비율이 증가함에 따라 캐처 적중률을 높임으로써 서버 CPU의 부하를 줄이는 일의 중요성이 커지고 있다. 서버의 성능을 증가시키기 위한 방법으로 콘텐츠 복제 서버 클러스터가 널리 활용되고 있다. 그러나 콘텐츠 복제 서버의 각 노드는 유사한 작업을 수행함에도 탈구하고 서로 독립적으로 동작하므로 캐쉬 적중률이 감소한다. 본 논문에서는 한 서버 노드에서 캐슁하는 웹 콘텐츠를 다른 서버 노드의 캐쉬에 복제함으로써 서버 팜의 각 노드의 캐쉬 내용을 유사하게 관리하여 캐쉬 적중률을 높인다.

  • PDF