• Title/Summary/Keyword: 웹 서버 클러스터

Search Result 107, Processing Time 0.027 seconds

계층적 캐시 기법을 이용한 대용량 웹 검색 질의 처리 시스템의 구현 (Implementation of a Large-scale Web Query Processing System Using the Multi-level Cache Scheme)

  • 임성채
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.669-679
    • /
    • 2008
  • 웹을 이용한 정보 공개 및 검색이 확대됨에 따라 웹 검색 엔진도 지속적인 주목을 받고 있다. 이에 따라 웹 검색 엔진의 다양한 기술적 문제를 해결하고자 하는 연구가 있었음에도 웹 검색 엔진의 질의 처리 시스템에 대한 기술적 내용은 잘 다뤄지지 않았다. 질의 처리 시스템의 경우 소프트웨어 아키텍처나 운영 기법을 고안하기 어렵기 때문에 본 논문에서는 구현된 상용 시스템을 바탕으로 관련 기술을 소개하고자 한다. 구현된 질의 처리 시스템은 6,500 만개 웹 문서를 색인하여 일 500만개 이상의 사용자 질의 요청을 수행하는 큰 규모의 시스템이다. 구현한 시스템은 질의 처리 결과를 재사용하기 위해 계층적 캐시 기법을 적용했으며, 저장된 캐시 데이타는 4계층으로 구성된 데이타 저장소에 분산 저장되는 것이 특징이다. 계층적 캐시 기법을 통해 질의 처리 용량을 400% 정도로 향상 시킬 수 있었으며 이를 통해 서버 구축비용을 70% 정도 절감할 수 있었다.

잠재 부하 정보와 HTTP 연결의 에이징을 통한 HTTP 연결 스케줄링 알고리즘 (Load Distribution Policy of Web Server using Subsequent Load and HTTP Connection Time)

  • 김시연;김성천
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.717-721
    • /
    • 2005
  • HTTP/l.0과 새로운 HTTP/1.1이 함께 사용됨으로써 단일 HTTP 연결이 단일 사용자 요청을 의미하던 환경에서 연구되었던 웹 서버 부하 분산 정책은 수정이 불가피하게 되었다. HTTP/l.0 환경에서는 사용자의 단일 요청만을 가지고 서버를 할당하였으나, 지속적인 HTTP 연결을 지원하게 되면서 하나의 HTTP 연결을 통해 여러 개의 요청을 서버에게 요구할 수 있으므로, 첫 번째로 도착한 요청 하나만으로는 앞으로 그 HTTP 연결을 통해 전송될 사용자의 요청이 서버의 자원을 얼마나 소비하게 될 것인지 전혀 예상할 수 없게 된다. 본 논문에서는 HTTP/1.1을 효율적으로 지원하는 부하 분산 정책을 제안하고자 한다. 이 정책은 사용자의 첫 번째 요청이 전달되면 그 요청의 내장 객체 정보와 현재 살아있는 HTTP 연결의 에이징(aging)을 고려하여 서버를 선택하는 알고리즘이다. 그리고 디스패처의 잘못된 분산 결정으로 인해 시스템의 성능에 누적되는 악영향을 최소화하기 위한 기법도 제시한다.

웹 사용 정보 마이닝 기반의 동적 사용자 프로파일 생성 (Generator of Dynamic User Profiles Based on Web Usage Mining)

  • 안계순;고세진;정준;이필규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.389-390
    • /
    • 2002
  • 동적 웹 컨텐츠 제공에서 고객을 위한 추천서비스에 이르는 인터넷 기반의 전자상거래 애플리케이션에서는 고객이 어떤 성향을 가지고 있는가에 대한 정보를 획득하는 것이 중요하다. 웹 개인화의 대표적인 기술인 협력적 석과는 사용자의 정보를 정적인 프로파일 형태로 저장하여 사용자의 성향 변화를 빨리 획득할 수 없다. 또한 사용자의 명시적 평가 의존성, 확장성 부족, 다차원 공간 데이터에 대한 적용 어려움 둥의 문제점을 가지고 있다. 이와 같은 단점을 해결하기 위한 해결 방안으로 웹 사용 정보 마이닝(web usage mining)이 쓰이고 있다. 웹 사용 정보 마이닝은 서버에 축적된 웹 사용 데이터(web usage data)를 이용하여 패턴을 발견하는 기술이다. 특히 연관 규칙 생성 알고리즘으로 웹 사용 패턴(web usage pattern)을 찾고 패턴을 클러스터링하는 기술이 사용되고 있다. 그러나 연관 규칙 생성 알고리즘은 많은 수의 패턴들을 찾고 또 유용하지 못한 패턴을 발견하는 단점이 있다. 본 논문에서는 검증된 웹 사용 패턴을 이용한 동적 사용자 프로파일 생성 방법을 제안한다. 먼저 패턴 발견을 위해 연관 규칙 생성 알고리즘인 Apriori를 이용하고 사용자 프로파일을 위한 클러스터를 생성하기 위해 ARHP를 채택하였다. 클러스터를 생성하기 전에 Dempster-Shafer 이론을 이용하여 유용하지 못한 패턴을 제거하는 패턴 검증 과정을 수행한다. 검증된 패턴을 이용하여 클러스터를 생성하고 사용자의 현재 활성화된 세션에 따라 동적으로 사용자 프로파일이 생성된다

TCP splicing 기반의 2단계 L4/L7 부하분산방법을 이용한 확장성 있는 클러스터형 웹서버의 설계 (A Design of Scalable Clustering Web Server Using Two-level L4/L7 Load Balancing Scheme based on TCP splicing)

  • 이진;권희웅;정규식;김동승
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(1)
    • /
    • pp.413-416
    • /
    • 2002
  • 중앙집중식 구조의 기존 내용기반 요구분산의 문제점인 확장성 및 성능을 향상시키기 위해, 본 논문에서 는 2단계로 구성된 분산구조로 된 L4/L7 방법을 사용한다. L4 스위치를 이용하여 1차적으로 부하를 분산시키고, 이들에 대해 Proxy의 성능상의 단점을 보완한 TCP splicing을 적용하여 2차로 L7 스위치 기능을 수행하도록 한다. 리눅스 환경에서 제안한 시스템을 구현하고 클러스터형 웹서버 시스템을 구성하여 실험하였다. 제안한 분산구조 방법이 중앙집중 방식에 비해 확장성, 성능면에서 우수함을 확인하였다.

  • PDF

라운드로빈 부하균형을 통한 웹 서버 클러스터 고속화 처리기법 (A high speed processing method of web server cluster through round robin load balancing)

  • 성경;김석수;박길철
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1524-1531
    • /
    • 2004
  • 본 논문에서는 라운드 로빈 알고리즘을 적용한 부하균형기법을 보이고 있다. 이를 위하여 2개의 패키지(패킷 캡춰와 라운드로빈 테스트 패키지)를 구현하였으며, 이러한 구현 패키지 S/W에 의해 본 연구 실험의 가상연결구조(데이터 생성기, 가상서버, 서버1,2,3) 에서 발생하는 패킷의 량을 측정한 것으로 서버1,2,3으로 트래픽 분산여부를 파악할 수 있었으며, 구현된 라운드로빈 부하균형 모니터링 시스템의 기능으로는 데이터의 수신량, 패킷량 표현, 패킷량 그래프 표현, 라운드 로빈 테스트, 시스템 모니터링 기능이 있다. 실험결과는 들어오는 데이터의 크기가 많이 차이나지 않는 이상 라운드 로빈 알고리즘은 확실한 형태의 트래픽 분산을 가능하게 해주었다 그리고 일부분에서 오차가 심한 경우도 있지만 횟수를 거듭하고 테스트가 장기화 될수록 오차는 줄어들었다.

분산 시스템 환경에서의 컨텐츠 및 어플리케이션의 디플로이먼트 (Contents and Application Deployment in Distributed System Environment)

  • 윤태웅;안형근;최은미;민덕기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.119-122
    • /
    • 2002
  • 인터넷 사용자가 증가함으로서 웹서버와 같은 서버들의 부하를 분산하기 위한 분산 시스템환경이 사용되어지고 있다. 이러한 경우에 있어서 기존의 ftp와 같은 도구로는 웹서버들간의 컨텐츠(Contents) 또는 애플리케이션(Application)을 동기화 함에 있어 한계가 나타난다. 이 논문에서 소개하는 Deploy 시스템은 이러한 분산 시스템 환경 하에서 시스템간의 컨텐츠 또는 애플리케이션의 동기화를 관리하는 방법을 제시한다. 시스템에서는 배포될 노드들을 클러스터라는 그룹단위의 배포가 가능하며 배포할 컨텐츠 또는 애플리케이션을 패키지화하여 버전관리, 히스토리 관리(백업), 스케줄링을 통한 예약 작업이 가능하다. 또한 현재 상용화 되어있는 분산 관리 시스템과의 연동으로 통해서 보다 효과적인 분산 관리 배포 시스템을 가능하게 한다.

  • PDF

웹과 네트워크 기술을 이용한 환자 맞춤식 암치료 계획 시뮬레이션 시스템 (A Customized Cancer Radiation Treatment Planning Simulation (ccRTPs) System via Web and Network)

  • 금오연
    • 한국의학물리학회지:의학물리
    • /
    • 제17권3호
    • /
    • pp.144-152
    • /
    • 2006
  • 네트워크기술을 이용한 서버-클라이언트 원격의료기술은 특히 의료시설이 낙후된 지방도시의 의료기관에 질 높은 의료서비스를 제공할 수 있는 기술이다. 이러한 기술은 중앙 집중 방식으로 진단과 검사용으로 사용되는 대형 컴퓨터 하드웨어와 소프트웨어를 매우 효율적이고 경제적으로 관리할 수 있게 하게 때문에 궁극적으로는 의료수가를 감소시키는데도 기여할 것이다. 각 환자에 대해 환자 맞춤형 방사선 치료계획은 매우 효율적인 암 치료를 가능하게 하기 때문에 환자와 의사 모두에게 매우 유익한 방법이다. 치료계획전문가들은 환자에게 너무 적은 선량을 주면 암이 계속 재발할 확률이 높고 너무 많은 선량을 주면 환자를 다치게 할 수도 있다는 것을 잘 이해한다. 최고의 해법은 가장 정확한 선량을 주는 것인데 이것은 각 환자의 CT 자료를 기반으로 정확한 선량계획 시뮬레이션 시스템을 사용하는 것이다. 우리는 네트워크 기반과 웹 기반을 이용한 환자 맞춤형 치료계획 시뮬레이션 시스템개발을 위해 관련된 4가지 컴퓨터 프로그램을 개발하고 있다. 환자의 CT자료를 이용하여 각 환자의 표적 자료를 만드는 프로그램, 이 표적자료를 바탕으로 방사선 선량 시뮬레이션을 하는 병렬 몬테카를로 프로그램, 선량주사변수들을 최적화시키는 프로그램, 그리고 계산결과를 시각화하는 프로그램들이다. 모든 소프트웨어는 약 100-200개의 개인컴퓨터로 구성된 클러스터에서 병렬모드로 운영이 된다. 이와 같이 방대한 하드웨어와 소프트웨어의 효과적인 관리를 각 병원에 맡기는 것은 효율적이지 못하기 때문에 이를 중앙에서 관리하면서 각 병원에서는 네트워크나 웹을 통하여 마치 모든 것이 자기 병원에 있는 것과 같이 편리하게 쓸 수 있게 하는 시스템으로 의사와의 계속적인 의사소통은 클라이언트-서버 시스템의 메신저 기능을 이용한다.

  • PDF

클러스터 웹서버 제어시스템의 Time-delay 및 전달 특성 분석 (Analysis of Transfer Characteristics and Time-delay of Control System based on Clustering Web Server)

  • 남의석
    • 디지털융복합연구
    • /
    • 제12권8호
    • /
    • pp.219-227
    • /
    • 2014
  • 인터넷을 통한 정보 전달 방법은 Ethernet과 ATM, CAN과 같은 다양한 통신 전달 프로토콜 및 방법을 통해 이루어지고 있다. 현재 연구된 네트워크상의 시간 지연 현상에 대한 연구는 일부 네트워크 모델을 바탕으로 연구되고 있으나 다양한 통신 환경 하에서 발생하는 시간 지연 현상에 대해 최적의 모델링 방법을 제시해 주고 있지 못하고 있다. 따라서 다양한 네트워크 환경에 적합하도록 인터넷 기반 비동기 샘플치 시스템 모델에 대한 연구가 필요하다. 아울러 인터넷을 통해 구성된 폐루프 시스템은 기존 제어 시스템과 다른 동작 특성과 외란 특성을 가지므로 인터넷 환경에 적합하게 설계된 견실 제어 방법이 필요하다. 따라서 안정성이 극히 요구되는 각종 산업 기기 등에 대한 웹기반 정밀 원격 제어를 원활히 수행하기 위해서는 웹 환경에 최적화된 강인 제어 이론 개발이 필요하다. 따라서, 본 논문에서는 원격지 플랜트에 대한 실시간 원격 제어를 안정적 및 효율적으로 수행하도록 인터넷상의 데이터 전송시 시간 지연 현상 분석 및 인터넷 기반 제어시스템의 전달 특성 분석하였다.

고가용성 솔루션 구축을 위한 그리드 측면에서의 소프트웨어 아키텍처를 통한 로드밸랜싱 구현 (Software Architecture for Implementing the Grid Computing of the High Availability Solution through Load Balancing)

  • 이병엽;박준호;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.26-35
    • /
    • 2011
  • 인터넷 환경의 급속한 발전과 더불어 국내외 미션 크리티컬한 비즈니스 환경이 온라인에 의해 서비스되고 있다. 반면 단일 환경 서버환경의 구축을 통해 비효율적인 IT Resources들의 자원 낭비가 가중되고 있는 현실이다. 따라서 웹 환경을 통해 처리되어야 할 정보의 양의 급증과, 이의 처리를 위해 여러 개의 단일 서버를 고속의 네트워크로 연결한 고가용성 구현이 가능한 클러스터 컴퓨팅 시스템이 등장하게 되었다. 하지만 클러스터 컴퓨팅 기술의 다소 제한적인 IT Resource의 단점을 가지고 있다. 이러한 단점을 보완하기 위하여 그리드 컴퓨팅 환경은 기존의 분산 컴퓨팅 기술의 확장된 개념으로, 다양한 분야에서 저비용의 고성능 컴퓨팅 퍼포먼스를 얻기 위하여 그리드를 이용하고 있다. 그러나 공통적으로 이용할 수 있는 정보 시스템의 부재로, 현재의 그리드는 대규모의 단일한 환경으로서의 그리드가 아닌, 기존의 클러스터 컴퓨터와 같은 의미로 사용되고 있다. 따라서 자신이 구성한 분산 컴퓨팅 환경을 그리드 환경의 한 부분으로 포함시키기 위해서는 컴퓨팅 환경에 대한 정보를 그리드의 이용자가 공유할 수 있어야 하며, 정보 서비스를 공개하여 공유할 수 있도록 해야 한다. 본 논문에서는 Grid 기술을 통하여 데티터베이스 로드밸런싱 목표치에 대한 검증을 제시하고 향후 고가용성 데이터베이스 구현을 위한 아키텍처를 제시한다.