• 제목/요약/키워드: 웹 구조

검색결과 1,925건 처리시간 0.03초

웹사이트의 구조주출, 저장 및 가시화를 위한 구조분석 에이전트 (A Structure Analysis Agent for Extraction, Storage and Visualization of Web Sites)

  • 정윤경;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.313-315
    • /
    • 2001
  • 인터넷 비즈니스 사이트가 많아짐에 따라 사용자에게 편리한 비즈니스 사이트를 구추하기위해 웹서버의 구조 및 내용을 평가하고 재구성해야 하는데, 수작업에 의한 웹문서의 평가시 인적, 시간적 비용이 높고 시스템에 대한 평가값이 객관적이지 못하다. 이를 해결하기 위해 본 논문에서는 구조추출, 구조저장, 구조가시화로 구성된 웹문서의 구조분석 에이전트를 제안한다. 구조추출 모듈은 URL로 웹문서를 받고 이를 잘정의된 XML형태로 변환한 후, 태그정보를 이용하여 웹문서의 구조를 구하고, 하이퍼링크데이터를 이용하여 웹문서간의 연결구조를 얻는다. 구조저장은 추출된 웹문서와 웹문서 연결관계를 웹서버와 같이 연결하여 저장하며, 구조 가시화에서 이를 계층적으로나 그래프형식으로 가시화된다. 제안한 시스템의 유용성을 보이기 위하여 웹문서의 평가문제에 적용한 결과, 많은 양의 데이터를 의 데이터의 기술적인 평가가 가능하고, 데이터를 수집하기 위한 인력자원, 시간과 비용을 줄일수 있으며, 쉽게 사이트를 평가하여 서비스 수준을 향상 시킬 수 있음을 알 수 있었다.

  • PDF

구조분석 에이전트를 사용한 웹사이트의 평가 (Web Site Evaluation Using Structure Analysis Agents)

  • 정윤경;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.143-145
    • /
    • 2000
  • 인터넷이 보편화되면서 그에 따른 정보량도 급증하고 있다. 웹문서량이 많아짐에 따라 웹문서를 구조를 이용하여 저장, 분석하는 연구가 활발히 이루어지고 있다. 본 논문에서는 웹사이트를 사용자가 평가하기 위해 계층적인 웹문서들의 관계를 사이트맵으로 구성하며 웹문서 내의 계층구조를 추출, 저장하고 그래픽적으로 표시하였다. 이를 위해 웹문서 내의 계층구조를 위해 W3기관의 공용으로 사용되는 Tidy 라이브러리를 이용하여 URL에 대한 HTML 문서를 얻고 이를 XML로 변환하였다. 변환된 XML 결과로 이진트리를 구성하고 계층구조를 표현하였다. 웹문서들의 사이트맵은 그래프형식과 계층구조형식으로 표현했는데 그래프형식을 이용하여 사이트맵의 연결구조를 파악할 수 있게 하였으며, 계층구조를 이용하여 웹문서간의 계층구조에 따른 정보를 얻을 수 있었다. 사이트맵을 구성하기 위해 URL들의 구조를 인접리스트로 저장하였으며, 방향성 그래프형식을 이용하였다. 또한 웹문서 구조를 계층적으로 구성하기 위해 웹문서의 그래프형식에 대해 BFS(Breadth First Search)방식을 이용했다. 또한 계층적 사이트맵을 이용한 평가항목을 이용하여 증권사이트에 대해 실험하였다. 실험을 통해 본 시스템이 웹사이트 평가에 유용성함을 입증하였다.

  • PDF

웹 사이트의 구조와 항해가능성 (The Structure of a Web site and Navigability)

  • 민경실;천성규;장기호;정효숙;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제14권3호
    • /
    • pp.51-62
    • /
    • 2011
  • 항해가능성은 사용자가 웹 사이트에서 원하는 정보를 얼마나 찾기 쉬운지를 말하며 웹 사이트구조에 영향을 받는다. 본 논문에서는 세 종류의 웹 사이트, 즉 작은 세상 구조의 웹 사이트, 준 매트로이드 구조의 웹 사이트, 그리고 온톨로지를 이용한 웹 사이트를 제작하고 각 웹 사이트의 항해 가능성을 두 가지 기준 (사용자가 원하는 정보를 찾기 위해 클릭한 하이퍼링크의 수 및 원하는 정보를 찾기 위해 걸린 시간) 으로 측정하였다. 세가지 구조를 선택한 이유는 각 구조마다 사용자가 정보를 찾기에 도움이 될 수 있도록 하이퍼링크를 만들 수 있기 때문이다. 실험 결과, 한 사용자가 정보를 찾기까지 거쳐 간 링크의 평균 개수는 준 매트로이드 구조의 웹 사이트 (100.37개) < 온톨로지 구조의 웹 사이트 (117.63개) < 작은 세상 구조의 웹 사이트 (236.17개) 순으로 나왔다. 그리고 한 사용자가 정보를 찾는데 소요된 평균 시간은 온톨로지 구조의 웹 사이트 (20분 26초) < 준 매트로이드 구조의 웹 사이트 (23분 6초) < 작은 세상 구조의 웹 사이트(30분 47초) 였다. 따라서 준 매트로이드 구조나 온톨로지 기반 구조의 웹 사이트가 상대적으로 작은 세상 구조의 웹 사이트보다 항해가능 하다고 볼 수 있다. 본 논문에서는 실험 결과를 어떻게 교육용 웹 사이트 설계에 적용할 수 있을 지도 제안하였다.

  • PDF

3-Tier 구조를 갖는 웹 데이터베이스 관리 시스템의 설계 및 구현 (The 3-Tiered Web-based Database Management System for Product-Line Management)

  • 백희숙;전재우;오삼권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.87-89
    • /
    • 1999
  • 인터넷과 웹 환경이 발달함에 따라 다양한 종류의 웹 응용프로그램들이 개발되고 있다. 최근에 개발되고 있는 웹 기반의 데이터베이스 시스템은 웹 데이터베이스 액세스를 위한 클라이언트 프로그램의 설치 없이 웹 브라우저만으로 데이터베이스를 액세스할 수 있는 장점을 갖고 있다. 기존의 많은 웹 기반 데이터베이스 시스템들은 클라이언트/서버의 2-Tier 구조를 가진다. 그러나 2-Tier 구조는 사용자 수의 증가에 따라 데이터베이스가 존재하는 서버에 과부하가 발생할 수 있다는 단점이 있다. 본 논문은 2-Tier 구조의 문제점을 해결하기 위한 3-Tier 구조의 웹 데이터베이스를 제시한다. 3-Tier 구조는 클라이언트 시스템과 서버 시스템간에 데이터베이스에 관련된 트랜잭션(transaction)처리와 사용자 관리를 위한 중간 시스템이 존재하는 구조이다. 3-Tier 구조는 사용자가 데이터베이스를 액세스할 때 중간시스템을 거쳐 서버로 연결되도록 함으로써 2-Tier 구조에서 발생할 수 있는 서버 과부하를 해결한다.

  • PDF

동시링크를 이용한 사회학 분야 웹 정보원의 지적구조 분석: (A Study on the Intellectual Structure in Web Information of Sociology Using the Co-links Analysis)

  • 김원진
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.113-120
    • /
    • 2006
  • 본 연구에서는 사회학 분야 웹 정보원을 대상으로 동시링크분석을 실시하여 특정 학문분야의 지적구조를 분석하고, 검색엔진별 지적 구조의 차이를 분석함으로써 웹 정보원의 특성을 살펴보았다. 세 개의 검색엔진을 대상으로 지적구조의 차이를 비교한 결과, 웹 정보원 지도에서 전체적인 지적구조는 비슷하게 나타났지만, 몇 개의 웹 정보원의 경우에는 소속군집이 다르게 나타난 경우도 있었다. 그리고 Altavista와 AlltheWeb은 지도상의 웹 정보원 분포에 있어서 거의 유사한 구조를 보여주었다.

  • PDF

다중 처리기 기반 웹 서버 구조의 실험적 성능 분석 (Experimental Analysis of Web Server on Multiprocessor)

  • 정진국
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권1호
    • /
    • pp.22-36
    • /
    • 2001
  • WWW의 급격한 발전은 몇몇 웹 서버에 큰 과부하를 가져오게 하였다. 이로 인해 고성능 웹서버의 구축이 필요하게 되었는데 그중 프로세스의 오버헤드를 줄이기 위해 도입된 멀티 쓰레드 기법을 이용한 병행 웹 서버들이 많이 이용되게 되었다. 일반적으로 멀티 쓰레드 기법을 이용하는 웹 서버의 구조는 요구 기반 웹 서버 작업 기반 웹 서버 Thread Pool 구조 웹 서버 등으로 나눌수 있다. 본 논문에서는 이런 웹 서버들을 리눅스가 탑재되어 있는 다중 처리기상에 구현하였으며 다양한 환경하에서 성능을 비교 분석하였다 각각의 웹 서버들은 Pthread 라이브러리와 Socket 라이브러리를 이용하여 구현하였으며 여러 파라미터-CPU 개수 CGI 비율, 웹 서버구조, 파일크기 부하량 등-를 조절하면서 실험하였다 실험 결과 분석에 의하면 요구 기반 웹 서버에서는 하나의 CPU에서 수행이 되는 쓰레드의 개수가 많게 되면 성능이 저하되는 것을 볼 수 있었고 작업 기반 웹 서버에서는 단계사이의 불균형으로 인하여 큐에서의 대기 시간이 누적되면 성능이 저하되는 것을 볼수 있었다,. Thread Pool 구조의 웹서버는 쓰레드의 개수가 조절되고 큐에서의 대기 시간 또한 없앰으로 해서 다른 웹 서버에 비해 좋은 성능을 보임을 알 수 있었다. 이와 같은 실험 결과는 다중 처리기를 이용한 고성능 웹 서버를 구축하는데 있어서 이용될 수 있을 것이다.

  • PDF

웹 정보 검색 엔진을 위한 저장구조의 설계 및 실험 (Design and Study on Structure of Storage for Web Search Engine)

  • 이동광;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.539-542
    • /
    • 2002
  • 인터넷의 발달은 월드 와이드 웹을 탄생 시켰고 그로 인한 인터넷의 폭발적 성장은 인터넷을 하나의 생활로 만들었다. 인터넷의 엄청난 자료의 양과 친숙해진 인터넷으로 인해 인터넷은 하나의 정보창구의 역할을 하게 되었고, 그에 따라 정보검색이 발전하게 되었다. 초기의 월드 와이드 웹은 많은 웹 문서가 아니었지만, 구글이 현재 20억 페이지를 색인할 만큼 엄청난 규모가 되었다. 또한 앞으로의 검색 엔진은 정보나, 웹상의 링크 정보를 통한 그 문서의 중요도를 분석하여 문서의 중요도를 판단하게 될 것이며, 지금까지의 검색엔진의 저장구조와는 다른 구조를 가지게 될 것이다. 그에 따라 웹 정보검색엔진의 저장구조는 효율적 저장과 속도 향상을 위해 중요한 구조가 되어가고 있다. 본 논문에서는 검색엔진의 저장구조에 따른 용량의 변화와 앞으로의 웹 검색엔진에서 등장할 기능인 문서의 정보나, 문서간의 링크 정보를 통한 문서의 중요도 분석 등을 수행할 수 있는 저장구조를 만들어보고 실험해 보았다.

  • PDF

웹 사용 데이타와 하이퍼링크 구조를 통합한 웹 네비게이션 마이닝 (Web Navigation Mining by Integrating Web Usage Data and Hyperlink Structures)

  • 구흠모;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.416-427
    • /
    • 2005
  • 웹 네비게이션 마이닝은 웹 접근 로그 데이타를 분석하여 웹을 항해하는 패턴을 발견하는 기법이다. 하지만 사용자들은 웹을 항해할 때 정상적인 계층적 경로를 따르지 않는 경우가 많기 때문에 웹 접근 로그 데이타에는 웹 항해 패턴 발견에 장애가 되는 잡음 정보가 많이 포함된다. 결과적으로 웹 접근 로그 데이타만을 이용한 기존의 웹 네비게이션 마이닝은 이런 잡음을 해결하기 위한 전처리 과정의 복잡성 등으로 인하여 웹 항해 패턴을 효율적으로 발견하는 데 좋은 성능을 보여주지 못했다. 이런 문제를 해결하기 위해 본 논문에서는 웹 접근 로그 데이타 외에 웹의 하이퍼링크 구조 정보를 함께 이용하여 웹 네비게이션 패턴을 효율적으로 발견하는 기법을 제시하였다. 웹 사이트의 계층적인 하이퍼링크 구조로부터 생성된 WebTree라 불리는 구조를 이용하여 웹 접근 로그 데이타에 포함된 비정상적인 경로에 대한 잡음을 효율적으로 제거하였다. 이 기법을 이용해 구현된 SPMiner(Sequence Pattern Miner) 시스템은 로그 데이타와 하이퍼링크 계층구조를 함께 이용함으로써 전처리의 오버헤드를 현저히 감소시켰고 결과적으로 효율적으로 네비게이션 패턴을 찾아주고 이를 추천에 이용할 수 있는 기반을 제시하였다.

국내 웹 그래프의 링크 구조 분석 (Link Analysis of Korean Web Graph)

  • 서정주;김진일;김은상;김영호;정하웅;김성렬;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.400-402
    • /
    • 2012
  • 웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로써 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 링크 데이터를 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 국내 웹 페이지들의 링크의 진입 차수와 연결 요소들의 크기 분포는 멱법칙을 따르고, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 가짐을 확인한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다.

웹서비스의 QoS를 지원하기 위한 계층적인 브로커링 기법 (A Scheme of Hierarchical Brokering for Supporting QoS of Web Services)

  • 강용혁;송창환;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.921-922
    • /
    • 2009
  • 웹서비스(Web service)는 네트워크 상에서 서로 다른 종류의 컴퓨터들 간에 상호작용을 지원하는 소프트웨어 시스템이다. 현재 웹서비스 표준들은 주로 서비스의 기능적인 요소들에 대한 내용에 집중되어 있어서 웹서비스의 QoS와 같은 서비스의 비기능적인 속성들을 표현하는 것은 어렵다. 본 논문에서는 보다 신속하고 효율적인 웹서비스 합성을 위해 계층적인 브로커링 방식을 사용하여 웹서비스 합성을 위한 기법을 제시한다. 본 논문에서는 복잡한 응용을 지원하기 위한 웹서비스의 구조가 계층적인 구조를 갖는다고 가정하고 웹서비스들을 지원하기 위하여 계층적인 브로커 구조를 제시하였다. 본 논문에서는 제안하는 계층적인 브로커들은 웹서비스의 QoS와 합성을 지원하기 위해서 브로커 시스템 내에 QoS 상태 정보와 합성 정보를 유지한다. 제안기법에서는 이러한 구조와 이러한 정보를 통해 웹서비스 QoS 요청에 대하여 효율적으로 처리할 수 있다.