• Title/Summary/Keyword: 웹 구조

Search Result 1,925, Processing Time 0.03 seconds

Discovery and Recommendation of User Search Patterns from Web Data (웹 데이터에서의 사용자 탐색 패턴 발견 및 추천)

  • 구흠모;양재영;홍광희;최중민
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.287-296
    • /
    • 2002
  • 웹 사용 마이닝은 데이터마이닝을 바탕으로 사용자의 로그 파일 정보를 이용하여 웹이 이용되는 패턴을 발견한다. 이를 이용하여 웹을 개선하여 사용자들이 보다 빨리 원하는 내용을 검색할 수 있도록 할 수 있으며 시스템 관리자에게는 효율적인 웹 구조를 인한 정보를 제공할 수 있다. 웹 사용 마이닝에서 사용하는 데이터는 성형화되어 있지 않으며 웹 사용 패턴을 분석하는데 방해가 되는 잡음 데이터까지 포함하고 있다. 이것은 기존에 개발된 여러 데이터마이닝 기법을 적용하는데 어려움으로 작용한다. 이러한 어려움을 해결하기 위해 본 논문에서는 새로운 방법을 도입한 SPMiner을 .제안한다. SPMiner는 웹의 구조를 이용하여 로그 파일의 전처리 과정을 줄이며 사용자의 탐색 패턴 분석을 효율적으로 수행 할 수 있는 시스템이다. SPMiner는 WebTree 에이전트를 이용하여 웹 사이트 구조를 분석하여 WebTree를 생성하고 사용자 로그 파일을 분석하여 각 웹 페이지의 사용빈도에 대한 정보를 추출한다. WebTree와 로그 파일에서 추출된 웹 페이지에 대한 정보는 SPMiner에 의해 패턴을 분석할 퍼 이용될 수 있는 형태인 WebTree$^{+}$로 병합된다 WebTree$^{+}$는 패턴 발견을 쉽게 해주며 사용자에게 추천할 정보나 웹 페이지를 능동적으로 추천할 수 있게 만들어 준다.

  • PDF

Web Structure Mining by Extracting Hyperlinks from Web Documents and Access Logs (웹 문서와 접근로그의 하이퍼링크 추출을 통한 웹 구조 마이닝)

  • Lee, Seong-Dae;Park, Hyu-Chan
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.11 no.11
    • /
    • pp.2059-2071
    • /
    • 2007
  • If the correct structure of Web site is known, the information provider can discover users# behavior patterns and characteristics for better services, and users can find useful information easily and exactly. There may be some difficulties, however, to extract the exact structure of Web site because documents one the Web tend to be changed frequently. This paper proposes new method for extracting such Web structure automatically. The method consists of two phases. The first phase extracts the hyperlinks among Web documents, and then constructs a directed graph to represent the structure of Web site. It has limitations, however, to discover the hyperlinks in Flash and Java Applet. The second phase is to find such hidden hyperlinks by using Web access log. It fist extracts the click streams from the access log, and then extract the hidden hyperlinks by comparing with the directed graph. Several experiments have been conducted to evaluate the proposed method.

Web Documents Classification with Fuzzy Integration of Multiple Structure-Adaptive Self-Organizing Maps (다중 구조적응 자기구성지도의 퍼지결합을 이용한 웹 문서 분류)

  • 김경중;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.371-373
    • /
    • 2003
  • 웹 문서를 분류하는 목적은 특정 주제별로 중요한 문서들을 구분하려는 것과 사용자의 선호도를 바탕으로 개인화를 하려는 것으로 나누어 볼 수 있다. 특히, 웹의 효율적인 탐색을 위해 사용자가 관심 있어 할 웹 문서를 분류하는 것은 중요하다 일반적으로 하나의 웹 문서는 특징 추출방법에 의해 문서 벡터로 표시되며 사용자의 선호여부나 주제번호를 클래스로 삼는다. 사용자가 선호도를 표시한 웹 문서를 사용하여 새로운 웹 문서의 선호 여부를 예측하기 위해 자기 구성지도(SOM)를 사용하면, 시각적으로 구조를 보여주어 데이터 사이의 관계를 효과적으로 이해할 수 있다. 그러나 SOM은 노드의 개수와 구조를 자동적으로 결정하지 못하는 단점이 있기 때문에, SOM의 장점을 활용하면서 자동적으로 구조를 결정하기 위해 구조적응 자기구성지도(SASOM)를 이용한다. 보다 나은 성능과 다양한 해석을 위해, 여러 개의 SASOM을 서로 다른 특징추출 방법을 이용하여 학습시킨 후 사용자가 주관적으로 분류기의 중요도를 결정할 수 있는 퍼지적분을 사용하여 결합하였다. UCI Syskill & Webert 데이터에 대한 실험결과 기존의 DT, MLP, naive Bayes 분류기 보다 향상된 성능을 보였다.

  • PDF

The Design and Implementation of XML Tree base on Web Server for XML Schema Generation from RDBMS (RDBMS로부터 XML 스키마 생성을 위한 웹 서버 기반의 XML Tree 설계 및 구현)

  • 박영수;장덕철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.424-426
    • /
    • 2004
  • 웹 기술이 발달할수록 사회 전반의 패러다임 변화속도는 빨라지고, 사용자의 요구 사항과 웹 프로그램 내부의 복잡성은 증가한다. 또한 콘텐츠의 생명 주기는 짧아지고, 웹 프로그램의 구조 변경과 유지보수가 많아지게 된다. 따라서 동적인 변화에 빠르게 대처할 수 있는 웹 프로그램 기술이 더욱 요구되고 있다. XML은 계층적 구조를 갖고 있으면서도 구조적 변경이 가능하고, 다른 형태로의 변환이 용이하다. 본 논문에서는 이런 장점을 이용하여 개발 기간을 단축시킬 수 있는 방법의 하나로, XML을 기반으로 하는 웹 프로그램 개발 지원 서버를 이용해 쉽고 간편하게 웹 서버 프로그램을 개발하고, 유지보수 할 수 있도록 하는데 중점을 두고 웹 기반의 XML 트리를 설계하고 구현하였다. XML 트리는 파싱뿐만 아니라 계층적 구조를 이루고 있어 접근성이 우수하고, XML 스키마와 XML 스타일시트 작성에도 않은 도움을 줄 수 있을 것으로 기대된다.

  • PDF

A Design of Web Ontology Learning and Population Model based on Structured Data (구조화 된 데이터 기반의 웹 온톨로지 학습 및 확장 모델 설계)

  • Jeong, Hye-Jin;Jeong, Dong-Won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.329-332
    • /
    • 2009
  • 이 논문에서는 보다 풍부하고 정확한 정보를 제공하기 위한 구조화 된 데이터를 이용한 웹 온톨로지 확장(Population) 모델을 제안한다. 시맨틱 웹이 등장하면서 웹 온톨로지의 구축이 필수 요소가 되었으며, 더욱 정확하고 보다 풍부한 정보를 제공하기 위한 웹 온톨로지 생성 모텔에 관한 연구의 필요성이 증가하였다. 이러한 요구 사항을 충족시키기 위해서는 첫 번째로, 일관성 있고 보편적인 개념을 이용한 웹 온톨로지 스키마 생성과 이를 기반으로 한 온톨로지 간 상호운용성 향상이 요구된다. 두 번째로, 보다 풍부한 정보 제공을 위해 정의된 온톨로지를 확장할 수 있는 방법 개발이 요구된다. 이 논문에서는 메타데이터 레지스트리 (MDR, Metadata Registry)를 이용하여 생성된 구조화 된 데이터 기반의 온톨로지 학습 및 확장 모델을 제안한다. 된 데이터에 대한 개념과 이를 기반으로 한 학습 및 확장의 특징 등에 대하여 기술하고 제안 모델을 위한 시스템 구조에 대하여 기술한다.

  • PDF

Network Modelling Approach for Web Site Structure Optimization (웹 사이트 구조 최적화를 위한 네트워크 모델링 접근법)

  • Lee, Woo-Key;Shin, Kwang-Sup;Kang, Suk-Ho;Kim, Hoon-Tai
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2005.05a
    • /
    • pp.420-424
    • /
    • 2005
  • 정보 통신 기술의 발달로 엄청난 양의 정보가 World Wide Web을 통해 저장되고 공유된다. 웹 정보의 양이 커질수록 이의 구조화 노력은 점증될 수밖에 없다. 본 논문의 목적은 웹을 유향그래프로 인식하고, 특히 웹 사이트에 초점을 맞추어 웹의 시작페이지(default page)와 이를 제외한 모든 페이지에 대해 최적구조화를 수행하되, 각 개별 웹 페이지를 하나의 종점(terminal page)으로 정의하고, 시작 페이지로부터 각 페이지로의 최적의 경로를 찾아내면서 전체 site의 비용을 최소화할 수 있는 구조를 탐색하는 것이다. 또한 라그랑지안 릴렉세이션을 적용하여 경로 제약조건의 변화에 대해 효율적인 최적해의 변화를 검증하며, 웹의 구조적분석에 적합한지 여부를 적용하는 것이다. 본 연구에서는 웹에 대해 최적화 모델링을 입안 및 분석하였으며, 실험으로서 입안된 모델을 최적화 툴에 적용하여 최적구조화에 부합되는 결과를 얻을 수 있음을 입증하였다.

  • PDF

A Modeling Technique for Web Application with Extended UML (확장형UML을 이용한 웹 애플리케이션 모델링 기법)

  • 박영주;이기열;신우창;이병정;김희천;우치수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.250-252
    • /
    • 2003
  • 인터넷의 성장과 더불어 웹 환경에서 동작하는 웹 애플리케이션을 체계적으로 개발하고 유지 관리하기 위한 연구가 활발히 진행되고 있다. 이에 웹 애플리케이션 설계 단계에서 웹 애플리케이션을 모델링하기 위한 여러 기법과 프로세스가 제시되었다. 그러나 기존의 연구들은 웹 애플리케이션 모델링의 요구사항에 대한 정확한 정의가 부족하고 웹 애플리케이션의 기술에 의존적이다. 본 연구에서는 웹 애플리케이션 모델링 요구사항에 대한 정의를 명확히 하고 웹 애플리케이션의 기술적인 면에 독립적인 고수준의 추상화를 통해 웹 애플리케이션을 UML로 구조 모델링하는 기법을 보인다. 구조 모델링은 컨텐츠의 구조와 각각의 컨텐츠가 실제 화면에 어떻게 매핑되는지를 표기하여 실제 구현 상태를 모델링에서 나타내는 것이 가능하도록 한다. 마지막으로 제안한 기법을 통해 일반적인 형태의 간단한 웹 애플리케이션을 모델링함으로써 유용성을 검증한다.

  • PDF

A Survey of Web Mining Focused on Web Structure Mining (웹 구조 마이닝에 초점을 둔 웹 마이닝의 조사)

  • Lee, Seok-Min;Park, Dae-Myeong;Yoo, Dae-Hun;Choi, Woong-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.334-338
    • /
    • 2010
  • 컴퓨터 기술의 발달 및 웹의 확산으로 인해 개인이 얻을 수 있는 정보의 양이 증가되었지만, 이로 인해 필요한 관련 정보를 탐색하는 것과 다량의 정보로부터 지식을 창출한다는 것이 어렵게 되었고, 고객 또는 사용자에 대한 학습 과정 및 정보의 개인화 등의 문제가 대두되게 되었다. 이러한 문제들을 해소하기 위해 웹으로부터 정보를 얻을 수 있는 자동화된 툴이 필요하게 되었고, 얻은 정보를 이용하여 웹 사용자들의 패턴을 식별할 수 있는 방법 또한 필요하게 되었다. 이러한 관심은 데이터 마이닝을 온라인에서 적용하고자 하는 노력으로 이어졌고, 현재 데이터 마이닝 기술을 온라인에 적용한 웹 마이닝 기술을 사용하고 있다. 웹 마이닝은 웹의 방대한 양의 자료 및 구조를 좀 더 유용하고, 효율적인 정보로 가공하여 사용자에게 제공할 수 있도록 도와주는 기술이다. 본 논문에서는 웹 마이닝의 전반적인 개념과 분류를 소개한다. 또한, 웹 마이닝의 분류 중 웹 구조 마이닝에 초점을 맞추어 개념 및 웹 구조 마이닝의 대표적인 알고리듬을 소개한다.

  • PDF

A Protein-Structural Information System using on Agent Service-to-Web Service Gateway (에이전트 서비스-웹 서비스 게이트웨이를 이용한 단백질 구조 정보 시스템)

  • 진훈;김인철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.244-246
    • /
    • 2004
  • 최근 들어 정보 시스템들 간에 폭넓게 보급되고 있는 대표적인 서비스 구조들로 에이전트 서비스와 웹 서비스가 있다. 이 두 서비스간의 연동이 가능하다면 더 다양한 형태의 에이전트 서비스와 웹 서비스 응용 시스템들의 개발이 가능하고, 서비스의 가용성도 한층 높아질 것이다. 본 연구에서는 생명과학 연구의 중요한 정보 자원의 하나인 단백질 구조 데이터베이스인 PDB의 가용성을 높이고, 단백질 구조 정보를 이용한 보다 다양한 응용 시스템 개발을 지원하기 위해, 에이전트 서비스-웹 서비스 게이트웨이를 이용한 단백질 구조 정보 시스템 PSIS를 설계하고 구현하였다.

  • PDF

Web Structure Mining Using Web Access Log (웹 접근로그를 활용한 웹 구조 마이닝)

  • Park, C.H.;Lee, S.D.;Jeon, S.H.;Park, H.C.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.393-396
    • /
    • 2006
  • 웹의 급속한 성장으로 정보의 양이 많아졌지만 디자인의 비중이 커지면서 웹 문서에 대한 구조를 추출하는데 어려움이 있다. 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서의 내용을 구조화하여 지속적으로 개선하면서 사용자의 특성과 행동 패턴에 따라 개인화 하여야한다. 이러한 문제를 해결하기 위해서는 웹 문서들 간의 정확한 구조를 추출하는 것이 선행되어야 한다. 본 논문에서는 보다 웹 사이트의 정확한 구조를 추출하기 위한 방법을 제안한다. 제안 방법은 기본적으로 웹문서 태그의 하이퍼링크와 플래시 파일을 2진 형태의 문서로 불러 하이퍼링크를 추출하고 이를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프로 만든다. 하지만 이러한 웹 문서 태그 탐색 시 애플릿이나 스크립트 등에 숨어 있는 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점이 보완되어야 한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가 삭제함으로써 보다 신뢰성 높은 방향 그래프를 만든다.

  • PDF