• 제목/요약/키워드: Web data mining

검색결과 407건 처리시간 0.03초

웹기반 교육에서 학습자별 학습현황 분석에 관한 연구 (The Analysis of Individual Learning Status on Web-Based Instruction)

  • 신지연;정옥란;조동섭
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.107-120
    • /
    • 2003
  • 웹기반 교육에서 학습과정을 평가한다는 것은 개별 학습자들의 학습 활동을 평가하는 것을 의미하기 때문에 학습자의 특정 수업내용에 대한 학습 시간, 학습 패턴, 학습 참여도(의견 교환, 질문), 학습 환경 등의 정보가 요구된다. 본 연구의 목적은 웹 기반 교육에서 쟁점이 되고 있는 학습과정 평가문제를 해결하기 위해 최적의 웹 로그 마이닝을 이용하여 학습자 개인별 학습현황에 관한 정보를 얻어 이를 수행 평가에 반영하고자 함이다. 연구 내용 및 결과로는 먼저, 학습현황 분석을 위한 항목을 선정하고 웹 로그 마이닝을 위한 로그 데이터 전처리 과정을 실행하였다. 다음으로는, 위의 웹 로그 데이터를 기초로 학습자별 데이터베이스를 구축하고 질의어를 사용하여 학습현황을 분석하였다.

  • PDF

스퀀스 연관규칙을 이용한 개인화 웹 마이닝 설계 (Design of a Personalized Web Mining System Using a Sequence Association Rule)

  • 윤종찬;윤성대
    • 한국멀티미디어학회논문지
    • /
    • 제10권9호
    • /
    • pp.1106-1116
    • /
    • 2007
  • 최근 들어 웹을 이용한 e-Commerce의 거래는 그 크기나 복잡도면에서 급속도로 확산되고 있다. 그러므로 웹사이트의 설계나 웹 서버 설계 등이 복잡해지고 있다. 또한 웹 사용자가 많은 웹 이동경로를 이용하기 때문에 웹 사용자에 대한 데이터를 분석하는 일이 쉽지 않다. 기존 논문에서는 연관 규칙 탐사는 항목들간의 상관성을 찾아내는 것으로 기존의 연관 규칙 탐사 알고리즘들은 상관성이 높은 모든 항목들을 찾아낸다. 그러나 사용자들은 종종 자신이 관심 있는 연관 규칙들만을 찾길 원한다. 하지만 기존의 알고리즘을 그대로 사용하여 찾아낸 모든 연관 규칙들 중에서 원하는 규칙들만을 찾아내는 것은 매우 비효율적이다. 본 논문에서는 웹 사용자의 이동경로의 사용자 패턴을 데이터마이닝 기법 중 하나인 연관규칙을 이용하여 사용자에게 맞는 이동경로를 구한 후 모든 경로를 이어주기 위해 시차 연관규칙을 이용하여 각 노드들을 이어주는 시스템을 제안한다. 제안한 시스템은 시차 연관규칙 기법을 통해 웹 사용자의 이동 경로를 사용자의 특성에 맞는 개인화 또는 고객 세분화된 사이트를 구축 가능하게 제안한다.

  • PDF

Mining Parallel Text from the Web based on Sentence Alignment

  • Li, Bo;Liu, Juan;Zhu, Huili
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.285-292
    • /
    • 2007
  • The parallel corpus is an important resource in the research field of data-driven natural language processing, but there are only a few parallel corpora publicly available nowadays, mostly due to the high labor force needed to construct this kind of resource. A novel strategy is brought out to automatically fetch parallel text from the web in this paper, which may help to solve the problem of the lack of parallel corpora with high quality. The system we develop first downloads the web pages from certain hosts. Then candidate parallel page pairs are prepared from the page set based on the outer features of the web pages. The candidate page pairs are evaluated in the last step in which the sentences in the candidate web page pairs are extracted and aligned first, and then the similarity of the two web pages is evaluate based on the similarities of the aligned sentences. The experiments towards a multilingual web site show the satisfactory performance of the system.

  • PDF

빈발 패턴 트리 기반 XML 스트림 마이닝 (Frequent Patten Tree based XML Stream Mining)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.673-682
    • /
    • 2009
  • 웹상에서 데이터 교환과 표현을 위한 표준으로 XML 데이터가 널리 사용되고 있으며 유비쿼터스 환경에서 XML 데이터의 형태는 연속적이다. 이와 관련하여 XML 스트림 데이터에 대한 빈발 구조 추출 및 효율적인 질의처리를 위한 마이닝 방법들이 연구되고 있다. 이 논문에서는 슬라이딩 윈도우 기반으로 하여 XML 스트림 데이터로부터 최근 윈도우 범위에 속하는 데이터에 대한 빈발 패턴 구조를 추출하기 위한 마이닝방법을 제안한다. 제안된 방법은 XML 스트림 데이터를 트리집합 모델, XFP_tree로 표현하고 이를 이용하여 최근의 데이터에 대한 빈발구조 패턴을 빠르게 추출한다.

웹 사용 정보에 기반한 다중 성향 키워드 모델의 설계와 응용 (Design and Application of Multi Concept Keyword Model based on Web-using Information)

  • 윤태복;이승훈;윤광호;이지형
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.95-105
    • /
    • 2009
  • 웹의 방대한 데이터에서 사용자에게 유용한 정보를 제공하기 위하여 다양한 연구가 시도되고 있다. 그 중에서 웹 사용 마이닝은 웹 사용자의 로그 정보를 기반으로 의미 있는 패턴을 추출하는 방법이다. 하지만 기존의 웹 사용 마이닝을 이용한 패턴 추출에는 사용자들의 다양한 성향을 고려하지 않은 개별적인 모델을 생성하는데 주를 이루고 있다. 웹에서 사용된 사용자들의 검색 키워드는 그들의 검색 의도나 배경지식에 따라 다양한 의미를 가질 수 있고, 그런 개개인의 검색의도에 맞는 검색 서비스가 제공할 수 있는 기술이 요구된다. 본 논문은 사용자 검색 키워드에 대한 웹 페이지 사용 행위 정보 및 방문한 웹 페이지 리스트를 수집하고 분석하여 다중 성향 키워드 모델(Multi Concept Keyword Model : MCK-Model)을 생성한다. MCK-Model은 사용자들이 특정 키워드를 이용하여 검색 후 방문한 웹 페이지 리스트를 통합하여 생성한 것으로, 사용자들이 검색 키워드에 대해 가지고 있는 다양한 검색 의도에 따라 방문하는 웹 페이지의 정보를 포함하고 있다. 생성된 MCK-Model은 웹 페이지 추천을 위하여 유용하게 사용할 수 있으며, 실험을 통하여 제안하는 방법의 유효함을 확인하였다.

  • PDF

웹 클릭 스트림의 효율적 분석을 위한 시간 간격 제한을 활용한 관심 순차패턴 탐색 (Mining Interesting Sequential Pattern with a Time-interval Constraint for Efficient Analyzing a Web-Click Stream)

  • 장중혁
    • 한국산업정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.19-29
    • /
    • 2011
  • 웹 관련 기술의 발달 및 스마트폰과 같은 지능형 모바일 서비스 기기의 사용 증가로 인해 오늘날 많은 분야에서 다양한 웹기반 서비스들이 널리 활용되고 있다 이러한 환정에서 개인화 및 지능화된 웹 서비스를 제공하기 위한 연구들이 활발히 진행되고 있으며, 웹 서비스 이용 기록으로부터 생성되는 웹 클릭 스트림에 대한 분석 기술은 관련 기술 중 핵심 기술의 하나이다. 본 논문에서는 순차정보 형태로 발생되는 웹 클릭 스트림에 대한 효율적 분석을 위해서 데이터 스트림 처리에 대한 기본적인 요구사항을 만족하면서 정제된 결과를 얻기 위한 순차패턴 마이닝 방법을 제시한다. 이를 위해서 먼저 순차패턴에 포함되는 단위항목들의 단순 발생 순서뿐만 아니라 발생 시간 정보를 추가로 활용하는 시간 간격 제한 관심 순차패턴을 정의하고, 이어서 웹 클릭 스트림과 같은 데이터 스트림에서 이를 효율적으로 탐색하기 위한 마이닝 방법을 제안한다. 해당 연구 결과는 웹 클릭 스트림뿐만 아니라 전자상거래, 생물정보학 및 USN 환경 등과 같이 데이터 스트림 형태로 정보를 발생시키는 여러 컴퓨터 용용 분야에서 유용하게 활용될 수 있을 것이다.

정보검색에서 웹마이닝을 이용한 동적인 질의확장에 관한 연구 (A Study on Dynamic Query Expansion Using Web Mining in Information Retrieval)

  • 황인수
    • Journal of Information Technology Applications and Management
    • /
    • 제11권2호
    • /
    • pp.227-237
    • /
    • 2004
  • While the WWW offers an incredibly rich base of information, organized as a hypertext, it does not provide a uniform and efficient way to retrieve specific information. When one tries to find information entering several query terms into a search engine, the highly-ranked pages in the result usually contain many irrelevant or useless pages. The problem is that single-term queries do not contain sufficient information to specify exactly which web pages are needed by the user. The purpose of this paper is to describe the employment of association rules in data mining for developing networks and computing associative coefficient among the terms. And this paper shows how the dynamic query expansion and/or reduction can be performed in information retrieval.

  • PDF

인터넷 설문조사의 방법론적인 문제점과 데이터마이닝 기법을 활용한 개인화된 인터넷설문조사 시스템의 구축 (Methodological Issues in Internet Survey and Development of Personalized Internet Survey System Using Data Mining Techniques)

  • 김광용;김기수
    • 품질경영학회지
    • /
    • 제32권2호
    • /
    • pp.93-108
    • /
    • 2004
  • The purpose of this research is to summarize the methodological issues in internet survey and to suggest personalized internet survey system using data mining technique for enhancing the survey quality of internet survey as well as utilizing the benefit of interactive multimedia factors of internet survey. The data mining technique used in this paper is Case Based Reasoning for adopting individual design preference affecting survey quality. For achieving the research purpose, two surveys, pre & post survey, were performed. Pre survey was done for implementing CBR database to find individual index affecting survey quality and post survey was used for measuring the peformance of personalized internet survey system. The result shows that the survey quality of personalized web survey system is better than generalized web survey system.

Design and Implementation of an Interestingness Analysis System for Web Personalizatoion & Customization

  • Jung, Youn-Hong;Kim, I-I;Park, Kyoo-seok
    • 한국멀티미디어학회논문지
    • /
    • 제6권4호
    • /
    • pp.707-713
    • /
    • 2003
  • Convenience and promptness of the internet have been not only making the electronic commerce grow rapidly in case of website, analyzing a navigation pattern of the users has been also making personalization and customization techniques develop rapidly for providing service accordant to individual interestingness. Web personalization and customization skill has been utilizing various methods, such as web log mining to use web log data and web mining to use the transaction of users etc, especially e-CRM analyzing a navigation pattern of the users. In this paper, We measure exact duration time of the users in web page and web site, compute weight about duration time each page, and propose a way to comprehend e-loyalty through the computed weight.

  • PDF

웹 데이터에서의 사용자 탐색 패턴 발견 및 추천 (Discovery and Recommendation of User Search Patterns from Web Data)

  • 구흠모;양재영;홍광희;최중민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.287-296
    • /
    • 2002
  • 웹 사용 마이닝은 데이터마이닝을 바탕으로 사용자의 로그 파일 정보를 이용하여 웹이 이용되는 패턴을 발견한다. 이를 이용하여 웹을 개선하여 사용자들이 보다 빨리 원하는 내용을 검색할 수 있도록 할 수 있으며 시스템 관리자에게는 효율적인 웹 구조를 인한 정보를 제공할 수 있다. 웹 사용 마이닝에서 사용하는 데이터는 성형화되어 있지 않으며 웹 사용 패턴을 분석하는데 방해가 되는 잡음 데이터까지 포함하고 있다. 이것은 기존에 개발된 여러 데이터마이닝 기법을 적용하는데 어려움으로 작용한다. 이러한 어려움을 해결하기 위해 본 논문에서는 새로운 방법을 도입한 SPMiner을 .제안한다. SPMiner는 웹의 구조를 이용하여 로그 파일의 전처리 과정을 줄이며 사용자의 탐색 패턴 분석을 효율적으로 수행 할 수 있는 시스템이다. SPMiner는 WebTree 에이전트를 이용하여 웹 사이트 구조를 분석하여 WebTree를 생성하고 사용자 로그 파일을 분석하여 각 웹 페이지의 사용빈도에 대한 정보를 추출한다. WebTree와 로그 파일에서 추출된 웹 페이지에 대한 정보는 SPMiner에 의해 패턴을 분석할 퍼 이용될 수 있는 형태인 WebTree$^{+}$로 병합된다 WebTree$^{+}$는 패턴 발견을 쉽게 해주며 사용자에게 추천할 정보나 웹 페이지를 능동적으로 추천할 수 있게 만들어 준다.

  • PDF