• Title/Summary/Keyword: 하이퍼링크 학습

Search Result 22, Processing Time 0.052 seconds

Learning User Profile in Information Filtering Systemby Using Hyperlink Information (하이퍼링크 정보를 위한 정보여과 시스템에서의 사용자 프로파일 학습)

  • 박민규;김준태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.66-68
    • /
    • 1999
  • 본 논문에서는 정보여과 시스템에서 웹 페이지를 수집하고 여과하는 과정과 사용자 프로파일을 학습하는 과정에 하이퍼링크 정보를 이용하는 방법을 제안한다. 사용자가 원하는 웹 페이지를 추천하기 위해 사용자 프로파일을 하이퍼링크 정보를 이용해 만들고 사용자의 반응(feedback)에 따라 사용자 프로파일을 조정한다. 가중치 조정에 있어서 학습 효과를 높이기 위해 사용자가 반응을 보인 웹 페이지에서 출발해 링크로 연결된 모든 페이지에 대해 깊이에 따라 가중치를 조정하는 가중치 전파 알고리즘(Weight Propagation Algorithm)을 제안한다. 적은 사용자의 반응으로도 프로파일 내의 많은 페이지에 영향을 줄 수 있어 높은 학습 효과를 기대할 수 있다.

  • PDF

Hypertext Networks Restructure using User Browsing Behaviors on WWW (웹 상에서 사용자 브라우징 행위를 이용한 하이퍼텍스트 네트워크 재구성)

  • 백영태;이세훈
    • Journal of the Korea Computer Industry Society
    • /
    • v.2 no.11
    • /
    • pp.1365-1372
    • /
    • 2001
  • We have suggested three learning rules and implemented an experimental system that automatically restructures hypertext networks according to their user browsing behavior. The system applies link weights to the hypertext networks and updates these weights according to the learning rules. The learning rules are based on how often a particular hyperlink is being traversed and operate on strictly local information of link traversals. Changes in network structure are fed back to users by dynamic link ordering according to descending link weight. This approach is used collaborative filtering and navigation support techniques. The system has been investigation to be able to structure random hypertext networks into valid representations of their user browsing preferences in experiments.

  • PDF

A Hypertext Categorization Method using Incrementally Computable Class Link Information (점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 방법)

  • Oh, Hyo-Jung;Myaeng, Sung-Hyoun
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.7
    • /
    • pp.498-509
    • /
    • 2002
  • As WWW grows at an increasing speed, a classifier targeted at hypertext has become in high demand. While document categorization il quite mature, the issue of utilizing hypertext structure and hyperlinks has been relatively unexplored. In this paper, we propose a practical method for enhancing both the speed and the quality of hypertext categorization using hyerlinks. In comparison against a recently proposed technique that appears to be the only one of the kind, we obtained up to 18.5% of improvement in effectiveness while reducing the processing time dramatically. We attempt to explain through experiments what factors contribute to tile improvement.

A Spam Mail Classification Using Link Structure Analysis (링크구조분석을 이용한 스팸메일 분류)

  • Rhee, Shin-Young;Khil, A-Ra;Kim, Myung-Won
    • Journal of KIISE:Software and Applications
    • /
    • v.34 no.1
    • /
    • pp.30-39
    • /
    • 2007
  • The existing content-based spam mail filtering algorithms have difficulties in filtering spam mails when e-mails contain images but little text. In this thesis we propose an efficient spam mail classification algorithm that utilizes the link structure of e-mails. We compute the number of hyperlinks in an e-mail and the in-link frequencies of the web pages hyperlinked in the e-mail. Using these two features we classify spam mails and legitimate mails based on the decision tree trained for spam mail classification. We also suggest a hybrid system combining three different algorithms by majority voting: the link structure analysis algorithm, a modified link structure analysis algorithm, in which only the host part of the hyperlinked pages of an e-mail is used for link structure analysis, and the content-based method using SVM (support vector machines). The experimental results show that the link structure analysis algorithm slightly outperforms the existing content-based method with the accuracy of 94.8%. Moreover, the hybrid system achieves the accuracy of 97.0%, which is a significant performance improvement over the existing method.

Web based Programming Education System (웹 기반 프로그래밍 교육 시스템의 설계 및 구현)

  • Kim Youngji;Yeum Yong-Cheul;Kim Hyeoncheol;Lee WonGyu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.67-69
    • /
    • 2005
  • 웹을 기반으로 한 프로그래밍 교육 시스템에 관하여 많은 연구가 이루어져 왔으나 대부분의 연구는 강의 노트의 제공 방법, 또는 하이퍼링크 상에서의 효과적인 네비게이션 방법과 같은 원격 교육 시스템에 국한된 내용이었다. 그러나 프로그래밍 교육은 그 특성상 강의노트의 제공 방법이나 하이퍼링크 상에서의 효과적인 네비게이션 방법보다도 많은 양의 과제를 통한 연습 기회의 제공과 각 과제에서의 교수자와 학습자간의 친밀하고 개인적인 상호작용이 학습자의 학업성취도에 더욱 큰 영향을 미친다. 본 논문에서는 원격 교육 시스템의 관점에서 더 나아가 교수자가 학습자에게 많은 양의 과제를 통한 연습의 기회를 부여 할 수 있고 각 과제당 교수자와 학습자간의 상호작용을 극대화할 수 있는 웹 기반 프로그래밍 교육 시스템을 구현하였다. 웹 기반 프로그래밍 교육 시스템은 학습자에게 시간과 장소에 구애됨이 없이 웹 브라우저를 이용하여 프로그램을 코딩하거나 컴파일할 수 있고 SPLINT를 통한 분석결과를 통해 즉시 피드백을 받을 수 있는 환경을 제공한다. 또한 교수자에게 많은 수의 학생들의 과제를 관리하고 교수자의 평가 기준에 의해 한꺼번에 자동으로 평가할 수 있는 환경을 제공하여 준다. 이러한 웹 기반 프로그래밍 교육 시스템은 웹을 이용한 프로그래밍 교육을 면대면 학습에 더욱 가깝게 만들어준다. 현재 웹 기반 프로그래밍 교육시스템은 K대학교 컴퓨터교육과 1학년 재학생들을 대상으로 한 C 프로그래밍 강좌에 사용되고 있다.

  • PDF

Distance Learning System on Hyperlink (하이퍼링크 기반의 원격교육 시스템)

  • Kang, Min-Hye
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.956-961
    • /
    • 2000
  • 지금까지의 웹에서의 학습(실습과목에 대한) 상황은 정지된 이미지를 보고 그에 대한 설명을 학습자가 읽기만 하고 진행되는 시스템이다. 이는 '웹 활용 학습(Web Based Instruction)' 측면에서 볼 때 너무나도 정적이고 학습자 주도적이지 못한 학습 진행 상황이다. 따라서, 학습자의 성취도 또한 낮았다. 이러한 배경을 토대로 인터넷상에서의 실습 과목에 대한 학습진행 상황을 실제 상황과 똑같이 진행될 수 있도록 설계하였다. 진행 상황 화면을 하나씩 캡춰하여 그 이미지에 대한 이벤트 처리를 HTML과 DHTML, JavaScript를 통하여 구현하였다. 이로써, 학습자가 자신의 시스템에 프로그램이 설치되어있지 않아도, 또한 장소를 가리지 않고 인터넷에 접속하여 자기 주도적이고 동적인 학습을 진행할 수 있도록 하였다.

  • PDF

Web Information Search Using Reinforcement Learning (강화학습을 이용한 웹 정보 검색)

  • 정태진;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.94-96
    • /
    • 2001
  • 현재 인터넷상에서 제공되고 있는 대부분의 서치엔진들은 정보소스에 접근해서 이를 가져오는 웹 로봇(webbot)이라고 불리우는 에이전트를 이용한다. 그런데 이런 웹 로봇들이 웹 문서를 검색하는 방법은 극히 단순하다. 물론 많은 정보를 가지고 오는 것에 초점이 맞추어져 있어서 정확도를 중시하지 않는 것에도 한 원인이 있다. 범용 검색엔진과는 달리 검색하는 영역을 축소하여 특정 주제에 관련된 정보만을 더 정확히 찾아주는 검색엔진의 필요성이 증가하고 있다. 이에 본 논문에서는 강화 학습 방법을 이용하여 웹 상에 존재하는 정보 중에서 특정 주제의 웹 페이지를 보다 더 정확히 찾는 방법을 제시한다. 강화 학습은 웹 상의 하이퍼링크를 따라가는 문제에 있어서 미래에 이로움을 주는 행동의 효용성을 측정하는데 있어서 이점을 보인다. 강화 학습을 이용하여 제시된 방법을 통한 실험에서는 일반적인 방법보다 더 적은 링크를 따라가고도 더 정확한 결과를 보였다.

  • PDF

Performance Improvement of Web Document Classification through Incorporation of Feature Selection and Weighting (특징선택과 특징가중의 융합을 통한 웹문서분류 성능의 개선)

  • Lee, Ah-Ram;Kim, Han-Joon;Man, Xuan
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.13 no.4
    • /
    • pp.141-148
    • /
    • 2013
  • Automated classification systems which utilize machine learning develops classification models through learning process, and then classify unknown data into predefined set of categories according to the model. The performance of machine learning-based classification systems relies greatly upon the quality of features composing classification models. For textual data, we can use their word terms and structure information in order to generate the set of features. Particularly, in order to extract feature from Web documents, we need to analyze tag and hyperlink information. Recent studies on Web document classification focus on feature engineering technology other than machine learning algorithms themselves. Thus this paper proposes a novel method of incorporating feature selection and weighting which can improves classification models effectively. Through extensive experiments using Web-KB document collections, the proposed method outperforms conventional ones.

Improving Hypertext Classification Systems through WordNet-based Feature Abstraction (워드넷 기반 특징 추상화를 통한 웹문서 자동분류시스템의 성능향상)

  • Roh, Jun-Ho;Kim, Han-Joon;Chang, Jae-Young
    • The Journal of Society for e-Business Studies
    • /
    • v.18 no.2
    • /
    • pp.95-110
    • /
    • 2013
  • This paper presents a novel feature engineering technique that can improve the conventional machine learning-based text classification systems. The proposed method extends the initial set of features by using hyperlink relationships in order to effectively categorize hypertext web documents. Web documents are connected to each other through hyperlinks, and in many cases hyperlinks exist among highly related documents. Such hyperlink relationships can be used to enhance the quality of features which consist of classification models. The basic idea of the proposed method is to generate a sort of ed concept feature which consists of a few raw feature words; for this, the method computes the semantic similarity between a target document and its neighbor documents by utilizing hierarchical relationships in the WordNet ontology. In developing classification models, the ed concept features are equated with other raw features, and they can play a great role in developing more accurate classification models. Through the extensive experiments with the Web-KB test collection, we prove that the proposed methods outperform the conventional ones.

A Hyperlink-based Feature Weighting Technique for Web Document Classification (웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법)

  • Lee, A-Ram;Kim, Han-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다