• Title/Summary/Keyword: 웹 링크 분석

Search Result 133, Processing Time 0.023 seconds

The Implementation of the Web Service for the Conversion of Speech-Recognition Web Page (음성인식용 웹페이지 변환을 위한 웹서비스 구현)

  • Oh, Jee-Young;Kim, Yoon-Joong
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.8
    • /
    • pp.1162-1169
    • /
    • 2004
  • This paper implemented the web service that converts general web page to the web page using the speech recognition and the web service consumer that provides speech recognition service for the web page. This system has the web service consumer, the web service provider that converts the web page and the web service provider that provides speech recognition. The web service provider that converts the web page analyzes general web page by using the regular expression and converts it to the speech-recognition web page. The speech recognizer is the web service providers that implemented in the previous study. As a result of experiment, we show that this system changes web page by analyzing tags and extracts hyperlink.

  • PDF

A Structure Analysis Agent for Extraction, Storage and Visualization of Web Sites (웹사이트의 구조주출, 저장 및 가시화를 위한 구조분석 에이전트)

  • 정윤경;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.313-315
    • /
    • 2001
  • 인터넷 비즈니스 사이트가 많아짐에 따라 사용자에게 편리한 비즈니스 사이트를 구추하기위해 웹서버의 구조 및 내용을 평가하고 재구성해야 하는데, 수작업에 의한 웹문서의 평가시 인적, 시간적 비용이 높고 시스템에 대한 평가값이 객관적이지 못하다. 이를 해결하기 위해 본 논문에서는 구조추출, 구조저장, 구조가시화로 구성된 웹문서의 구조분석 에이전트를 제안한다. 구조추출 모듈은 URL로 웹문서를 받고 이를 잘정의된 XML형태로 변환한 후, 태그정보를 이용하여 웹문서의 구조를 구하고, 하이퍼링크데이터를 이용하여 웹문서간의 연결구조를 얻는다. 구조저장은 추출된 웹문서와 웹문서 연결관계를 웹서버와 같이 연결하여 저장하며, 구조 가시화에서 이를 계층적으로나 그래프형식으로 가시화된다. 제안한 시스템의 유용성을 보이기 위하여 웹문서의 평가문제에 적용한 결과, 많은 양의 데이터를 의 데이터의 기술적인 평가가 가능하고, 데이터를 수집하기 위한 인력자원, 시간과 비용을 줄일수 있으며, 쉽게 사이트를 평가하여 서비스 수준을 향상 시킬 수 있음을 알 수 있었다.

  • PDF

Improving the Performance of Web Search using Query Types (질의유형에 기반한 웹 검색의 성능 향상)

  • Kang, In-Ho;An, Dong-Un
    • The KIPS Transactions:PartB
    • /
    • v.11B no.5
    • /
    • pp.537-544
    • /
    • 2004
  • The Web is rich with various sources of information. Due to the massive and heterogeneous web document collections, users want to find various types of target pages. Each type of information for Web search has designated queries. If a user query is not a designated query, then we cannot have good result documents. Different strategies are needed to utilize the goodness of each type of information for a search engine. If we know the property of information, then we can refine candidate pages and rank them delicately. Various experiments are conducted to show the properties of each type of information. Therefore, we show an appropriate combining formula to utilize the properties of each type of information. In addition, for a service finding task, we propose Service Link Information that utilizes the existence of mechanisms for a user interaction.

Efficient Design of Web Searching Robot Engine Using Distributed Processing Method with Javascript Function (자바스크립트 함수처리 기능을 포함한 분산처리 방식의 웹 수집 로봇의 설계)

  • Kim, Dae-Yu;Kim, Jung-Tae
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.13 no.12
    • /
    • pp.2595-2602
    • /
    • 2009
  • In this paper, we proposed and implemented web robot using active script engine with internet explore to process javascript function link, which is not processing in conventional web searching robot. This web searching robot is developed to measure collecting amount of web searching robot with processing of javascript function link. We analysed the architecture of web searching robot with google and naybot to develope web searching robot, implemented element of configuration applicable to searching robot and designed with distributed processing type. In addition to, we estimated the proposed web robot employing javascript processing model and analysed the comparison of collecting amount of web site board using javascript. We obtained the result of 1,000 web page collecting compared to conventional method in case of 1,000 web site board.

An Experimental Study of Cocitation Analysis on Web Information (웹 정보원의 동시인용분석에 관한 실험적 연구)

  • 정동열;최윤미
    • Journal of the Korean Society for information Management
    • /
    • v.16 no.2
    • /
    • pp.7-26
    • /
    • 1999
  • This experimental study examines informetric analysis of World Wide Web based upon cocitation analysis of Web pages and features of Web resources in the field of communication studies. Cocitation analysis is basically performed to examine the intellectual structure of the communication studies in reflecting link count on the Web. The selected Web resources in the field are mapped in two dimensions based upon the similarities of cocitation frequency, correlation matrix, mutidimensional scale and cluster analysis. Cocitation analysis methods using organizational homepage, personal homepage, or Web index, to Web produced clustering of Web resources that had topical similarities. So far, although informetric analysis of Web resources is in the preliminary stage, it shows that Web can be a new tool for indicating the intellectual structure of a specific research field. In addition, this study analyzes characteristics of printing resources and Web resources, and differences of research methods in applying cocitation analysis.

  • PDF

Extending Bibliographic Information Using Linked Data (링크드 데이터 방식을 통한 서지 정보의 확장에 관한 연구)

  • Park, Zi-Young
    • Journal of the Korean Society for information Management
    • /
    • v.29 no.1
    • /
    • pp.231-251
    • /
    • 2012
  • In this study, Linked Data was used for extending bibliographic data, because Linked Data provides shareable identifiers, data structures, and link information. Linked Data is especially efficient in expanding bibliographic data integrated with bibliographic ontology. Therefore, Linked Data and bibliographic ontologies were analyzed and available Linked Data was suggested. By linking between meta-data schemes, bibliographic data, and authority data, issues for the effective Linked Data sharing were suggested: 1) selecting proper Linked Data for each bibliographic organization, 2) linking between different Linked Data, and 3) developing their own Linked Data for each bibliographic organization.

Implementation of Anti-Porn Spam System based on Hyperlink Analysis Technique's of the Web Robot Agent (웹 로봇 에이전트의 하이퍼링크 분석기법을 이용한 음란메일 차단 시스템의 구현)

  • Lee, Seung-Man;Jung, Hui-Sok;Han, Sang;Song, Woo-Seok;Lee, Do-Han;Hong, Ji-Young;Ban, Eui-Hwan;Yang, Joon-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.332-335
    • /
    • 2007
  • 이메일은 누구나 쉽게 정보를 교환할 수 있는 편리함 때문에 인터넷에서 가장 중요한 수단으로 사용되고 있다. 그러나 순수한 의사소통의 수단이 아닌 스팸메일의 범람은 성인뿐만 아니라, 어린이 청소년에게도 무차별적으로 전송됨으로써 심각한 부작용을 낳고 있다. 본 논문은 점차 지능화 되는 신 유형의 음란 스팸메일로부터 청소년을 보호하기 위하여 새로운 방법의 음란메일 차단시스템을 제안하고자 한다. 기존의 스팸메일 차단시스템은 사용자가 직접 음란한 메일이라고 판단되는 메일에 대해 일일이 키워드를 설정하거나, 메일 내용 중에 텍스트만을 추출하여 패턴 매칭방법으로 분류하는 것이 대부분이었지만, 본 논문은 기존 방법의 문제점을 해결하기 위하여 이미지 내 Skin-Color분포의 Human Detection 알고리즘과 웹 로봇 에이전트의 하이퍼링크 분석기법을 사용하였다. 성능 측정결과, 형태소 분석과 Human Detection 알고리즘을 병합하여 적용한 경우 성능 측정에서 90% 정도의 F-measure를 보였지만, 추가적으로 웹 로봇 에이전트의 하이퍼링크 분석기법을 병합하여 적용한 경우 97% 이상의 F-measure를 보이며, 신뢰성이 높은 음란스팸메일 차단 시스템을 구현할 수 있다는 것을 증명하였다.

  • PDF

Analysis of Preference Criteria for Personalized Web Search (개인화된 웹 검색을 위한 선호 기준 분석)

  • Lee, Soo-Jung
    • The Journal of Korean Association of Computer Education
    • /
    • v.13 no.1
    • /
    • pp.45-52
    • /
    • 2010
  • With rapid increase in the number of web documents, the problem of information overload in Internet search is growing seriously. In order to improve web search results, previous research studies employed user queries/preferred words and the number of links in the web documents. In this study, performance of the search results exploiting these two criteria is examined and other preference criteria for web documents are analyzed. Experimental results show that personalized web search results employing queries and preferred words yield up to 1.7 times better performance over the current search engine and that the search results using the number of links gives up to 1.3 times better performance. Although it is found that the first of the user's preference criteria for web documents is the contents of the document, readability and images in the document are also given a large weight. Therefore, performance of web search personalization algorithms will be greatly improved if they incorporate objective data reflecting each user's characteristics in addition to the number of queries and preferred words.

  • PDF

Web Log Mining for Adaptive Web Sites (적응형 웹 사이트를 위한 웹 로그 마이닝)

  • Ko, Kyong-Ja;Kim, In-Cheol
    • Annual Conference of KIPS
    • /
    • 2001.04a
    • /
    • pp.325-328
    • /
    • 2001
  • 본 논문에서는 웹 사이트에 접근하는 이용자의 패턴을 분석하여 정보 제공이 보다 용이한 구조로 자동 개선시켜 나가는 적응형 웹 사이트의 구현 방안을 제시한다. 특히, 본 연구에서는 기존 웹 사이트의 구조를 가능한 파괴하지 않는 범위 내에서 웹 사이트론 변경하고자 이용자의 접근 패턴상 연관성은 높으나 접근 경로가 긴 문서들을 추출하여 색인 페이지를 추가 생성한다. 이를 위하여, 먼저 대용량의 웹 서버 로그 데이터를 대상으로 하이퍼 링크 구조에 따라 필터링된 최후 전진 문서만을 가지고 데이터 시퀀스를 구성한다. 이러한 데이터 시퀀스에 새로운 순차 접근 패턴 탐색 알고리즘인 TPA를 적용함으로써 웹 문서간 충분한 지지도를 갖는 연관성 있는 문서들의 시퀀스를 구한다. 이와같은 빈발 시퀀스들에 대한 색인 페이지를 추가로 생성시켜주는 서비스를 통하여 이용자들의 효과적인 정보 접근을 지원할 수 있는 웹 사이트로의 변경이 가능하다.

  • PDF

A Study on the Management and Services of Web Resources in Policy Research Institutes (정책연구기관의 웹자원 관리와 서비스 제공 방안에 관한 연구)

  • Lee, Myeong-Hee
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.27 no.2
    • /
    • pp.171-191
    • /
    • 2016
  • This research was examined to evaluate whether the websites of 6 policy research institutes provide web resources which were collected and provided as information resources, and that they were sure that the web resources had value as policy information by content analysis method. Web resources provided as policy information in policy research institutes were classified into and evaluated by 4 categories. Evaluation had been conducted on 10 items in the 4 categories of content, design, accessibility and meta data. From the result, the information content have been found to be reliable and up-to-date although more thorough description is required. Navigation and the search function in the design category were found to be excellent, but dead links were present in all of the institutions. The accessibility was proven to be great as it was able to access information with only three clicks. However, it has been found that a comprehensive review of the meta data is required in order to improve the accuracy of search functions. In conclusion, improvements to the dead link problems, quality control of the meta data, systematic and professional management plan of policy research information, and the establishment of a comprehensive policy research information portal system have been proposed.