• 제목/요약/키워드: Web-page

검색결과 675건 처리시간 0.024초

웹 기반 공동작업을 위한 다중 프로토콜 인터페이스 방법의 구현 (Implementation of Multi-Protocol Interface for Web-based Collaborative Service)

  • 이은령;김지용;설동명;김두현;임기욱
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.340-351
    • /
    • 2003
  • 본 논문에서는 웹 페이지상에서 하이퍼링크를 사용하여 정적인 정보를 검색하는 것뿐만 아니라 인적 자원과의 연결로 그 범위를 넓혀주는 Page Together 시스템의 구현에 대한 개발 경험 및 이 시스템을 기반으로 한 시범 사이트를 소개하고자 한다. 이 시스템은 인터넷 사용자들이 웹 상에서 다른 사용자들과 만나 영상 및 음성 통화를 하면서, 같은 웹 페이지를 동시에 서핑 할 수도 있고 여러 가지 공동작업도 할 수 있도록 지원한다. 시스템 구성을 살펴보면 공동 브라우징 모듈 및 멀티미디어 회의 모듈, 데이터 회의 모듈, 다중 프로토콜 인터페이스(MPI)로 구성되며 , 각 모듈은 인터넷상에서의 표준 프로토콜을 채택함으로써 개발자들에게 범용성을 제공하고 있다 MPI는 각각 독립적으로 동작하는 모듈들간에 세션에 대한 정보를 일치시키기 위해 정의하였다 MPI를 통한 메시지 전송은 세션 연결 과정 및 세션 종료 단계에서 최소화 함으로써 각 모듈간의 의존성을 낮추었다. 또한 Page Together 시스템을 이용하여 웹 게시판 서비스를 제공하는 웹 사이트를 함께 소개하고있다. 어떤 사용자가 자신의 관심분야에 대한 게시물을 게재할 때 자신에게 연결되는 링크를 함께 게재하여 둔다. 게시물을 읽은 다른 사용자가 질문이 있을 경우 그 링크를 선택함으로써 게시자와 직접 통화를 하거나 의견을 나눌 수 있다 웹 사이트를 통하여 Page Together 시스템은 원격 교육 및 원격 회의 등의 다양한 인터넷서비스에 활용할 수 있다는 것을 확인할 수 있다.

  • PDF

웹페이지 분석을 위한 딥러닝 모델 학습과 구현에 관한 연구 (Research on Training and Implementation of Deep Learning Models for Web Page Analysis)

  • 김정환;조재원;김진산;이한진
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.517-524
    • /
    • 2024
  • 본 연구는 ChatGPT 서비스의 개시 이후 인공지능 혁명이라 일컬어지는 시대적 배경 속에서, 웹사이트의 제작과 인공지능의 융합을 위해 딥러닝 모델을 학습 및 구현하고자 한다. 딥러닝 모델은 수집한 3,000개의 웹페이지 이미지를 구성요소와 레이아웃 분류체계 기반의 데이터 가공을 통해 학습하였으며, 다음과 같은 세 가지 단계로 구분하여 진행하였다. 첫째, 인공지능 모델에 관한 선행연구를 조사하여 구현하고자 하는 모델에 가장 적합한 알고리즘을 선택하였다. 둘째, 적합한 웹페이지 및 단락 이미지를 수집하고 분류 및 가공하였다. 셋째, 딥러닝 모델을 학습시키고 서빙 인터페이스를 연동해 모델의 실제 결과를 확인하였다. 이렇게 구현된 모델은 실제 웹페이지를 구성하는 복수의 단락을 탐지하고, 단락별 규모, 요소, 특징을 분석하여 분류체계를 기반으로 의미 있는 데이터를 도출할 것이다. 이 과정은 점차 발전하여 웹페이지를 보다 정밀하게 분석할 수 있게 될 것이다. 그리고 정밀 분석기법을 역으로 설계하여, 인공지능이 완벽한 웹페이지를 자동으로 생성할 수 있는 연구의 초석이 될 것으로 기대한다.

Main Content Extraction from Web Pages Based on Node Characteristics

  • Liu, Qingtang;Shao, Mingbo;Wu, Linjing;Zhao, Gang;Fan, Guilin;Li, Jun
    • Journal of Computing Science and Engineering
    • /
    • 제11권2호
    • /
    • pp.39-48
    • /
    • 2017
  • Main content extraction of web pages is widely used in search engines, web content aggregation and mobile Internet browsing. However, a mass of irrelevant information such as advertisement, irrelevant navigation and trash information is included in web pages. Such irrelevant information reduces the efficiency of web content processing in content-based applications. The purpose of this paper is to propose an automatic main content extraction method of web pages. In this method, we use two indicators to describe characteristics of web pages: text density and hyperlink density. According to continuous distribution of similar content on a page, we use an estimation algorithm to judge if a node is a content node or a noisy node based on characteristics of the node and neighboring nodes. This algorithm enables us to filter advertisement nodes and irrelevant navigation. Experimental results on 10 news websites revealed that our algorithm could achieve a 96.34% average acceptable rate.

웹2.0의 동영상 UCC 서비스현황과 소비자 참여 (Multimedia UCC Services as a Web 2.0 and Consumer Participation)

  • 김연정;박선영
    • 가정과삶의질연구
    • /
    • 제26권1호
    • /
    • pp.95-105
    • /
    • 2008
  • This paper identifies current status and key determinants of participation in multimedia UCC as a web2.0 paradigm. Significant factors composed of IT digital convergence environments and young generation's value, attitude to connecting to web (human relation, visual expressionism, arousal, et al). This paper analyze multimedia UCC service status & current status of participation level of UCC users. The research implemented to analysis customer click streaming data (inter-temporary page-view, unique user)of small-mid multimedia UCC Company and to 2nd data(ww.rankey.com) for page-view and unique user to participation tendency by age and sex about total participation amount of multimedia UCC. In case of young generation be familiar with new internet service, Internet web space meaning important information seeking media and 1 person media able to connect to new web network as prosumer. In UCC centered internet business, web based customers implemented the role of prosumer as generate web contents and consuming to net-working.

웹 탐색 성능 향상을 위한 강화학습 이용과 기준 페이지 선택 기법 (The Use of Reinforcement Learning and The Reference Page Selection Method to improve Web Spidering Performance)

  • 이기철;이선애
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.331-340
    • /
    • 2002
  • 웹의 세계는 하루가 다르게 확장되고 있다. 이에 따라, 지능형 정보추출 기능이 없다면 우리는 넘쳐나는 데이터 앞에서 더욱 무기력해 질 수밖에 없다. 범용 탐색 엔진을 위한 기존의 웹 검색 기법은 특정 영역이나 특정 키워드에만 집중해야하는 특정 검색 엔진에는 너무 느린 경향이 있다. 본 논문에서는 웹 검색 능력을 개선하는 새 모델을 제시하고 실험하였다. 특정 영역과 관련된 초기의 관련 웹 페이지 집합에서 적절한 웹 페이지들을 선택하는 문제는 웹 검색 속도를 향상시키기 위해 매우 중요할 수 있다. 기준 웹 페이지 선택 기법 DOPS는 선택된 웹 페이지들이 가능한 한 직교성을 갖도록 동적으로 웹 페이지를 선택한다. 또한 새로 정의된 메져를 이용하여 적합한 기준 페이지들의 수도 결정해줄 수 있다. 매우 특화된 영역에 대한 실험을 통해서도, 본 방법은 거의 전문가 수준에 가까이 동작하였다. 전문가들이 초대형 초기 페이지 집합에 대해 일할 수 없다는 점과 그들도 기준 페이지 수의 최적치를 결정하기에 어려움을 느낀 다는 점을 고려하면, 본 방법은 매우 유망하다 할 수 있다. 또한 웹 환경에 강화학습도 적용하도록 하였고, DOPS에 기반을 둔 강화학습 실험을 통해 본 방법이 하이퍼링크 수나 시간 면에서 매우 양호한 결과를 보임을 알 수 있었다.

  • PDF

태그 경로 및 텍스트 출현 빈도를 이용한 HTML 본문 추출 (HTML Text Extraction Using Tag Path and Text Appearance Frequency)

  • 김진환;김은경
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1709-1715
    • /
    • 2021
  • 웹 페이지에서 필요한 텍스트를 정확하게 추출하기 위해 본문이 존재하는 곳의 태그와 스타일 속성을 웹 크롤러에 명시하는 방법은 웹 페이지 구성이 변경될 때마다 본문을 추출하는 로직을 수정해야 하는 문제가 있다. 이러한 문제점을 해결하기 위해 이전 연구에서 제안한 텍스트의 출현 빈도를 분석하여 본문을 추출하는 방법은 웹 페이지의 수집 채널에 따라 성능 편차가 크다는 한계점이 있었다. 따라서 본 논문에서는 텍스트의 출현 빈도뿐만 아니라 웹 페이지의 DOM 트리로부터 추출된 텍스트 노드의 부모 태그 경로를 분석하여 다양한 수집 채널에서 높은 정확도로 본문을 추출하는 방법을 제안하였다.

웹서비스를 위한 모바일 웹 컨텐츠 변환 시스템 개발 (A development of the Conversion System of Mobile Web Contents for the Web Service)

  • 황인숙;김윤중;김승연
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.517-520
    • /
    • 2003
  • 본 논문에서는 XML Page로부터 닷넷 모바일 Web Page로의 변환 기능을 제공하는 웹서비스 프로바이더를 설계ㆍ구현하였다. 웹서비스 프로바이더는 플랫폼과 프로그래밍언어의 제약 없이 누구나 사용 가능하다는 장점을 가지고 있다. 본 논문에서 구현한 웹서비스 프로바이더로 제공하는 변환 라이브러리는 어휘분석기 모들과 구문 지향 번역기 모듈로 구성되어 있다. 어휘분석기 모들은 XML Page를 입력받아 각 태그들을 분석하고 토큰을 출력한다. 구문 지향 번역기 모듈은 어휘분석기에서 출력된 토큰들을 입력받아 문법을 체크하고, Parsing이 완료되면 대응되는 모바일 .NET 컨트롤로 변환하여 최종적인 닷넷 모바일 Web Page를 생성한다. 어휘분석기 모듈과 구문 지향 번역기 모들은 각각 어휘분석기 생성기(LEX)와 파서 생성기(YACC)를 사용하여 구현하였다. LEX와 YACC의 사용은 태그를 확장할 경우 변경된 부분만 설계함으로써 유연하게 대처할 수 있는 장점을 가지고 있다.

  • PDF

Design and Implementation of Web Crawler with Real-Time Keyword Extraction based on the RAKE Algorithm

  • Zhang, Fei;Jang, Sunggyun;Joe, Inwhee
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.395-398
    • /
    • 2017
  • We propose a web crawler system with keyword extraction function in this paper. Researches on the keyword extraction in existing text mining are mostly based on databases which have already been grabbed by documents or corpora, but the purpose of this paper is to establish a real-time keyword extraction system which can extract the keywords of the corresponding text and store them into the database together while grasping the text of the web page. In this paper, we design and implement a crawler combining RAKE keyword extraction algorithm. It can extract keywords from the corresponding content while grasping the content of web page. As a result, the performance of the RAKE algorithm is improved by increasing the weight of the important features (such as the noun appearing in the title). The experimental results show that this method is superior to the existing method and it can extract keywords satisfactorily.

Design and Implementation for Web Page Visualization Techniques using Android Smartphone

  • Song, Teuk-Seob;Choi, Seung-Ho
    • Journal of information and communication convergence engineering
    • /
    • 제8권4호
    • /
    • pp.416-420
    • /
    • 2010
  • SMARTPHONE has become a big issue in South Korea and worldwide. In this work we will propose techniques that display web contents according to user preference and service provider' interest for small screen devices such as smartphones. A number of works and research have been conducted to generate suitable web contents for small screen devices. But such previous attempts have not failed to reflect the interest of users and service providers. Our proposed system simulates the Google Android Emulator, which is a free and well known open source.

개인건강기록을 위한 실시간 심전도 모니터링 시스템 설계 및 구현 (Design and Implementation of Real-time ECG Monitoring System for Personal Health Records)

  • 김흥기;조진수
    • 반도체디스플레이기술학회지
    • /
    • 제11권3호
    • /
    • pp.45-50
    • /
    • 2012
  • In this paper, we propose a real-time ECG monitoring system for personal health records. This study aims to provide services that help patients to monitor their own physical condition and manage their own health records consistently, whereas existing medical services are Medical Institute-Centric model. The system is composed of web server, smart phone, and ECG meter, and web page. Without time and space restraints, It provides us with managing personal health records by performing patient's ECG measurement and real-time monitoring. And also Real-time bidirectional communication between smart phone and web page can be performed rapidly by applying the ECG monitoring with WebSocket Technology that follows HTML5 standard. Through this system, It can handle patient in need immediately.