• Title/Summary/Keyword: web pages

Search Result 553, Processing Time 0.032 seconds

DEVELOPMENT OF THE PHOTOMETRY DATABASE AND FRAMEWORK FOR MICROLENSING EVENT (중력렌즈 사건 측광 데이터베이스 및 프레임워크 개발)

  • Kim, D.J.;Lee, C.U.;Kim, S.L.;Park, B.G.
    • Publications of The Korean Astronomical Society
    • /
    • v.26 no.1
    • /
    • pp.37-44
    • /
    • 2011
  • We constructed a photometric database system which is optimally designed for microlensing events from KMTNet (Korea Microlensing Telescope Network) observation. We developed a framework software for the convenience of archiving, uploading, searching, and downloading of processed photometric data. From various tests for optimal data archiving engines, we found that the MyISAM storage engine shows the best performance. For the high performance of database system, data types of each field are carefully suggested from various combinations of tests especially to correct round-off errors. The developed framework provides the convenience of access to the database server using query forms via web pages, and displays the light curve of selected target for a quick view.

An Object Model of Korean Web Pages for Title Identification (테이블 객체 모델링을 이용한 웹 문서의 제목추출)

  • 박세종;윤주형;이승욱;한영석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.541-543
    • /
    • 2003
  • 한국어 웹 문서에는 일반적으로 제목이 명시가 되어 있음으로 텍스트를 하는 방식의 제목추출과는 달리 여러 테이블 형태로 이루어진 웹 문서의 특성을 고려하여 제목에 해당하는 테이블 객체를 찾아내야 한다. 웹 문서를 테이블 객체의 리스트로 보고, 이들을 휴리스틱 규칙에 의해서 본문 후보와 이를 기준으로 하는 제목 후보 객체들로 구분하는 단계와 제목 후보들 간의 확률적 분포 값과 본문과의 언어적 유사도를 이용하여 제목 개체를 결정하는 단계를 통하여 제목을 인식한다. 인식의 정확성에 기여하는 것은 제목과 본문 객체를 구분하는 규칙 그리고 제목의 확률분포 및 언어적 유사정도 등이며 이들 각 정보가 정확성에 기여하는 정도를 실험하였다. 무작위로 추출된 500개의 다양한 양식의 웹 문서를 대상으로 실험한 결과 제목인식 정확성은 95.1%였다.

  • PDF

Semantic Classification of Web Pages using Ontology Concept Structure (온톨로지의 개념구조에 의한 웹페이지의 의미적 분류)

  • Song, Mu-Hee;Lim, Soo-Yeon;Park, Seong-Bae;Kang, Dong-Jin;Lee, Sang-Jo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.487-489
    • /
    • 2005
  • 본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

Analysis of Web-pages based on an Extended Server-Side Script (확장된 서버 사이드 스크립트 기반의 웹 페이지 분석)

  • You Il-Sun;Yang Seong-Mi
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.304-306
    • /
    • 2005
  • CGI 프로그래밍 기법이후에 동적 웹 페이지 기술은 CGI 프로그래밍 기법을 개선하기 위해 활발히 연구되었고, 그 결과 Fast-CGI, 서버 사이드 스크립트 그리고 확장 서버 사이드 스크립트 기법이 제안되었다. 본 논문에서는 이러한 동적 웹 페이지 기술을 고찰함과 동시에 벤치마크 테스트를 통해 확장된 서버 사이드 스크립트 기법과 서버 사이드 스크립트 기법의 성능을 비교분석하였다. 벤치마크 테스트 결과에 의하면 확장 서버 사이드 스크립트 기법이 성능과 프로그램 개발 및 유지보수 비용을 함께 고려할 때 2-계층구조와 3-계층구조에서 우수하다는 것을 알 수 있었다. 특히, 대부분의 웹 시스템이 데이터베이스에 의존하는 전형적인 3-계층구조를 따르고 있기 때문에 웹 환경에서 확장 서버 사이드 스크립트 기법은 다른 기법에 비해 우수한 효율성을 나타내리라 기대된다.

  • PDF

A Probabilistic Method for Recognizing Unlabeled Text on Web Pages (웹페이지에서 레이블이 없는 텍스트 인식을 위한 확률 모델)

  • 정창후;이민호;주원균;맹성현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.163-165
    • /
    • 2003
  • 도메인 지식은 텍스트의 포맷과 의미 정보를 이용하여 웹에 존재하는 텍스트의 다양한 의미를 이해할 수 있도록 도와준다. 그러나 도메인 지식은 텍스트에 데이터의 의미를 표현하는 레이블이 존재하지 알을 경우에 텍스트 인식을 제대로 수행할 수 없기 때문에 무용지물이 되고 만다. 이러한 문제를 해결하기 위해 본 논문에서는 레이블이 존재하지 않는 텍스트의 의미를 효과적으로 추론할 수 있는 엔티티 인식 모델을 제안한다 엔티티 인식 모델은 베이지언 모델과 컨텍스트 정보를 결합한 방법으로서, 구조 분석을 수행한 HTML 문서의 텍스트 토큰에 대해서 어떤 엔티티에 속할 것인가를 결정하는 기능을 수행한다. 실험 결과 본 모델을 사용할 경우 기존에는 레이블이 없어서 인식되지 않았던 텍스트들을 효과적으로 인식하는 것을 확인할 수 있었다.

  • PDF

Feature Selection and Classification of Web Pages (웹 페이지에서의 자질 선택과 분류)

  • 송무희;임수연;박성배;강동진;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.796-798
    • /
    • 2004
  • 본 논문에서는 웹 문서의 분류 성능을 향상시키기 위해 웹 페이지에서의 자질선택과 그에 따른 웹 문서 분류 방법을 제안한다. 문서 분류에는 문서에 포함된 단어를 분류 자질로 사용하게 되며 이때 한 문서의 모든 단어를 분류 자질로 이용한다고 좋은 성능을 보인다고 보장할 수는 없다. 그러므로 문서에 필요한 단어만을 자동으로 추출하여 문서데이터의 자질을 축소하는 작업이 필요하다. 따라서 본 논문에서는 모집군 내의 자질벡터의 범위가 큰 것을 적은 수의 주요성분으로 감소시키기 위해 통계적 분석 기법중의 하나인 주성분분석 방법을 이용하여 자질감소와 그에 따른 문서분류의 성능 향상을 실험을 통하여 보인다. 야후 스포츠 뉴스 웹 페이지가 분류를 위해 사용되었으며, 분류기로는 Naive Bayesian 분류 방법을 사용하였다. 실험 결과를 통해 본 논문에서 제안한 뉴스 웹페이지 분류 방법이 스포츠 뉴스 데이터 군에서 만족할 만한 분류 정확도를 제공한다는 것을 알 수 있다.

  • PDF

Real-Time Personalized Advertisement Techniques for Internet Shopping Mall (인터넷 상점에서의 실시간 개인화된 광고 제공 기법)

  • Kim, Jong-Woo;Lee, Kyung-Mi;Kim, Young-Kuk;Yoo, Kwan-Jong
    • Asia pacific journal of information systems
    • /
    • v.9 no.4
    • /
    • pp.107-124
    • /
    • 1999
  • This paper describes a personalized advertisement technique as a part of intelligent customer services in Internet shopping malls. Based on customers' initial profile, purchase history, and behaviors in an Internet shopping mall, the technique displays appropriate advertisements on Internet web pages when customers' visit to the shopping mall. Customers preference scores for product groups which are main sources to select advertisements, are stored either a preference table or preference trees. Both of the two storage methods can support selection of advertisements on real time, and the preference tree method can reflect affinity among product groups. The suggested technique selects different advertisements to reflect changes of customers preferences as time goes by. An experiment has been performed to evaluate the effectiveness of the algorithm, which revealed that the algorithm selects more customer-oriented advertisements rather than random selection.

  • PDF

An Efficient WWW Metering Scheme based on Hash Functions (해쉬함수 기반의 효율적인 WWW 사용량 측정 방안)

  • Shin, Weon;Rhee, Kyung-Hyune
    • Journal of Korea Multimedia Society
    • /
    • v.3 no.2
    • /
    • pp.133-139
    • /
    • 2000
  • In this paper we propose a secure and an efficient metering scheme for measuring the usage and the popularity of web pages. The proposed scheme is based on the cryptographic secure hash functions. Since the metering schemes based on cryptographic technology provides security, efficiency, accuracy and anonymity comparing to the existing metering schemes in WWW, they have the advantages that are secure against attempts by servers who inflate the number of clients and against attempt of collaboration of severs and clients.

  • PDF

An Implementation of Web-Based Chinese Letters Learning System Using Edutainment System

  • Lee, Eun-Ah;Kim, Tai-Suk
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.6
    • /
    • pp.806-813
    • /
    • 2004
  • Internet users are increasingly depending on acquiring and spreading a variety of information from home pages and they are also making use of education systems based on the internet. This study suggests an efficient method to make learners study Chinese Letters with ease and fun through the internet. The detailed methods of attaining Chinese letters Using Edutainment system are divided into 5 elements as follows. Utilizing the transition process of the letters, using games, applying animation and through switching over from Chinese letters to Korean letters and vice versa including making use of the sound of letters and their meanings.

  • PDF

A Study on the Transformation of Web Pages for Mobile Devices (모바일을 위한 웹페이지 변환에 관한 연군)

  • 윤창현;박두순
    • Proceedings of the KAIS Fall Conference
    • /
    • 2003.06a
    • /
    • pp.215-218
    • /
    • 2003
  • 오늘날 인터넷의 광범위한 보급은 이제 유선을 넘어 무선 이동통신 기술로의 급발전을 가져오게되었고, 실생활에 있어서도 무선단말기를 통한 인터넷 상에서의 정보검색이 시간과 장소에 구애받지 않고 가능하게 되었다. 그러나 무선인터넷의 성장세는 무선 단말기가 가진 자체의 제한과 무선망의 제한으로 인해, 광범위한 보급과 활용만큼 성장이 급속화 되어지지는 못하다. 이러한 무선인터넷의 성장을 가로막는 요인들은 컨텐츠의 부족, 접속시간의 지연, 애플리케이션 미비, 무선인터넷 단말기의 보급지연, 완벽한 보완의 미흡등이다. 본 논문에서는 이러한 제한요인중에서 기존의 유선통신에서 사용되어지는 HTML로 구성된 웹페이지를 무선에서도 보다 효율적으로 이용할 수 있는 방법에 관해 제시함으로서 모바일 컨텐츠 개발의 생산성을 향상시키고 개발기간 및 비용을 단축할 수 있는 웹탐색 변환방법을 시도한다.

  • PDF