• 제목/요약/키워드: Documents

검색결과 5,362건 처리시간 0.035초

An Improved Approach to Ranking Web Documents

  • Gupta, Pooja;Singh, Sandeep K.;Yadav, Divakar;Sharma, A.K.
    • Journal of Information Processing Systems
    • /
    • 제9권2호
    • /
    • pp.217-236
    • /
    • 2013
  • Ranking thousands of web documents so that they are matched in response to a user query is really a challenging task. For this purpose, search engines use different ranking mechanisms on apparently related resultant web documents to decide the order in which documents should be displayed. Existing ranking mechanisms decide on the order of a web page based on the amount and popularity of the links pointed to and emerging from it. Sometime search engines result in placing less relevant documents in the top positions in response to a user query. There is a strong need to improve the ranking strategy. In this paper, a novel ranking mechanism is being proposed to rank the web documents that consider both the HTML structure of a page and the contextual senses of keywords that are present within it and its back-links. The approach has been tested on data sets of URLs and on their back-links in relation to different topics. The experimental result shows that the overall search results, in response to user queries, are improved. The ordering of the links that have been obtained is compared with the ordering that has been done by using the page rank score. The results obtained thereafter shows that the proposed mechanism contextually puts more related web pages in the top order, as compared to the page rank score.

Style Control of Structured Documents using DSSSL

  • Lee, Kyong-Ho;Lee, Jin-Ho;Choy, Yoon-Chul
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.455-462
    • /
    • 1997
  • SGML(Standard Generalized Markup Language) is the ISO standard fer describing the logical structure of documents and is also adopted as the CALS standard for document description. Since then, there have been growing interests in SGML application in a variety of fields. However because SGML doesn't provide a standard method for describing various processing informations, ie, formatting and transformation, most applications have applied methods that are system dependent. Recently, ISO defined DSSSL(Document Style Semantics and Specification Language) as a standard mechanism to specify the formatting, transformation and retrieval of structured documents. Therefore, in this paper, we present a DSSSL processing system far style control of structured documents such as SGML documents. The system processes DSSSL style sheet that describes layout of documents and browses the result of its application to a SGML document. We have conducted tests on a lot of SGML documents and DSSSL style sheets successfully. Now, we are developing the SGML document management system that supports creation, editing, storage and retrieval of SGML document based upon the DSSSL processor and the SGML parser which we have developed.

  • PDF

검색 포털의 클릭 집중 문서 분석 평가 (Analysis and Evaluation of Most Clicked Documents of Korean Search Portal)

  • 박소연
    • 한국도서관정보학회지
    • /
    • 제42권1호
    • /
    • pp.325-338
    • /
    • 2011
  • 본 연구에서는 국내 주요 검색 포털인 네이버 통합 검색의 클릭 집중 문서의 특징을 조사, 분석하였다. 즉 이 연구에서는 클릭 집중 문서들을 대상으로 클릭 집중 비율, 컬렉션별 분포, 작성 연도별 분포를 조사하고, 문서의 적합도, 최신성, 신뢰도 등을 평가하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구 결과, 클릭 집중 문서가 가장 많이 발생한 컬렉션은 블로그였으며, 질의별로 클릭의 절반가량이 한 문서에 집중되고 있는 것으로 나타났다. 또한 클릭 집중 문서의 적합도와 최신성은 상당히 높지만, 신뢰도는 보통 수준인 것으로 나타났다. 본 연구의 결과는 향후 포털의 효과적인 검색 알고리즘 및 인터페이스 개발에 활용될 수 있을 것으로 기대된다.

구조 검색을 위한 XML 문서 저장 시스템 (XML Document Repository System for structured retrieval)

  • 임산송;현득창;정회경
    • 정보학연구
    • /
    • 제4권4호
    • /
    • pp.89-100
    • /
    • 2001
  • XML(extensible Markup Language)은 W3C(World Wide Web Consortium)에서 표준으로 제정, 발표한 대표적인 전자문서 표준이다. XML 문서는 구조화된 정보를 체계적으로 생성하고 전송할 수 있으며, 기존의 파일 형태 정보에 비하여 의미적인 정보 단위를 구조로 표현하고 이러한 구조 정보를 이용해 문서의 관리 및 검색, 저장에 이용할 수 있다. 이에 본 논문에서는 XML의 구조적 정보를 이용하여 저장 검색하기 위한 XML 저장 시스템을 설계 및 구현하였다. 문서의 기본 단위인 엘리먼트(element) 단위로 모델링(modeling)하여 저장하였고, 저장된 XML 정보를 구조 단위로 검색 할 수 있도록 모델링 하였다. 또한 DTD(Document Type Definition)와 인스턴스(instance)에 대하여 스키마(schema)를 생성하여 다양한 문서에 대한 구조를 효과적으로 관리, 저장할 수 있도록 하였다.

  • PDF

SMIL 문서의 구조 정보 모델 및 검색 (Structured Information Modeling and Query Method for SMIL Documents)

  • 류은숙;이기호;이규철
    • 한국멀티미디어학회논문지
    • /
    • 제7권3호
    • /
    • pp.293-307
    • /
    • 2004
  • XML 기반의 SMIL(Synchronized Multimedia Integration Language) 문서는 문서를 구조적인 특성에 따라 논리적 구조 정보, 공간적 구조 정보, 시간적 구조 정보, 하이퍼링크 구조 정보로 표현할 수 있다. 본 논문은 이와 같이 SMIL 문서에 내재된 다중 구조 정보를 효과적으로 모델링하고, 관련 정보를 검색할 수 있는 기능을 지원한다. 특히, 본 논문에서는 SMIL문서의 구조 정보에 대한 객체 클래스와 클래스간의 계층 구조 및 관계를 표현하기 위해 UML의 클래스 다이어그램을 이용하여 객체 지향 모델링을 제공한다. 또한 객체 클래스들을 정의하기 위해 데이터베이스 표준 언어인 SQL3를 이용하고 있다 그밖에, SMIL 문서의 구조적인 구성 요소들을 효과적으로 검색하기 위해 계층 구조 접근 연산을 제공하며, SMIL문서의 효율적인 검색을 지원하고 있다.

  • PDF

국제무역거래에서의 서류조건에 관한 비교연구 - Incoterms(R) 2010규칙과 UCP 600규칙을 중심으로 - (A Comparative Study on the Documentary Conditions of International Trade Transaction)

  • 신정식
    • 무역상무연구
    • /
    • 제54권
    • /
    • pp.99-122
    • /
    • 2012
  • According to the United Nations Convention on the International Sale of Goods, the Seller must deliver the goods, hand over any documents relating to the them and transfer the property the to the goods as required by the contract, and buyer must pay the price for the goods and take delivery of them as required by the contract. In particular, the seller provides the documents is important. If the documents are discrepancies in credit, the beneficiary may not receive the payment. So It is important to study on conditions of documents in international trade. Documents provided by the seller shall be determined by express terms. If there is no agreement on the express terms, it shall be determined by the implied terms or governing law terms. In practice Seller shall provide the documents are as follows, For example, transport documents, commercial invoice, certificate of origin, insurance policy, packing list, inspection certificate etc. As stated above if it can not be determined by express terms, it is determined by the implied terms. In international trade, leading to the implied terms is incoterms(R) 2010 and UCP 600. Incoterms(R) 2010 define the seller must provide the goods and the commercial in conformity with the sales contract and any other evidence of conformity that may be required by the contract and UCP 600 are rules that apply to documentary credit. This paper, the practical utility between Incoterms(R) 2010 and UCP 600 is studied.

  • PDF

SGML(Standardized Genernal Markup Language)에 대한 기본 파서의 구현 (Implementation of SGML Basic Parser)

  • 홍은선;정회경;이수연
    • 한국통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.495-508
    • /
    • 1992
  • 이 논문은 SGML(Standardized General Markup Larguage)을 적용하여 작성된 SGML 문서와 DTD(Document Type Definition)를 분석하는 SGML파서(parser)의 설계를 기술한다. 먼저 SGML 규칙을 내포하는 yacc 정의 파일을 구성하였고, 이 파일에 의하여 SGML DTD와 문서를 적합한 토큰(token)으로 파싱하였다. 이 토근으로 SGML문서의 논리적 구조를 내부 구조화하고, 엔터티(entity)테이블(table),엘리먼트(element)테이블등을 생성하여 데이터베이스(database)를 구축하였으며,이를 이용하여 속성값 입력등의 다음 단계처리에 이용 할 수 있게 하였다. 또한 이 파서는 소규모 참조를 변화하여 확장하는 기능도 갖는다. 이 파서에 몇몇 SGML문서를 시험 적용하여 바르게 시행됨을 확인하였다.

  • PDF

데이터베이스와 XML에 기반한 건설프로젝트 기술문서 전자화 (Digitalizing Technical Documents of Construction Projects Based on Database and XML)

  • 정종현
    • 한국건설관리학회논문집
    • /
    • 제6권4호
    • /
    • pp.190-198
    • /
    • 2005
  • 본 연구의 목적은 건설프로젝트에 관련된 기술문서(technical document)를 효율적으로 저장하고 웹(web)을 통하여 신속하고 정확하게 교환할 수 있도록 전자화(digitalization)하는 방안을 제시하는 것이다. 이를 위해 본 연구에서는 먼저 전자화 측면을 고려하여 기술문서의 여러 특성을 분석하였고 이를 바탕으로 저장에는 데이터베이스(database)를, 웹을 통한 교환에는 XML을 적용하여 기술문서를 전자화할 수 있는 방안을 도출하였다. 여기에는 기술문서의 저장과 검색, 부분적인 XML문서의 작성, 기술문서에 적합한 구성항목과 구성체계 설정, 웹에서의 수식과 그래픽 처리 방안이 포함된다. 마지막에는 전형적인 기술문서 중의 하나인 구조계산서(structural design sheets)를 대상으로 하여 데이터베이스에 저장하기 위한 자료구조(data structure) 정의, 실제 XML문서의 작성 및 웹을 통한 교환 등을 부분적으로 구현하여 본 연구에서 제안한 데이터베이스와XML에 기반한 기술문서 전자화 방안의 적정성을 검토하였다.

대용량 오피니언 문서에 대한 특성 기반 요약 기법 (Feature-Based Summarization Method for a Large Opinion Documents Collection)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.33-42
    • /
    • 2016
  • 최근 SNS나 포털을 중심으로 다양한 분야 대해 대중들의 의견이 표현될 수 있는 환경이 확대되고 있고, 이로 인해 오피니언 문서들은 빠르게 대량화 되고 있다. 이러한 환경에서 대용량의 오피니언 문서들의 내용을 파악하기 위해서는 자동 요약 기술의 적용이 필수적이다. 하지만 오피니언 문서 내에는 대상 객체가 갖는 특성들과 주관적 표현들이 내재되어 있어 일반적인 요약 기법으로는 효율적인 요약이 불가능하다. 본 논문에서는 대용량의 오피니언 문서를 대상으로 주요 문장들을 추출하여 요약하는 기법을 제안한다. 제안된 기법에서는 사전에 정의된 오피니언 문서의 특성들에 대해서, 특성들에 대한 오피니언이 표현된 대표적인 문장들이 추출되도록 설계되었다. 또한 실험을 통하여 제안된 방법의 유용성을 증명하였다.

화환신용장거래에서 물품명세의 일치성요건에 관한 사례연구 (A Case Study on Complying Requirements of the Description of the Goods in Documentary Credit Transactions)

  • 김종칠
    • 통상정보연구
    • /
    • 제10권3호
    • /
    • pp.239-261
    • /
    • 2008
  • Documentary credit transactions are judged by the principle of strict compliance. The compliance of the tendered documents with the credit's teams ensures the proper completion of the underlying transaction. But if the documents tendered by beneficiary differ, a discrepancy of documents occurs. Such a discrepancy raises difficult problems for the bank to which the documents are tendered. It has to decide whether to reject or accept them or to accept them under a protective mechanism. Therefore, this study is to examine the case study of complying presentation of the description of the goods in documentary credit through the Korean Supreme Court Cases. The objectives of this paper are as follow : 1. To examine two point of views on document compliance such as strict compliance and substantial compliance. 2. To analyze Korean Case Law which challenges the legal conclusions, standard for examination of documents and New ISBP. 3. To draw out the criterion for conformity and discrepancy of description in invoices and WC and to provide the guidelines for determining the nature and extent of an issuing bank's duty of documentary compliance. 4. Finally to suggest some implications through the Korean case law. By using the examination standards for description of goods suggested in Korean Case Law and New ISBP, the traders will be able to prepare documentation more perfectly and document checkers will be able to examine the negotiation documents more easily.

  • PDF