• 제목/요약/키워드: databases

검색결과 5,085건 처리시간 0.032초

온라인 데이터베이스정보의 분포특성 분석 (The Distribution of Citations in Online Databases)

  • 이효숙
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1995년도 제2회 학술대회 논문집
    • /
    • pp.41-44
    • /
    • 1995
  • Twenty six databases relevant to ‘trade’ have been searched to test for a Bradford's law of scatter. Citations in the databases adhere to the linearity of Bradford's distribution, however, they show that the concentration of citations in core databases is not as great as being expected.

  • PDF

유니코드 한자 검색의 문제점 및 개선방안 (Problems with Chinese Ideographs Search in Unicode and Solutions to Them)

  • 이정현
    • 정보화정책
    • /
    • 제19권3호
    • /
    • pp.50-63
    • /
    • 2012
  • 본고는 국내 한국학 관련 데이터베이스, 국내 도서관, 국내 학술 데이터베이스, 해외 도서관의 한자 검색 현황을 분석하여 문제점을 파악하고 개선 방안을 도출해 보고자 하였다. 유니코드 환경에서 한자 검색이 문제가 되는 주요한 이유를 '다중코드자', '간체자'와 '이체자'로 정리하고, 각각 3글자를 샘플로 검색하여 현황을 정리하였다. 한국학 관련 데이터베이스 13개, 국내 도서관 데이터베이스 5개, 국내 학술 데이터베이스 4개, 해외 도서관 데이터베이스 2개의 한자검색 현황을 조사하였다. 다중코드자에 대한 검색을 지원하기 위해서는 유니코드 컨소시엄에 공개된 소스를 적용해야 한다. 간체자와 이체자에 대한 검색 기능을 개선하기 위해서는 신뢰할 수 있는 매칭테이블을 표준화하여 유니코드 컨소시엄에 제안해야 한다.

  • PDF

시공간 데이터베이스를 위한 히스토그램 기반 선택도 추정 기법 (Histogram-based Selectivity Estimation Method in Spatio-Temporal Databases)

  • 이종연;신병철
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.43-50
    • /
    • 2005
  • 시공간 데이터베이스의 영역에는 그게 이동객체를 다루는 시계열 데이터베이스 영역과 이력객체를 다루는 서열 데이터베이스 영역으로 나뉜다. 최근에는 시공간 데이터베이스의 질의 최적화를 위한 선택도 추정 연구가 활발히 진행되었으나, 기존 연구는 주로 시계열 데이터베이스의 선택도 추정에 의한 질의 최적화에 중점을 두었고 서열 데이터베이스에 대한 질의 최적화 연구는 전무하였다. 따라서 본 논문에서는 시공간 데이터베이스의 질의 최적화를 위한 T-Minskew 히스토그램을 구축하고 이를 이용한 선택도 추정 기법을 제안한다. 또한 임계치 기법을 이용한 효과적인 히스토그램 유지 기법을 제안한다.

빅데이터환경에서의 문서데이터베이스 활용방안 (Application Plan of Document Databases in the Big Data Environment)

  • 박승범;이상원;안현섭;정인환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.230-232
    • /
    • 2013
  • 많은 기업들은 경영활동 중에 매우 많은 데이터를 생성하고 관리하고 있다. 그러나, 관계형 데이터베이스, 계층형 데이터베이스, 네트워크 데이터베이스 같은 일반적인 데이터베이스로, 이러한 다량의 문서 데이터를 효과적이고 효율적으로 관리하고 분석하는 것은 불가능에 가깝다. 그래서, 본 논문에서는, 이러한 문제를 해결하기 위해, 우선 문서 데이터베이스를 정의하고, 일관성이나 트랜잭션 같은 특성들을 살펴본 후, 문서 데이터베이스를 적용해야 할 분야와 적용하지 말아야 할 분야에 대해 언급하고자 한다.

  • PDF

Genomic and Proteomic Databases: Foundations, Current Status and Future Applications

  • Navathe, Shamkant B.;Patil, Upen;Guan, Wei
    • Journal of Computing Science and Engineering
    • /
    • 제1권1호
    • /
    • pp.1-30
    • /
    • 2007
  • In this paper we have provided an extensive survey of the databases and other resources related to the current research in bioinformatics and the issues that confront the database researcher in helping the biologists. Initially we give an overview of the concepts and principles that are fundamental in understanding the basis of the data that has been captured in these databases. We briefly trace the evolution of biological advances and point out the importance of capturing data about genes, the fundamental building blocks that encode the characteristics of life and proteins that are the essential ingredients for sustaining life. The study of genes and proteins is becoming extremely important and is being known as genomics and proteomics, respectively. Whereas there are numerous databases related to various subfields of biology, we have maintained a focus on genomic and proteomic databases which are the crucial stepping stones for other fields and are expected to play an important role in the future applications of biology and medicine. A detailed listing of these databases with information about their sizes, formats and current status is presented. Related databases like molecular pathways and interconnection network databases are mentioned, but their full coverage would be beyond the scope of a single paper. We comment on the peculiar nature of the data in biology that presents special problems in organizing and accessing these databases. We also discuss the capabilities needed for database development and information management in the bioinformatics arena with particular attention to ontology development. Two research case studies based on our own research are summarized dealing with the development of a new genome database called Mitomap and the creation of a framework for discovery of relationships among genes from the biomedical literature. The paper concludes with an overview of the applications that will be driven from these databases in medicine and healthcare. A glossary of important terms is provided at the end of the paper.

과학기술분야 해외 온라인 데이터베이스 평가 연구 (A Evaluation Study on Foreign Science & Technology Online Databases)

  • 김석영
    • 정보관리연구
    • /
    • 제33권1호
    • /
    • pp.61-80
    • /
    • 2002
  • 본 연구는 과학기술분야 해외 온라인 데이터베이스의 현황을 평가하고 조사한 것이다. 데이터베이스에 대한 평가는 과학기술정보 이용자나 정보 제공자에게 매우 중요한 과제로 인식되고 있다. 본 연구에서는 우선적으로 데이터베이스 평가에 대한 선행 연구를 간략하게 요약하였다. 그리고 현재 이용 가능한 해외 온라인 데이터베이스 618종을 대상으로 주제분야별, 발행처별, 갱신주기별, 온라인 이용방법별로 분석하였다. 또한 과학기술분야별로 주요한 온라인 데이터베이스를 간략하게 소개하였다.

DE 알고리즘을 사용한 관계형 데이터베이스를 위한 가역 워터마킹 (Reversible Watermarking For Relational Databases using DE (Difference Expansion) Algorithm)

  • 김천식
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.7-13
    • /
    • 2015
  • 일반적으로 워터마킹은 오디오, 비디오, 이미지, 그리고 텍스트 등의 콘텐트의 저작권을 위해서 사용되고 있다. 인터넷의 발달로 어플리케이션과 연동되는 관계형 데이터베이스는 악의적인 공격자들에 의한 데이터베이스 복제, 유출등이 빈번히 발생하고 있다. 따라서 데이터베이스의 저작권보호 역시 필요성이 증대되고 있다. 또한 데이터베이스에는 민감한 개인정보에서 산업기밀 정보까지 다양한 정보고 포함되어 있다. 따라서 관계형 데이터베이스의 보호는 데이터베이스 분야에서 매우 중요한 연구 영역이 되고 있다. 본 논문에서는 관계형 데이터를 보호할 수 있는 다양한 방안의 기존의 연구를 살펴보고, 이들 데이터를 보호할 수 있는 새로운 방법을 제안하고자 한다. 특히 본 논문에서는 가역적인 방법으로 데이터베이스에 워터마크를 삽입하는 방법을 제안하고자 한다. 실험결과 제안한 기술은 악의적인 공격에 강함을 보였다. 또한, 제안한 방법이 실제 어플리케이션에 적용 가능함을 보였다.

철도 산업의 공기 질 데이터베이스 연합형 통합을 위한 지능형 데이터 거버넌스 (Intelligent Data Governance for the Federated Integration of Air Quality Databases in the Railway Industry)

  • 김민정;원종운;박상찬;박가영
    • 품질경영학회지
    • /
    • 제50권4호
    • /
    • pp.811-830
    • /
    • 2022
  • Purpose: In this paper, we will discuss 1) prioritizing databases to be integrated; 2) which data elements should be emphasized in federated database integration; and 3) the degree of efficiency in the integration. This paper aims to lay the groundwork for building data governance by presenting guidelines for database integration using metrics to identify and evaluate the capabilities of the UK's air quality databases. Methods: This paper intends to perform relative efficiency analysis using Data Envelope Analysis among the multi-criteria decision-making methods. In federated database integration, it is important to identify databases with high integration efficiency when prioritizing databases to be integrated. Results: The outcome of this paper aims not to present performance indicators for the implementation and evaluation of data governance, but rather to discuss what criteria should be used when performing 'federated integration'. Using Data Envelope Analysis in the process of implementing intelligent data governance, authors will establish and present practical strategies to discover databases with high integration efficiency. Conclusion: Through this study, it was possible to establish internal guidelines from an integrated point of view of data governance. The flexiblity of the federated database integration under the practice of the data governance, makes it possible to integrate databases quickly, easily, and effectively. By utilizing the guidelines presented in this study, authors anticipate that the process of integrating multiple databases, including the air quality databases, will evolve into the intelligent data governance based on the federated database integration when establishing the data governance practice in the railway industry.

전문데이터베이스의 특성과 정보검색성능 (On the Characteristics and Information Retrieval Performance of Full-Text Databases)

  • 조명희
    • 한국문헌정보학회지
    • /
    • 제17권
    • /
    • pp.339-366
    • /
    • 1989
  • Appearance of full-text online is the most encouraging phenomenon ·during the development of databases. The full-text databases of today is derived from by-product of electronic publication of printed materials. Now, there are also some movements toward electronic production of documents in Korea although not powerful. The present study is designed to examine the characteristics and effective retrieval method of full-text databases now commercially available through various vendors. The outline of this paper IS as follows: First, background and present situation of existing full-text database services through national and worldwide are examined. Second, free-text searching system of full-text databases is compared with controlled vocabulary system. The factors influencing on free-text retrieval performance, searching thesaurus, and hybrid or compromising system, which is using limited controlled vocabulary in conjunction with natural language for the enrichment needed for practical operation of the . system, are examined. Third, user demands through the analysis of preceding studies on 'various types of full-text databases are recognised. Fouth, application of CD-ROM full-text database to the libraries and information centers is examined as prospective resources for them. Finally, some problems and prospect of full-text databases are presented.

  • PDF

Semantic Correspondence of Database Schema from Heterogeneous Databases using Self-Organizing Map

  • Dumlao, Menchita F.;Oh, Byung-Joo
    • 전기전자학회논문지
    • /
    • 제12권4호
    • /
    • pp.217-224
    • /
    • 2008
  • This paper provides a framework for semantic correspondence of heterogeneous databases using self- organizing map. It solves the problem of overlapping between different databases due to their different schemas. Clustering technique using self-organizing maps (SOM) is tested and evaluated to assess its performance when using different kinds of data. Preprocessing of database is performed prior to clustering using edit distance algorithm, principal component analysis (PCA), and normalization function to identify the features necessary for clustering.

  • PDF