• 제목/요약/키워드: Document Databases

검색결과 130건 처리시간 0.024초

빅데이터환경에서의 문서데이터베이스 활용방안 (Application Plan of Document Databases in the Big Data Environment)

  • 박승범;이상원;안현섭;정인환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.230-232
    • /
    • 2013
  • 많은 기업들은 경영활동 중에 매우 많은 데이터를 생성하고 관리하고 있다. 그러나, 관계형 데이터베이스, 계층형 데이터베이스, 네트워크 데이터베이스 같은 일반적인 데이터베이스로, 이러한 다량의 문서 데이터를 효과적이고 효율적으로 관리하고 분석하는 것은 불가능에 가깝다. 그래서, 본 논문에서는, 이러한 문제를 해결하기 위해, 우선 문서 데이터베이스를 정의하고, 일관성이나 트랜잭션 같은 특성들을 살펴본 후, 문서 데이터베이스를 적용해야 할 분야와 적용하지 말아야 할 분야에 대해 언급하고자 한다.

  • PDF

분산 정보 검색을 위한 신경망 기반 사용자 피드백 학습 메카니즘 (Neural Net Based User Feedback Learning Mechanism for Distributed Information Retrieval)

  • 최용석
    • 컴퓨터교육학회논문지
    • /
    • 제4권2호
    • /
    • pp.85-95
    • /
    • 2001
  • 웹과 같은 분산 정보 검색 환경에서 문서들은 많은 문서 데이터 베이스들에 자연스럽게 분할되어서 존재한다. 그러므로 이러한 문서들의 효율적인 검색을 위해서는 먼저 질의에 관련되어 문서들을 제공할 것으로 판단되는 문서 데이터 베이스를 찾아내고 다음으로 그 문서 데이터 베이스에 질의를 줌으로써 분산 정보 검색을 수행해야 한다. 본 논문에서는 이러한 효율적인 분산 정보 검색을 위한 신경망 기반 사용자 피드백 학습 메카니즘을 제안한다. 제안된 학습 메카니즘은 질의 검색 예제들을 통하여 얻어진 질의에 대한 사용자의 관련도 피드백 정보에 기반하여 역전파 알고리즘으로 분산 정보 검색 지식을 학습한다. 충분히 학습한 후의 학습 메카니즘은 주어진 질의에 대하여 관련 문서 데이터 베이스들을 찾아내고 그 문서 데이터 베이스들로부터 관련되는 문서들을 검색하는데 효과적으로 사용될 수 있다. 실험에서는 제안된 학습 메카니즘을 적용한 신경망 에이전트 시스템을 구현하고 이 시스템의 정보 검색 성능을 기존 시스템들과 비교하여 제안된 학습 메카니즘의 유용성을 입증한다.

  • PDF

자원공유 수단으로서의 전문 데이터베이스 (Full-text databases as a means for resource sharing)

  • 노진구
    • 한국도서관정보학회지
    • /
    • 제24권
    • /
    • pp.45-79
    • /
    • 1996
  • Rising publication costs and declining financial resources have resulted in renewed interest among librarians in resource sharing. Although the idea of sharing resources is not new, there is a sense of urgency not seen in the past. Driven by rising publication costs and static and often shrinking budgets, librarians are embracing resource sharing as an idea whose time may finally have come. Resource sharing in electronic environments is creating a shift in the concept of the library as a warehouse of print-based collection to the idea of the library as the point of access to need information. Much of the library's material will be delivered in electronic form, or printed. In this new paradigm libraries can not be expected to su n.0, pport research from their own collections. These changes, along with improved communications, computerization of administrative functions, fax and digital delivery of articles, advancement of data storage technologies, are improving the procedures and means for delivering needed information to library users. In short, for resource sharing to be truly effective and efficient, however, automation and data communication are essential. The possibility of using full-text online databases as a su n.0, pplement to interlibrary loan for document delivery is examined. At this point, this article presents possibility of using full-text online databases as a means to interlibrary loan for document delivery. The findings of the study can be summarized as follows : First, turn-around time and the cost of getting a hard copy of a journal article from online full-text databases was comparable to the other document delivery services. Second, the use of full-text online databases should be considered as a method for promoting interlibrary loan services, as it is more cost-effective and labour saving. Third, for full-text databases to work as a document delivery system the databases must contain as many periodicals as possible and be loaded on as many systems as possible. Forth, to contain many scholarly research journals on full-text databases, we need guidelines to cover electronic document delivery, electronic reserves. Fifth, to be a full full-text database, more advanced information technologies are really needed.

  • PDF

Access Control Mechanism for CouchDB

  • Ashwaq A., Al-otaibi;Reem M., Alotaibi;Nermin, Hamza
    • International Journal of Computer Science & Network Security
    • /
    • 제22권12호
    • /
    • pp.107-115
    • /
    • 2022
  • Recently, big data applications need another database different from the Relation database. NoSQL databases are used to save and handle massive amounts of data. NoSQL databases have many advantages over traditional databases like flexibility, efficiently processing data, scalability, and dynamic schemas. Most of the current applications are based on the web, and the size of data is in increasing. NoSQL databases are expected to be used on a more and large scale in the future. However, NoSQL suffers from many security issues, and one of them is access control. Many recent applications need Fine-Grained Access control (FGAC). The integration of the NoSQL databases with FGAC will increase their usability in various fields. It will offer customized data protection levels and enhance security in NoSQL databases. There are different NoSQL database models, and a document-based database is one type of them. In this research, we choose the CouchDB NoSQL document database and develop an access control mechanism that works at a fain-grained level. The proposed mechanism uses role-based access control of CouchDB and restricts read access to work at the document level. The experiment shows that our mechanism effectively works at the document level in CouchDB with good execution time.

Multimedia Document Databases : Representation, Query Processing and Navigation

  • Kalakota, Ravi S.;Whinston, Andrew B.
    • 정보기술과데이타베이스저널
    • /
    • 제1권1호
    • /
    • pp.31-62
    • /
    • 1994
  • Information systems for application areas like office automation, customer service or computer aided manufacturing are usually highly interactive and deal with complex document structures composed of multiple media formats. For the realization of these systems, nonstandard database systems, which we call document databases, need to handle different types of coarse-and fine-grained document objects(like full-text documents, graphics and images), hierarchical and non-hierarchical relationships between objects(like composition-links and cross-references using hypertext structures) and document attributes of different types such as formatting/presentation information and access control. In this paper, we present the underlying data model for document databases based on descriptive markup languages that provide mechanisms for specifying the logical structure(or schema) of individual documents stored in the database. We then describe extensions to the data model for supporting notion of composite structures("join" operators for documents) --composition and hyperlinking mechanisms for representing compound documents and inter-linked documents as unique entites separate from their components. Furthermore, due to the interactive nature of the application domains, the database system in conjunction with clients(or browsers) has to support visual navigation and graphical query mechanisms. We describe the functionality of a new user interface paradigm called HyBrow for meeting the above mentioned requirements. The underlying implementation strategy is also discussed.discussed.

  • PDF

분산 정보 검색을 위한 신경망 에이전트의 계층적 구성 (Hierarchical Organization of Neural Agents for Distributed Information Retrieval)

  • 최용석
    • 컴퓨터교육학회논문지
    • /
    • 제8권6호
    • /
    • pp.113-121
    • /
    • 2005
  • 웹과 같은 분산 정보 검색 환경에서 문서들은 많은 문서 데이터베이스들에 자연스럽게 분할되어서 존재한다. 그러므로 이러한 문서들의 효율적인 검색을 위해서는 먼저 질의에 관련되는 문서들을 제공할 것으로 판단되는 문서 데이터베이스를 찾아내고 다음으로 그 문서 데이터베이스에 질의를 줌으로써 분산 정보 검색을 수행해야 한다. 본 논문에서는 이러한 분산 정보 검색을 위한 신경망 에이전트를 소개하고, 확장성을 가지게 하기 위하여 신경망 에이전트들이 계층적으로 구성된 다중신경망 에이전트 시스템을 제안한다. 신경망 에이전트들의 계층적 구성은 정보 검색 성능을 저하시키지 않으면서도 각 신경망 에이전트의 학습을 위한 전체 훈련 비용을 허용할 만한 범위 내에서 유지시켜 주므로 대규모 문서 데이터베이스 환경에서의 분산 정보 검색에도 신경망 에이전트를 적용할 수 있게 해준다. 제안된 신경망 에이전트를 단일 에이전트와 계층적 다중 에이전트 시스템으로 실현 환경에서 구현하여 각각의 정보 검색 성능을 기존의 통계적 분산 정보 검색 기법을 사용했을 때와 비교함으로써 신경망 에이전트의 유용성을 예증한다.

  • PDF

본문 데이타베이스 연구에 관한 고찰과 그 전망 (Future and Directions for Research in Full Text Databases)

  • 노정순
    • 한국문헌정보학회지
    • /
    • 제17권
    • /
    • pp.49-83
    • /
    • 1989
  • A Full text retrieval system is a natural language document retrieval system in which the full text of all documents in a collection is stored on a computer so that every word in every sentence of every document can be located by the machine. This kind of IR System is recently becoming rapidly available online in the field of legal, newspaper, journal and reference book indexing. Increased research interest has been in this field. In this paper, research on full text databases and retrieval systems are reviewed, directions for research in this field are speculated, questions in the field that need answering are considered, and variables affecting online full text retrieval and various role that variables play in a research study are described. Two obvious research questions in full text retrieval have been how full text retrieval performs and how to improve the retrieval performance of full text databases. Research to improve the retrieval performance has been incorporated with ranking or weighting algorithms based on word occurrences, combined menu-driven and query-driven systems, and improvement of computer architectures and record structure for databases. Recent increase in the number of full text databases with various sizes, forms and subject matters, and recent development in computer architecture artificial intelligence, and videodisc technology promise new direction of its research and scholarly growth. Studies on the interrelationship between every elements of the full text retrieval situation and the relationship between each elements and retrieval performance may give a professional view in theory and practice of full text retrieval.

  • PDF

전문데이터베이스의 탐색특성에 관한 연구 - 주제전문가와 탐색전문가 - (A Study of the Behaviours in Searching Full-Text Databases- Subject Specialists vs. Professional Searchers -)

  • 이응봉
    • 한국문헌정보학회지
    • /
    • 제30권2호
    • /
    • pp.51-86
    • /
    • 1996
  • 본 연구는 전문데이터베이스의 탐색에 있어서 주제전문가와 탐색전문가는 어떠한 특징적인 차이가 있는지를 밝히려 하였다. 이 연구를 통하여 얻어진 결론을 요약하면, 주제전문가와 탐색전문가는 전문데이터베이스의 탐색에, 있어서 탐색질문의 분석(탐색질문의 이해도. 탐색어 선정의 난이도, 탐색결과에 대한 기대수준), 탐색과정(탐색어수, 연산자 순 브라우징 문헌 순 접속시긴 출력문헌 건당 소요시긴 적합문헌 건당 소요시간), 탐색결과 (적합문헌수 재현율 정확율, 총 탐색비용 출력문헌 건당 소요비용, 적합문헌 건당 소요비용, 탐색결과에 대한 만족도)에 대하여 뚜렷한 차이를 나타내는 것으로 밝혀졌다.

  • PDF

An XML Data Management System Using an Object-Relational Database

  • Nam, S.H.;Jung, T.S.;Kim, T.K.;Kim, K.R.;Zahng, H.K.;Yoo, J.S.;Cho, W.S.
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2007년도 춘계학술대회
    • /
    • pp.163-167
    • /
    • 2007
  • We propose an XML document storage system, called XDMS (XML Document Management System), by using an object-relational DBMS. XDMS generates object database schema from XML Schema and stores the XML documents in an object-relational database. SAX parser is used for understanding the structure of the XML documents, and XDMS transforms the documents into objects in the database. Experiment shows that object-relational databases provide more efficient storage and query model compared with relational databases.

  • PDF

SGML을 이용한 특허정보처리 연구 (A Study of Patent Document Processing by SGML)

  • 권영숙
    • 정보관리연구
    • /
    • 제30권3호
    • /
    • pp.44-54
    • /
    • 1999
  • SGML(Standard Generalized Markup Language)의 디스크립션은 WIPO(World Intellectual Property Organization) Standard ST.32의 디스크립션과 더불어 자세히 기술되고있다. SGML의 이용에 대한 이점이 강조되고 있으며, 그것은 시스템 독립적이며 특허출판 및 전문 데이터베이스구축에 타당성이 있다는 것이다. WIPO Standard ST.32를 적용한 특허문헌의 내용구조는 ST.32에 따라 작성한 DTD로 표현하고 텍스트 자체는 DTD에 따른 범용 마크업을 사용하여 기술한다. 본고에서는 전체문헌, 특정 서브문서, 문단 등의 계층구조와 표, 도면, 화학구조식 등의 비계층구조로 되어 있는 문서구조를 어떻게 표현하는가에 대하여 예를들어 설명하였다. 그리고 특허 문헌처리에서 SGML의 효과에 대하여 논의하였다.

  • PDF