• 제목/요약/키워드: machine-readable

검색결과 84건 처리시간 0.023초

Addressing the Challenges of Describing Alternative Format Materials: A Metadata Framework to Enhance Information Accessibility of People with Disabilities

  • Lee, Seungmin
    • Journal of Information Science Theory and Practice
    • /
    • 제9권4호
    • /
    • pp.1-14
    • /
    • 2021
  • Library communities face many problems and limitations in describing alternative format materials based on the traditional MAchine Readable Cataloging (MARC) structure. To address these problems, this research proposes an XML-based descriptive metadata framework that establishes general but fundamental bibliographic aspects of various alternative format materials by providing core elements that are essential in describing these materials. Different from existing bibliographic structures, the proposed metadata framework can represent a fundamental descriptive structure by establishing four upper-level categories, 17 core elements, and 10 sub-elements in a hierarchical structure optimized to alternative format materials. By using this principal descriptive structure, the proposed metadata framework can guide different institutions in the creation of bibliographic records for these materials in a consistent way. It is also expected to address the difficulties in describing alternative format materials in library communities and enhance the information accessibility of individuals with various types of disabilities. In addition, the proposed metadata framework is an alternative approach which functions as a mediator between heterogeneous characteristics of alternative format materials and the existing bibliographic structures in library communities.

CRMS 도입을 맞아 생각해보는 디지털 시대의 기록관리 (Considerations of the Record Management of the Digital Age While CRMS was Introduced)

  • 임진희
    • 한국기록관리학회:학술대회논문집
    • /
    • 한국기록관리학회 2019년도 춘계학술대회
    • /
    • pp.61-67
    • /
    • 2019
  • 최근 중앙행정기관은 업무관리시스템을 클라우드 기반의 온나라 문서2.0으로 변경하여 사용하고 있다. 이에 맞춰 국가기록원은 클라우드 기반의 기록관리시스템을 보급하고 있다. 클라우드 컴퓨팅을 포함한 디지털 기술의 발전에 따라 기록의 보존과 활용 방안도 이에 조응하면서 효과적 효율적으로 이루어지도록 끊임없이 재설계해 나가야 한다. 전자기록 관리의 프로세스와 방법이 종이기록 관리의 단순 전자화에서 탈피하여 디지털 기술에 따른 변환(Transformation)의 관점에서 변화하길 바란다. 논리적 이관, 디지털객체의 생애주기별 저장과 중복성 제거, 공문서 서식의 기계가독형 설계, 빅데이터 분석이 용이한 포맷, 공문서 서식과 포맷의 문제, UUID와 해쉬값 기반의 진본성 인증체계 등의 도입을 제안한다.

Knowledge Representation Using Fuzzy Ontologies: A Survey

  • V.Manikandabalaji;R.Sivakumar
    • International Journal of Computer Science & Network Security
    • /
    • 제23권12호
    • /
    • pp.199-203
    • /
    • 2023
  • In recent decades, the growth of communication technology has resulted in an explosion of data-related information. Ontology perception is being used as a growing requirement to integrate data and unique functionalities. Ontologies are not only critical for transforming the traditional web into the semantic web but also for the development of intelligent applications that use semantic enrichment and machine learning to transform data into smart data. To address these unclear facts, several researchers have been focused on expanding ontologies and semantic web technologies. Due to the lack of clear-cut limitations, ontologies would not suffice to deliver uncertain information among domain ideas, conceptual formalism supplied by traditional. To deal with this ambiguity, it is suggested that fuzzy ontologies should be used. It employs Ontology to introduce fuzzy logical policies for ambiguous area concepts such as darkness, heat, thickness, creaminess, and so on in a device-readable and compatible format. This survey efforts to provide a brief and conveniently understandable study of the research directions taken in the domain of ontology to deal with fuzzy information; reconcile various definitions observed in scientific literature, and identify some of the domain's future research-challenging scenarios. This work is hoping that this evaluation can be treasured by fuzzy ontology scholars. This paper concludes by the way of reviewing present research and stating research gaps for buddy researchers.

국립중앙도서관의 자료정리현황과 그 방향에 관한 연구 (The Technical Services of the National Central Library: A Search for Rational Direction)

  • 이춘희
    • 한국문헌정보학회지
    • /
    • 제7권
    • /
    • pp.3-67
    • /
    • 1980
  • Because of the changes made in the modes of cataloguing and classification in its long history, the present catalogue of the National Central Library has become complicated and provides an inadequate guide to its collection. There can be no doubt that this is a serious deficiency in a closed access library since materials housed in the library are virtually inaccessible to unskilled readers. The whole breakdown of the efficiency of the catalogue is emminent and will ultimately create the most serious problems for the library. The main purpose of this survey is: (a) to identify problem areas created by the frequent changes in the cataloguing and classifying principles in the library and (b) to grope a rational direction for the future development. Analysing the various classification schemes and cataloguing rules adopted in processing materials (mainly books) in the library, the following conclusions have been made. A. The library adopted five different clasification schemes in different periods, of which KDCP was used for the most part of its collection. KDCP is recommended to use for the future colletion. A classification development office is recommended to be established within the library, of which the main function is to revise the KDCP in collaboration with the appropriate committee of the Korean Library Association. B. The present practice in the library is to apply three different cataloguing rules and two different author notation tables to the Oriental, classical, and Western collections. Efforts should be made to find out an efficient system so that this variety is simplified. An alphabetical index should be added to the classified catalogue, and improvements are required in the Japanese collection. C. The technical services division is inadequately staffed. The staff should be sufficiently numerous and specially qualified. D. The present financial support for the technical services of the library is inadequate. Sufficient financial provision should be made to ensure the effective work. E. A feasibility study should be carried out to develop a computer processing system for providing machine-readable catalogue records on magnetic tape for use by the library community in Korea.

  • PDF

Bayes 정리에 기반한 개선된 동형이의어 분별 모텔 (An Improved Homonym Disambiguation Model based on Bayes Theory)

  • 김창환;이왕우
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권12호
    • /
    • pp.1581-1590
    • /
    • 2001
  • 본 연구에서는 동형이의어 분별을 위하여 허정(2000)이 제시한 "사전 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템"이 가지는 문제점과 향후 연구과제로 제시한 문제들을 개선하기 위하여 Bayes 정리에 기반한 동형이의어 분별 모델을 제안한다. 의미 분별된 사전 뜻풀이말 코퍼스에서 동형이의어를 포함하고 있는 뜻풀이말을 구성하는 체언류(보통 명사), 용언류(형용사, 동사) 및 부사류(부사)를 의미 정보로 추출한다. 동형이의어의 의미별 사전 출현 빈도수가 비교적 균등한 기존 9개의 동형이의어 명사를 대상으로 실험하여 비교하였고, 새로 7개의 동형이의어 용언(형용사, 동사)을 추가하여 실험하였다. 9개의 동형이의어 명사를 대상으로 한 내부 실험에서 평균 99.37% 정확률을 보였으며 7개의 동형이의어 용언을 대상으로 한 내부 실험에서 평균 99.53% 정확률을 보였다. 외부 실험은 국어 정보베이스와 ETRI 코퍼스를 이용하여 9개의 동형이의어 명사를 대상으로 평균 84.42% 정확률과 세종계획의 350만 어절 규모의 외부 코퍼스를 이용하여 7개의 동형이의 어 용언을 대상으로 평균 70.81%의 정확률을 보였다. 정확률을 보였다.

  • PDF

사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구 (An Experimental Study on an Effective Word Sense Disambiguation Model Based on Automatic Sense Tagging Using Dictionary Information)

  • 이용구;정영미
    • 정보관리학회지
    • /
    • 제24권1호
    • /
    • pp.321-342
    • /
    • 2007
  • 이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.

시맨틱웹 기술과 활용방안 (The SemanticWeb Technology and its Applications)

  • 오삼균
    • 정보관리학회지
    • /
    • 제19권4호
    • /
    • pp.298-319
    • /
    • 2002
  • 시맨틱웹은 기계가독형 정의에 기반한 정보의 연계를 통해 웹 자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모하는 새로운 기술이다. 시맨틱웹의 구축은 자원에 불변 고유식별자를 부과하는 URI 체제, 각 정보기관에서 생성되는 요소와 속성의 의미 충돌을 방지하는 XML 네임스페이스, 메타데이터 스키마를 활용한 호환적 자원기술을 가능하게 하는 RDF, 메타 데이터 요소 및 이와 연관된 클래스와 속성 관계 정의의 기반이 되는 RDF 스키마, 그리고 RDF 스키마 위에 논리적 추론과 표현력을 강화한 웹 온톨로지 언어 DAML+OIL 및 그 건조자 (constructors)를 삭제 또는 수정 보완한 OWL (Web Ontology Language) 등의 여러 핵심 개념과 기술을 필요로 하는 작업이다. 이 논문은 이러한 개념과 기술의 점진적 발전 양상을 개괄 설명하고, XML/RDF 스키마를 기반으로 메타데이터 요소들을 정의할 경우 도출할 수 있는 상호운용성과 온톨로지의 다양한 활용 방안 등을 고찰한다.

정보기술이 자원공유에 미치는 영향 (The impact of technology on resource sharing)

  • 이영자
    • 한국도서관정보학회지
    • /
    • 제22권
    • /
    • pp.205-244
    • /
    • 1995
  • Originally the concept of the traditional resource sharing has been discussed in the context of bibliographic materials, and has been labor-intensive and high-cost activities. The technology has had a great impact on such pattern of the resource sharing, and has expanded the limited scope of the traditional concept into the sharing of library information in the levels of local, regional and national systems, and expertise, materials, facilities, equipments and personnels of the library system. While the traditional circulation service as a basic method to share library materials by users can provide the resource to a single person at a time, the electronic resource can be shared, by multi-users at a time anytime anywhere. The maximization of the electronic resource sharing requires that publishing process should be fundamentally changed and articles, books, chapters, speech manuscripts, music scores, maps, sound, and other formats of materials should be prepared in machine readable format. This study examined the positive effects of the technology on the resource sharing, but not investigate the concrete and complex problems as to the cost, guidelines, detailed procedures, design details, and intellectual properties and protection involved in the resource sharing. Some findings extracted from the study can be summarized as follows; (1) ILL will lose its meaning as a method to share the materials if they are all in the electronic format and the phrase 'networked information resource' becomes omnipresent. (2) The technology keeps on changing the concept of resource sharing. Today, the scope of resource sharing not only encompasses the sharing of the primary and secondary materials but also the sharing of the processings(eg. cataloging), expertise, user education, special facilities, and the integrated automated library systems. (3) The sharing of the networked resource will be a method to provide better services for library users in the low cost. (4) The a n.0, pplication of the technology to the resource sharing should be focus on the method which allows an end-users to do the direct access to the needed materials, and to be delivered the primary document as soon as possible.

  • PDF

Utilizing Various Natural Language Processing Techniques for Biomedical Interaction Extraction

  • Park, Kyung-Mi;Cho, Han-Cheol;Rim, Hae-Chang
    • Journal of Information Processing Systems
    • /
    • 제7권3호
    • /
    • pp.459-472
    • /
    • 2011
  • The vast number of biomedical literature is an important source of biomedical interaction information discovery. However, it is complicated to obtain interaction information from them because most of them are not easily readable by machine. In this paper, we present a method for extracting biomedical interaction information assuming that the biomedical Named Entities (NEs) are already identified. The proposed method labels all possible pairs of given biomedical NEs as INTERACTION or NO-INTERACTION by using a Maximum Entropy (ME) classifier. The features used for the classifier are obtained by applying various NLP techniques such as POS tagging, base phrase recognition, parsing and predicate-argument recognition. Especially, specific verb predicates (activate, inhibit, diminish and etc.) and their biomedical NE arguments are very useful features for identifying interactive NE pairs. Based on this, we devised a twostep method: 1) an interaction verb extraction step to find biomedically salient verbs, and 2) an argument relation identification step to generate partial predicate-argument structures between extracted interaction verbs and their NE arguments. In the experiments, we analyzed how much each applied NLP technique improves the performance. The proposed method can be completely improved by more than 2% compared to the baseline method. The use of external contextual features, which are obtained from outside of NEs, is crucial for the performance improvement. We also compare the performance of the proposed method against the co-occurrence-based and the rule-based methods. The result demonstrates that the proposed method considerably improves the performance.

어절 내 형태소 출현 정보와 클러스터링 기법을 이용한 어휘지식 자동 획득 (The automatic Lexical Knowledge acquisition using morpheme information and Clustering techniques)

  • 유원희;서태원;임희석
    • 컴퓨터교육학회논문지
    • /
    • 제13권1호
    • /
    • pp.65-73
    • /
    • 2010
  • 본 논문은 자연어처리 연구를 위하여 지도학습(supervised learning)방식의 어휘지식(lexical knowledge) 수동 구축 방법의 한계점을 극복하기 위하여 비지도학습(unsupervised learning)방식의 자동 어휘지식 획득 모델을 제안한다. 제안하는 모델은 벡터화, 클러스터링, 어휘지식 획득 과정을 통하여 입력으로 주어지는 어휘목록에서 어휘지식을 자동으로 획득한다. 모델의 어휘지식 획득 과정에서 파라미터 변화에 따른 어휘지식 개수의 변화와 어휘지식의 특징이 나타나는 어휘 지식 사전의 일부 모습을 보인다. 실험결과 어휘지식 중 하나로 획득되는 어휘범주 지식의 클러스터가 일정한 개수에서 수렴하는 것이 관찰되어 어휘지식을 필요로 하는 전자사전 자동구축의 가능성을 확인하였다. 또한 한국어 특성이 반영되어 좌 우 통사정보가 포함된 어휘사전을 구축하였다.

  • PDF