• Title/Summary/Keyword: 문서 이해

Search Result 372, Processing Time 0.028 seconds

Understanding the Ongoing Archival Research on the Permanent Preservation of Electronic Records (전자문서의 영구보존을 위한 표준화 연구 동향)

  • Park, Eun-Gyung
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.2 no.1
    • /
    • pp.97-117
    • /
    • 2002
  • In the fast growing digital environment, assuring continued authenticity is an essential and intransigent preservation consideration for digital data and records. Several key issues need to be addressed, including: What are electronic records and data?; Which intellectual and technical elements of data and records are essential for assuring authenticity in electronic format?; How should these be maintained and preserved over time?; How are authentic data and records used in various systems of practice?; and What are the best strategies of preserving authentic electronic records and data?. There have been many research projects to answer these questions to date. This paper discusses the characteristics of electronic records in light of preservation consideration and reports the activities and findings of some of the research projects in brief. This paper focuses on explaining the InterPARES (International Research on Permanent Authentic Records in Electronic Systems) Project, which is defining requirements for authenticity that can help develop strategies for long-term preservation in electronic records. To identify those requirements, more than thirty case studies have been conducted with government agencies, academic institutions, and various organizations in America, Canada, Europe, Asia and Australia and models developed for appraisal, preservation, and strategies in relation to the management of electronic records. The paper also suggests research questions and implications for preserving authentic electronic records as well as the encouragement for Korean research on digital preservation.

VOC Summarization and Classification based on Sentence Understanding (구문 의미 이해 기반의 VOC 요약 및 분류)

  • Kim, Moonjong;Lee, Jaean;Han, Kyouyeol;Ahn, Youngmin
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.1
    • /
    • pp.50-55
    • /
    • 2016
  • To attain an understanding of customers' opinions or demands regarding a companies' products or service, it is important to consider VOC (Voice of Customer) data; however, it is difficult to understand contexts from VOC because segmented and duplicate sentences and a variety of dialog contexts. In this article, POS (part of speech) and morphemes were selected as language resources due to their semantic importance regarding documents, and based on these, we defined an LSP (Lexico-Semantic-Pattern) to understand the structure and semantics of the sentences and extracted summary by key sentences; furthermore the LSP was introduced to connect the segmented sentences and remove any contextual repetition. We also defined the LSP by categories and classified the documents based on those categories that comprise the main sentences matched by LSP. In the experiment, we classified the VOC-data documents for the creation of a summarization before comparing the result with the previous methodologies.

Development of Advanced Intelligent Table Search System (향상된 지능형 테이블 검색 시스템의 개발)

  • Han, Kee-Jun;Kim, Seong-Chan;Liu, Ying
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.405-407
    • /
    • 2012
  • 학술 문서 내에서 테이블은 실험 결과, 정의, 요약하는 정보들을 함축하여 사용자에게 제공하는 역할을 한다. 즉 이러한 테이블을 학술 문서 내에서 탐색, 추출하여 검색에 이용하는 것은 학술 문서의 이해를 돕는 것과 더불어 학술 문서를 사용자가 직접 작성할 때에도 비슷한 형태의 테이블을 참조하여 형식에 맞는 테이블을 작성하는 데에 도움을 준다. 따라서 본 연구는 이러한 다양한 목적의 테이블 검색을 지원하기 위하여 문서로부터 자동으로 적합한 키워드를 추출하고 이를 통하여 문서와 유사한 테이블, 문서 내 테이블과 유사한 형식의 테이블을 검색하는 데 적합한 새로운 지능형 테이블 검색 시스템을 제안하며 이를 통해 기존에 존재하는 테이블 검색 시스템 알고리즘들과 성능 비교를 통해 향후 테이블 기반 검색 시스템 발전 가능성을 제시한다.

The Development of EDI Prototype System Based on XML (XML 기반의 EDI 프로토타입 시스템 개발)

  • 조준구;김창수;한우용;정회경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.388-390
    • /
    • 2000
  • 본 논문은 인터넷 환경 하에서 B2B(Business to Business)사이에 이루어지는 비즈니스 전자문서의 구조를 내용 정의(Content Definition)와 정보 교환(Information Exchange)이 용이한 인터넷 문서 표준인 XML(eXtensible Markup Language)형태로 구성시켜, 상거래 응용의 비 호환적인 성질에 따른 상호 운영이 제대로 되지 못하는 문제점을 극복하기 위한 XML/EDI 시스템을 설계 구현한 것이다. 이를 위해 CommerceNet에서 제공하는 인터넷 전자 상거래 문서 서식인 CBL(Common Business Library)을 참조하여 XML 기반의 비즈니스 문서를 생성하고, 생성한 문서들은 상거래의 주체들인 판매, 운송, 지불, 구매측에 서로 전송을 하게 된다. 내용 정의와 정보 교환 기능이 강한 XML 문서로 구성되어 있어 시스템이 이해하기 쉽고 많은 양의 비즈니스 문서 내용을 담을 수 있게 되어 상호 운영이 가능하고 자동화된 상거래 트랜잭션이 이루어 질 수 있도록 설계 구현 되었다.

  • PDF

Interpretation Principle of Construction Contract for harmonious Management of Construction Work (건설공사의 원활한 관리를 위한 공사계약의 해석방향 -판례 및 중재판정을 중심으로-)

  • Doo Sung-Kyu
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • autumn
    • /
    • pp.31-36
    • /
    • 2001
  • Construction contract have great possibility of dispute between contract parties because of long term performance of contract, various participation of the person concerned, effect according to external environment, etc. It is needed correct comprehension and construction management because good reason of claims depends upon contract document or clauses of the related laws and regulations in cases. The purpose of this study is to suggest desirable Interpretation principle for the harmonious management of the construction work in the cases or arbitration adjudication.

  • PDF

Understanding "Authenticity" in Records Management: A Survey of Practitioners and Users

  • Park, Eun-Gyung
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.3 no.1
    • /
    • pp.43-68
    • /
    • 2003
  • This paper examines the concepts and language that practitioners actually use when talking about authenticity, which is one of the most significant concepts in archives, and explores how they in records and information management currently understand the construct of authenticity in their professional activities. This paper provides brief descriptive statistics drawn from a survey and then analysis related to providing authenticity; the difficulties of judging something authentic; and definitions of authenticity as used and understood in the context of respondents' professional activity. The analysis provides indications of how professionals actually understand and use the concept of authenticity in their professional work depending on the context; and how these professionals react differently to paper records and electronic records. The paper concludes with a discussion of how this preliminary analysis fits within the context of the outcomes of prior electronic records research.

LSTM based Language Model for Topic-focused Sentence Generation (문서 주제에 따른 문장 생성을 위한 LSTM 기반 언어 학습 모델)

  • Kim, Dahae;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.17-20
    • /
    • 2016
  • 딥러닝 기법이 발달함에 따라 텍스트에 내재된 의미 및 구문을 어떠한 벡터 공간 상에 표현하기 위한 언어 모델이 활발히 연구되어 왔다. 이를 통해 자연어 처리를 기반으로 하는 감성 분석 및 문서 분류, 기계 번역 등의 분야가 진보되었다. 그러나 대부분의 언어 모델들은 텍스트에 나타나는 단어들의 일반적인 패턴을 학습하는 것을 기반으로 하기 때문에, 문서 요약이나 스토리텔링, 의역된 문장 판별 등과 같이 보다 고도화된 자연어의 이해를 필요로 하는 연구들의 경우 주어진 텍스트의 주제 및 의미를 고려하기에 한계점이 있다. 이와 같은 한계점을 고려하기 위하여, 본 연구에서는 기존의 LSTM 모델을 변형하여 문서 주제와 해당 주제에서 단어가 가지는 문맥적인 의미를 단어 벡터 표현에 반영할 수 있는 새로운 언어 학습 모델을 제안하고, 본 제안 모델이 문서의 주제를 고려하여 문장을 자동으로 생성할 수 있음을 보이고자 한다.

  • PDF

A Presentation Technique of Dynamic Entities Based on Relative Metadata of Meeting Documents (회의 문서의 관계성 메타데이터에 기반한 동적 엔터티 표현 기법)

  • Ryu Han-Seok;Lee Byung-Chul;Kim Jin-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.1397-1400
    • /
    • 2006
  • 지식 근로자들은 회의 문서 작업 및 활용에 상당한 시간을 할애하고 있다. 하지만 문서들의 관계를 고려하지 않은 메타데이터의 처리와 기존의 계층적인 네비게이션 방식은 사용자가 한 눈에 여러 문서들의 메타데이터 관계를 파악하기가 어려웠다. 하지만 본 논문에서는 회의 문서의 관계성 메타데이터를 평면적으로 펼쳐 조회할 수 있도록 프로젝트, 회의, 작업 문서들의 관계에 기반한 동적 엔터티 표현 기법을 제안한다. 이를 통해 사용자는 메타데이터의 계층에 대한 내용을 전혀 이해하고 있지 않아도 관련된 정보를 한 눈에 확인 할 수 있게 된다.

  • PDF

Test on Learning Method for Improving Performance Using Cohesion Devices (Cohesion Devices를 이용한 학습 적용 방법과 성능 개선을 위한 실험)

  • Kim, Yonghoon;Chung, Mokdong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.755-758
    • /
    • 2018
  • 현재의 정보 검색 및 문서를 분류하는 기법에 대하여 신경망을 이용한 정보검색 모델에 대한 연구가 활발히 진행되고 있으며, 간단한 문장에 대한 주제어 분석에서부터 장문에 해당하는 수필 등의 문서를 분류하는 기술이 요구되고 있으며, 이를 실현하기 위한 다양한 알고리즘을 적용하거나, 단어 및 문서에 가중치를 적용하거나, 문서에서의 특이 값을 구하고, 이를 분석하는 방법에 대하여 정보화가 가속화 되면서 정확한 문서에 대한 이해가 요구되고 있다. 이러한 연구와 직접적으로 관련된 단어의 빈도에 대한 논의는 사회과학의 영어학습에 대한 연구 또는 순수 언어에 대한 연구에 머물러 있다. 이에 본 연구에서는 영문에서의 응집장치를 이용하여 문장에서의 중요 단어에 대한 빈도를 합리적으로 증가시켜 문장의 의미를 더 정확하게 분석할 수 있는 기법에 대하여 제시하고자 하며, 본 논문에서는 영문 수필 사이트의 분류를 추측하고 이를 자동 분류 할 수 있는 방법에 대하여 제시하고자 하며, 이를 구현하여 문서의 의미에 대한 연구에 기여하고자 한다.

Ontology Based Semantic Search System Using Inference (온톨로지를 통한 추론형 시멘틱 검색 시스템에 관한 연구)

  • 하상범;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.625-627
    • /
    • 2004
  • 시멘틱 웹의 등장으로 온톨로지를 통하여 에이전트가 이해할 수 있는 의미(semantic)를 갖는 문서를 생성하는 것이 가능해졌다. 이러한 시멘틱 웹의 영역은 비즈니스 업무 효율을 증가시키고 이를 통해 이윤을 극대화시키는 방법으로 시멘틱 검색을 통한 정보검색시스템으로 확대적용 될 수 있다. 데이터베이스를 활용하여 문서를 저장하고 데이터베이스의 질의문물 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 시스템은 다양한 분야에서 많이 연구되어 왔다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시멘틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다. 본 논문에서 제안하는 방식은 기존의 데이터베이스 질의문으로 검색이 불가능하거나 정보관리 시스템에서 단순히 키워드 매칭으로 검색되지 않는 문서에 대해서 본 시스템이 온톨로지라 추론을 통하여 문서의 검색에 가능함을 보인다. 이러한 방식은 자연어처리 검색과 유사한 검색영역을 갖는다. 이는 문서의 검색에 있어 단순히 키워드의 유사도에 의존하지 않고 Description Logic을 바탕으로 구성된 온톨로지에 미리 정의 되어있는 의미를 바탕으로 생성된 메타데이타를 가지고 추론을 하기 때문에 가능하다 또한 기존의 정보관리 시스템에서 채용한 데이터베이스를 통한 질의응답 시스템을 적용하여 온톨로지 표현언어에 대해 질의 응답이 가능한 DQL 인터페이스와 연동을 통하여 본 시스템의 속도와 효율성을 극대화시킨다.

  • PDF