• 제목/요약/키워드: 문서지

검색결과 2,043건 처리시간 0.026초

객체 식별자를 이용한 객체지향 데이터베이스의 XML 문서로의 변환 (Transformation of Object-Oriented Databases into XML Documents using Object Identifiers)

  • 윤정희;박창원;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.131-139
    • /
    • 2001
  • 데이터 변환은 데이터 재사용, 데이터 교환 및 통합 등에 사용되는 중요한 기술이다. 본 논문에서는 객체지향 데이터베이스를 유효한 XML 문서들로 변환시키는 두 가지 알고리즘을 제시한다. 먼저 객체지향 데이터베이스의 스키마, 객체지향 데이터베이스, DTD 그리고 XML 문서를 정의한 뒤 두 가지 알고리즘, 즉 객체지향 데이터베이스의 스키마를 DTD로 변환시키는 알고리즘과 객체지향 데이터베이스를 XML 문서들로 변환시키는 알고리즘을 제시한다. 그리고 제시한 두 가지 알고리즘의 결과는 항상 잘 구성된 XML 문서들이고 유효한 XML 문서들임을 증명한다. 잘 구성된 XML 문서는 XML문서가 갖추어야 하는 필수 조건이므로 반드시 필요하다. 또한 유효성은 유효한 XML 문서들을 필요로 하는 XML 응용에 유효한 XML 문서를 제공할 수 있도록 한다.

  • PDF

MIRAGE-III 디지털도서관에서 가상문서 검색 서버의 설계 및 구현 (Design and Implementation of a Retrieval Server for Virtual Documents in the MIRAGE-III Digital Library)

  • 이용배;맹성현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.219-230
    • /
    • 2002
  • 인터넷이용의 급증에 따라 지식정보화사회 전반의 작업들이 분산환경의 디지털도서관에 저장되어 있는 멀티미디어 컨텐츠를 쉽고 신속하게 찾아 새로운 정보를 생성 또는 공유하는 작업을 통해 이루어진다. 이를 위해 핵심적으로 연구해야 할 부분은 원격지에 흩어져 있는 정보를 효과적으로 연결시켜서 의미있고 일관된 형태로 보여지도록 하는 것이다. 이 목적을 달성하기 위해 디지털도서관에서는 물리적으로 홑어져 있는 정보들이 논리적으로 일관되게 표현될 수 있는 가상공간을 제공해야 하며 가상공간에서 정보가 표현되었을 때 사용자가 원하는 정보를 신속하게 수집하여 제시할 수 있어야 한다. 가상문서(Virtual Document)란 특정 저장장소에 저장되어 존재하던 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. MIRAGE-III 디지털도서관에서는 일반 텍스트문서와 XML로 기술된 구조화된 가상문서를 대상으로 내용기반 검색을 수행한다. 이 시스템에서는 XML 문서구조를 기반으로 부분문서의 검색이 가능하며 문서의 속성 및 계층구조에 대한 검색과 문서간의 링크관계를 이용한 검색도 가능하다. 본 논문에서는 MIRAGE-III 디지털도서관에서의 질의어처리기 및 검색기를 설계하고 구현한 방법론에 대하여 기술한다.

조선시대 고문서(古文書)에 사용된 종이 분석 (An Analysis of Papers used in Historical Manuscrips)

  • 손계영
    • 한국기록관리학회지
    • /
    • 제5권1호
    • /
    • pp.79-105
    • /
    • 2005
  • 본 연구는 조선시대의 고문서에 사용된 종이를 분석하여 그 특징을 고찰함에 그 목적을 두고 있다. 현존하는 종이 실물의 분석을 통하여 조선시대 고문서에 사용된 종이의 상태와 변화를 실질적으로 관찰해 보고자 한다. 분석대상은 문중에 소장하고 있는 고문서 1,504건으로, 그 종류는 17종 23항이다. 분석방법으로는 종이의 발형태(발초 발끈의 형태), 밀도, 섬유종류를 분석하는 방법을 시도하였다. 우선 발의 형태는 발초수와 발끈폭으로 나누어 관찰하였는데, 3cm내의 발초수는 크게 10개 내외의 경우와 17개 내외의 경우로 나누어진다. 17개 내외의 경우는 조선초기의 책지에서 보이는 발초수와 유사하나, 10개 내외의 경우는 그 사례가 드물다. 10개 내외의 발초수를 갖춘 것은 1933년 Dard Hunter의 조사에 보이는 억새발인 것으로 파악된다. 발초수를 시기적으로 살펴보면, 조선전기에 비해 중기부터 말기로 갈수록 발초가 더욱 촘촘해짐을 확인할 수 있다. 발끈폭은 상당히 불규칙적으로 나타나며, 이외에도 다양한 현상을 발견할 수 있다. 예를 들면, 발끈과 발끈 사이에 짧은 발끈이 있는 경우, 발끈이 이중으로 나타나는 경우, 발끈폭이 좁게 나타나는 경우 등이 그것이다. 발끈폭은 조선후기로 갈수록 좁아지는 현상을 보이는데, 특히 1800년대 이후에 확연히 좁아짐을 알 수 있다. 다음으로 밀도를 살펴보면, 문서종류마다 나타나는 평균밀도가 "탁지준절(度支準折)"에 기록된 종이 종류와 무관하지 않다. 종이 종류의 항목이 같은 문서는 서로 유사한 평균밀도를 보이며 초주지, 상품도련지, 하품도련지, 저주지의 순으로 밀도가 점점 낮아진다. 이외에도 같은 종류 문서의 밀도를 분석해 보면 당시에 문서를 둘러싼 다양한 이해관계를 알 수 있다. 마지막으로 문서지에 사용된 식물섬유의 종류를 살펴보았다. "탁지준절"에서 구분한 상품도련지, 하품도련지, 초주지, 저주지를 사용한 각 문서지의 섬유를 관찰한 결과, 모두 같은 형태의 닥섬유임을 알 수 있다. 이는 문서지 제조에 사용된 종이가 식물섬유의 차이에 의해서 구분되었던 것이 아니라, 제작 가공방법 등의 차이로 구분되었음을 알려주는 것이다. 문서의 작성목적에 따라 종이의 종류를 다르게 사용하고, 시기에 따라서도 종이의 특징이 다른 양상으로 나타난다. 본 연구를 통해서 책지(冊紙)와 문서지(文書紙)의 비교를 할 수 있고, 중국의 고대 종이와 조선시대 종이의 비교도 가능하게 되었다. 이와 같은 연구를 통해 당시의 종이 종류와 문서종류별 시대별 변화과정을 구체적으로 이해할 수 있는 계기가 되리라 믿는다.

전자문서 유효기간 검증 기능을 탑재한 전자문서관리시스템 구현 (Implementation of EDMS(Electric Document Management System) with Validity Verification)

  • 박중오;이승민;김상근;전문석
    • 한국통신학회논문지
    • /
    • 제35권7B호
    • /
    • pp.1043-1049
    • /
    • 2010
  • 전자문서의 신뢰성과 안정성을 보장하는 공인전자문서보관소를 구축,운영하는데 있어서 "전자문서 보관 및 발급 서비스"는 핵심 서비스 중에 하나이다. 문서 소유자가 전자문서를 등록한 후 향후 제 3자에게 발급하는 과정에서 등록된 전체의 정보가 아닌 부분정보 발급을 통해 불필요한 정보유출을 방지한다. 또한 유효성 검사 모듈을 문서 자체 내에 포함시켜 문서의 유효기간을 점검하는 시스템을 제안하였다.

하둡과 의미특징을 이용한 문서요약 (Document Summarization using Semantic Feature and Hadoop)

  • 김철원
    • 한국정보통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.2155-2160
    • /
    • 2014
  • 본 논문은 하둡 기반의 분산병렬처리에 의한 문서의 의미특징을 추출하고, 추출된 의미특징을 이용하여 문서를 요약하는 새로운 방법을 제안한다. 제안된 방법은 문서요약에 비음수 분해된 문서의 의미특징을 이용함으로써 문서의 내부 구조를 잘 표현 할 수 있다. 또한 하둡을 이용하여 빅데이터의 문서를 요약할 수 있다. 실험결과 제안방법이 단일 컴퓨터 환경에서 처리할 수 없는 대용량의 문서를 요약할 수 있음을 보인다.

개인화 웹 검색 시스템 기반의 문서 요약 시스템 (A Document Summary System based on Personalized Web Search Systems)

  • 김동욱;강수용;김한준;이병정;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.357-365
    • /
    • 2010
  • 개인화 웹 검색 시스템은 사용자의 검색의도에 따라 질의어 확장, 검색 결과의 재순위화 등의 방법을 통하여 사용자에게 개인화된 검색 결과를 제공한다. 이를 위해 검색 시스템은 질의어와 사용자의 프로파일 정보를 활용하여 사용자의 검색 의도를 파악하고 분석하여, 검색 결과 페이지에 반영하여 보여주게 된다. 이때 검색 결과 페이지는 문서의 URL과 문서의 제목, 작은 텍스트 조각을 표시한다. 여기서 작은 텍스트 조각은 검색 질의어가 포함된 문서의 요약이며, 스니펫이라고 알려져 있다. 사용자는 이러한 문서의 요약을 통하여 웹 문서가 자신이 원하는 정보를 가진 문서인지를 판단하거나, 해당 URL에 직접 접속하지 않고도 원하는 정보를 얻을 수 있게 된다. 따라서 문서 요약은 사용자가 문서를 볼 것인지 아닌지에 대한 중요한 판단 기준이 되며, 만약 문서 요약 시스템이 개인화된 요약 결과를 제공한다면 사용자의 만족도는 더욱 증가할 것이다. 본 논문은 전체 웹 검색 시스템에서 검색 속도의 큰 하락없이 사용자의 만족도를 증가시킬 수 있는 개인화 문서 요약 시스템을 제안한다.

다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법 (A Method for Automatic Detection of Character Encoding of Multi Language Document File)

  • 서민지;김명호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권4호
    • /
    • pp.170-177
    • /
    • 2016
  • 문자 인코딩은 문서를 컴퓨터에서 이용할 수 있도록 문자 코드 테이블을 이용하여 이진화하는 방법이다. 이진화된 문서를 읽기 위해서는, 문서에 적용된 문자 코드를 이용하여 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 각 언어별 자주 사용하는 단어를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 자주 사용하는 단어를 이용한 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 다국어 문서에서 기존의 방법보다 높은 문자 인코딩 인식률을 보인다. 주로 표현하는 언어의 비중이 20% 미만일 경우, 기존의 방법은 약 50%의 문자 인코딩 인식률을 보였으나, 제안하는 방법은 문자 인코딩에서 표현하는 언어의 비중과는 상관없이 96% 이상의 문자 인코딩 인식률을 보였다.

온톨로지 기반의 문서 생성 시스템 (A Document Generation System Based on an Ontology)

  • 류재현;박성배
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.313-316
    • /
    • 2016
  • 온톨로지란 사물이나 개념의 속성이나 관계를 사람과 컴퓨터 모두 이해할 수 있는 형태로 표현한 모델로 정보검색, 인공지능, 소프트웨어 공학 등의 분야에서 많이 활용된다. 온톨로지에는 다양한 정보가 구조화되어 저장되어 있지만 일반적으로 온톨로지가 제공하는 그래프 형태의 데이터들은 사용자들이 직관적으로 이해하기가 힘들다. 따라서 본 논문에서는 온톨로지의 정보를 문장화하여 한국어 문서를 생성하는 시스템을 제안한다. 제안하는 시스템은 주제와 관련된 트리플을 추출하고 이를 문장정렬, 결합, 생성을 위한 정보가 담긴 템플릿을 생성한 뒤 한국어 문법에 맞게 문장을 생성한다. 또한 기존 연구에서 다루지 않았던 이벤트 온톨로지의 내용을 포함하여 문장을 생성한다. 두 온톨로지로부터 생성된 문장을 연결하여 주제어를 설명하는 하나의 문서를 작성한다.

  • PDF

온톨로지 기반의 문서 생성 시스템 (A Document Generation System Based on an Ontology)

  • 류재현;박성배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.313-316
    • /
    • 2016
  • 온톨로지란 사물이나 개념의 속성이나 관계를 사람과 컴퓨터 모두 이해할 수 있는 형태로 표현한 모델로 정보검색, 인공지능, 소프트웨어 공학 등의 분야에서 많이 활용된다. 온톨로지에는 다양한 정보가 구조화되어 저장되어 있지만 일반적으로 온톨로지가 제공하는 그래프 형태의 데이터들은 사용자들이 직관적으로 이해하기가 힘들다. 따라서 본 논문에서는 온톨로지의 정보를 문장화하여 한국어 문서를 생성하는 시스템을 제안한다. 제안하는 시스템은 주제와 관련된 트리플을 추출하고 이를 문장정렬, 결합, 생성을 위한 정보가 담긴 템플릿을 생성한 뒤 한국어 문법에 맞게 문장을 생성한다. 또한 기존 연구에서 다루지 않았던 이벤트 온톨로지의 내용을 포함하여 문장을 생성한다. 두 온톨로지로부터 생성된 문장을 연결하여 주제어를 설명하는 하나의 문서를 작성한다.

  • PDF

단문화와 변환 규칙을 이용한 온톨로지의 자동 생성 (Automatic Generation of Ontology with Simplified Sentences and Transfer Rules)

  • 박인철
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1092-1097
    • /
    • 2007
  • 온톨로지의 구축은 상당한 시간과 비용을 소모하기 때문에 상업적인 시맨틱 웹의 구축은 매우 어려운 작업이다. 이러한 문제의 해결 방법은 온톨로지를 자동적으로 구축하는 것이다. 본 논문에서는 대부분의 중요한 정보를 포함하고 있는 웹 문서를 분석하여 온톨로지를 자동으로 생성하는 시스템을 제안한다. 제안하는 시스템은 한국어 문장을 분석하여 문서 내 모든 문장을 단문으로 재구성하는 단문화 과정과 변환 규칙을 이용한 온톨로지 자동 생성 과정의 두 단계로 구성된다. 이러한 시스템은 온라인 쇼핑몰처럼 비슷한 내용을 포함하는 문서가 대다수 존재하고, 문서의 갱신 및 추가가 빈번한 응용 분야에서 매우 유용하게 사용될 수 있다.

  • PDF