• 제목/요약/키워드: 원문정보

검색결과 292건 처리시간 0.035초

워드문서 콘텐츠의 사용자 XML 콘텐츠로의 변환 및 저장 시스템 개발 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.555-559
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 워드 문서를 대상으로 사용자가 작성한 구조적인 규칙과 XML 기반 워드 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)워드문서의 원시 XML문서로의 변환방법, 2)XML 기반 구조적인 규칙 작성과 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 워드문서의 변환을 위해서 독립적으로 동작하는 OCX 기반의 워드문서 변환 데몬(daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 구조적인 문서로 생성하거나 DB에 저장할 수 있다. 개발한 시스템(PPE)은 워드 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 처리를 하거나 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리 시스템과 성과정보시스템에 시범 적용하였다.

  • PDF

계몽기·근대시조 DB의 개선 및 콘텐츠화 방안 연구 (A study on the improving and constructing the content for the Sijo database in the Period of Modern Enlightenment)

  • 장정수
    • 한국시조학회지:시조학논총
    • /
    • 제44권
    • /
    • pp.105-138
    • /
    • 2016
  • 최근 검색 기능을 갖춘 "계몽기 근대시조의 XML 데이터베이스 문서화"라는 자료가 기초학문자료센터(http://www.krm.or.kr)를 통해 제공되고 있어 근대시조의 문화콘텐츠화를 진행할 수 있는 기반이 마련되었다. 이에 본고에서는 계몽기 근대시조 DB의 특성 및 문제점을 검토해 보고 개선 방향을 탐색함으로써 이 자료의 콘텐츠화 방안을 모색해 보았다. 계몽기 근대시조 DB는 12,500여 수에 이르는 방대한 양의 근대시조를 한자리에서 일별할 수 있도록 집성해 놓았다는 점과 문헌 및 작가명 작품명 검색, 원문 검색, 시기별 검색 등의 검색 기능을 갖춘 최초의 시조 DB라는 점에서 의의를 지닌다. 그러나 이 DB는 현대어 정규화 텍스트가 형성되지 않아 제목이나 원문이 고어나 한자로 표기되어 있는 경우 검색이 되지 않으며, 1945년 이후에 발표된 작품과 개인 시조집에 수록된 작품이 대거 누락되어 있어 계몽기 근대시조의 총체적 모습을 확인하는 데에 한계가 있다는 문제점을 지니고 있다. 또한 작자 표시가 실명, 호, 필명 등으로 다양하게 표기되어 있어 작가별 자료 추출에 불편함이 따르는 문제가 있다. 이러한 문제점을 해결하고 DB 활용을 제고(提高)하는 방안으로 본고에서는 현대어 정규화 텍스트 마련, 작품 별 내용소(內容素) 색인어 부여, 고시조 DB와의 통합, 작품 형식에 대한 정보 제공 등을 제시하였다. 나아가 '시조문화정보시스템'의 성격을 갖춘 복합적인 성격의 계몽기 근대시조 DB가 형성된다면 이를 연구 및 교육콘텐츠로 활용할 수 있음을 피력하였다. 그 구체적인 방안으로는 근대사 학습 및 근대기 국토 인식 등에 대한 보조 자료, 고유의 동식물 캐릭터 학습 및 상업적 캐릭터 생성을 위한 원천 자료, 시조놀이 등의 시조학습 도구로 활용할 수 있음을 제안하였다.

  • PDF

협력형 자원개발을 위한 해외학술지 중복 연구 (A Foreign Serials Overlap Study for Collaborative Collection Development)

  • 황혜경;김순영;이혜진
    • 정보관리연구
    • /
    • 제39권2호
    • /
    • pp.131-161
    • /
    • 2008
  • 오늘날 인터넷과 전자출판 기술의 발달로 전자자원에 대한 이용이 매우 활발히 이루어지면서 연구자들 학술활동의 핵심 정보자원인 학술지가 전자원문 형태로 활발히 이용되고 있다. 이는 한정된 도서관 자료수집 예산 속에서 물리적인 자료 소장 공간의 부족, 이용의 편리성을 고려한 점을 원인으로 볼 수 있다. 그러나 현실적으로 전자자원은 소유보다는 접근의 개념에서 출판사 및 정보제공기관에 의해 이용권한이 매우 제한적이며, 구독기간이 만료되면 더 이상 이용하기 어렵다는 한계가 있다. 이에 전세계적으로 전자자원을 통한 이용의 편리성을 도모하는 한편, 인쇄자원에 대한 분담 수집 및 공동 보존을 하기 위한 움직임이 일어나고 있다. 본 연구에서는 국내외 도서관에서 해외인쇄학술지 수집 및 유통현황을 분석하고 국내에서 수집되고 있는 인쇄학술지를 대상으로 국내 기관유형별 지역분포, 중복수집기관분포, 주제분포 현황을 살펴보았다. 그리고 협업기반의 전략적 자원개발을 추진하기 위한 고려사항을 논의하였다. 이는 국가차원에서 자원에 대한 중복을 최소화함과 동시에 학술지의 가용성을 극대화할 수 있는 공유협력기반의 자원 개발을 추진하기 위함이었다.

블록체인기술을 적용한 기록관리 모델 구축 방법 연구 (A Study on the Application of Blockchain Technology to the Record Management Model)

  • 홍덕용
    • 한국기록관리학회지
    • /
    • 제19권3호
    • /
    • pp.223-245
    • /
    • 2019
  • 4차 산업혁명의 기반으로서 블록체인은 다양한 산업에서 신성장 동력을 만들어내는 중요한 핵심 인프라이면서 기술로 자리를 잡아가고 있다. 세계적으로 블록체인에 대한 관심이 기업과 기관의 환경으로 빠르게 확산되고 있다. 본 연구에서는 블록체인 기술의 특성 및 동향을 조사 및 정리하고 공공기관 기록관리부분에 블록체인 기술의 적용이 필요한지 알아보았으며 공공기관의 기록관리분야의 구축절차 및 구축방법을 문헌으로 연구하였다. 최종적으로 기록물관리분야에 블록체인 기술을 적용하여 아카이브체인(Archivechain)모델을 제안하고 어떠한 기대가 예상되는지 기술하고자 하였다. 전자문서의 기록관리 과정을 기록한 트랜잭션이 블록체인에 탑재되게 되면 단편적으로 비연계되었던 기록관리 표준업무처리 과정에 모든 단계 정보를 한 번에 확인 할 수 있다. 전자기록관리시스템에 블록체인기능이 탑재된다면 문서를 획득 등록하여 문서를 생산한 자가 메타데이터 및 정보를 입력한 후 모든 내용을 저장하고 분류한다. 그렇게 되면 생산현황보고의 절차가 간결하게 될 것이고 원문정보공개서비스를 통해 실시간으로 정보를 제공할 수 있다. 아카이브체인(Archivechain)은 전자문서생산시스템과 기록관리시스템이 일체되었다는 가정하에 하이퍼레저 플랫폼을 적용하여 BaaS형 클라우드 인프라를 적용한 모델이다. 스마트하고 전자 정부로 진보하는 기록관리 체계를 만들기 위해 공공 기록물관리의 모든 생애주기에 블록체인에 배치함으로써 흩어져 있는 정보를 하나로 모을 수 있는 문제를 해결 할 수 있다.

한국연구재단 오픈액세스 정책 실행방안 연구 (A Study on Methods of Implementation for the NRF Open Access Policy)

  • 정경희;이재윤;정은경;최상희
    • 정보관리학회지
    • /
    • 제37권4호
    • /
    • pp.255-286
    • /
    • 2020
  • 본 연구는 '한국연구재단 오픈액세스 2021(안)'에 대한 실행방안을 도출하기 위한 것이다. 본 연구는 APC 지원규모와 방법 및 절차, 국내 학술지의 오픈액세스 전환 지원, 오픈액세스 리포지터리에 논문을 기탁하는 방안 등 세 가지 측면에서 실행방안을 제안하였다. 첫째, APC는 합리적인 수준에서 지원되어야 하며 그 상한액을 설정하기 위하여 매년도 이전 3년간 오픈액세스 학술지에 출판한 논문의 APC 평균값이나 중위값을 적용한다. 또한 APC는 오픈액세스 학술지와 오픈액세스전환약정 학술지에 논문을 출판하는 경우 지원하고 하이브리드 학술지나 이중접근 학술지에는 지원하지 않는다. 둘째, 국내 학술지 오픈액세스 출판전환을 위하여 과도기에는 KJCI에 CCL 적용을 등록한 오픈액세스 학술지와 오픈액세스 출판 전환의향서를 제출한 학술지에 대하여 지원사업 신청이 가능하도록 해야 한다. 셋째, 하이브리드 학술지와 이중접근 학술지 및 구독학술지에 출판한 경우 원문기탁과 동시에 엠바고 등 저작권 사항을 보고해야 한다. 본 연구의 결과는 한국연구재단이 국내 학술지 출판환경과 국제적인 학술커뮤니케이션 상황에 부합하는 오픈액세스 정책을 신속하면서도 안정적이고 지속적으로 실행하는데 기초 자료로 활용될 수 있을 것이다.

"임원십육지(林園十六志)" 인용문헌(引用文獻) 분석고(分析考)(1) - 농학분야(農學分野)를 중심으로 - (A Study on Citation Analysis of Limwonsibyukji)

  • 노기춘
    • 한국도서관정보학회지
    • /
    • 제37권1호
    • /
    • pp.375-403
    • /
    • 2006
  • 이 연구는 임원십육지(林園十六志) 가운데 농학분야(農學分野)에 속하는 6개 (지)志의 인용문헌(引用文獻)을 분석한 논문이다. 분석결과, 인용문헌(引用文獻)의 표기상 오류(誤謬)로 확인된 문헌은 20종이며, 약서명(略書名) 또는 이서명(異書名)은 53증으로 확인되었다. 서명(書名)의 오기(誤記)와 약서명(略書名) 또는 이서명(異書名)을 정리하여 본 결과, 농학분야(農學分野)의 인용문헌(引用文獻)은 총 357종, 인용회수는 총 5349회로 밝혀졌다. 그리고 임원십육지(林園十六志)의 농학분야(農學分野) 편찬에 인용회수가 100회 이상인 핵심문헌은 군방보(群芳譜)(667회), 농서(왕정)(農書(王禎))(299회), 농정전서(農政全書)(296회), 본초강목(本草綱目)(268회), 재민요술(齋民要術)(264회), 증보산림경제(增補山林經濟)(251회), 난호어목지(蘭湖漁牧志)(250회), 행포지(杏蒲志)(213회), 화한삼재도회(和漢三才圖會)(137회), 호주목단사(毫州牧丹史)(107회) 등 10종으로 밝혀졌고, 농학분야(農學分野)인 6개 (지)志는 원문(1차 자료)의 직접인용을 통한 편찬 작업이 주류를 이루고 있음이 확인되었다.

  • PDF

전래동화 <해님과 달님>의 이본(異本) 비교 (Comparison with the Alternative Versions of the Korean Fairy Tele )

  • 송정숙
    • 한국도서관정보학회지
    • /
    • 제36권1호
    • /
    • pp.47-69
    • /
    • 2005
  • 구전설화에 바탕을 두고 있는 전래동화는 다양한 이본이 존재하는데, 어린이들을 위해 어떤 책을 선택하는 것이 좋을지, 즉 어느 책의 본문이 가장 좋을지가 늘 의문이었다. 이 연구는 이 의문을 해결하기 위하여 시도된 것으로 원문서지학의 연구방법으로 문헌을 비평하였다. 널리 알려진 전래동화 <해님과 달님>의 이본 6편을 대상으로 줄거리 파악을 통해 구조를 분석하고 이를 토대로 제목, 배경, 등장인물, 문체, 기능을 비교 분석하였다. 그 결과 6편의 이본 가운데 어효선본의 본문이 비교적 우수하다고 판단되었다. 어효선본에서 조력자인 옥황상제를 하느님으로 바꾸고, 문체를 구어체로 바꾸며, 해와 달이 된 오누이가 서로 바꾸는 마지막 장면을 삭제한다면 이상적인 원문이 될 것이다. 이러한 원문서지학적인 연구가 축적되고, 이러한 역량이 갖추어질 때 비로소 사서가 내용, 즉 컨텐츠에 대해서 발언할 수 있게 될 것이다.

  • PDF

영-한 병렬 코퍼스로부터 외래어 표기 사전의 자동 구축 (Automatic Construction of Foreign Word Transliteration Dictionary from English-Korean Parallel Corpus)

  • 이재성
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.9-21
    • /
    • 2003
  • 본 논문에서는 한국어 번역문과 영어 원문으로 구성된 병렬 코퍼스로부터 자동으로 외래어 표기 사전을 구축하는 시스템을 제안한다. 구축 시스템은 첫 단계로 한국어 문서에서 명사를 추출하고, 두 번째 단계에서 추출된 명사 중 언어 모델에 근거하여 외래어만을 추출한 후, 마지막 세 번째 단계에서 확률적 정렬 방법을 이용하여 외래어에 대응되는 영어를 추출한다. 특히, 외래어는 한국어 어미나 조사가 붙어서 같이 쓰이기 때문에, 한국어 어절 내에서 정확하게 외래어 부분만을 분리하기 위해, 병렬 코퍼스 내에 존재하는 대응 영어 단어 정보를 활용하였다. 또, 문자체계가 다른 두 단어를 같은 문자로 변환하지 않고 직접 음운 유사도를 비교할 수 있도록 했다. 실험 결과, 성능은 전처리 단계인 한국어 미등록어 및 외래어 추정에 영향을 많이 받았고, 수작업으로 전처리를 한 모델 중 가장 성능이 높은 것은 재현률 85.4%, 정확률 91.0%를 보였고, 전 과정을 자동으로 한 모델중에서는 재현률 68.3%, 정확률 89.2%를 보였다.

  • PDF

근대 수문조사 고문서의 수집 및 검토 (Collection and Examination of Historical Documents on Modern Hydrological Investigation)

  • 권성일;김원;김동구;김혜진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.243-243
    • /
    • 2011
  • 수문조사를 우량, 수위, 유량을 측정하는 것으로 정의하고, 위와 같은 기록을 바탕으로 하면 우리나라의 근대 수문조사는 1911년에 시작된 것으로 볼 수 있다. 이에 따라 2011년은 우리나라의 근대 수문조사 100년이 되는 해이다. 이를 계기로 과거 우리나라 수문조사의 역사를 정리하고 새로운 발전방향을 제시하는 것이 필요하다. 본 연구에서는 1910∼1945년의 기간에 발간된 고문서를 대상으로 하여 수문조사에 대하여 작성한 문서를 발굴, 정리 및 분석하여 과거 수문조사에 대한 내용을 쉽게 파악하고, 역사적, 학술적으로 중요한 수문조사의 문서를 쉽게 접할 수 있도록 하였다. 1911년 이후에 수문조사, 하천, 기상, 수력, 홍수 등에 대하여 작성된 문서를 수집하기 위해서 문헌 조사를 실시하였다. 특히, 1911년부터 1940년의 일제 강점기때 조선총독부에서 우리나라의 수문조사 및 수자원 등에 대하여 발행한 문서 중에서 아직까지 일반인에게 보급되지 않은 문서를 중심으로 조사하였다. 이러한 문헌 조사는 국내외 도서관에서의 문서 검색, 고문서 판매서점의 판매문서 확인 등의 방법으로 이루어졌고, 이렇게 하여 수집된 문서는 총 115권이었다. 수집한 문서 중에서 조사 및 공사 연보, 원문 내용을 확인하기 곤란한 경우, 기번역된 문서를 제외한 나머지 문서에 대해서 내용을 쉽게 파악할 수 있도록 주요 내용을 정리하였다. 주요 내용에는 서지정보로서 저자, 발행기관, 발행연도, 핵심용어 등을 정리하고, 일본어로 작성된 문서 내용을 파악하는데 도움을 주기위해 주요 내용과 목차를 번역하여 정리하였다. 이렇게 정리된 문서는 본문 내용, 발행연도, 발행기관 등에 대하여 경향성을 살펴볼 수 있었다. 본문 내용에 대하여 살펴본 결과, 호우 등에 의한 수해 현황을 기술한 문서, 수문관측 자료를 기술한 문서, 하천조사 내용을 기술한 문서 등이 많은 것으로 나타났다. 발행연도별로 살펴보면, 1920년도와 1930년도에 많이 발행된 것으로부터 이 시기에 수문관측, 하천조사, 하천공사 등이 활발하게 이루어졌음을 짐작할 수 있었다. 그리고 이 문서들은 조선총독부에서 발행한 것으로 일본이 조선의 하천 상황을 파악하기 위해 계획적이고 체계적으로 수문관측, 하천조사 등을 실행하였음을 짐작할 수 있었다. 이와 같이 우리나라 수문조사의 역사를 발굴하고 분석한 결과 자료는 향후 우리나라 수문조사의 발전방향을 제시하는데 있어 밑거름이 될 수 있을 뿐만 아니라 학술적, 기술적으로 활용할 수 있을 것으로 판단된다.

  • PDF

조선 개항장의 감리서(監理署)와 기록 - 부산항을 중심으로 - (The Superintendent Office (Gamriseo) at the Open Ports in Joseon Dynasty of Korea and Related Records: Focused on the Busan Port)

  • 송정숙
    • 한국기록관리학회지
    • /
    • 제13권3호
    • /
    • pp.255-282
    • /
    • 2013
  • 이 연구는 개항장에 한시적으로 설치되었던 감리서의 설치과정 및 관련 기록을 부산항을 중심으로 살펴보았다. 먼저 감리서가 요구되는 시대상황을 파악하기 위해 부산항이 개방되어 가는 과정을 살펴보고, 감리서 기록이 생산되는 맥락정보를 파악하기 위해서 감리서의 직제와 설치와 폐지에 대해 살펴보았다. 다음으로는 감리서가 업무를 수행하면서 생산하거나 접수한 기록을 감리의 기능에 따라 교섭기록, 재판기록, 경무기록, 통상기록, 목민기록, 일록의 여섯 유형으로 나누어 각 기록의 내용을 살펴보았다. 부산항의 개방과 관련한 조약과 감리서의 설치와 폐지에 관한 칙령들은 "고종실록"이나 "승정원일기" 등 연대기 자료와 "한말근대법령자료집"에 게재되어 있다. 감리서에서 생산하거나 접수한 원본 문서는 대부분 규장각에 소장되어 있는데, 목록이나 해제만 제공되고 있으며, 일부는 "각사등록"과 "구한국외교관계부속문서"에 게재되어 있다. 이러한 감리서 관련 기록들 가운데 "고종실록"만 국역되어 있으므로 연구의 활성화를 위해서는 국역과 원문 서비스 제공이 시급하다.