• 제목/요약/키워드: PDF 페이지

검색결과 9건 처리시간 0.029초

PDF 파일의 페이지단위 복구 기법 (A Recovery Technique of PDF File in the Unit of Page)

  • 장지원;방승규;한재혁;이상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권1호
    • /
    • pp.25-30
    • /
    • 2017
  • 안티 포렌식 기법 중 하나인 데이터 삭제 기법은 그 행위의 단순함에 비해 포렌식 분석 관점에서의 그 영향력은 상당하다. 학계에서는 데이터 삭제 기법에 대응하여 지속적으로 삭제된 파일 복구 기법에 대해 연구하였으며, 대표적으로 파일시스템 기반 파일 복구 기법과 파일 포맷 기반 복구 기법이 존재한다. 파일이 삭제되고 난 후 해당 파일의 메타데이터가 파일시스템 상에 존재한다면, 이를 이용하여 손쉽게 파일을 복구할 수 있으나, 메타데이터가 존재하지 않는 경우엔 시그니처 기반 카빙 기법을 이용하여 파일을 복구하거나 파일 포맷에 기반한 복구기법을 적용해야 한다. 이때 파일 포맷에 기반한 복구기법은 파일 구조에 대한 분석과 복구 가능한 기법이 제시되어야 한다. 본 논문은 PDF 파일의 구조적 특성에 기반한 삭제된 PDF 파일의 페이지 단위 복구 기법을 제시한다. 해당 기법은 PDF 파일의 1개 페이지를 구성하는 Page Object의 태그 값을 이용한다. 각 태그 값을 일종의 시그니쳐로서 활용하여 Object를 추출하며, 추출된 Object들을 분석하여 PDF파일의 메타데이터를 재조합한 후 페이지 단위로 재구성한다. 페이지 단위로 복구한다는 것은 삭제된 PDF 파일이 온전하지 않더라도 PDF 파일을 구성했던 일부 페이지라도 복구할 수 있음을 의미한다. 해당 기법을 이용하면 온전하지 않은 상태의 PDF파일에 대한 복구가 가능하다. 이는 디지털 포렌식 분석 관점에서 기존보다 더 많은 데이터를 복구하는데 활용될 수 있다.

디지털교과서 내용 구성에 관한 사용자 선호도 분석 (Analysis of User Preferences on the Structure of Digital Textbook Contents)

  • 김미혜
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.900-911
    • /
    • 2009
  • 본 논문에서는 고등교육에서 활용되는 PDF, HTML 문서 형식에 기반을 둔 디지털교과서 기본 내용 구성에 관한 사용자 선호도를 분석하고자 한다. 이는 현재 웹상에서 사용되고 있는 PDF와 HTML 기반의 대표적인 내용 구성 양식을 바탕으로 사용자 선호도에 관한 온라인 설문조사를 실시하여 분석한 후 이루어졌다. 설문조사 결과, PDF 기반인 경우 화면 왼쪽에 목차 링크를, 오른쪽에 교과서 내용을 제시한 디지털교과서 내용 구성이 82%의 응답자에 의해 가장 선호되는 구성으로 나타났으며, 보기 기능으로는 단면 보기에 서책의 한 페이지를 컴퓨터 화면 폭에 맞추어 제시한 것이었다. HTML 기반인 경우에도 PDF 경우와 유사하게 두-프레임을 이용하여 왼쪽 프레임에는 목차 링크를, 오른쪽 프레임에는 교과서 내용을 제시한 내용 구성이 84%의 응답자에 의해 가장 선호되는 형식으로 드러났다. 그러나 현재 대부분의 웹사이트에서 사용되고 있는 PDF, HTML 기반의 디지털교과서 내용 구성은 사용자 선호도를 반영하고 있지 못한 것으로 드러났다. 따라서 향후 디지털교과서 개발 시에는 학생들이 교과서 내용을 보다 쉽고 편리하게 읽을 수 있도록 사용자 선호도를 고려하여 교과서 내용을 구성해야 할 것으로 보인다.

웹 기반의 광고 CTS 설계를 위한 자동화 도구 (An Automation Tool for Design of Web-Based Advertisement CTS)

  • 한군희;정병완
    • 한국산학기술학회논문지
    • /
    • 제8권4호
    • /
    • pp.810-814
    • /
    • 2007
  • 급속한 인터넷의 발달과 고속 인쇄기의 보급으로 누구나 손쉽게 문서를 원하는 형태로 제작 출력이 가능해 졌다. 하지만 명함이나 광고 전단지, 신문이나 잡지, 전화번호부 책자 및 무가지를 제작하기 위해서는 전용 편집용 소프트웨어를 이용하여 전문가들이 제작을 하고 있다. 본 논문에서는 가장 대표적인 광고도안인 명함을 인터넷을 이용하여 신청단계부터 PDF파일을 생성하는 단계까지 일련의 작업공정을 자동화시스템을 구축하기 위한 컴퓨터조판시스템의 모델을 제시한다. 어도비사의 인디자인을 웹사이트와 연계하여 웹페이지에서 신청을 받은 요청에 대하여 실시간으로 이미지파일을 생성하여, 주문자의 확인을 받아 결재시스템과 연계한 후 PDF파일을 제작하는 시스템을 제시한다.

  • PDF

텍스트마이닝 기반 고정밀 검색시스템

  • 안태성;서형국;이경일
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.88-97
    • /
    • 2004
  • 지난 10년 동안 인터넷의 대중화 덕분으로 World Wide Web과 e-mail은 이미 정보 전달의 일반적인 수단으로 자리를 잡았다. 인터넷과 이에 기반한 e-Busine器는 기존 산업의 전 부분에 걸쳐 효율성과 생산성 증대를 위한 전략적인 도구로 그 중요성이 지속적으로 증대되고 있으며. 지식 노동자들은 업무 시간의 대부분을 문서로 대표되는 정보와 지식을 생산하고 검색하는데 보내고 있다. 새로운 기업정보 자료들이 끊임없이 등록되고, 지난 자료들이 수정, 갱신되는 등 전 세계에 있는 수 많은 기업에서 다양한 지식 자산(Knowledge Asset)들이 지속적으로 생성, 재활용되고 있다. 그러나 이렇게 기업이 생성, 저장, 재 사용하는 정보 중 20% 만이 활용성이 높은 정형 데이터로 구성되어 있고, 나머지 80%는 워드프로세서, e-mail, 프리젠테이션, 스프레드시트, PDF와 같은 복합문서와 인터넷 페이지 등의 비정형 텍스트 형태로 구성되어 있다[1].(중략)

  • PDF

클라우드 서비스를 활용한 프레젠테이션 실시간 공유 시스템 및 방법 (System And Method For Sharing Presentation Using Cloud Service)

  • 임창빈;김원진;강아름;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.238-240
    • /
    • 2014
  • 회의 진행 시, 회의 참석자의 컴퓨터에 별다른 애플리케이션의 설치 없이 인터넷 URL에 접속함으로써 회의 자료를 공유하여 원활한 회의 진행을 제공한다. 회의진행자는 클라우드 서버의 파일을 이용하여 회의를 진행하고 이 파일은 서버를 거쳐 PDF파일로 변환되어 인터넷 브라우저에 표현된다. 회의 진행자는 그리기 기능을 이용하여 프레젠테이션에 설명을 덧붙일 수 있다. 그리기 기능과 함께 프레젠테이션의 페이지 넘김 기능도 실시간으로 회의 참석자의 인터넷 브라우저에 표현 된다.

AI를 활용한 시추주상도 자동 디지털 DB화 방안에 관한 연구 (A Study on the Automatic Digital DB of Boring Log Using AI)

  • 박가현;한진태;윤영노
    • 한국지반공학회논문집
    • /
    • 제37권11호
    • /
    • pp.119-129
    • /
    • 2021
  • 국토지반정보 포털시스템에서 관리되는 지반정보는 사람이 직접 PDF 파일을 보고 일일이 타이핑을 해서 구축하고 있기 때문에 인적·시간적 자원 소모가 크며, 정확도 문제가 빈번하게 발생한다. 본 연구에서는 다양한 지반정보 중에서 국내에서 가장 일반적이고 널리 활용되고 있는 시추주상도를 대상으로 인공지능(Artificial Intelligence, AI)을 활용하여 자동 디지털 데이터베이스 구축하는 방안에 대해 제안하였다 우선, 다양한 시추주상도 양식에 대해서도 예외없이 데이터를 자동으로 데이터베이스화 하기 위해서 딥러닝모델 ResNet 34를 이용하여 시추주상도 양식분류를 하였으며, 총 6가지 시추주상도 양식에 대해 이미지 분류를 진행하여 전체 정확도(accuracy)는 99.7, ROC_AUC score는 1.0의 매우 높은 정확도로 시추주상도 양식을 분리할 수 있었다. 이 후, 각각의 양식에 대하여 미세조정(fine-tuning)된 로보틱 처리 자동화 기법을 이용하여 PDF 내 텍스트를 자동으로 읽어 들인 후 시추주상도 내 일반정보, SPT 시험정보 및 지층정보에 대해 데이터를 추출, 분리하여 이 값들을 기존 국토지반정보 포털시스템에서 제공하는 형태와 동일한 형태의 DB로 구축하도록 구현하였다. 최종적으로 기존 국토지반정보 포털시스템에서 제공하는 형태와 동일한 형태로 시추주상도내 정보를 초당 140페이지의 속도로 자동으로 DB화 할 수 있었다.

매체 유형에 따른 초등학생의 읽기 성과에 관한 연구 (A Study on the Reading Performance of Elementary School Students by Media Type)

  • 노경국;소병문
    • 한국도서관정보학회지
    • /
    • 제54권1호
    • /
    • pp.221-240
    • /
    • 2023
  • 이 연구는 정보통신 기술의 발달과 함께 디지털 원주민을 대상으로 다양한 매체별 읽기 성과를 파악하는데 있다. 이를 위해 초등학교 6학년을 대상으로 매체 유형에 따른 읽기 자료의 완독 시간과 내용 이해도를 묻는 수업을 실시하였다. 이 연구는 동일한 기사 내용을 3개 모둠으로 나누어 각각 매체 유형을 달리해 읽는 시간을 측정하고 평가 문항을 통해 매체에 따른 내용 이해도를 확인하였다. 측정 결과, 웹 페이지의 평균 완독 시간은 3분 28초이며, 평균 평가 문항 정답 개수는 3.99문제였으며, pdf 파일의 평균 완독 시간은 5분 23초이며, 평균 평가 문항 정답 개수는 4.35문제였다. 또한 인쇄자료의 평균 완독시간은 7분 14초이며 평균 평가 문항 정답 개수는 6.26문제로 나타났다. 실험에 참여한 학생 수는 144명으로 연구자의 실험 결과만으로 매체 유형에 따른 읽기 방식을 일반화하기에는 한계가 있다.

사용자의 국가 R&D 정보 이용 접근성 향상을 위한 큐레이션 서비스 : 이슈로 보는 R&D 사례를 중심으로 (Curation Service to Improve User's Access to National R & D Information : Focusing on Issues R&D Service)

  • 유은지;최광남;황유나
    • 한국콘텐츠학회논문지
    • /
    • 제20권9호
    • /
    • pp.1-10
    • /
    • 2020
  • 국가 R&D 데이터는 기초과학 연구부터 산업화 부분까지 전 분야에 대한 정보를 포괄하고 있지만 전문적인 용어로 표현되며 이로 인해 대중의 이용에는 어려움이 있다. 이에 NTIS 는 국가 R&D 데이터를 이용한 데이터 큐레이션 서비스를 개발하여 국가적인 현안과 사회적 이슈에 대해 국가 R&D 정보를 선별하여 제공하고 있다. 이에 본 연구에서는 NTIS 의 데이터 큐레이션 서비스인 이슈로 보는 R&D 서비스 분석을 통해 국가 R&D 정보를 이용한 데이터 큐레이션 서비스 구축 방안을 제안하고자 하며 이 서비스가 국가 R&D 정보에 대한 사용자의 접근성 향상에 미친 영항도 분석하였다. 이슈로 보는 R&D 서비스는 뉴스기사에서 추출한 이슈와 관련된 국가 R&D 과제, 성과, 주요 연구기관 등을 매핑하여 정리, 제공한다. 패키징에 이용된 데이터는 모두 오픈되어 있고 관련 자료는 보고서 형식으로 정리돠어 PDF 파일로 제공된다. 또한 해당 프로세스를 자동화 하여 관리자 뿐 만 아니라 NTIS 이용자라면 누구나 개인적인 이슈패키징을 가능하게 하였다. 이 밖에 Special Issue 코너를 개설하며 주요 현안에 대한 사용자의 접근,이용 편의성을 높였고 코너 개설 이후 접속자의 페이지뷰가 증가한 것으로 나타났다.

학술논문 내에서 참고문헌 정보가 포함된 서지 메타데이터 자동 생성 연구 (Automatic Generation of Bibliographic Metadata with Reference Information for Academic Journals)

  • 정선기;신현호;지선영;최성필
    • 한국문헌정보학회지
    • /
    • 제56권3호
    • /
    • pp.241-264
    • /
    • 2022
  • 서지정보는 연구 주제의 최신 동향의 인지와 유용성을 검증하는 데에 참고할 수 있다. 즉, 각자 연구자들이 필요로 하는 문헌에 신속하게 접근하기 위해서는 학술논문에서 저자 정보, 요약, 초록, 참고문헌 등을 쉬운 방법으로 파악해야 한다. 그러나, 현재 출판되는 PDF 형식의 전자 학술논문은 출판 주체별로 고유한 양식을 띄고 있어서, 몇몇 특징에 의한 규칙 기반 추출법으로는 수많은 문헌에서 목표 정보를 추출하여 요약된 서지사항으로 자동 생성하기 어렵다. 이에 본 연구는 학술논문 서지사항 자동 생성에 있어서 양식의 다양성으로 인한 메타데이터 자동 추출의 난점을 극복할 방법을 제안한다. 제안하는 모델은 서지사항이 주로 기술되는 학술논문의 첫 페이지에서 목표 영역과 본문의 시작점을 구분할 수 있는 심층신경망 기반 모델과 앞의 모델로 추출된 서지사항을 상세한 메타데이터로 분류하고 재생성하는 규칙 기반 모델로 구성된다. 제안하는 모델은 참고문헌 요약정보를 생성하는 모델도 포함하는데, 본문의 말미와 참고문헌 시작점의 분리, 그리고 개별 참고문헌 추출을 규칙 기반 방법으로 진행하고, 추출한 각개 참고문헌의 서지정보를 분류하는 데에 심층신경망을 이용하도록 구성하였다. 추가로, 논문 자체의 서지정보를 전후처리 없이 추출/생성하는 모델의 가능성을 확인하기 위하여 참고문헌 영역까지 아우르는 모델을 구축하여 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방식이 서지정보를 전후처리 하지 않고 진행한 비교 실험에 비하여 더 높은 성능을 보였다.