• 제목/요약/키워드: PDF 파일

검색결과 56건 처리시간 0.033초

PDF 파일의 페이지단위 복구 기법 (A Recovery Technique of PDF File in the Unit of Page)

  • 장지원;방승규;한재혁;이상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권1호
    • /
    • pp.25-30
    • /
    • 2017
  • 안티 포렌식 기법 중 하나인 데이터 삭제 기법은 그 행위의 단순함에 비해 포렌식 분석 관점에서의 그 영향력은 상당하다. 학계에서는 데이터 삭제 기법에 대응하여 지속적으로 삭제된 파일 복구 기법에 대해 연구하였으며, 대표적으로 파일시스템 기반 파일 복구 기법과 파일 포맷 기반 복구 기법이 존재한다. 파일이 삭제되고 난 후 해당 파일의 메타데이터가 파일시스템 상에 존재한다면, 이를 이용하여 손쉽게 파일을 복구할 수 있으나, 메타데이터가 존재하지 않는 경우엔 시그니처 기반 카빙 기법을 이용하여 파일을 복구하거나 파일 포맷에 기반한 복구기법을 적용해야 한다. 이때 파일 포맷에 기반한 복구기법은 파일 구조에 대한 분석과 복구 가능한 기법이 제시되어야 한다. 본 논문은 PDF 파일의 구조적 특성에 기반한 삭제된 PDF 파일의 페이지 단위 복구 기법을 제시한다. 해당 기법은 PDF 파일의 1개 페이지를 구성하는 Page Object의 태그 값을 이용한다. 각 태그 값을 일종의 시그니쳐로서 활용하여 Object를 추출하며, 추출된 Object들을 분석하여 PDF파일의 메타데이터를 재조합한 후 페이지 단위로 재구성한다. 페이지 단위로 복구한다는 것은 삭제된 PDF 파일이 온전하지 않더라도 PDF 파일을 구성했던 일부 페이지라도 복구할 수 있음을 의미한다. 해당 기법을 이용하면 온전하지 않은 상태의 PDF파일에 대한 복구가 가능하다. 이는 디지털 포렌식 분석 관점에서 기존보다 더 많은 데이터를 복구하는데 활용될 수 있다.

윈도우즈 자동화 스크립트를 이용한 멀티 세션 PDF 변환기 구현 (Implementation of Multi Session PDF Converter Using Automated Scripts for Windows)

  • 강병준;김훈희;주상웅;심규철;강현진;김경환;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.643-645
    • /
    • 2013
  • 워드프로세서 파일(아래한글, MS-Office)에 입력된 대량의 데이터를 온 오프라인에서 PDF 파일로 변환 작업을 수행하면 현재의 PDF 변환 솔루션들은 하나의 원본 파일을 윈도우즈 가상 프린터 환경에서 PDF 변환 작업을 수행 한다. 이러한 PDF 변환 작업을 수행하면 원본 파일의 용량에 따라 PDF 변환 속도가 상이하고 대량의 PDF 변환 작업을 수행 할 경우 매우 느린 속도로 수행한다. 본 논문에서는 원본 파일의 PDF 변환 작업을 수행할 때 하나의 윈도우즈 서버에서 터미널 서버를 사용하여 터미널에 멀티 세션을 생성하여 동시에 PDF 변환 작업을 수행 할 수 있는 PDF 변환기에 대하여 연구하였다.

  • PDF

연재 - 인디자인에서 파일 내보내기와 포스트스크립 파일로 PDF파일 만들기

  • 박송원
    • 프린팅코리아
    • /
    • 제9권2호
    • /
    • pp.100-103
    • /
    • 2010
  • 인디자인으로 작업한 편집 디자인 문서는 인쇄 전 파일을 꼼꼼히 점검하고 저장해야 한다. 편집 디자인 작업은 실제 인쇄 직전과 인쇄 과정에서 문제가 가장 많이 발생하기 때문이다. 이번 호에서는 실무에 유용하게 활용할 수 있는 PDF 파일로 저장하는 방법에 대해 알아본다. 본 설명은 의 일부 내용을 발췌한 것으로 Window XP 운영체제에서 인디자인 CS3를 사용한 모습니다.

  • PDF

PDF를 활용한 고문헌의 원문디지털화 방안에 대한 고찰 (Study on Methods of Digitalization of Older Books Using PDF)

  • 리상용
    • 한국문헌정보학회지
    • /
    • 제34권1호
    • /
    • pp.133-153
    • /
    • 2000
  • 본 논문은 1999년 4월에 출시된 Acrobat 4.0에서 지원하는 PDF(Portable Document Format)를 이용해서 고문헌의 원문을 디지털화하여, 웹상에서 이용자가 고문헌의 원문을 손쉽게 검색할 수 있도록 하기 위한 방안에 대해 연구한 것이다. 이전의 Acrobat 3.0판은 한글 지원에 문제가 많았으나, 이번에 개정된 4.0판에서는 다국어폰트의 지원으로 한글, 중국어, 일본어 등의 PDF변환이 가능해졌다. 따라서 <한글97>(속칭<아래아 한글>)로 구축된 고문헌의 원문파일을 PDF로 변환은 물론 편집도 가능하게 되었다. PDF파일의 뷰어인 Acrobat Reader는 웹상에서 무상으로 다운로드 받을 수 있으므로, 이 PDF를 이용하여 고문헌의 원문을 디지털화 한다면, 향후 개선되어야 할 문제가 있긴 하지만, 이용자가 인터넷상에서 손쉽게 고문헌의 원문을 검색할 수 있게 될 것이다.

  • PDF

영상 처리와 딥러닝을 이용한 악보 코드 변환 프로그램 (Conversion Program of Music Score Chord using OpenCV and Deep Learning)

  • 문지수;김민지;임영규;공기석
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.69-77
    • /
    • 2021
  • 본 논문은 사용자가 입력한 PDF 악보를 사용자가 원하는 조(chord)의 MIDI 파일로 제공하는 앱의 개발을 다룬다. 이 앱은 사용자가 PDF 악보 파일과 바꾸고자 하는 조를 입력하면 조 변환을 위해 PDF 파일을 PNG 파일로 변환한다. 이를 영상 처리 알고리즘을 통해 악보의 음계를 인식하여 구분하고, 딥러닝을 통해 악보 음표의 박자를 인식하여 구분한다. 이를 통해 사용자가 원하는 조와 기존 악보의 MIDI 파일을 제공한다. 개발한 영상 처리 알고리즘과 딥러닝은 2, 4, 8, 16분 음표, 2, 4, 8, 16분 쉼표, 잇단 음표, 화음 음표가 인식 가능하다. 실험결과 악보의 음표 인식률 100%, 딥러닝 모델을 통한 박자 인식률은 90% 이상인 것을 확인하였다.

CUDA GPU 상의 PDF 1.4-1.6 해독 최적 구현 (PDF 1.4-1.6 Passward Cracking Optimal Implementation on CUDA GPU)

  • 김현준;엄시우;서화정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.187-190
    • /
    • 2022
  • PDF (Portable Document Format)는 1992년 Adobe 에서 개발한 파일 형식으로 ISO 32000 으로 표준화 되어 전세계적으로 사용되고 있다. PDF와 같이 주로 사용되는 파일은 암호 해독(Password Cracking)의 대상이 될 수 있다. 본 논문에서는 PDF 1.4-1.6 암호 해독을 위해 CUDA GPU 상의 최적 구현하였다. 암호 해독에 사용되는 MD5와 RC4 알고리즘의 최적화와 CUDA GPU의 요소를 사용하였으며 RTX 3060 환경에서 크래킹 도구 해시캣과 비교하여 22.5%의 성능 향상을 달성하였다.

사용자의 인터렉션 향상을 위한 EPUB eBook 변환 기법 (EPUB eBook Converting Schemes for Improving User Interactions)

  • 이남희;김재훈;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권3호
    • /
    • pp.117-124
    • /
    • 2017
  • 기존 책 문서인 PDF문서를 전자책에서 사용 가능하도록 전자책의 표준 형태로 변환하는 과정이 필요하다. PDF문서를 전자책의 표준 형태인 EPUB으로 변환할 때, 인쇄 색상 표현방법인 CMYK를 디지털 색상 RGB 형태로 변환하는 과정에서 형태의 차이로 인해 색감이 제대로 변환되지 못하는 문제점이 있다. 그리고 EPUB은 동영상, 자바스크립트 등을 이용해서 시각적인 효과를 줄 수 있으며, 사용자와의 상호작용이 가능하다. 본 연구는 PDF를 EPUB으로 변환 시 발생할 수 있는 문제점에 대해서 연구를 하였다. (1) 첫 번째는 색감을 잃지 않도록 ICC 프로파일을 이용한 변환 연구를 수행하였다. (2) 두 번째는 변환 과정에서 레이아웃 구성에 대한 연구를 수행하였다. (3) 세 번째는 전자책 독자들과 상호작용할 수 있는 시각적인 효과를 제공하기 위하여, 텍스트 중 특정 부분을 인식하여 시각적인 효과를 주는 연구를 수행하였으며 기존 책에서의 퀴즈를 추출하여 변환 시 자바스크립트를 이용한 퀴즈 플랫폼 프로토타입을 구현하였다. 또한 PDF문서를 EPUB에 기반 한 전자책 문서로 변환 후 사용자 평가를 통해 변환유효성 및 편의성을 검증하였다.

PDF 형식 북스캔 파일 불법 유통 방지를 위한 관리 프레임워크 (A framework of management for preventing illegal distribution of pdf bookscan file)

  • 이국헌;정현지;유대걸;이상진
    • 정보보호학회논문지
    • /
    • 제23권5호
    • /
    • pp.897-907
    • /
    • 2013
  • 다양한 스마트 기기의 보급으로 인해 종이책이 아닌 전자책(e-book)으로 책을 읽는 사용자가 증가하고 있다. 하지만 전자책으로 출판되는 책의 다양성이 부족하여 사용자가 직접 원하는 책을 스캔하여 전자책으로 만드는 북스캔(Bookscan)이 생겨났다. 현재 북스캔 서비스는 PDF(Portable Document Format), JPG파일 형태로 제공되고 있으며 파일 관리에 대한 문제점으로 인해 PDF 파일 형식이 보편적으로 사용되고 있다. 북 스캐닝은 고가의 장비와 시간 탓에 북스캔 대행업체가 시장을 형성해가고 있다. 하지만 이는 엄연히 저작권법에 위배되는 불법 행위이다. 또한 북스캔 대행업체는 저작물에 대한 보호조치가 없어 북스캔본이 웹을 통해 불법 공유되고 있다. 북스캔 서비스의 저작권 문제로 출판 산업 시장도 과거 소리바다 음원 시장 붕괴와 같은 절차를 밟을 것으로 보인다. 따라서 북스캔에 대해 법제도 정비를 위한 기술적인 뒷받침이 필요하다. 기존 불법 저작물 추적관리 시스템은 음원, 영화에 대해 적용이 되고 출판물에 대해서는 조치가 없었다. 이에 대해 본 논문에서는 실현 가능한 기술을 기반으로 PDF 형식의 북스캔 파일에 대한 관리 프레임 워크를 제시하고자 한다.

효율적인 HWP 악성코드 탐지를 위한 데이터 유용성 검증 및 확보 기반 준지도학습 기법 (Efficient Hangul Word Processor (HWP) Malware Detection Using Semi-Supervised Learning with Augmented Data Utility Valuation)

  • 손진혁;고기혁;조호묵;김영국
    • 정보보호학회논문지
    • /
    • 제34권1호
    • /
    • pp.71-82
    • /
    • 2024
  • 정보통신기술(ICT) 고도화에 따라 PDF, MS Office, HWP 파일로 대표되는 전자 문서형 파일의 활용이 많아졌고, 공격자들은 이 상황을 놓치지 않고 문서형 악성코드를 이메일과 메신저를 통해 전달하여 감염시키는 피해사례가 많아졌다. 이러한 피해를 막고자 AI를 사용한 악성코드 탐지 연구가 진행되고 있으나, PDF나 MS-Office와 같이 전 세계적으로 활용성이 높은 전자 문서형 파일에 비해 주로 국내에서만 활용되는 HWP(한글 워드 프로세서) 문서 파일은 양질의 정상 또는 악성 데이터가 부족하여 지속되는 공격에 강건한 모델 생성에 한계점이 존재한다. 이러한 한계점을 해결하기 위해 기존 수집된 데이터를 변형하여 학습 데이터 규모를 늘리는 데이터 증강 방식이 제안 되었으나, 증강된 데이터의 유용성을 평가하지 않아 불확실한 데이터를 모델 학습에 활용할 가능성이 있다. 본 논문에서는 HWP 악성코드 탐지에 있어 데이터의 유용성을 정량화하고 이에 기반하여 학습에 유용한 증강 데이터만을 활용하여 기존보다 우수한 성능의 AI 모델을 학습하는 준지도학습 기법을 제안한다.

OpenCV 를 활용한 타브 악보 인식 시스템 (Tab sheet recognition system using OpenCV)

  • 이민석;김승우;최혁규;서승현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.743-744
    • /
    • 2023
  • 타브(TAB) 악보는 주로 현악기에서 쓰이는 악보로, 일반적으로 생각하는 오선보 대신 악기의 줄 수만큼 선을 긋고 그 선 위에 프렛의 위치를 숫자 또는 문자로 표기한 형식의 악보이다. 본 논문에서는 입력된 PDF 형식의 타브 악보에서 OpenCV 를 사용하여 음표 및 악상 기호를 인식하는 시스템을 제안한다. 이 시스템은 사용자가 인식을 원하는 PDF 형식의 악보를 입력하면 PDF 파일을 PNG 파일로 변경한 뒤, 이를 OpenCV 를 활용하여 음표의 길이, 프렛의 위치 등 연주에 필요한 요소들만 객체 검출한 뒤 Tesseract 로 인식한다.