• 제목/요약/키워드: Document Reading

검색결과 64건 처리시간 0.026초

문서 읽기 행위를 이용한 연속적 사용자 인증 기반의 내부자 문서유출 탐지기술 연구 (A system for detecting document leakage by insiders through continuous user authentication by using document reading behavior)

  • 조성영;김민수;원종일;권상은;임채호;강병훈;김세헌
    • 정보보호학회논문지
    • /
    • 제23권2호
    • /
    • pp.181-192
    • /
    • 2013
  • 기업 내의 문서 유출을 탐지 제어하기 위한 다양한 기술들이 연구되고 있다. 하지만 이러한 기술들은 대부분 외부에 의한 문서 유출을 대상으로 하고 있으며, 문서에 대한 정당한 권한을 가지고 있는 내부자에 의한 문서 유출을 탐지하고 제어하는 연구는 미비한 수준이다. 본 연구에서는 내부자에 의한 문서 유출을 탐지하고 제어하기 위하여 사용자의 문서 읽기 행위를 관찰한다. Microsoft Word 로거에서 추출할 수 있는 속성으로부터 각 사용자의 관찰된 문서 읽기 행위에 대한 패턴을 만들고 시스템에 적용함으로써 문서를 읽고 있는 사용자가 실제 사용자인지 여부를 판단한다. 이를 통하여 사용자가 문서를 읽는 행위를 바탕으로 효과적으로 문서 유출을 방지할 수 있을 것으로 기대한다.

Automatic Reading System for On-off Type DNA Chip

  • Ryu, Mun-Ho;Kim, Jong-Dae;Kim, Jong-Won
    • Journal of Information Processing Systems
    • /
    • 제2권3호
    • /
    • pp.189-193
    • /
    • 2006
  • In this study we propose an automatic reading system for diagnostic DNA chips. We define a general specification for an automatic reading system and propose a possible implementation method. The proposed system performs the whole reading process automatically without any user intervention, covering image acquisition, image analysis, and report generation. We applied the system for the automatic report generation of a commercialized DNA chip for cervical cancer detection. The fluorescence image of the hybridization result was acquired with a $GenePix^{TM}$ scanner using its library running in HTML pages. The processing of the acquired image and the report generation were executed by a component object module programmed with Microsoft Visual C++ 6.0. To generate the report document, we made an HWP 2002 document template with marker strings that were supposed to be searched and replaced with the corresponding information such as patient information and diagnosis results. The proposed system generates the report document by reading the template and changing the marker strings with the resultant contents. The system is expected to facilitate the usage of a diagnostic DNA chip for mass screening by the automation of a conventional manual reading process, shortening its processing time, and quantifying the reading criteria.

간호학과 학생들의 전자형태 문서이용 및 문서읽기행태에 대한 분석 (Analyzing Undergraduate Nursing Students' Electronic Document Use and Document Reading Behavior)

  • 나경식;이지수
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.271-291
    • /
    • 2014
  • 본 연구는 간호학과 학생들의 전자형태 문서의 이용 및 문서읽기 행태를 분석하기 위해 이들의 행태에서 나타나는 요소들에 대해 종합적으로 분석해 보고자 하였다. 이를 위해 본 연구는 간호학과 학생을 중심으로 지난 한 학기동안 학생들이 경험한 읽기행태를 조사하여 문서형태선호도와 요소 등을 다각적으로 분석하였다. 총 509명의 응답에 기초하여 분석한 결과, 간호학과 학생들은 일반적으로 전자형태문서에 대한 선호도가 높은 것으로 나타났으며, 소장하고 싶은 문서형태 또한 전자형태문서라고 응답하였다. 응답자 중, 약 94% 이상이 필요한 정보를 찾기 위해 30분 이상을 소요하고 있다고 나타났으며, 접근경로는 '네이버' 검색엔진을 가장 많이 사용하는 것으로 응답하였다. 또한 주로 찾는 정보의 주제는 수업관련 정보가 가장 많았으며, 정보의 접근 장소로는 집에서 주로 정보를 찾고 이용하는 것으로 나타났다. 특히, 응답자들의 이동 중에 나타나는 문서선호도는 전자형태에 대한 선호도가 높게 나타났으며, 이동의 간편성과 접근의 용이성이 가장 높은 이유로 드러났다. 본 연구의 결과는 간호학과 학생들의 문서읽기행태를 분석하여 인쇄형태와 전자형태 문서의 읽기행태에 대한 이해를 증진시키고 향후 간호학 분야에서의 의학도서관 디지털정보이용의 서비스 설계 및 도구를 개발 또는 보완하기 위한 자료와, 더 나아가, 디지털 도서관 이용자 서비스 개선 방안을 모색하는 데 자료를 제시하고자 한다.

SATS: Structure-Aware Touch-Based Scrolling

  • Kim, Dohyung;Gweon, Gahgene;Lee, Geehyuk
    • ETRI Journal
    • /
    • 제38권6호
    • /
    • pp.1104-1113
    • /
    • 2016
  • Non-linear document navigation refers to the process of repeatedly reading a document at different levels to provide an overview, including selective reading to search for useful information within a document under time constraints. Currently, this function is not supported well by small-screen tablets. In this study, we propose the concept of structure-aware touch-based scrolling (SATS), which allows structural document navigation using region-dependent touch gestures for non-sequential navigation within tablets or tablet-sized e-book readers. In SATS, the screen is divided into four vertical sections representing the different structural levels of a document, where dragging into the different sections allows navigating from the macro to micro levels. The implementation of a prototype is presented, as well as details of a comparative evaluation using typical non-sequential navigation tasks performed under time constraints. The results showed that SATS obtained better performance, higher user satisfaction, and a lower usability workload compared with a conventional structural overview interface.

대학도서관 주제자료실의 가구계획 및 배치유형 분석 (Analysis of Furniture Planning and Layout Type in Subject Specialization of University Library)

  • 장아리;황연숙
    • 한국실내디자인학회논문집
    • /
    • 제24권2호
    • /
    • pp.180-188
    • /
    • 2015
  • University libraries aim to improve not only educational effects but also the general quality of colleges. A primary way of pursuing this goal is through providing professors and students with sufficient amounts of available references and materials that can be used for academic purposes. However, even though university libraries are intended to be used by college students majoring in different fields, they tend to provide mostly books. This limited offering of resources means that they are not distinguishing themselves from regular libraries. The purpose of this study is to present basic data for the spatial design of a subject specialization room in a college library. Included in the design are recommendations for the type and placement of the furniture in the room. The summary of results for this study and the conclusions are as follows: The layout of data space and reading space in a subject specialization room can be categorized into both document-oriented (document centralized and document categorized) and reading-oriented (reading centralized, all, and group types). The public reading seats and private reading seats in a subject specialization room, according to their ratio, can be divided into private reading, public reading, and distributed reading sections. The ratio of open-spaced tables is higher for groups of four or more people, but users often sit separately from others in order to ensure privacy. Unfortunately, this practice results in seating gaps that do not make efficient use of space. The result is that the public reading seats are less efficient than the private reading seats in terms of space. Therefore, it is necessary to increase the number of cubicles.

HTML 태그 깊이 임베딩: 웹 문서 기계 독해 성능 개선을 위한 BERT 모델의 입력 임베딩 기법 (HTML Tag Depth Embedding: An Input Embedding Method of the BERT Model for Improving Web Document Reading Comprehension Performance)

  • 목진왕;장현재;이현섭
    • 사물인터넷융복합논문지
    • /
    • 제8권5호
    • /
    • pp.17-25
    • /
    • 2022
  • 최근 종단 장치(Edge Device)의 수가 증가함에 따라 빅데이터가 생성되었고 특히 정제되지 않은 HTML 문서가 증가하고 있다. 따라서 자연어 처리 모델을 이용해 HTML 문서 내에서 중요한 정보를 찾아내는 기계 독해(Machine Reading Comprehension) 기술이 중요해지고 있다. 본 논문에서는 기계 독해의 여러 연구에서 준수한 성능을 보이는 BERT(Bidirectional Encoder Representations from Transformers) 모델이 HTML 문서 구조의 깊이를 효과적으 로 학습할 수 있는 HTDE(HTML Tag Depth Embedding Method)를 제안하였다. HTDE는 BERT의 각 입력 토큰에 대하여 HTML 문서로부터 태그 스택을 생성하고 깊이 정보를 추출한다. 그리고 BERT의 입력 임베딩에 토큰의 깊이를 입력으로하는 HTML 임베딩을 더한다. 이 방법은 문서 구조를 토큰 단위로 표현하여 주변 토큰과의 관계를 식별할 수 있기 때문에 HTML 문서에 대한 BERT의 정확도를 향상시키는 효과가 있다. 마지막으로 실험을 통해 BERT의 기존 임베딩 기법에 비해 HTML 구조에 대한 모델 예측 정확도가 향상됨을 증명하였다.

InferSent를 활용한 오픈 도메인 기계독해 (Open Domain Machine Reading Comprehension using InferSent)

  • 김정훈;김준영;박준;박성욱;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2022
  • 오픈 도메인 기계독해는 질문과 연관된 단락이 존재하지 않아 단락을 검색하는 검색 기능을 추가한 모델이다. 문서 검색은 단어 빈도 기반인 TF-IDF로 많은 연구가 진행됐으나 문서의 양이 많아지면 낮은 성능을 보이는 문제가 있다. 아울러 단락 선별은 단어 기반 임베딩으로 많은 연구가 진행됐으나 문장의 특징을 가지는 단락의 문맥을 정확히 추출하지 못하는 문제가 있다. 그리고 문서 독해는 BERT로 많은 연구가 진행됐으나 방대한 파라미터로 느린 학습 문제를 보였다. 본 논문에서는 언급한 3가지 문제를 해결하기 위해 문서의 길이까지 고려한 BM25를 이용하며 문장 문맥을 얻기 위해 InferSent를 사용하고, 파라미터 수를 줄이기 위해 ALBERT를 이용한 오픈 도메인 기계독해를 제안한다. SQuAD1.1 데이터셋으로 실험을 진행했다. 문서 검색은 BM25의 성능이 TF-IDF보다 3.2% 높았다. 단락 선별은 InferSent가 Transformer보다 0.9% 높았다. 마지막으로 문서 독해에서 단락의 수가 증가하면 ALBERT가 EM에서 0.4%, F1에서 0.2% 더 높았다.

키워드 가중치 기반 문단 추출 알고리즘 (Keyword Weight based Paragraph Extraction Algorithm)

  • 이종원;주상웅;이현주;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.504-505
    • /
    • 2017
  • 기존의 형태소 분석기는 문서 내에 사용된 단어들을 분류한다. 이를 기반으로 문장과 문단을 추출하는 시스템이 개발되고 있으나 해당 문서를 압축하여 주요 문단을 추출하는 시스템은 매우 미흡한 실정이다. 본 논문에서 제안하는 알고리즘은 문서 내에 사용된 키워드들의 가중치를 계산하고 키워드를 포함한 문단들을 추출한다. 이는 해당 문서를 모두 읽지 않고 키워드가 포함된 문단들을 읽음으로써 문서를 이해하는 시간을 줄일 수 있다. 또한 검색에 사용된 키워드의 개수에 따라 추출되는 문단의 수가 다름으로 사용자는 기존 시스템에 비해 다양한 패턴의 검색이 가능하다.

  • PDF

XML-based EDI Document Processing System with Binary Format Mapping Rules

  • Kim, Chang-Su;Jung, Hoe-Kyung
    • Journal of information and communication convergence engineering
    • /
    • 제10권3호
    • /
    • pp.258-263
    • /
    • 2012
  • Recently, the magnitude of electronic data interchange (EDI) document processing for the handling of port logistics is abruptly being increased. The existing system processes EDI documents in a script mode, but due to a complicated script preparation procedure and low document processing efficiency, it cannot meet the demand as the usage flow of documents increases. In this paper, an EDI electronic document processing system was designed and implemented in a document scanner and mapper, which are binary form electronic document processing tools and do not require script files during the conversion of extensible markup language (XML)-based electronic documents. This new system has the merits of XML features during reading and writing with improved speed, usage convenience, and good portability on systems when compared to the conventional ones.

비밀문서유통을 위한 보안 요구사항 분석 (The Analysis of the security requirements for a circulation of the classified documents)

  • 이지영;박진섭;강성기
    • 안보군사학연구
    • /
    • 통권1호
    • /
    • pp.361-390
    • /
    • 2003
  • In this paper, we analyze the security requirement for a circulation of the classified documents. During the whole document process phases, including phases of drafting, sending/receiving messages, document approval, storing and saving, reading, examining, out-sending and canceling a document, we catch hold of accompanied threat factors and export every threat factors of security. We also propose an appropriate and correspondent approach for security in a well-prepared way. Last, we present the security guidelines for security architecture of the classified documents circulation.

  • PDF