• 제목/요약/키워드: engineering document

검색결과 1,253건 처리시간 0.026초

Latent Semantic Analysis Approach for Document Summarization Based on Word Embeddings

  • Al-Sabahi, Kamal;Zuping, Zhang;Kang, Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.254-276
    • /
    • 2019
  • Since the amount of information on the internet is growing rapidly, it is not easy for a user to find relevant information for his/her query. To tackle this issue, the researchers are paying much attention to Document Summarization. The key point in any successful document summarizer is a good document representation. The traditional approaches based on word overlapping mostly fail to produce that kind of representation. Word embedding has shown good performance allowing words to match on a semantic level. Naively concatenating word embeddings makes common words dominant which in turn diminish the representation quality. In this paper, we employ word embeddings to improve the weighting schemes for calculating the Latent Semantic Analysis input matrix. Two embedding-based weighting schemes are proposed and then combined to calculate the values of this matrix. They are modified versions of the augment weight and the entropy frequency that combine the strength of traditional weighting schemes and word embedding. The proposed approach is evaluated on three English datasets, DUC 2002, DUC 2004 and Multilingual 2015 Single-document Summarization. Experimental results on the three datasets show that the proposed model achieved competitive performance compared to the state-of-the-art leading to a conclusion that it provides a better document representation and a better document summary as a result.

XML 문서 키워드 가중치 분석 기반 문단 추출 모델 (XML Document Keyword Weight Analysis based Paragraph Extraction Model)

  • 이종원;강인식;정회경
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2133-2138
    • /
    • 2017
  • 기존의 XML 문서나 다른 문서는 단어를 중심으로 분석이 진행되었다. 이는 형태소 분석기를 활용하여 구현이 가능하나 문서 내에 기재되어 있는 많은 단어를 분류할 뿐 문서의 핵심 내용을 파악하기에는 어려움이 있다. 사용자가 문서를 효율적으로 이해하기 위해서는 주요 단어가 포함되어 있는 문단을 추출하여 사용자에게 보여주어야 한다. 본 논문에서 제안하는 시스템은 정규화 된 XML 문서 내에 키워드를 검색하고 사용자가 입력한 키워드들이 포함되어 있는 문단을 추출하여 사용자에게 보여준다. 그리고 검색에 사용된 키워드들의 빈도수와 가중치를 사용자에게 알려주고 추출한 문단의 순서와 중복 제거 기능을 통해 사용자가 문서를 이해하는데 발생할 수 있는 오류를 최소화하였다. 제안하는 시스템은 사용자가 문서 전체를 읽지 않고 문서를 이해할 수 있게 하여 문서를 이해하는데 필요한 시간과 노력을 최소화할 수 있을 것으로 사료된다.

MathML Based Browser for the Web Application

  • Kim, Sung-Han;Min, Jae-Hong;Jung, Hoe-Gyung
    • Journal of information and communication convergence engineering
    • /
    • 제1권3호
    • /
    • pp.147-149
    • /
    • 2003
  • Recently, many kinds of XML based application services are widely used in internet. And the markets for mathml editor are needed for the technology combined with other text editor. We are developing a system for MathML based browser and editor for the service of internet application. MathML based browser is applicable for e-book service and many kinds of document system. This system is composed of document editing module and displaying processing module. This system is useful for the processing of MathML tag by unexperienced users with MathML syntax. Users can edit the math tag's document with ease and efficiently. Based on XML, many parser functions are optimized for the speed of document processing. This system can afford to the development of internet world.

Automatic Linkage Method Between Email and Block Structure to Store Construction Project Documents in The Blockchain

  • Kim, Eu Wang;Park, Min Seo;Kim, Jong Inn;Wei, Ameng;Kim, Kyoungmin;Kim, Kyong Ju
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.886-892
    • /
    • 2022
  • In construction projects, it is common to exchange documents using email because of convenience. In this study, a method extracting and organizing block information automatically based on email was developed. This method is composed of document exchange and archiving processes, which are difficult to manage and vulnerable to loss. Therefore, this study aims to develop a solution that can automatically link email and block information. The block data components are designed to derive from email exchange and user-additional input information. Also, automatically generating blocks process including extraction and conversion of information was proposed. This solution can lead to promote the convenience of project document management in terms of identifying the document flow and preventing loss of information.

  • PDF

Document Clustering Using Semantic Features and Fuzzy Relations

  • Kim, Chul-Won;Park, Sun
    • Journal of information and communication convergence engineering
    • /
    • 제11권3호
    • /
    • pp.179-184
    • /
    • 2013
  • Traditional clustering methods are usually based on the bag-of-words (BOW) model. A disadvantage of the BOW model is that it ignores the semantic relationship among terms in the data set. To resolve this problem, ontology or matrix factorization approaches are usually used. However, a major problem of the ontology approach is that it is usually difficult to find a comprehensive ontology that can cover all the concepts mentioned in a collection. This paper proposes a new document clustering method using semantic features and fuzzy relations for solving the problems of ontology and matrix factorization approaches. The proposed method can improve the quality of document clustering because the clustered documents use fuzzy relation values between semantic features and terms to distinguish clearly among dissimilar documents in clusters. The selected cluster label terms can represent the inherent structure of a document set better by using semantic features based on non-negative matrix factorization, which is used in document clustering. The experimental results demonstrate that the proposed method achieves better performance than other document clustering methods.

MSER-b 이진화 기법을 이용한 스마트폰 문서 이미지 보정 기법 (Rectification of Document Image on Smartphone Using MSER-b Binarization)

  • 유영중;문상호;박성호
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.201-207
    • /
    • 2015
  • 스마트폰 카메라로 생성한 문서 이미지는 촬영 방법에 따라 일반 스캐너에 비해 회전 왜곡과 원근 왜곡이 발생한다. 본 논문에서는 MSER-b 통해 조명에 영향을 적게 받는 이미지를 생성하고 텍스트 이미지의 특성을 고려한 텍스트 영역 윤곽선 검출 기법을 제안하고 이를 통해 왜곡된 문서 이미지를 보정하여 프린터 품질의 이미지로 복원하였다. 그리고 제안한 기법의 성능 평가를 위해 현재 서비스되고 있는 타사의 제품과 비교하였으며, 다양한 왜곡에 대하여 효과적으로 처리가 가능함을 실험을 통해 보였다.

HL7 CDA 문서 등록을 위한 IHE XDS.b 와 IHE MHD의 메시지 비교 (Comparison of IHE XDS.b and IHE MHD messages for registering HL7 CDA documents)

  • 박동욱;도형호;인정민;이성기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.796-798
    • /
    • 2012
  • IHE(Integrating the Healthcare Enterprise)에서는 환자의 전자진료기록 공유를 위하여 XDS.b(Cross-Enterprise Document Sharing.b) 프로파일을 개발하였다. 그러나 XDS.b 프로파일의 Document Source와 Document Consumer는 모바일 환경에서는 사용하기에는 부적당하기 때문에 모바일 환경에서 XDS.b infrastructure에 쉽게 접근할 수 있는 MHD(Mobile access to Health Documents) 프로파일을 개발하였다. 본 논문에서는 전자진료기록 표준인 HL7 CDA 문서 등록을 위한 XDS.b Document Source의 Provide and Register Document Set-b[ITI-41] 트랜잭션과 MHD Document Source의 Put Document Dossier[ITI-65] 트랜잭션을 모바일 환경에서 구현하고 메시지의 크기를 비교하였다. 구현된 결과를 통하여 MHD ITI-65 트랜잭션의 메시지 크기가 XDS.b ITI-41 트랜잭션 메시지 보다 80% 정도 감소함을 알 수 있었다.

교량설계문서의 통합관리를 위한 XML 기반의 문서모델 개발과 응용 (Development of XML-based Document Model and Its Applications for Integrated Management of Bridge Design Documents)

  • 이상호;김붕근;정동균;강형택
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2004년도 가을 학술발표회 논문집
    • /
    • pp.179-184
    • /
    • 2004
  • This paper presents a prototype of document schema to guarantee the consistency of the bridge design information during the life-cycle of bridge. The main component of document schema for bridge design information is derived from the Document Type Definition (DTD) Pool which is the Construction CALS/EC standard in Korea and the document schema is implemented by using the XML Schema. The ifcXML are adopted for representing product data of bridge. A pilot system adopting the document schema and its application to existing bridge show that the suggested document schema can be efficiently used to develop software modules supporting the integrated design documents for bridges.

  • PDF

한글 문서 접근 제어시스템 구현 (Implementation of the Access Control System for Hangul Document System)

  • 장승주
    • 한국정보통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.323-329
    • /
    • 2018
  • 본 논문은 한글 문서에서 허가된 사용자만 문서를 사용할 수 있도록 하는 접근 제어 시스템을 구현한다. 본 논문에서 구현하는 시스템은 한글 문서 헤드 정보를 특정 형식으로 변형 설계 및 구현한다. 한글 문서 헤더 정보에서 특정 필드의 기능을 특정 형식으로 만들어 접근 정보를 갖지 않은 사용자는 문서를 열어서 볼 수 없도록 한다. 접근 허용정보를 가진 사용자는 한글 파일에 접근이 가능하도록 한다. 이렇게 함으로써 중요한 한글 문서에 대한 접근 권한을 통제할 수 있도록 한다. 본 논문에서는 제안하는 내용에 대해서 구현하고 실험을 수행하였다. 실험을 수행한 결과 접근제어시스템이 정상적으로 잘 동작됨을 확인할 수 있었다.

MS-Word 문서 접근 제어시스템 설계 (Design of the Access Control System for MS-WORD Document System)

  • 장승주
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1405-1411
    • /
    • 2018
  • 본 논문은 MS-워드 문서 시스템에 대한 접근 제어 시스템을 설계한다. 본 논문에서 설계하는 시스템은 MS-워드 문서 구조를 분석하여 문서 관련 정보를 활용한다. MS-워드문서 정보를 일부 변형하여 변형된 정보에 접근할 수 없는 사용자는 접근을 차단하도록 설계하는 것이다. 이렇게 함으로써 MS-워드문서에 대해서 접근 권한을 가진 사용자 외에는 문서를 읽을 수 없도록 한다. 즉, MS-워드문서에 대한 접근 권한을 통제할 수 있도록 한다. MS-워드문서에 대한 접근 권한을 가진 사용자는 변형된 정보를 원래 정보로 복구할 수 있도록 하여 정상적으로 문서를 읽을 수 있도록 한다. 본 논문에서 설계하는 내용을 실제 구현하고 실험을 수행하였다. 실험에서는 MS-워드문서 정보를 변형하였을 경우 문서 접근이 되는지를 수행하였다. 실험을 수행한 결과 MS-word 접근제어시스템이 정상적으로 잘 동작됨을 확인할 수 있었다.