• 제목/요약/키워드: 문서자동화

검색결과 218건 처리시간 0.027초

기술용어 간 관계추출의 성능평가를 위한 반자동 테스트 컬렉션 구축 프레임워크 개발 (Development of a Framework for Semi-automatic Building Test Collection Specialized in Evaluating Relation Extraction between Technical Terminologies)

  • 정창후;최성필;이민호;최윤수
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.481-489
    • /
    • 2010
  • 관계 추출 시스템의 중요성이 날로 부각되면서 이러한 시스템을 평가하기 위한 테스트 컬렉션의 구축이 중요한 과제로 떠오르고 있다. 본 논문에서는 반자동화된 처리 과정을 거쳐서 규모 있는 관계 추출용 테스트 컬렉션을 구축하는 프레임워크를 제안한다. 그리고 개발된 프레임워크를 이용하여 실제적으로 과학기술 문헌에 존재하는 기술용어 간 연관관계 추출 시스템의 성능 평가를 위한 테스트 컬렉션을 구축하고(관계유무 파악 및 관계분류 식별을 검사할 수 있는 1,707건의 문장 규모) 결과를 분석한다. 제안된 방법론은 정형화되고 시간이 많이 소요되는 문서분석 작업을 처리과정별로 자동화함으로써 구축에 들어가는 비용을 최소화할 수 있고, 시스템의 알고리즘을 기반으로 동작하기 때문에 구축자의 성향에 따른 편차를 줄이고 일관된 결과물을 얻을 수 있다. 또한 문헌 집합(과학기술 전 분야에 걸친 30,858,830건의 학술 데이터베이스) 및 용어 사전(16개 분야 253,603건 규모의 전문용어) 선정 시 특정 분야에 편중되지 않도록 노력함으로써 균형 잡히고 객관화된 테스트 컬렉션을 생성할 수 있다.

XML기반의 안전한 E-Procurement 시스템 설계 및 구현 (Design and Implementation of Secure E-Procurement System based on XML)

  • 문태수;송유진
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1043-1054
    • /
    • 2002
  • 본 논문은 국내 자동차산업을 대상으로 개발된 응용시스템으로, UML(Unified Modeling Language)을 이용한 XML(eXtensible Markup Language)기반의 안전한 전자조달(E-Procurement) 시스템을 제안하고 있다. 컴포넌트 개발기법인 UML 방법론의 활용으로 자동차산업의 구매업무 Workflow가 분석되었으며, XML 기반의 EDI(Electronic Data Interchange)와 전자서명 기능을 구현함으로써 기업간 구매업무를 자동화하는 효율적인 E-Procurement 시스템 프로토타입이 구현되었다. 또한 본 논문은 기존 정보공학방법론에서 한계로 지적되던 S/W의 재사용성과 Life Cycle의 위험을 줄인 컴포넌트 개발기법을 활용하고, 기업내 Legacy 시스템인 ERP와의 연동을 가능하게 하였다. 본 시스템은 기존 시스템이 제공하지 못하는 워크플로우(workflow)분석 및 설계, 컴포넌트 개발, 기업내부 시스템과의 연동, 그리고 전자문서의 무결성과 인증을 위한 XML 전자서명을 적용하는 해법을 제안하고 있다.

특허 및 뉴스 기사 텍스트 마이닝을 활용한 정책의제 제안 (Policy agenda proposals from text mining analysis of patents and news articles)

  • 이새미;홍순구
    • 디지털융복합연구
    • /
    • 제18권3호
    • /
    • pp.1-12
    • /
    • 2020
  • 본 연구의 목적은 텍스트 마이닝을 활용하여 특허와 뉴스 기사 분석을 통해 블록체인 기술 동향을 탐색하고 사회적 관심을 파악하여 블록체인 정책의제를 제안하는 것이다. 이를 위해 국내 블록체인 특허 요약문 327건과 온라인 뉴스기사 전문 5,941건을 수집하고 전처리 과정을 거쳐 LDA 토픽모델링 방법을 사용하여 특허 토픽 12개와 뉴스 토픽 19개를 추출하였다. 특허 분석을 통해 인증과 거래 관련 토픽이 높은 비중을 차지하였다. 뉴스 기사 분석 결과, 사회적 관심은 암호화폐에 치중되어 있는 것으로 나타났다. 이러한 분석 결과와 의제설정이론에 근거하여 블록체인 관련 정책의제를 도출하였다. 본 연구는 대용량 텍스트 문서 분석의 자동화된 기법을 활용하여 분석을 효율적·객관적으로 수행하였으며, 블록체인 기술 동향과 사회적 관심도를 파악한 실증된 기초 분석 자료를 기반으로 정책의제를 제안하였다. 본 연구에서 제시된 정책의제는 향후 정책 결정과정에의 기초자료로 활용될 수 있을 것이다.

플랜트 EPC 해외 사업을 위한 입찰단계 시 AI 기반의 ITB Risk 관리 모델 개발 (Development of ITB Risk Mgt. Model Based on AI in Bidding Phase for Oversea EPC Projects)

  • 이돈희;윤건호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.151-160
    • /
    • 2019
  • EPC 회사들이 해외에서 계속 사업을 운영하기 위해서는 위험이 더 이상 피할 수있는 것이 아니라 관리 대상이된다는 것이 점점 더 분명 해지고 있다. 입찰 단계에서 입찰 패키지 내의 요구 사항, 사양 및 프로젝트 광고 항목을 자세히 조사하여 비용 초과를 방지하기 위해 다양한 위험 요소를 분석해야한다. 그러나 막대한 양의 입찰 서류를 검토하는 것은 시간이 많이 걸리고 노동 집약적이며 쉬운 작업이 아니며 자동화 된 정보 기술이 도움이 될 수 있다. 이 연구에서는 짧은 시간에 방대한 양의 문서를보다 효과적으로 분석하고 적용 할 수있는 Watson AI 기반의 ITB 분석 모델을 구축하였다. AI 기반 ITB 위험 관리 모델 연구, 학습 절차 및 분석 대상 선택, 성능 평가 기준을 위한 Watson Explorer AI 아키텍처의 구성을 정의하고 시험 연구를 수행하기위한 테스트 베드를 구축하였다. 결과적으로 분석 시간 단축의 효과와 전문가의 결과 및 VOC 운영 품질을 확인하였다.

사이버공격 융합 동향 분석을 위한 딥러닝 기반 보안 취약점 분석 자동화 메커니즘 (Deep Learning-Based Automation Cyber Attack Convergence Trend Analysis Mechanism for Deep Learning-Based Security Vulnerability Analysis)

  • 김진수;박남제
    • 정보보호학회논문지
    • /
    • 제32권1호
    • /
    • pp.99-107
    • /
    • 2022
  • 다양한 기술들이 하나로 융합되어 새로운 기술로 변화되고 있는 현재의 기술사회에서 사회의 변화에 발맞추듯 새로운 사이버공격들이 만들어지고 있다. 특히, 다양한 공격들이 하나로 융합됨으로 인해 기존의 보안 체계만으로 시스템을 보호하는데 어려움이 발생하고 있다. 이와 같은 사이버공격에 대응하기 위해 많은 정보가 생성되고 있다. 하지만, 무분별하게 발생하는 취약점 정보는 관리자에게 불필요한 정보를 제공하여 혼란을 유도할 수 있다. 따라서 본 논문에서는 딥러닝 기반의 언어 학습 모델을 이용하여 문서를 학습하고, 취약점 정보를 추출하여 MITRE ATT&CK 프레임워크에 따라 분류함으로써 관리자에게 구분화된 취약점 정보를 제공하여 새로이 발생하고 있는 사이버공격 융합 기술의 분석을 보조하는 메커니즘을 제안한다.

개인정보 비식별화를 위한 개체명 유형 재정의와 학습데이터 생성 방법 (Re-defining Named Entity Type for Personal Information De-identification and A Generation method of Training Data)

  • 최재훈;조상현;김민호;권혁철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.206-208
    • /
    • 2022
  • 최근 빅데이터 산업이 큰 폭으로 발전하는 만큼 개인정보 유출로 인한 사생활 침해 문제의 관심도 높아졌다. 자연어 처리 분야에서는 이를 개체명 인식을 통해 자동화하려는 시도들이 있었다. 본 논문에서는 한국어 위키피디아 문서의 본문에서 비식별화 정보를 지닌 문장을 식별해 반자동으로 개체명 인식 데이터를 구축한다. 이는 범용적인 개체명 인식 데이터에 반해 비식별화 대상이 아닌 정보에 대해 학습되는 비용을 줄일 수 있다. 또한, 비식별화 정보를 분류하기 위해 규칙 및 통계 기반의 추가적인 시스템을 최소화할 수 있는 장점을 가진다. 본 논문에서 제안하는 개체명 인식 데이터는 총 12개의 범주로 분류하며 의료 기록, 가족 관계와 같은 비식별화 대상이 되는 정보를 포함한다. 생성된 데이터셋을 이용한 실험에서 KoELECTRA는 0.87796, RoBERTa는 0.88575의 성능을 보였다.

  • PDF

BIM-COBie를 활용한 교량 상부구조의 손상정보 관리 방법 (A Method for Information Management of Defects in Bridge Superstructure Using BIM-COBie)

  • 이상호;이정빈;탁호균;이상호
    • 대한토목학회논문집
    • /
    • 제43권2호
    • /
    • pp.165-173
    • /
    • 2023
  • 교량에 발생하는 손상에 대한 관리 및 평가는 정기적인 점검으로 작성된 보고서와 외관조사망도 및 손상물량표를 포함한 점검 및 진단자료에 기초한다. 이러한 자료 대부분은 2D 기반의 문서형식으로 작성되어 있고, 표준화된 방식으로 디지털화하기 어려워 정해진 목적 외의 활용이 쉽지 않다. 이에 본 연구에서는 점검자료를 기반으로 손상을 포함한 BIM 기반 교량모델을 구축하는 방법을 제시하고, BIM 표준을 준용하는 유지관리용 건설정보교환표준인 COBie (Construction Operations Building Information Exchange)를 사용하여 모델로부터 도출한 스프레드시트 데이터 형식의 손상정보들을 교량모델과 연계하여 관리하고 활용하는 방법을 제시하였다. 또한 전술한 방법들을 이용해 손상이 발생한 교량 상부구조 각 부위별 상태등급을 디지털 데이터 기반으로 자동화된 방법으로 평가하는 방법을 제안하였다. 본 연구에서 제안된 방법들은 PSC I형 콘크리트 교량의 상부구조를 대상으로 검증이 이루어졌으며 그 실효성이 검증되었다.

DTW와 PCA에 기반한 효과적인 필적 검증 (Effective Handwriting Verification through DTW and PCA)

  • 장석우;허문행;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권7호
    • /
    • pp.25-32
    • /
    • 2009
  • 논문에서는 오프라인 환경에서 패턴분석을 적용하여 두필적의 유사성을 자동으로 분석하여 필적을 검증하는 방법을 제안한다. 제안된 방법에서는 먼저 필적 문서에서 문자 영역만을 분할하고, 분할된 문자 영역에 대한 특징을 추출한다. 그리고 비선형적인 형태로 추출되는 특징으로부터 동적 타임 워핑(DTW)과 다변량 통계 분석법(PCA) 알고리즘을 이용하여 기준이 되는 특징과의 유사성을 구한다. 본 논문에서 제안된 필적 검증 방법은 효과적인 특징 추출 방법 및 기존의 짧은 패턴에서 효과적으로 수행하던 방법들을 다양한 길이를 가진 특징에 대해서도 효과적으로 필적 검증이 가능하도록 하였다. 본 논문은 실험 결과는 제안된 방법인 기존의 방법보다 우수함을 다양한 실험을 통해서 보여준다. 제안된 필적 검증 방법은 기존에 감정 전문가에 의해 수동적으로 수행되던 필적 검증 작업을 자동화하고, 기존 필적 검증 작업의 객관성을 배가할 수 있을 것으로 기대된다.

활동기준원가계산법(Actvitiy-Based Costing)에 의한 모듈러 건축물 공장제작단계 간접비 산정 방안 (Application of Activity-Based Costing(ABC) for Modular Building Construction Indirect Costs Calculation at the Manufacturing Stage)

  • 이정훈;박문서;이현수;이광표;현호상
    • 한국건설관리학회논문집
    • /
    • 제16권4호
    • /
    • pp.139-145
    • /
    • 2015
  • 최근 건설 기업들은 노동력 부족, 원자재값 상승, 건설경기 위축 등으로 인해 새로운 건설시장 개척 및 자동화 기술도입을 적극적으로 추진하고 있다. 이러한 노력의 일환으로 최근 제조업의 생산프로세스와 건설생산프로세스가 결합된 모듈러 건축공법이 부각되고 있으며 이와 관련된 연구가 활발히 진행되고 있다. 모듈러 건축프로세스에서 공장제작의 가장 큰 장점 중 하나는 기존 건축프로세스에서 사용하기 어려웠던 제조업의 생산설비시스템을 활용한 생산원가(공사원감)절감이 가능하다는 것 있다. 이를 뒷받침하기 위해서는 대다수의 건축공종이 집중되어있는 공장제작단계에서의 원가산정이 정확해야 하며 특히 직접적인 계산이 어려운 간접비에 대한 구체적인 산정방인 필요하다. 그러나 국내 모듈러 건축산업이 시장도입단계로 이와 관련된 연구가 한정적으로 이루어지고 있어 모듈러 건축물의 원가왜곡현상이 나타날 수 있는 문제가 있다. 따라서 본 연구는 모듈러 건축물의 공장제작단계에서 국내계약법상에서 명시된 제조업과 건설업에서의 간접비 정의를 고찰하고 활동기준원가계산법을 통해 모듈러 건축물을 구성하는 모듈러 유닛별 간접비 산정방식을 제시하였다. 본 연구는 공장제작단계에서의 전 과정 뿐만 아니라 모듈러 건축물의 설계, 제작, 운송, 시공의 간접비 배분에 대한 기초자료로서 활용될 수 있으며 향후 모듈러 건축물의 공장제작단계에서의 원가산정 정확도 향상 및 모듈러 건축물의 전 생애주기에 따른 원가산정방안 마련에 기여할 것으로 기대된다.

YouTube 동영상 의견분석을 통한 사용과 충족 이론 측정 : 트로트 가수 조명섭 동영상을 중심으로 (Analyzing Comments of YouTube Video to Measure Use and Gratification Theory Using Videos of Trot Singer, Cho Myung-sub)

  • 홍한국;임병학;김삼문
    • 한국콘텐츠학회논문지
    • /
    • 제20권9호
    • /
    • pp.29-42
    • /
    • 2020
  • 본 연구의 목적은 소셜미디어 중 하나인 YouTube 동영상 사용자들이 남긴 의견을 추출하여 분석하는 질적연구방법을 제시한다. 이를 위해서 YouTube 동영상 사용자의견을 사용하여 사용과 충족 이론의 쾌락적 충족, 사회적 충족, 그리고 실용적 충족을 빈도분석과 토픽모델링을 통해 측정하였다. 측정결과, YouTube KBS 한국방송 채널 중 트로트 가수 조명섭 동영상을 사용자들이 시청하는 이유는 첫 번째로 높은 빈도를 보이는 것이 쾌락적 충족을 위해서였다. 다음 순으로 사회적 충족과 실용적 충족으로 나타났다. 단어-문서 네트워크 분석에서 연결정도중심성은 '응원', '감사', '화이팅', '최고' 등이 높게 나타났고, 매개중심은'감사', '응원', '화이팅'등의 단어가 높게 나타나 연결정도 중심성과 유사함을 보였다. 아이겐벡터중심성은 '사랑', '마음', '감사' 등의 단어가 높게 나타나 사용자들의 의견들에 가장 영향력이 높은 단어들임을 알 수 있다. 이는 YouTube의 트로트 가수 조명섭 동영상 시청자들 중 대다수가 동영상에 대해 사랑과 감사의 마음을 보이고 있음을 알 수 있다. 위의 세 가지 중심성 분석결과는 동영상을 시청하는 동기로 사용충족 이론의 쾌락적 충족과 사회적 충족 관련 단어들이 높은 값을 보이고 있다. 본 연구는 설문조사 기반의 구조방정식 모형을 따르지 않고, 질적분석연구를 자동화한 텍스트마이닝 기법을 사용하여 YouTube동영상을 사용하는 동기를 사용 및 충족 이론에 의해 밝혀냈다는 것에서 연구 함의를 찾을 수 있다.