• 제목/요약/키워드: 문서자동화

검색결과 220건 처리시간 0.039초

검증 자료를 활용한 가짜뉴스 탐지 자동화 연구 (A Study on Automated Fake News Detection Using Verification Articles)

  • 한윤진;김근형
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.569-578
    • /
    • 2021
  • 오늘날 웹의 발전으로 우리는 각종 언론 매체를 통해 온라인 기사를 쉽게 접하게 된다. 온라인 기사를 쉽게 접할 수 있게 된 만큼 거짓 정보를 진실로 위장한 가짜뉴스 또한 빈번하게 찾아볼 수 있다. 가짜뉴스가 전 세계적으로 대두되면서 국내에서도 가짜뉴스를 탐지하기 위한 팩트 체크 서비스가 제공되고 있으나, 이는 전문가 기반의 수동 탐지 방법을 기반으로 하며 가짜뉴스 탐지를 자동화하는 기술에 대한 연구가 계속해서 활발하게 이루어지고 있다. 기존 연구는 기사 작성에 사용된 문맥의 특성이나, 기사 제목과 기사 본문의 내용 비교를 통한 탐지 방법이 가장 많이 사용되고 있으나, 이러한 시도는 조작의 정밀도가 높아졌을 때 탐지가 어려워질 수 있다는 한계를 가진다. 따라서 본 논문에서는 기사 조작의 발달에 따른 영향을 받지 않기 위하여 기사의 진위 여부를 판단할 수 있는 검증기사를 함께 사용하는 방법을 제안한다. 또한 가짜뉴스 탐지 정확도를 개선시킬 수 있도록 실험에 사용되는 기사와 검증기사를 문서 요약 모델을 통해 요약하는 과정을 추가했다. 본 논문에서는 제안 알고리즘을 검증하기 위해 문서 요약 기법 검증, 검증기사 검색 기법 검증, 그리고 최종적인 제안 알고리즘의 가짜뉴스 탐지 정확도 검증을 진행하였다. 본 연구에서 제안한 알고리즘은 다양한 언론 매체에 적용하여 기사가 온라인으로 확산되기 이전에 진위 여부를 판단하는 방법으로 유용하게 사용될 수 있다.

웹 기반의 광고 CTS 설계를 위한 자동화 도구 (An Automation Tool for Design of Web-Based Advertisement CTS)

  • 한군희;정병완
    • 한국산학기술학회논문지
    • /
    • 제8권4호
    • /
    • pp.810-814
    • /
    • 2007
  • 급속한 인터넷의 발달과 고속 인쇄기의 보급으로 누구나 손쉽게 문서를 원하는 형태로 제작 출력이 가능해 졌다. 하지만 명함이나 광고 전단지, 신문이나 잡지, 전화번호부 책자 및 무가지를 제작하기 위해서는 전용 편집용 소프트웨어를 이용하여 전문가들이 제작을 하고 있다. 본 논문에서는 가장 대표적인 광고도안인 명함을 인터넷을 이용하여 신청단계부터 PDF파일을 생성하는 단계까지 일련의 작업공정을 자동화시스템을 구축하기 위한 컴퓨터조판시스템의 모델을 제시한다. 어도비사의 인디자인을 웹사이트와 연계하여 웹페이지에서 신청을 받은 요청에 대하여 실시간으로 이미지파일을 생성하여, 주문자의 확인을 받아 결재시스템과 연계한 후 PDF파일을 제작하는 시스템을 제시한다.

  • PDF

전자책 표준 적합성 도구의 개발 (Developing a Test Tool for Electronic Book Standard Conformance)

  • 김재경;손원성;임순범;김성혁;최윤철
    • 한국전자거래학회지
    • /
    • 제9권1호
    • /
    • pp.269-284
    • /
    • 2004
  • 한국문서형표준(KS X 6100)은 지난 2001년 7월 제정된 한국전자책문서표준(EBKS1.0)이 2002년 7월 한국산업기술표준원의 산업표준심의를 거쳐 제정되었다. 그러므로 한국문서형표준에 기반하여 작성된 전자책 문서들은 표준의 목적과 명세를 준수하여야 하며 표준의 준수 여부를 판별하기 위해서 적합성 검사가 요구된다. 본 논문에서는 이러한 적합성 검사의 기준이 되는 적합성 조항(Conformance Clause)의 정의와 이에 따른 적합성 검사 도구(Conformance Testing Tool)를 개발하였다. 따라서 본 논문에서 정의된 조항들을 통하여 전자책 제작자들은 전자책표준의 목적과 명세에 보다 적합한 전자책문서들을 제작할 수 있으며, 서비스 제공자들은 적합성 검사 도구를 통한 자동화된 적합성 검사 절차를 사용하여 효율적인 적합성 검사가 가능하다.

  • PDF

ETOM+RPost기반의 문서분류시스템의 설계 및 구현 (Design and Implementation of Text Classification System based on ETOM+RPost)

  • 최윤정
    • 한국산학기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.517-524
    • /
    • 2010
  • 최근의 컴퓨터 기술과 인터넷 기술의 발달로 인해 분석 데이터가 급속도로 증가함에 따라 이들을 다루기 위한 자동분류시스템에 대한 요구가 높다. 문서분류시스템은 감독학습이 필수적이기 때문에 최소한의 전문가의 개입만으로도 높은 정확도가 보장되는 자동화 시스템에 대한 요구가 크다. 반면, 분류할 데이터들은 형식이나 내용상으로 그 복잡도가 높아지고 있어서, 일반적인 분류방법으로는 좋은 분석결과를 얻기 어려운 양상을 보인다. 특히 스팸성 데이터와 같이 어떠한 의도가 반영되어 가공되거나 변형되는 데이터는 분석의 어려움을 가중시킨다. 본 논문에서는 분류알고리즘의 성능향상을 위해 제안한 ETOM과 RPost방법을 구현하였다. 분류의 경계선 상에 있는 스팸문서들에 구현시스템을 적용하여 그 과정을 분석하였다. 실험결과 제안방법에 의한 정확도가 0.795에서 0.93으로 약 16%의 증가하였음을 확인하였다.

메타 태그를 이용한 자동 웹페이지 분류 시스템 (An Automatic Web Page Classification System Using Meta-Tag)

  • 김상일;김화성
    • 한국통신학회논문지
    • /
    • 제38B권4호
    • /
    • pp.291-297
    • /
    • 2013
  • 최근 월드 와이드 웹(World Wide Web)의 사용이 폭발적으로 증가함에 따라 다양한 정보를 포함하고 있는 웹 페이지들의 양도 엄청나게 증가 하였다. 따라서 웹상에 존재 하고 있는 웹페이지들에 대한 접근을 용이하게 하고, 그룹화를 통한 검색을 가능하게 하기 위해 웹 페이지 분류의 필요성이 대두 되고 있다. 웹 페이지 분류는 기존의 웹 상에 산재 되어 있는 웹페이지들을 비슷한 문서 유형 또는 같은 키워드를 사용하는 문서들의 묶음으로 구분하는 작업을 의미하며, 웹 페이지 분류 기술은 웹페이지 검색, 그룹 검색, 메일 필터링 등의 분야에 응용될 수 있는 기술이다. 하지만 웹상에 존재하는 웹페이지들을 사람이 수동적으로 분류하는 방법으로는 현재 월드 와이드 웹에 존재하는 엄청난 양의 웹페이지들을 처리할 수 없으며, 자동적인 분류 방법 역시 서로 다른 형태로 작성된 웹페이지들을 정확하게 분류할 수 없다는 문제로 인해 한계를 보이고 있다. 본 논문에서는 서로 다른 형태로 작성된 웹 문서들에 대한 부정확한 분류 문제를 해결하기위해 웹페이지에 존재하는 메타 정보를 획득하여 자동적으로 분류하는 메타 태그기반의 자동화된 웹페이지 분류 시스템을 제안하였다.

자동화된 통합 프레임워크를 위한 시맨틱 웹 기반의 정보 검색 시스템 (Semantic Web based Information Retrieval System for the automatic integration framework)

  • 최옥경;한상용
    • 정보처리학회논문지C
    • /
    • 제13C권1호
    • /
    • pp.129-136
    • /
    • 2006
  • 정보 검색 시스템은 사용자가 찾고자 하는 지식 정보를 보다 정확하고 빠르게 전달하는 데 그 목적이 있다. 그러나 현재의 검색 시스템은 단순 구문 분석 방식으로 사용자가 원하는 정확한 정보를 제공하지 못한다. 따라서 본 논문에서는 온톨로지 서버를 이용한 SW-IRS(Semantic Web based Information Retrieval System)를 제안한다. 제안한 시스템은 에이전트 기반의 자동 분류 기술과 시맨틱 점 기반의 정보 검색 기법들을 이용하여 반구조(semi-structured) 문서뿐만 아니라 비구조(unstructured) 문서의 처리를 극대화시키고자 한다. 또한 상호 운용성 및 데이터 통합을 위해 RDF(Resource Description Framework) 방식의 문서 저장 서버를 지원하며 웹 페이지들간에 검색 순위를 두어 보다 신속하고 정확한 정보 검색이 가능하도록 하고자 한다. 마지막으로 새로운 순위 측정 알고리즘을 제안하고 이를 이용한 성능 평가를 실시하여 그 효율성과 정확성을 검증해 보이고자 한다.

개념간 관계의 추출과 명명을 위한 통계적 접근방법 (A Statistical Approach for Extracting and Miming Relation between Concepts)

  • 김희수;최익규;김민구
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.479-486
    • /
    • 2005
  • 온톨로지는 차세대 시맨틱 웹을 위한 논리의 기반을 구성하기 위해 제안되었다. 이러한 온톨로지는 특정 분야에 대한 지식을 정형화된 형태로 표현함으로써 기계에 의한 지식의 이해를 가능하게 하고, 이를 사용하여 사용자의 요구에 알맞은 지능화된 서비스를 제공할 수 있게 한다. 하지만, 온톨로지의 구축과 유지는 많은 사람의 시간과 노력을 요구한다. 본 고에서는 온톨로지 구축 방법의 일환으로, 문서로부터 온톨로지를 구성하는 개념간의 관계를 정의하는 자동화된 방법을 제안한다. 본 고에서 제안된 방법은 특정 분야의 문서에 존재하는 개념을 기반으로 개념간의 연관 규칙을 형성하는 개념 쌍을 찾고, 두 개념 사이에 존재하는 내용의 군집화를 통해 두 개념간의 관계를 설명하는 패턴을 찾는다. 마지막으로 패턴간의 군집화를 사용하여 개념 사이의 일반화된 관계를 명시한다. 본 고에서는 제안된 방법을 검증하기 위한 방법으로 TREC(Text REtrieval Conference)에서 제공하는 문서집합을 사용하여 개념간의 관계를 추출, 평가하였으며, 그 결과 제안된 방법은 개념간의 관계를 설명하는 유용한 정보를 제공할 수 있음을 보여준다.

문서 요약 기법이 가짜 뉴스 탐지 모형에 미치는 영향에 관한 연구 (A Study on the Effect of the Document Summarization Technique on the Fake News Detection Model)

  • 심재승;원하람;안현철
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.201-220
    • /
    • 2019
  • 가짜뉴스가 전세계적 이슈로 부상한 최근 수년간 가짜뉴스 문제 해결을 위한 논의와 연구가 지속되고 있다. 특히 인공지능과 텍스트 분석을 이용한 자동화 가짜 뉴스 탐지에 대한 연구가 주목을 받고 있는데, 대부분 문서 분류 기법을 이용한 연구들이 주를 이루고 있는 가운데 문서 요약 기법은 지금까지 거의 활용되지 않았다. 그러나 최근 가짜뉴스 탐지 연구에 생성 요약 기법을 적용하여 성능 개선을 이끌어낸 사례가 해외에서 보고된 바 있으며, 추출 요약 기법 기반의 뉴스 자동 요약 서비스가 대중화된 현재, 요약된 뉴스 정보가 국내 가짜뉴스 탐지 모형의 성능 제고에 긍정적인 영향을 미치는지 확인해 볼 필요가 있다. 이에 본 연구에서는 국내 가짜뉴스에 요약 기법을 적용했을 때 정보 손실이 일어나는지, 혹은 정보가 그대로 보전되거나 혹은 잡음 제거를 통한 정보 획득 효과가 발생하는지 알아보기 위해 국내 뉴스 데이터에 추출 요약 기법을 적용하여 '본문 기반 가짜뉴스 탐지 모형'과 '요약문 기반 가짜뉴스 탐지 모형'을 구축하고, 다수의 기계학습 알고리즘을 적용하여 두 모형의 성능을 비교하는 실험을 수행하였다. 그 결과 BPN(Back Propagation Neural Network)과 SVM(Support Vector Machine)의 경우 큰 성능 차이가 발생하지 않았지만 DT(Decision Tree)의 경우 본문 기반 모델이, LR(Logistic Regression)의 경우 요약문 기반 모델이 다소 우세한 성능을 보였음을 확인하였다. 결과를 검증하는 과정에서 통계적으로 유의미한 수준으로는 요약문 기반 모델과 본문 기반 모델간의 차이가 확인되지는 않았지만, 요약을 적용하였을 경우 가짜뉴스 판별에 도움이 되는 핵심 정보는 최소한 보전되며 LR의 경우 성능 향상의 가능성이 있음을 확인하였다. 본 연구는 추출요약 기법을 국내 가짜뉴스 탐지 연구에 처음으로 적용해 본 도전적인 연구라는 점에서 의의가 있다. 하지만 한계점으로는 비교적 적은 데이터로 실험이 수행되었다는 점과 한 가지 문서요약기법만 사용되었다는 점을 제시할 수 있다. 향후 대규모의 데이터에서도 같은 맥락의 실험결과가 도출되는지 검증하고, 보다 다양한 문서요약기법을 적용해 봄으로써 요약 기법 간 차이를 규명하는 확장된 연구가 추후 수행되어야 할 것이다.

BIM기반 자동화 데이터 수집기술을 활용한 위험지역 식별 모델 (Hazardous Area Identification Model using Automated Data Collection(ADC) based on BIM)

  • 김현수;이현수;박문서;이광표;편재호
    • 한국건설관리학회논문집
    • /
    • 제11권6호
    • /
    • pp.14-23
    • /
    • 2010
  • 건설 산업의 재해 중 상당 부분은 작업자의 이동 중 발생한다. 건설 현장의 안전관리는 작업을 중심으로 수행되며, 이는 이동 경로에 존재하는 위험원에 대한 안전관리 수준을 상대적으로 낮게 만든다. 많은 연구자들이 위험원을 인지하는 것이 안전관리의 기본임을 제시하였다. 따라서 본 연구에서는 자동화 데이터 수집기술(Automated Data Collection)을 이용하여 작업자의 이동경로에 존재하는 위험원에 대한 안전관리자의 인지를 지원하는 모델을 개발하였다. 모델은 실시간 위치추적기술 기반의 작업자의 위치정보와 BIM을 통한 최적이동 동선의 비교를 통해 일차적으로 위험 가능 지역을 찾는다. 그리고 기존 위험지역과 작업지역을 필터링함으로써 위험 가능 지역을 폭을 좁힌다. 이를 바탕으로 안전 관리자는 위험원이 존재할 가능성이 높은 지역에 대한 정보를 제공받고, 현장의 상황에 맞는 안전관리대책을 수립할 수 있을 것이다. 본 연구에서 제시된 모델을 통해 발견하지 못한 채 남을 수 있는 위험지역을 인지함으로써 안전관리 프로세스 범위에 속하지 않는 위험원을 줄일 수 있으며, 이를 통해 건설 현장의 안전 향상에 도움을 줄 것이라 예상된다.

해양 소프트웨어 품질 제고를 위한 자동화 도구 활용 사례 연구 (Case study of Utilizing Automated Tools for Improving Maritime Software Quality)

  • 임상우;김길용;이서정
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 추계학술대회
    • /
    • pp.51-52
    • /
    • 2015
  • 국제해사기구에서는 e-Navigation의 개발과정에 소프트웨어 품질에 대한 고려가 필수적으로 도입될 수 있도록 해양 소프트웨어품질 보증을 진행해오고 있다. 소프트웨어 품질 확보를 위해서는 소프트웨어 개발 프로젝트 전반에 걸쳐 정해진 절차를 따르고, 각 절차를 수행한 결과로 산출물의 작성이 필요하다. 이를 지원하는 도구의 활용은 소프트웨어 개발의 생산성에 중요한 요소가 될 수 있다. 본 논문에서는 실시간 모니터링과 문서의 자동화가 가능한 도구를 활용하여 해양 소프트웨어 개발에 적용하기 위한 사례를 소개한다. 도구 활용에 대한 기대효과 및 해양 SQA에 적용하기 위한 절차의 개선에 대해서도 논의한다. 개선된 절차를 도구에 반영하여 해양 SQA에 맞춤형 도구를 개발하는 것을 향후 목표로 한다.

  • PDF