Korean Article Extraction and Text Processing based on TextrRank Library

TextRank 기반의 한국어 기사 추출 및 텍스트 처리

  • Lee, Se-Hoon (Dept. of Computer Systems & Engineering, Inha Technical College) ;
  • Kong, Jin-Yong (Dept. of Computer Systems & Engineering, Inha Technical College) ;
  • Hwang, Ji-Hyeon (Dept. of Computer Systems & Engineering, Inha Technical College) ;
  • Ye, Ji-Min (Dept. of Computer Systems & Engineering, Inha Technical College)
  • 이세훈 (인하공업전문대학 컴퓨터시스템과) ;
  • 공진용 (인하공업전문대학 컴퓨터시스템과) ;
  • 황지현 (인하공업전문대학 컴퓨터시스템과) ;
  • 예지민 (인하공업전문대학 컴퓨터시스템과)
  • Published : 2021.07.14

Abstract

인터넷과 컴퓨팅 기술의 발전, 모바일 기기와 센서들의 진화, 소셜 네트워크의 출현 등으로 정보량은 급속도로 늘어나고 있다. 따라서 방대한 정보 속에서 의미있는 지식을 추출하기 위한 시스템의 기반 연구가 활발히 시도되고 있다. 본 논문에서는 텍스트 랭크를 사용한 중심 문장 추출을 통한 서비스와 사용자 이미지에 대한 한국어 OCR, 맞춤법 검사와 문장 생성을 가능케 하는 통합 한국어 처리 서비스 사이트를 구현함으로써, 신문 기사를 읽는 다수의 경제성을 확보했고, 한국어 처리의 편의성을 제공한다.

Keywords