한국컴퓨터정보학회:학술대회논문집 (Proceedings of the Korean Society of Computer Information Conference)
- 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
- /
- Pages.27-28
- /
- 2020
트리 구조 데이터의 의미 기반 라벨 리스트 표현 정보 추출
Semantic-Based Label Lists Represented Information Extraction from Tree Data
- 백주련 (평택대학교 데이터정보학과)
- Paik, Juryon (Dept. of Digital Information & Statistics, Pyeongtaek University)
- 발행 : 2020.07.15
초록
이형 데이터 간의 정보 전송과 교환을 가능하게 하는 유연한 트리 구조의 특성은 인터넷 및 IoT 환경에서의 대량 데이터 저장·전송·교환 등에 있어서 XML이나 JSON에서 주요하게 사용된다. 사용성에 있어서는 수월한 반면에, 감추어져 있는 가치있는 정보들을 트리 구조의 대량 데이터들로부터 찾아내는 것은 일반 단순 구조의 데이터에 비해서 훨씬 어려우며 복잡하고 난해한 문제들을 발생시킨다. 이는 트리가 갖는 계층 구조 때문이다. 본 논문에서는 계층 구조를 갖는 대량 트리 데이터들을 보다 단순한 리스트 구조로 변형한 후 해당 구조로부터 가장 자주 발생하는 유용한 정보들을 추출하는 방법을 제시한다.