• 제목/요약/키워드: 문서 분류기

검색결과 193건 처리시간 0.019초

Mecab-ko 형태소 분석을 이용한 한국체육학회지 연구동향 분석 (The Research Trend Analysis of the Korean Journal of Physical Education using Mecab-ko Morphology Analyzer)

  • 박성건;김완섭;이대택
    • 한국체육학회지인문사회과학편
    • /
    • 제56권6호
    • /
    • pp.595-605
    • /
    • 2017
  • 본 연구의 목적은 Mecab-ko 형태소 분석을 기반으로 한국체육학회 연구자들이 선호하는 연구 분야가 무엇이며, 인문사회과학과 자연과학 분야 간 연구자들의 관심사에 차이점이 있는지 그리고 이유는 무엇인지 텍스트 분석을 통해 알아보는 것이다. 본 연구를 위해 수집된 데이터는 2002년 3월~2017년 3월까지 한국체육학회지 온라인에 게재된 5,014편의 논문이다. 본 연구에서는 수집된 문서에서 키워드를 추출하기 위해 Mecab-ko 형태소 분석기를 사용하였다. 연구 결과, 한국체육학회지에 게재되는 논문 수는 감소하고 있는 것으로 나타났다. 연구자들이 선호하는 연구 분야는 여가, 생활체육 및 건강이 경기력 향상보다 상대적으로 높게 나타났으며, 관심이 높은 연구 대상은 여성, 중년, 노인으로 나타났다. 인문사회과학 분야 연구자들은 전통적 연구 분야와 사회적 관심사에 모두 관심을 보인 반면에, 자연과학 분야 연구자들은 전통적 연구를 보다 깊게 연구하는 것에 관심이 높은 것으로 나타났다. 결론적으로, 스포츠 분야 융합 연구 활성화를 구현하기 위해서는 연구의 깊이와 폭에 중점을 두어야 하는 학문 분야가 무엇인지, 새로운 학문 분류 체계 및 정립이 필요하다.

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.

나주 복암리 목간 출토의 고고학적 의의 (Archaeological Meanings of Wooden Tablets from Bogam-ri in Naju)

  • 김혜정
    • 헤리티지:역사와 과학
    • /
    • 제49권2호
    • /
    • pp.142-157
    • /
    • 2016
  • 2008년 나주 복암리유적에서 백제지방 최초로 목간이 출토되었다. 이 글에서는 목간을 묵서가 있는 목제품으로 정의하고 복암리 유적 발굴보고서에 수록된 목간 65점 중 묵서가 확인된 13점을 대상으로 백제 목간 출토현황과 비교하여 복암리 목간의 의미를 살펴 보았다. 복암리 출토 목간은 모두 대형의 1호수혈에서 일괄 출토되었다. 수혈 내부 토층은 모두 43개의 층으로 세분되나 출토된 목간을 비롯한 다수의 목제품, 토기, 기와 등 유물의 시기적 차이는 보이지 않는다. 목간은 다른 유구에서는 출토되지 않았으며 수혈에 일부러 폐기한 것으로 보이는데, 목간의 형태적 특징을 통해 2차 폐기되었음을 알 수 있다. 복암리 목간은 간지명 묵서 '경오년(庚午年)'이 확인된 목간과 $C^{14}$ 연대측정 결과 등을 토대로 610년을 중심연대로 7세기 초반으로 편년된다. 출토된 13점의 목간을 묵서 내용과 형태적 특징을 토대로 기능적으로 분류하면 문서목간 6점, 부찰목간 6점, 기타목간 1점으로 나뉜다. 현재까지 출토된 백제 목간은 총 89점으로 출토 지역은 나주와 금산을 제외하면 모두 부여에서 출토되었고, 사비도성 안팎의 왕궁지, 궁원지, 사찰 등으로 다양하다. 복암리 목간과 비교되는 주요 백제 목간으로는 관북리 목간, 궁남지 목간, 쌍북리 280-5번지 목간 등이다. 이들 목간과의 비교를 통해 웅진도독부 시절의 지명에 대한 검토, 지명+관등+인명 순으로 정형화된 신분표시 방식, 백제에서 군제가 실시되었고 복암리는 군이 설치된 지역이었다는 단서, 정중제 실시 등을 살펴볼 수 있다. 복암리 목간은 작성시기(610년), 작성지(군이 설치된 두힐성), 작성주체(군좌, 지방관 등)가 확실하며 기록된 내용은 백제 목간의 표준화된 신분표시 방식, 서사방식, 정중제와 양전제의 실시 등 백제 지방사회의 지배에 대한 일면을 단적으로 보여주는 중요자료라 할 수 있다.