• 제목/요약/키워드: 키워드 매핑

검색결과 33건 처리시간 0.018초

공공기록에 대한 접근성 제고 방안에 관한 연구 - 대통령기록관 주제시소러스 개발 사례를 중심으로 - (A Study on the Improvement of Accessibility to Public Records: Based on the Construction of Subject Thesaurus for Presidential Archives)

  • 이해영;권용찬;성효주;유병후
    • 한국기록관리학회지
    • /
    • 제14권4호
    • /
    • pp.127-151
    • /
    • 2014
  • 기능별 분류체계나 출처 중심의 탐색은 이용자들에게 쉽지 않으며 키워드검색도 이용자가 입력한 검색어와 기록물명의 단순 매칭 결과만 제시하여, 이용자의 기대에 부응하지 못하고 있다. 대통령기록관에서는 주제 분류체계를 개발하여 기록검색의 효율성을 높이고자 하였으며, 이와 연계하여 이용자들의 검색 과정을 돕고 기록관리 업무에도 용어통제 등 도움을 줄 주제 시소러스를 개발하고자 하였다. 본 연구에서는 대통령기록물 건명을 형태소 분석하고, 관련 시소러스와 이용자가 웹사이트에 입력한 검색 용어 및 정보공개 청구용어 등의 현황을 면밀히 분석한 후, 주제 분류체계와의 매핑을 통해 주제시소러스를 개발한 과정을 제시한다. 또한 주제 시소러스의 업무 및 온라인 서비스에의 활용 방안을 제시하며, 앞으로의 발전방향을 제시한다.

IT자산 장애처리의 사전 예측을 위한 기계학습 프로세스 (Machine Learning Process for the Prediction of the IT Asset Fault Recovery)

  • 문영준;류성열;최일우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.281-290
    • /
    • 2013
  • IT자산은 조직의 경영목적을 지원해주는 핵심영역이며, IT자산의 장애 발생시 신속한 처리를 지원하는 것은 매우 중요하다. 본 연구에서는 IT자산의 장애가 발생할 경우, 장애해결을 위하여 기존의 장애 데이터를 기초로 장애처리 예측 기법을 제시한다. 제안한 장애처리 예측 기법은 첫째, 기존의 장애처리 데이터를 전처리하여 장애처리 유형별로 분류하고 둘째, 분류된 장애처리 유형과 장애 발생 후 접수된 내용을 키워드 매핑시키는 규칙을 제정하였으며 셋째, 제정된 규칙에 의하여 장애 발생 후 장애처리 방법이 사전에 예측 가능한 기계학습 프로세스를 제시하였다. 제시한 기계학습 프로세스의 유효성을 입증하기 위하여 A사에서 6개월 동안 접수된 33,000여건의 전산기기 장애 데이터를 실험한 결과 장애처리 예측의 적중률이 약 72%였으며, 지속적인 기계학습을 통하여 81%로 향상되었다.

문서분류를 위한 의미적 주제선정방법 (Semantic Topic Selection Method of Document for Classification)

  • 고광섭;김판구;이창훈;황명권
    • 한국정보통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.163-172
    • /
    • 2007
  • 웹은 전세계 규모의 네트워크로써 문자, 화상, 음성 등의 미디어 정보들을 페이지 단위로 관리되며, 링크를 이용하여 분산된 정보들을 연결하고 있다. 이러한 웹의 지속적인 발전으로 무수한 정보들을 축적하고 있으며, 그 중 텍스트로 구성된 문서들이 주를 이룬다. 사용자는 이렇게 많은 정보들 중에서 자신이 원하는 특정 정보를 찾기 위해 웹을 사용한다. 그래서 웹은 사용자 요구에 적합한 정보를 검색해 주기 위해 계속적인 시도와 많은 연구들로 발전되고 있다. 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등 기존의 방법들은 문서의 의미적인 주제나 특징을 정확하게 처리 할 수 없어 사용자는 재검색을 해야 하는 문제점을 갖는다. 특히, 국내 문서 분류를 위한 연구는 많이 이루어지지 않아 검색에 더욱 어렵다. 이러한 문제점을 보완하기 위해 본 논문에서는 국내문서의 효율적이고 의미적인 분류를 위해 출현 개념의 TF(Term Frequency)와 주변 개념들과의 관계된 정도(RV : Relation Value)를 추출한다. 그리고 추출된 키워드들을 국내 어휘 사전인 U-WIN에 매핑하여 문서의 주제를 선택하고 본문에서 제 시하는 분류방법에 의해 웹 문서를 분류한다. 이는 문서 내 개념들의 관계를 이용하여 문서의 주제를 선정하고 문서의 의미적인 분류를 가능하게 한다.