• 제목/요약/키워드: 과학기술표준분류

검색결과 105건 처리시간 0.023초

국가 과학기술 표준분류 체계 기반 연구보고서 문서의 자동 분류 연구 (Research on Text Classification of Research Reports using Korea National Science and Technology Standards Classification Codes)

  • 최종윤;한혁;정유철
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.169-177
    • /
    • 2020
  • 과학기술 분야의 연구·개발 결과는 연구보고서 형태로 국가과학기술정보서비스(NTIS)에 제출된다. 각 연구보고서는 국가과학기술 표준 분류체계 (K-NSCC)에 따른 분류코드를 가지고 있는데, 보고서 작성자가 제출 시에 수동으로 입력하게끔 되어있다. 하지만 2000여 개가 넘는 세분류를 가지고 있기에, 분류체계에 대한 정확한 이해가 없이는 부정확한 분류코드를 선택하기 십상이다. 새로이 수집되는 연구보고서의 양과 다양성을 고려해 볼 때, 이들을 기계적으로 보다 정확하게 분류할 수 있다면 보고서 제출자의 수고를 덜어줄 수 있을 뿐만 아니라, 다른 부가 가치적인 분석 서비스들과의 연계가 수월할 것이다. 하지만, 국내에서 과학기술표준 분류체계에 기반을 둔 문서 자동 분류 연구 사례는 거의 없으며 공개된 학습데이터도 전무하다. 본 연구는 KISTI가 보유하고 있는 최근 5년간 (2013년~2017년) NTIS 연구보고서 메타정보를 활용한 최초의 시도로써, 방대한 과학기술표준 분류체계를 기반으로 하는 국내 연구보고서들을 대상으로 높은 성능을 보이는 문서 자동 분류기법을 도출하는 연구를 진행하였다. 이를 위해, 과학기술 표준분류 체계에서 과학기술 분야의 연구보고서를 분류하기에 적합한 중분류 210여 개를 선별하였으며, 연구보고서 메타 데이터의 특성을 고려한 전처리를 진행하였다. 특히, 가장 영향력 있는 필드인 과제명(제목)과 키워드만을 이용한 TK_CNN 기반의 딥러닝 기법을 제안한다. 제안 모델은 텍스트 분류에서 좋은 성능을 보이고 있는 기계학습법들 (예, Linear SVC, CNN, GRU등)과 비교하였으며, Top-3 F1점수 기준으로 1~7%에 이르는 성능 우위를 확인하였다.

국방과학기술 정보의 분류체계 고찰

  • 허아라;류연승
    • 정보보호학회지
    • /
    • 제28권6호
    • /
    • pp.25-32
    • /
    • 2018
  • 국방과학기술 중 국가안보를 위해 보호해야 하는 기술을 방위산업기술로 정의하고 있다. 방위산업기술보호법의 대상기관은 보유 또는 연구개발 중인 방위산업기술을 식별한 후, 방위산업기술 정보를 적절한 보호등급으로 분류하여 보호하여야 한다. 이를 위해서는 국방과학기술 정보의 분류체계 국가 표준이 수립되어야 하지만 아직까지 분류체계가 정립되어 있지 않고 대상기관 별로 자체 내규로 정하도록 지침이 마련 중으로 향후 혼란을 야기할 수 있어 이에 대한 개선이 필요하다. 본 논문에서는 현행 국방과학기술 정보의 분류체계와 미국 국방부의 과학기술 정보의 분류체계를 비교하고 발전방향을 고찰해본다.

과학기술데이터 신뢰성 평가를 통한 참조표준 확립에 관한 연구

  • 채균식
    • STIMA Bulletin
    • /
    • 통권5호
    • /
    • pp.24-37
    • /
    • 2006
  • 과학기술테이터는 엄격한 평가기준에 의해 신뢰성과 정확성이 보장된 참조표준(standard reference data)값을 지닐 수 있어야 한다. 참조표준은 측정표준을 바탕으로 구하여진 결과 값을 표준화시키는 작업으로서 테잍의 생산조건, 실험환경, 측정방법, 데이터 처리 등이 검토되어 참조데이터(reference data)와 구분된다. 참조표준은 '공인된 수치데이터'로 표현되고 이는 측정결과의 신뢰도를 정량적으로 나타내는 불확도(uncertainty)로 표기된다.본고에서는 참조표준에 대한 의미를 이해하고,평가되지 않은 과학기술 데이터가 어떤 평가 과정을 거쳐 참조표준으로 분류되는지를 알아보기 위해 소재물성분야를 예로 살펴보았다.

  • PDF

NTIS 측면에서 본 국가과학기술표준분류 및 호환표의 유용성에 관한 연구 (A Study on the problems of current National Standard Classification of Science and Technology for National Science and Technology Information System)

  • 송충한;설성수
    • 기술혁신학회지
    • /
    • 제9권3호
    • /
    • pp.496-513
    • /
    • 2006
  • 과학기술부는 국가 과학기술정보의 체계적인 수집, 분석 및 배포를 위해 국가차원에서 국가과학기술종합정보시스템(NTIS)을 구축하고 있다. 성공적인 NTIS의 추진을 위해서는 다양한 정보를 체계적으로 분류하고 유통시킬 수 있는 분류체계가 필요하다. 본 논문에서는 현재의 국가과학기술표준분류와 각 기관의 분류를 상호 연계하는 호환표를 사용하여 NTIS를 구축하는 것이 타당한지에 대하여 분석하였다. 분석결과 현행 분류체계를 이용하는 경우 정보의 유통이 원활하지 못한 것으로 나타나고 있으므로 성공적인 NTIS의 구축을 위해서는 새로운 분류체계가 고려될 필요가 있는 것으로 보인다.

  • PDF

분류체계 일치를 통한 과학기술정보 상호 교환 방법에 관한 기초 연구 (A Preliminary Study on Interchange of Science and Technology Information through Harmonization of Classification Schemes)

  • 홍성화;서태설
    • 정보관리연구
    • /
    • 제35권3호
    • /
    • pp.109-123
    • /
    • 2004
  • 과학기술정보의 의미적 상호운용성 문제는 빈번하게 발생한다. 잘 만들어진 분류체계는 상이한 데이터베이스 간에 의미상 불일치 없이 정보를 교환하기 위한 도구로 사용될 것이다. 하지만 각 데이터베이스가 취하고 있는 분류체계가 상이함으로 인해서 여전히 현실적인 장벽이 존재한다. 따라서 분류체계간의 일치 및 조화는 매우 시급한 문제이다. 본 논문의 목표는 다른 분류체계('국가과학기술표준분류'와 'KISTI 표준 분류')를 갖는 데이터베이스간의 정보 교환 시에 발생할 수 있는 의미적 불일치를 해결하는 것이다. 이를 위해서 과학기술의 개념적 체계 분석을 수행하였고 다섯가지의 일치/불일치 유형을 사례에 기반하여 분석하였다.

기계학습 기반 단문에서의 문장 분류 방법을 이용한 한국표준산업분류 (Standard Industrial Classification in Short Sentence Based on Machine Learning Approach)

  • 오교중;최호진;안현각
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.394-398
    • /
    • 2020
  • 산업/직업분류 자동코딩시스템은 고용조사 등을 함에 있어 사업체 정보, 업무, 직급, 부서명 등 사용자의 다양한 입력을 표준 산업/직업분류에 맞춰 코드 정보를 제공해주는 시스템이다. 입력 데이터로부터 비지도학습 기반의 색인어 추출 모델을 학습하고, 부분단어 임베딩이 적용된 색인어 임베딩 모델을 통해 입력 벡터를 추출 후, 출력 분류 코드를 인코딩하여 지도학습 모델에서 학습하는 방법을 적용하였다. 기존 시스템의 분류 결과 데이터를 통해 대, 중, 소, 세분류에서 높은 정확도의 모델을 구축할 수 있으며, 기계학습 기술의 적용이 가능한 시스템임을 알 수 있다.

  • PDF

과학기술 표준분류의 결정문제 (On the Standard Taxonomic System of Science and Technology)

  • 이초식
    • 과학기술학연구
    • /
    • 제2권1호
    • /
    • pp.1-38
    • /
    • 2002
  • 최근 한국 과학기술기획평가원에서 마련한 <국가 과학기술 표준분류체계> (이하 <초안>으로 약칭함)에 관한 공청회가 있었다. 필자는 이 공청회를 통해 많은 것을 배우게 되었고 나름대로 생각나는 것이 있어 <의견서>도 제출한 바 있다. 과학기술의 표준분류에 관한 논의는 과학기술학(STS)의 연구 분야와 긴밀히 연결되고 우리 학회차원에서도 검토해볼 만한 문제다. 이 글은 일차적으로 결단의 맥락(contort of decision)에서 표준화 안에 대한 비판과 대안을 제시하고 있으나 그것만이 이 글의 목표는 아니다. 그에 못지 않게 중요한 것은 STS의 시각이다. 그것은 공청회를 탐구공동체(community of inquiry)로 보는 시각이며 이를 통해 무엇인가를 배워보려는 배움의 맥락(context of learning)에서 STS의 한 가지 모델을 구성하려는 것이다. 결단의 맥락에서는 <초안>의 분류기준들 중에서 규모성 원칙이 잘못되었음을 지적하고 그런 잘못 때문에, 과학기술을 본격적으로 연구하는 과학기술학을 <국가 과학기술표준분류체계>에서 제외시키는 등의 문제점을 지적한다. 배움의 맥락에서는 과학기술학의 전형적인 사례연구(case study)의 한 가지 모형을 추구한다. 어떤 제안에 반대하거나 수정을 요구하는 부정적인 비판뿐만 아니라 미흡할지라도 적극적으로 대안을 제시하는 것이 STS의 전형적 과제로 여겨진다. 대안을 분명히 해야 새로운 비판이나 수용에 기여할 수 있기 때문이다. 여기서 제시한 STS의 모델 자체도 그러한 새로운 비판과 수용에 기여하기를 기대한다.

  • PDF

온라인 과학기술정보자원의 분류체계에 대한 실천적 구성방안 (A Practical Scheme for the Classification of On-line Information Resources on Science and Technology)

  • 김유일;최성배;구영덕
    • 정보관리연구
    • /
    • 제37권4호
    • /
    • pp.125-139
    • /
    • 2006
  • 인터넷의 등장은 과학기술정보의 생산과 유통에 많은 변화를 초래하고 있다. 기존 과학기술정보들은 주로 문헌위주로 생산되었다. 그러나, 인터넷이 대중화되면서 온라인 과학기술정보들이 대량으로 생산되고 있으며, 그 활용이나 중요도 또한 과학기술분야의 문헌에 뒤지지 않고 있다. 온라인 과학기술정보의 양적 질적 성장으로 인해, 정보서비스기관들은 이들 정보들의 체계적인 관리와 효율적인 서비스를 고민하고 있으며, 다양한 정보관리방법을 모색하고 있다. 효율적인 정보 관리를 위한 방법 중의 하나인 분류체계는 주요한 이슈이며, 지금까지는 문헌정보 중심의 분류체계나 일반 웹사이트의 분류체계를 벤치마킹하여 온라인 과학기술정보를 위해 도입되는 경우가 많았다. 본고에서는 국가 차원의 표준분류를 이용하여, 온라인 과학기술정보를 위한 분류체계 구성방안을 실천적으로 제시하여 보았다.

국가과학기술표준분류체계 용어 관리를 위한 SKOS 기반 메타데이터 요소 개발 연구 (A Study on Development of SKOS-based Metadata Elements for Managing Keywords in the National Science and Technology Standard Classification System)

  • 송민선;박진호
    • 한국비블리아학회지
    • /
    • 제32권4호
    • /
    • pp.67-88
    • /
    • 2021
  • 국가과학기술표준분류는 과학기술 관련 정보, 인력, 연구개발사업 등을 효율적으로 관리하기 위한 목적으로 제정 및 운영되고 있으며 개정주기는 5년이다. 2022년은 차기 개정 절차의 첫 해로 현재의 대, 중, 소분류체계 중 소분류체계를 기술키워드화 하는 것이 주 목적이다. 이는 현재의 경직된 구조로 인해 발생하는 유관 분류체계와의 연계 어려움과 최신 용어에 대한 미반영 문제를 해결하기 위한 것이다. 본 연구에서는 이 문제 해결을 위해 기존의 분류체계 관리를 용어관리체계로 변화시켜 용어의 품질과 활용성을 높일 수 있는 방법을 제안하였다. 이를 위해 표준용어관리체계인 SKOS와 ISO/IEC 11179 표준을 기본 모델로 설정하였다. 또 해외 과학기술용어집에서 활용하고 있는 용어관리 메타데이터 표준을 조사하여 현 국가과학기술표준분류체계와 비교한 후 용어관리관점에서 즉시 활용할 수 있는 메타데이터들을 도출하였다. 그 결과 현 관리체계에서 즉시 변형하여 적용할 수 있는 11개 표준 요소를 발굴 제안하였으며, 차후 분류체계 개정 작업을 거친 후 적용할 수 있는 5개 요소를 발굴하여 제안하였다.