• Title/Summary/Keyword: 주제분류

Search Result 986, Processing Time 0.036 seconds

A study on classification accuracy improvements using orthogonal summation of posterior probabilities (사후확률 결합에 의한 분류정확도 향상에 관한 연구)

  • 정재준
    • Spatial Information Research
    • /
    • v.12 no.1
    • /
    • pp.111-125
    • /
    • 2004
  • Improvements of classification accuracy are main issues in satellite image classification. Considering the facts that multiple images in the same area are available, there are needs on researches aiming improvements of classification accuracy using multiple data sets. In this study, orthogonal summation method of Dempster-Shafer theory (theory of evidence) is proposed as a multiple imagery classification method and posterior probabilities and classification uncertainty are used in calculation process. Accuracies of the proposed method are higher than conventional classification methods, maximum likelihood classification(MLC) of each data and MLC of merged data sets, which can be certified through statistical tests of mean difference.

  • PDF

A study on the Design of Subject Gateway of Web Information Resource Using Metadata in Mechanical Engineering (베타데이터를 이용한 기계공학분야 웹 정보자원의 주제 게이트웨이 설계에 관한 연구)

  • 송재윤;이응봉
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.131-138
    • /
    • 2002
  • 본 고에서는 공학분야 중에서도 그 응용범위가 가장 광범위하다고 할 수 있는 기계공학분야의 이용자에게 수준 높은 웹 정보자원을 효율적으로 제공하기 위하여 검색엔진을 통하여 자동 수집된 웹 정보자원을 기계공학분야 주제전문가의 평가를 통해 핵심정보를 선정하고 이를 더블린코어 메타데이터를 응용한 베타데이터 요소에 따라 조직하여 웹 상의 검색 인터페이스에 의해 이용될 수 있도록 주제 게이트웨이 시스템을 설계하였다. 정보자원의 검색방법으로는 키워드 검색과 주제분류체계에 따른 브라우징 검색 등 두 가지 방법을 이용하였다.

  • PDF

The classification if literature on the medical history: Research scope of medical history (의학사 문헌의 분류에 관한 연구: 의학사 연구범주를 중심으로)

  • 정경희
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.95-98
    • /
    • 1997
  • 의학사 연구영역의 확대로 다양한 주제를 다룬 연구문헌들이 배출되고 있음에도 불구하고 분류표에서 의학사는 매우 간단하게 취급되고 있어 이들 문헌을 분류하는데 어려움이 있다. 본 연구에서는 KDC, DDC, 중국도서관 도서분류법 등 일반 도서관용 분류표와 NLMC, 보스톤의학도서관분류,. 커닝햄분류표, 버나드분류표 등 의학도서관용 분류표에서 의학사가 어떻게 취급되고 있는 지 살펴보았으며, 의학사문헌의 보다 정확한 분류 및 분류표 재전개를 위하여 의학사의 연구범주를 고찰하였다.

  • PDF

Multi-labeled Domain Detection Using CNN (CNN을 이용한 발화 주제 다중 분류)

  • Choi, Kyoungho;Kim, Kyungduk;Kim, Yonghe;Kang, Inho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.56-59
    • /
    • 2017
  • CNN(Convolutional Neural Network)을 이용하여 발화 주제 다중 분류 task를 multi-labeling 방법과, cluster 방법을 이용하여 수행하고, 각 방법론에 MSE(Mean Square Error), softmax cross-entropy, sigmoid cross-entropy를 적용하여 성능을 평가하였다. Network는 음절 단위로 tokenize하고, 품사정보를 각 token의 추가한 sequence와, Naver DB를 통하여 얻은 named entity 정보를 입력으로 사용한다. 실험결과 cluster 방법으로 문제를 변형하고, sigmoid를 output layer의 activation function으로 사용하고 cross entropy cost function을 이용하여 network를 학습시켰을 때 F1 0.9873으로 가장 좋은 성능을 보였다.

  • PDF

Application of a Naive Bayes Classifier for Topic Word Sense Disambiguation (주제어의 중의성 해소를 위한 Naive Bayes 분류기 적용에 관한 연구)

  • 유현숙;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.71-74
    • /
    • 2000
  • 단어의 의미 중의성을 해소하는 것은 자연언어처리의 중요한 문제 중의 하나이다. 특히 문서의 주제어가 중의성을 가질 때, 이 문서는 부적합한 범주에 속하게 되어 정보검색시 잡음을 일으키는 원인이 되기도 한다. 그러므로, 본 논문에서는 문서를 대표하는 주재어의 의미 중의성을 해소하기 위해 주변 문맥자질을 고려하는 방법을 모색한다 이를 위해 자연언어처리의 통계적 방법으로 문서 범주화에 많이 사용되는 Naive Bayes 분류기를 중의성 해소에 적용하고, 그 결과 얻어진 중의성 해소 성능을 평가한다.

  • PDF

A Study on Design and Analysis of Metadata and Ontology based on Humanities and Social Sciences (기초학문자료 메타데이터 설계 분석 및 온톨로지 적용 방안 연구)

  • Lee, Jung-Yeoun;Kim, Jung-Min;Choi, Suk-Doo;Kim, Lee-Kyum
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.41 no.2
    • /
    • pp.291-316
    • /
    • 2007
  • The purpose of this study is to design metadata model for describing different kinds of concepts, properties, and semantic relationships of result materials of researches. We examine our metadata model to evaluate correctness and efficiency of the model through contents analysis of a constructed database. From the results of examination, we suggest more effective structure of metadata schema. Domain ontology could constructed by the enlarged thesaurus in order to overcome the limitation of the keyword search, therefore we design a philosophy and religion ontology based on subject classification to improve information retrieval and implement it using XML/Topic Maps to improve retrieval functionality of our database.

A Design and Implementation of Web Robot by Using Genre-based Categorization and Subject-based Categorization (장르기반 분류와 주제기반 분류를 이용한 웹 로봇의 설계 및 구현)

  • Lee Yong-Bae
    • The KIPS Transactions:PartB
    • /
    • v.12B no.4 s.100
    • /
    • pp.499-506
    • /
    • 2005
  • It still has some restrictions to collect a specialized information with only the function of existing web robot which collect an enormous of data by circulating through the internet. Therefore, in this paper the functions of the current web robot and its application areas are analyzed and the limitations of collecting a specialized information are found out. Also we define what functions are necessary for a web robot in order to collect a specialized information. Then the designed structure is described. There are two critical functions which are applied to web robot. One is a genre-based categorization that classifies the text by the type, and the other is a content-based categorization by the subject. Most of all, genre-based categorization is used as fundamental feature which enables web robot to collect the aimed documents efficiently.

A Study of Subject Contents in High-School Economic Geography (고등학교 경제지리 교육내용의 선정과 조직)

  • 조성욱
    • Journal of the Korean Geographical Society
    • /
    • v.35 no.3
    • /
    • pp.455-474
    • /
    • 2000
  • 제 7 차 교육과정에서 경제지리 과목이 심화 선택 과목으로 새롭게 설정되었다. 그러나 제 6차 교육과정 한국지리 과목의 경제지리 교육내용을 단순 확대.심화시켜 구성하였기 때문에, 그 동안의 비판과 문제점을 해결하지 못하고 있다. 지리교육에서 경제 지리교육내용의 선정 및 조직 바법은 산업별 분류방법, 주제 중심방법, 경제과정 중심방법으로 분류할 수 있는데, 기존은 교육과정은 산업별 분류방법을 근간으로 하고 있다. 본 연구에서는, 공급자의입장에서 나열적으로 교육내용을 선정.조직하고 있는 기존 방법의 문제점을 개선하고, 실생활에서 학습의 유용성을 확인시켜 학습자의 관심과 흥미를 갖게 하며, 다양한 형태의 교수-학습 활동이 가능하도록 하면서, 심화 선택 과목의 특성을 살릴 수 있는 경제 지리 과목의 교육내용 선정 및 조직 대안으로 지역문제 중심방법을 제안한다.

  • PDF

Article Analytic and Summarizing Algorithm by facilitating TF-IDF based on k-means (TF-IDF를 활용한 k-means 기반의 효율적인 대용량 기사 처리 및 요약 알고리즘)

  • Jang, Minseo;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.271-274
    • /
    • 2018
  • 본 논문에서는 뉴스기사 데이터를 활용하여 대규모 뉴스기사를 소주제로 분류하는 군집 분석 방법을 제안한다. 또한, 분류된 뉴스기사를 사용자가 빠르게 이해하고 접할 수 있도록 핵심 문장을 추출하여 제공하는 방법을 제안한다. 분석 데이터는 포털 사이트 점유율 1위인 네이버의 경제 분야 뉴스기사를 크롤링하여 수집한다. 뉴스기사의 분석을 위해 전 처리를 통해 특수문자, 조사, 어미, 구두점 등의 불 용어 처리를 수행한다. 또한, k-means 알고리즘을 이용하여 대용량의 뉴스기사를 주제 별로 분류하는 것을 진행하며 그것을 토대로 핵심 문장을 추출한다. 추출된 핵심 문장은 분류된 뉴스기사의 주제를 나타내며 사용자에게 빠르게 정보를 전달하기 위해 활용한다. 본 논문의 연구 내용이 여러 언론사 사이트에 반영되면 사이트 품질과 사용자 만족도 향상에 기여할 수 있을 것으로 보인다.

A study on the classification scheme of the Internet search engine (인터넷 탐색엔진의 분류체계에 관한 연구)

  • 김영보
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.99-102
    • /
    • 1997
  • 인터넷 도구 중의 하나인 탐색엔진은 월드 와이드 웹의 보편화와 함께 중요한 매개체로 자리잡고 있다. 탐색엔진은 서비스 제공형태에 의해 크게 분류체계 제공형과 주제어 검색 제공형으로 나뉘어 지는데, 분류체계 제공형 엔진에 대한 연구는 그 이용빈도에 비해 부족한 편이다. 따라서, 인터넷 이용자의 탐색노력을 줄이는데 보다 유용한 분류체계 제공형 엔진에 대한 연구가 필요하다. 본 연구에서는 분류체계 제공에 중점을 두고 있는 국내외의 대표적인 탐색엔진 6종과 문헌 분류이론인 KDC와 DDC를 선정하여 그 분류체계를 비교ㆍ분석하여 적합한 형태의 탐색엔진 분류체계의 모형을 구축하고자 한다.

  • PDF