• Title/Summary/Keyword: 용어 분류

Search Result 477, Processing Time 0.032 seconds

Establishing Facet for Classifying Theological Terms (신학 용어 분류를 위한 패싯 설계에 관한 연구)

  • Yoo, Yeong-Jun
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.42 no.3
    • /
    • pp.259-279
    • /
    • 2008
  • The purpose of this study is to classify theological terms using facets and form foundation to build a theological thesaurus The terms was chosen in a English theological dictionary and the number of them are 1,031 but eventually, 984 terms were classified. The facets which classify the terms are 7 fundamentals and 14 sub-facets. Analysing the result of classification, abstract terms are much more than physical terms. They are 70% of the whole. Decimal classification to classify documents comes to dead end. therefore I think the research to classify terms of a specific subject as theology must be active. Furthermore, It is necessary to have knowledge about a specific subject to organize information in a specific subject.

A Comparative Study on Lexical Classification (용어분류의 비교연구)

  • 백지원;최석두
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.19-26
    • /
    • 2002
  • 본 연구의 목적은 용어분류를 그 특성에 따라 유형 구분하고 그 각각의 장단점을 밝힘으로써 앞으로의 용어분류 연구를 위한 기반을 제공하는 것이다. 이를 위해 먼저 용어분류의 개념을 밝히고, 그 목적 및 활용분야를 논하였다. 다음으로 다양한 용어 분류 관련 사례를 그 내·외형적 특성에 따라 크게 유의어 사전류와 분류형 시소러스류의 두 가지 유형으로 나눈 후, 이를 다시 세분하여 그 각각의 특징을 분석하였다. 이 분석을 바탕으로, 특히 색인과 검색 등 정보처리에 필요한 용어분류의 유형과 특성을 논하였다.

  • PDF

A Study on the Development of a Classification Model for Terminological Relationships (용어관계의 분류 모형 개발에 관한 연구)

  • Baek, Ji-Won;Chung, Yeon-Kyoung
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.1 s.59
    • /
    • pp.63-81
    • /
    • 2006
  • The purpose of this study is to present the limitation of terminological relationships in the current information environment and to propose a solution to result in the richer and refined terminological resources. For this, various kinds of terminological relationships in knowledge organization systems and theoretical researches were collected and analyzed. Based upon the analysis, a methodology for classification of terminological relationships was suggested and classification models were presented. Additionally, four suggestions were made for the practical uses of the classification models.

A study on compositions of listed terms in 2011 elementary mathematics curriculum in Korea (우리나라 2011 초등수학 교육과정 등재용어의 조성에 관한 연구)

  • Park, Kyo-Sik;Kwon, Seo-Kil
    • Journal of Educational Research in Mathematics
    • /
    • v.22 no.3
    • /
    • pp.429-444
    • /
    • 2012
  • As one of the trials for a systematic approach to mathematics terms which occupies an important place in teaching and learning mathematics, compositions of listed terms in 2011 elementary mathematics curriculum in Korea are discussed in this study. To this end, listed terms are classified in view of three points and looked for their characteristics, from which implications are found out for elementary mathematics teaching and learning First of all classifications into grade-group and domain-specific terms, then into newly coined terms and terms from everyday life, and then into korean terms and chinese character terms and english terms are attempted. Next, terms with a kernel and terms without a kernel are distinguished, and in this process, term-sets are presented. Finally, object terms, operation terms, relationship terms, measure terms, conditions terms, graphics terms, name terms are classified. Based on these results, the following implications for elementary mathematics teaching and learning are suggested. First, it should be considered that many of the listed terms in 2011 curriculum are newly coined and chinese character terms. Second, the interconnections between terms should be considered. Third, a variety of roles and functions of the terms should be considered.

  • PDF

확률 벡터를 사용한 전자 문서의 개념적 분류 기법

  • 조완섭;김영렬;강원석;강현규
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1997.11a
    • /
    • pp.53-62
    • /
    • 1997
  • 본 논문에서는 전자문서의 개념적 분류기법을 제안한다. 기존의 문서분류는 대부분 문서에 나타난 용어를 기반으로 분류하므로 개념적인 분류가 불가능하다. 제안된 기법에서는 한국어 시소러스를 사용하여 문서에 나타난 용어 뿐 아니라 용어의 상하위 개념을 기준으로 문서를 분류할 수 있다. 특히, 제안된 방법은 확률 벡터를 사용하는 방식으로써 점진적인 학습이 가능하다는 장점도 가진다.

  • PDF

Automatic Text Categorization by using Normalized Term Frequency Weighting (정규화 용어빈도가중치에 의한 자동문서분류)

  • 김수진;김민수;백장선;박혁로
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.510-512
    • /
    • 2003
  • 본 논문에서는 문서의 자동 분류를 위한 용어 빈도 가중치 계산 방법으로 Box-Cox변환기법을 응용한 정규화 용어빈도 가중치를 정의하고, 이를 문서 분류에 적응하였다. 여기서 Box-Cox 변환기법이란 자료를 정규분포화 할 때 적용하는 통계적인 변환방법으로서, 본 논문에서는 이를 응용하여 새로운 용어빈도가중치 계산법을 제안한다. 문서에서 등장한 용어 빈도는 너무 많거나 적게 등장할 경우, 중요도가 떨어지게 되는데, 이는 용어의 중요도가 빈도에 따른 정규분포로 모델링 될 수 있다는 것을 의미한다. 또한 정규화 가중치 계산방법은 기존의 용어빈도 가중치 공식과 비교할 때, 용어마다 계산방법이 달라져, 로그나 루트와 같은 고정된 가중치 방법보다는 좀더 일반적인 방법이라 할 수 있다. 신문기사 8000건을 대상으로 4개의 그룹으로 나누어 실험 한 결과, 정규화 용어빈도가중치 계산방법이 모두 우위의 분류 정확도롤 가져, 본 논문에서 제안한 방법이 타당함을 알 수 있다.

  • PDF

Text Categorization Based on Terminology and Information Extraction (전문용어 및 정보추출에 기반한 문서분류시스템)

  • Lee, Kyung-Soon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.79-84
    • /
    • 1999
  • 본 연구에서는 문서분류시스템에서 자질의 표현으로 전문분야사전을 이용한 분야정보와 개체정보추출을 통한 개체정보를 이용한다. 또한 지식정보를 보완하기 위해 통계적인 방법으로 범주 전문용어를 인식하여 자질로 표현하는 방법을 제안한다. 문서에 나타난 용어들이 어떤 특정 전문분야에 속하는 용어들이 많이 나타나는 경우 그 문서는 용어들이 속한 분야의 문서일 가능성이 높다. 또한, 정보추출을 통해 용어가 어떠한 개체를 나타내는지를 인식하여 문서를 표현함으로써 문서가 내포하는 의미를 보다 잘 반영할 수 있게 된다. 분야정보나 개체정보를 알 수 없는 용어에 대해서는 학습문서로부터 전문분야를 자동 인식함으로써 문서표현의 지식정보를 보완한다. 전문분야, 개체정보 및 범주전문용어에 기반해서 표현된 문서의 자질에 대해서 지지벡터기계 학습에 기반한 문서분류기틀 이용하여 각 범주에 대해 이진분류를 하였다. 제안된 문서자질표현은 용어기반의 자질표현에 비해 좋은 성능을 보이고 있다.

  • PDF

The Classification and Concept of Elementary School Computer Terms (초등학교 컴퓨터 용어의 분류 및 정의)

  • Choi, Eun-Hee;Kim, Kap-Su
    • 한국정보교육학회:학술대회논문집
    • /
    • 2004.08a
    • /
    • pp.548-555
    • /
    • 2004
  • ICT 교육의 소양교육과정 부분에서 초등학교 컴퓨터 용어교육이 절실히 요구된다. 초등학교 컴퓨터 용어교육은 ICT 소양교육의 바탕이기 때문이다. 특히, 기존의 컴퓨터 용어 사전은 성인들을 대상으로 한 것이어서 초등학생의 특성에 맞게 분류하고 정의한다. 초등학교 컴퓨터 용언의 분류는 제 7차 교육과정에서 정의하는 ICT 단계와 영역에 맞게 한다. 초등학교 컴퓨터 용어의 정의는 초등학생의 특성을 고려하여 구체성의 원리, 경험성의 원리, 현실성의 원리, 동기유발의 원리에 맞게 한다. 이에 따른 분류와 정의를 통해 몇 가지 용어를 예시적으로 정의한다. 이상과 같은 분류와 정의에 의해 초등학교 컴퓨터 용어는 초등학생들이 쉽게 이해하여 ICT 소양교육의 질은 저절로 높아질 것이다.

  • PDF

Text Similarity Decision System by Term Selection Method (용어 선별 기법에 의한 유사 문서 판별 시스템)

  • 장성호;강승식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.534-536
    • /
    • 2003
  • 대부분의 정보 검색 시스템은 문서 내어서 추출된 모든 용어를 이용해서 문서간 유사도 계산이나 문서 분류, 문서 클러스터링 등에 활용한다. 그러나 실질적으로 문서 내외 모든 용어를 추출해야만 이러한 정보 검색 시스템을 활용할 수 있는 것은 아니며, 오히려 용어 빈도수 같은 가중치가 낮은 용어를 용어 추출에서 제외시킴으로써 모든 용어 추출로 인해서 발생하는 시간과 공간을 많이 소비하는 문제를 해결할 수 있다. 또한 정확하고 자동적인 문서 분류를 위한 문서 클러스터링보다 유사 문서 검색의 활용은 검색효율의 증가를 가져 올 수 있다. 본 논문에서는 유사 문서 판별 시스템을 이용해 용어 추출의 효율성을 실험하였으며, 모든 용어를 추출한 경우보다 중요 용어만 추출한 경우에 더 좋은 성능을 보였다.

  • PDF

An Experimental Study on Feature Selection Using Wikipedia for Text Categorization (위키피디아를 이용한 분류자질 선정에 관한 연구)

  • Kim, Yong-Hwan;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.29 no.2
    • /
    • pp.155-171
    • /
    • 2012
  • In text categorization, core terms of an input document are hardly selected as classification features if they do not occur in a training document set. Besides, synonymous terms with the same concept are usually treated as different features. This study aims to improve text categorization performance by integrating synonyms into a single feature and by replacing input terms not in the training document set with the most similar term occurring in training documents using Wikipedia. For the selection of classification features, experiments were performed in various settings composed of three different conditions: the use of category information of non-training terms, the part of Wikipedia used for measuring term-term similarity, and the type of similarity measures. The categorization performance of a kNN classifier was improved by 0.35~1.85% in $F_1$ value in all the experimental settings when non-learning terms were replaced by the learning term with the highest similarity above the threshold value. Although the improvement ratio is not as high as expected, several semantic as well as structural devices of Wikipedia could be used for selecting more effective classification features.