• 제목/요약/키워드: 용어 분류

검색결과 477건 처리시간 0.026초

신학 용어 분류를 위한 패싯 설계에 관한 연구 (Establishing Facet for Classifying Theological Terms)

  • 유영준
    • 한국문헌정보학회지
    • /
    • 제42권3호
    • /
    • pp.259-279
    • /
    • 2008
  • 신학 분야의 시소러스를 구축하는 전 단계로서, 패싯을 이용하여 신학 용어를 분류하였다. 영어로 된 신학 사전에서 1.031개의 용어를 선정하였고, 이 중에서 실제로 분류한 용어의 수는 984개이다. 용어를 분류하기 위해서 전개한 패싯은 기본 패싯 7개와 하위 패싯 14개이었다. 분류한 용어들을 분석해 본 결과, 신학 분야의 특성에 맞게 물리적 형태를 갖는 구체적인 용어의 수보다 추상적인 용어의 수가 많았으며. 전체 용어 수의 70% 정도를 차지하였다. 문헌 분류를 위한 십진 분류 체계에 대한 연구가 한계에 이른 상황에서. 이러한 특정 주제 분야의 용어를 분류하고 시소러스를 구축하는 연구가 더 활발해져야 한다고 생각한다.

용어분류의 비교연구 (A Comparative Study on Lexical Classification)

  • 백지원;최석두
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.19-26
    • /
    • 2002
  • 본 연구의 목적은 용어분류를 그 특성에 따라 유형 구분하고 그 각각의 장단점을 밝힘으로써 앞으로의 용어분류 연구를 위한 기반을 제공하는 것이다. 이를 위해 먼저 용어분류의 개념을 밝히고, 그 목적 및 활용분야를 논하였다. 다음으로 다양한 용어 분류 관련 사례를 그 내·외형적 특성에 따라 크게 유의어 사전류와 분류형 시소러스류의 두 가지 유형으로 나눈 후, 이를 다시 세분하여 그 각각의 특징을 분석하였다. 이 분석을 바탕으로, 특히 색인과 검색 등 정보처리에 필요한 용어분류의 유형과 특성을 논하였다.

  • PDF

용어관계의 분류 모형 개발에 관한 연구 (A Study on the Development of a Classification Model for Terminological Relationships)

  • 백지원;정연경
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.63-81
    • /
    • 2006
  • 본 연구는 모든 지식조직체계의 근간인 용어관계가 동일성, 계층성, 연관성이라는 세 가지 포괄적인 기준에 의해 정의되어 사용됨으로써 정보의 정확성이 중시되는 오늘날의 정보 환경에서 제 기능을 다하지 못하고 있으므로, 그 해결 방안의 하나로 용어관계의 분류 모형을 제시하고자 하는데 목적이 있다. 이를 위해 기존의 여러 지식조직체계에 나타나는 각종 용어관계의 사례와 용어관계에 대한 이론적 연구들을 광범위하게 수집하여 다양한 용어관계의 유형을 파악하였다. 그리고 이를 바탕으로 용어관계를 명확하게 정의하고 범주화할 수 있는 용어관계 분류의 근거를 세우고 용어관계의 분류 모형을 개발하였다. 더 나아가 이 분류 모형을 정보검색을 비롯한 다양한 방면에 활용할 수 있는 방안을 모색하고 향후 용어관계 분류 연구에 대한 제언을 했다.

우리나라 2011 초등수학 교육과정 등재용어의 조성에 관한 연구 (A study on compositions of listed terms in 2011 elementary mathematics curriculum in Korea)

  • 박교식;권석일
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제22권3호
    • /
    • pp.429-444
    • /
    • 2012
  • 본 연구에서는 초등학교 수학 교수 학습에서 중요한 위치를 차지하는 수학 용어에 체계적으로 접근하기 위한 시도의 한 가지로, 2011 등재용어의 조성에 관해 논의한다. 이를 위해 등재용어를 세 관점에서 분류하여, 분류 결과로부터 초등학교 수학 교수 학습을 위한 시사점을 찾는다. 먼저 용어에 대한 일차적 분류로서 학년군별 및 영역별 분류, 조어 및 일상어별 분류, 그리고 한글, 한자어, 영어별 분류를 시도한다. 다음으로는 용어의 연결성에 주목하는 분류로서 핵을 갖는 용어와 그렇지 않은 용어를 구별하고, 이 과정에서 용어집합을 제시한다. 마지막으로 용어를 그 역할과 기능에 따라 대상 용어, 조작 용어, 관계 용어, 측도 용어, 상태 용어, 도표 용어, 기명 용어로 분류한다. 이러한 결과를 바탕으로 수학 교수 학습과 관련하여 다음의 제언을 한다. 첫째, 등재용어의 상당수가 조어이면서 한자어라는 것을 고려해야 한다. 둘째, 용어의 상호연결성을 고려해야 한다. 셋째, 용어의 역할과 기능이 다양하다는 것을 고려해야 한다.

  • PDF

확률 벡터를 사용한 전자 문서의 개념적 분류 기법

  • 조완섭;김영렬;강원석;강현규
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 추계학술대회 발표논문집:21세기를 향한 정보통신 기술의 전망
    • /
    • pp.53-62
    • /
    • 1997
  • 본 논문에서는 전자문서의 개념적 분류기법을 제안한다. 기존의 문서분류는 대부분 문서에 나타난 용어를 기반으로 분류하므로 개념적인 분류가 불가능하다. 제안된 기법에서는 한국어 시소러스를 사용하여 문서에 나타난 용어 뿐 아니라 용어의 상하위 개념을 기준으로 문서를 분류할 수 있다. 특히, 제안된 방법은 확률 벡터를 사용하는 방식으로써 점진적인 학습이 가능하다는 장점도 가진다.

  • PDF

정규화 용어빈도가중치에 의한 자동문서분류 (Automatic Text Categorization by using Normalized Term Frequency Weighting)

  • 김수진;김민수;백장선;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.510-512
    • /
    • 2003
  • 본 논문에서는 문서의 자동 분류를 위한 용어 빈도 가중치 계산 방법으로 Box-Cox변환기법을 응용한 정규화 용어빈도 가중치를 정의하고, 이를 문서 분류에 적응하였다. 여기서 Box-Cox 변환기법이란 자료를 정규분포화 할 때 적용하는 통계적인 변환방법으로서, 본 논문에서는 이를 응용하여 새로운 용어빈도가중치 계산법을 제안한다. 문서에서 등장한 용어 빈도는 너무 많거나 적게 등장할 경우, 중요도가 떨어지게 되는데, 이는 용어의 중요도가 빈도에 따른 정규분포로 모델링 될 수 있다는 것을 의미한다. 또한 정규화 가중치 계산방법은 기존의 용어빈도 가중치 공식과 비교할 때, 용어마다 계산방법이 달라져, 로그나 루트와 같은 고정된 가중치 방법보다는 좀더 일반적인 방법이라 할 수 있다. 신문기사 8000건을 대상으로 4개의 그룹으로 나누어 실험 한 결과, 정규화 용어빈도가중치 계산방법이 모두 우위의 분류 정확도롤 가져, 본 논문에서 제안한 방법이 타당함을 알 수 있다.

  • PDF

전문용어 및 정보추출에 기반한 문서분류시스템 (Text Categorization Based on Terminology and Information Extraction)

  • 이경순;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 1999
  • 본 연구에서는 문서분류시스템에서 자질의 표현으로 전문분야사전을 이용한 분야정보와 개체정보추출을 통한 개체정보를 이용한다. 또한 지식정보를 보완하기 위해 통계적인 방법으로 범주 전문용어를 인식하여 자질로 표현하는 방법을 제안한다. 문서에 나타난 용어들이 어떤 특정 전문분야에 속하는 용어들이 많이 나타나는 경우 그 문서는 용어들이 속한 분야의 문서일 가능성이 높다. 또한, 정보추출을 통해 용어가 어떠한 개체를 나타내는지를 인식하여 문서를 표현함으로써 문서가 내포하는 의미를 보다 잘 반영할 수 있게 된다. 분야정보나 개체정보를 알 수 없는 용어에 대해서는 학습문서로부터 전문분야를 자동 인식함으로써 문서표현의 지식정보를 보완한다. 전문분야, 개체정보 및 범주전문용어에 기반해서 표현된 문서의 자질에 대해서 지지벡터기계 학습에 기반한 문서분류기틀 이용하여 각 범주에 대해 이진분류를 하였다. 제안된 문서자질표현은 용어기반의 자질표현에 비해 좋은 성능을 보이고 있다.

  • PDF

초등학교 컴퓨터 용어의 분류 및 정의 (The Classification and Concept of Elementary School Computer Terms)

  • 최은희;김갑수
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2004년도 하계학술대회
    • /
    • pp.548-555
    • /
    • 2004
  • ICT 교육의 소양교육과정 부분에서 초등학교 컴퓨터 용어교육이 절실히 요구된다. 초등학교 컴퓨터 용어교육은 ICT 소양교육의 바탕이기 때문이다. 특히, 기존의 컴퓨터 용어 사전은 성인들을 대상으로 한 것이어서 초등학생의 특성에 맞게 분류하고 정의한다. 초등학교 컴퓨터 용언의 분류는 제 7차 교육과정에서 정의하는 ICT 단계와 영역에 맞게 한다. 초등학교 컴퓨터 용어의 정의는 초등학생의 특성을 고려하여 구체성의 원리, 경험성의 원리, 현실성의 원리, 동기유발의 원리에 맞게 한다. 이에 따른 분류와 정의를 통해 몇 가지 용어를 예시적으로 정의한다. 이상과 같은 분류와 정의에 의해 초등학교 컴퓨터 용어는 초등학생들이 쉽게 이해하여 ICT 소양교육의 질은 저절로 높아질 것이다.

  • PDF

용어 선별 기법에 의한 유사 문서 판별 시스템 (Text Similarity Decision System by Term Selection Method)

  • 장성호;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.534-536
    • /
    • 2003
  • 대부분의 정보 검색 시스템은 문서 내어서 추출된 모든 용어를 이용해서 문서간 유사도 계산이나 문서 분류, 문서 클러스터링 등에 활용한다. 그러나 실질적으로 문서 내외 모든 용어를 추출해야만 이러한 정보 검색 시스템을 활용할 수 있는 것은 아니며, 오히려 용어 빈도수 같은 가중치가 낮은 용어를 용어 추출에서 제외시킴으로써 모든 용어 추출로 인해서 발생하는 시간과 공간을 많이 소비하는 문제를 해결할 수 있다. 또한 정확하고 자동적인 문서 분류를 위한 문서 클러스터링보다 유사 문서 검색의 활용은 검색효율의 증가를 가져 올 수 있다. 본 논문에서는 유사 문서 판별 시스템을 이용해 용어 추출의 효율성을 실험하였으며, 모든 용어를 추출한 경우보다 중요 용어만 추출한 경우에 더 좋은 성능을 보였다.

  • PDF

위키피디아를 이용한 분류자질 선정에 관한 연구 (An Experimental Study on Feature Selection Using Wikipedia for Text Categorization)

  • 김용환;정영미
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.155-171
    • /
    • 2012
  • 텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.