• 제목/요약/키워드: information classification

검색결과 8,390건 처리시간 0.032초

한중 자동 문서분류를 위한 최적 자질어 비교 (Comparison Between Optimal Features of Korean and Chinese for Text Classification)

  • 임미영;강신재
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.386-391
    • /
    • 2015
  • 본 논문에서는 한국어와 중국어의 언어학적인 특징을 고려하여 문서 자동분류 시스템의 성능을 높일 수 있는 최적의 자질어 단위를 제안한다. 언어 종속적 단위인 형태소 자질어와 언어 독립적 단위인 n-gram 자질어 그리고 이들을 조합한 복합 자질어 집합을 대상으로 각 언어의 인터넷 신문기사를 SVM으로 분류하는 실험을 수행하였다. 실험 결과, 한국어 문서분류에서는 bi-gram이 F1-measure 87.07%로 가장 좋은 분류 성능을 보였고, 중국어 문서분류에서는 'uni-gram 명사 동사 형용사 사자성어'의 복합 자질어 집합이 F1-measure 82.79%로 가장 좋은 성능을 보였다.

용어관계의 분류 모형 개발에 관한 연구 (A Study on the Development of a Classification Model for Terminological Relationships)

  • 백지원;정연경
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.63-81
    • /
    • 2006
  • 본 연구는 모든 지식조직체계의 근간인 용어관계가 동일성, 계층성, 연관성이라는 세 가지 포괄적인 기준에 의해 정의되어 사용됨으로써 정보의 정확성이 중시되는 오늘날의 정보 환경에서 제 기능을 다하지 못하고 있으므로, 그 해결 방안의 하나로 용어관계의 분류 모형을 제시하고자 하는데 목적이 있다. 이를 위해 기존의 여러 지식조직체계에 나타나는 각종 용어관계의 사례와 용어관계에 대한 이론적 연구들을 광범위하게 수집하여 다양한 용어관계의 유형을 파악하였다. 그리고 이를 바탕으로 용어관계를 명확하게 정의하고 범주화할 수 있는 용어관계 분류의 근거를 세우고 용어관계의 분류 모형을 개발하였다. 더 나아가 이 분류 모형을 정보검색을 비롯한 다양한 방면에 활용할 수 있는 방안을 모색하고 향후 용어관계 분류 연구에 대한 제언을 했다.

문서측 자질선정을 이용한 고속 문서분류기의 성능향상에 관한 연구 (Improving the Performance of a Fast Text Classifier with Document-side Feature Selection)

  • 이재윤
    • 정보관리연구
    • /
    • 제36권4호
    • /
    • pp.51-69
    • /
    • 2005
  • 문서분류에 있어서 분류속도의 향상이 중요한 연구과제가 되고 있다. 최근 개발된 자질값투표 기법은 문서자동분류 문제에 대해서 매우 빠른 속도를 가졌지만, 분류정확도는 만족스럽지 못하다. 이 논문에서는 새로운 자질선정 기법인 문서측 자질선정 기법을 제안하고, 이를 자질값투표 기법에 적용해 보았다. 문서측 자질선정은 일반적인 분류자질선정과 달리 학습집단이 아닌 분류대상 문서의 자질 중 일부만을 선택하여 분류에 이용하는 방식이다. 문서측 자질선정을 적용한 실험에서는, 간단하고 빠른 자질값투표 분류기로 SVM 분류기만큼 좋은 성능을 얻을 수 있었다.

Cloud-Type Classification by Two-Layered Fuzzy Logic

  • Kim, Kwang Baek
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.67-72
    • /
    • 2013
  • Cloud detection and analysis from satellite images has been a topic of research in many atmospheric and environmental studies; however, it still is a challenging task for many reasons. In this paper, we propose a new method for cloud-type classification using fuzzy logic. Knowing that visible-light images of clouds contain thickness related information, while infrared images haves height-related information, we propose a two-layered fuzzy logic based on the input source to provide us with a relatively clear-cut threshold in classification. Traditional noise-removal methods that use reflection/release characteristics of infrared images often produce false positive cloud areas, such as fog thereby it negatively affecting the classification accuracy. In this study, we used the color information from source images to extract the region of interest while avoiding false positives. The structure of fuzzy inference was also changed, because we utilized three types of source images: visible-light, infrared, and near-infrared images. When a cloud appears in both the visible-light image and the infrared image, the fuzzy membership function has a different form. Therefore we designed two sets of fuzzy inference rules and related classification rules. In our experiment, the proposed method was verified to be efficient and more accurate than the previous fuzzy logic attempt that used infrared image features.

교량공사를 중심으로 한 범용 프로젝트 관리를 위한 전산 입력 자료 모형 구축 (A Study on A Computerized Input Data Model for A General -Purpose Project Management)

  • Park, Hongtae
    • 한국재난정보학회 논문집
    • /
    • 제12권1호
    • /
    • pp.19-31
    • /
    • 2016
  • 본 연구는 범용 프로젝트 관리 및 운영을 위해 범용 프로젝트 관리 전산시스템에 적용할 수 있는 초기 전산관리용 데이터베이스를 구축하였다. 본 연구에서 제시한 데이터베이스 구축 모형은 시설요소, 구조요소, 공사요소, 자원요소의 조직정보분류체계를 근거로 2교대 3경간의 교량공사를 조직분류체계, 활동, 자원별 활동의 계층으로 표현하여 구축하였다. 본 연구에서 구축된 데이터베이스 모형은 향후 범용 프로젝트 관리 및 운영을 위해서 매우 체계적이고 과학적인 관리로 활용할 수 있을 것으로 사료된다.

인터넷 탐색엔진에 관한 연구 (A Study on the Classification Scheme of the Internet Search Engine)

  • 김영보
    • 한국비블리아학회지
    • /
    • 제8권1호
    • /
    • pp.197-227
    • /
    • 1997
  • The main purpose of this study is ① to settle and to analyze the classification of the Internet Search Engine comparitively, and ② to build the compatible model of Internet Search Engine classification in order to seek information on the Internet resources. specially in the branch of the Computers and Internet areas. For this study, four Internet Search Engine (Excite, 1-Detect, Simmany, Yahoo Korea!), Inspec Classification and two distionaries were used. The major findings and result of analysis are summarized as follows : 1. The basis of the classification is the scope of topics, the system logic, the clearness, the efficiency. 2. The scope of topics is analyzed comparitively by the number of items from each Search Engine. In the result, Excite is the most superior of the four 3. The system logic is analyzed comparitively by the casuality balance and consistency of the items from each Search Engine. In the result, Excite is the most superior of the four 4. The clearness is analyzed comparitively by the clearness and accuracy of items, the recognition of the searchers. In the result, Excite is the most superior of the four. 5 The efficiency is analyzed comparitively by the exactness of indexing and decreasing the effort of the searchers. In the result, Yahoo Korea! is the most superior of the four. 6 The compatible model of Internet Search Engine classification is estavlished to uplift the scope of topics, the system logic, the clearness, and the efficiency. The model divides the area mainly based upon the topics and resources using‘bookmark’and‘shadow’concept.

  • PDF

Object Classification based on Weakly Supervised E2LSH and Saliency map Weighting

  • Zhao, Yongwei;Li, Bicheng;Liu, Xin;Ke, Shengcai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권1호
    • /
    • pp.364-380
    • /
    • 2016
  • The most popular approach in object classification is based on the bag of visual-words model, which has several fundamental problems that restricting the performance of this method, such as low time efficiency, the synonym and polysemy of visual words, and the lack of spatial information between visual words. In view of this, an object classification based on weakly supervised E2LSH and saliency map weighting is proposed. Firstly, E2LSH (Exact Euclidean Locality Sensitive Hashing) is employed to generate a group of weakly randomized visual dictionary by clustering SIFT features of the training dataset, and the selecting process of hash functions is effectively supervised inspired by the random forest ideas to reduce the randomcity of E2LSH. Secondly, graph-based visual saliency (GBVS) algorithm is applied to detect the saliency map of different images and weight the visual words according to the saliency prior. Finally, saliency map weighted visual language model is carried out to accomplish object classification. Experimental results datasets of Pascal 2007 and Caltech-256 indicate that the distinguishability of objects is effectively improved and our method is superior to the state-of-the-art object classification methods.

농학분야의 문헌분류 체계에 관한 연구 (A Study on the Classification of Agriculture)

  • 김정현;이명규
    • 한국도서관정보학회지
    • /
    • 제34권1호
    • /
    • pp.239-260
    • /
    • 2003
  • 이 연구는 농학분야의 정보자료를 효율적으로 관리하기 위한 새로운 문헌분류표의 모형을 제시하기 위하여 시도된 것이다. 이를 위해 먼저 농학분야의 학문적 정의와 범위, 체계에 대하여 고찰하였고, 현재 사용되고 있는 KDC, DDC, UDC, NDC 등의 문헌분류법에서 농학분야 주제를 전개하고 있는 강목표에 대하여 비교 분석하였고 NAL의 AGRICOLA SCC를 살펴보았다. 그리고 이를 토대로 농학분야의 새로운 문헌분류표의 강목을 설정하여 전개하였다. 새로운 강목분류표의 전개는 농업과 관련한 인문사회학, 식물관련 농업, 동물관련 농업, 인간과의 관계성, 농업관련 보조분야 순으로 전개하였고, 강목표는 23개의 항목으로 설정되었다.

  • PDF

EVALUATION OF SPEED AND ACCURACY FOR COMPARISON OF TEXTURE CLASSIFICATION IMPLEMENTATION ON EMBEDDED PLATFORM

  • Tou, Jing Yi;Khoo, Kenny Kuan Yew;Tay, Yong Haur;Lau, Phooi Yee
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.89-93
    • /
    • 2009
  • Embedded systems are becoming more popular as many embedded platforms have become more affordable. It offers a compact solution for many different problems including computer vision applications. Texture classification can be used to solve various problems, and implementing it in embedded platforms will help in deploying these applications into the market. This paper proposes to deploy the texture classification algorithms onto the embedded computer vision (ECV) platform. Two algorithms are compared; grey level co-occurrence matrices (GLCM) and Gabor filters. Experimental results show that raw GLCM on MATLAB could achieves 50ms, being the fastest algorithm on the PC platform. Classification speed achieved on PC and ECV platform, in C, is 43ms and 3708ms respectively. Raw GLCM could achieve only 90.86% accuracy compared to the combination feature (GLCM and Gabor filters) at 91.06% accuracy. Overall, evaluating all results in terms of classification speed and accuracy, raw GLCM is more suitable to be implemented onto the ECV platform.

  • PDF

The SWG Component Technology Classification Scheme Researchthrough the Technology Trend Analysis

  • Son, Hong Min;Hu, Jong Wan
    • 한국수자원학회논문집
    • /
    • 제48권11호
    • /
    • pp.945-955
    • /
    • 2015
  • The technology of the SWG (Smart Water Grid) as one of most important national projects results in significant assignment that is closely associated with systematic management and effective operation. The individual component technics are required to establish directory and classification for the purpose of effectively managing their information related to research and development (R&D). The national science technology (S&T) standard classification tree which results in the representative example has been established with an intention to manage R&D information, human resource, and budget. It has been also revised every five years and then used in the various fields related to the evaluation, administration, and prediction of the national R&D projects. In addition, the standard classification system for R&D projects has been widely used in the UNESCO (United Nations Educational, Scientific and Cultural Organization) and EU (European Union) since the Frascati Manual was established in the Organization for Economic Cooperation and Development (OECD). Therefore, it is necessary for SWG techniques to develop the standard S&T classification tree for research management and evaluation. For this, it is essential to draw the core techniques for the SWG, which are incorporated with IT (Information Technology), NT (Nano Technology), and BT (Biology Technology).