• 제목/요약/키워드: Information classification

검색결과 8,385건 처리시간 0.028초

A Novel Thresholding for Prediction Analytics with Machine Learning Techniques

  • Shakir, Khan;Reemiah Muneer, Alotaibi
    • International Journal of Computer Science & Network Security
    • /
    • 제23권1호
    • /
    • pp.33-40
    • /
    • 2023
  • Machine-learning techniques are discovering effective performance on data analytics. Classification and regression are supported for prediction on different kinds of data. There are various breeds of classification techniques are using based on nature of data. Threshold determination is essential to making better model for unlabelled data. In this paper, threshold value applied as range, based on min-max normalization technique for creating labels and multiclass classification performed on rainfall data. Binary classification is applied on autism data and classification techniques applied on child abuse data. Performance of each technique analysed with the evaluation metrics.

국가지식정보 자원 분류 체계 표준화 연구 (A Study on the Developing Standard Classsification of the National Knowledge and Information Resources)

  • 고영만;서태설;조순영
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.151-173
    • /
    • 2006
  • 본 연구의 목적은 지식정보자원 데이터베이스를 구축하고 관리하고 서비스하는 국내의 모든 공공 기관과 민간 기관에서 공동으로 활용될 수 있으며 다양한 자료유형과 매체유형을 포괄할 수 있는 국가지식정보 분류표준(안)을 개발하는 것이다. 연구의 기초 작업으로서 문헌분류 체계와 지식정보자원 분류 체계의 차이, 지식정보자원의 분류사례 및 지식정보자원 분류에 대한문헌분류 체계의 적용 가능성을 분석하였다. 기초 분석에 이어 국가지식정보 표준분류 체계 개발에 필요한 지식의 분야별 분포, 분류의 계층과 유연성 확보 방안, 지식정보 자원의 자료유형과 매체유형, 국가지식정보의 포털서비스 방안 등이 분석되었다. 이러한 분석을 토대로 본 연구에서는 주제 분류표, 자료유형 분류표, 매체유형 분류표로 구성된 다원적 국가지식정보 분류 표준(안) 모형을 제시하였다.

음식문화 분야의 DDC 분류체계 개선방안에 관한 연구 (A Study on the Improvements of Food and Culture in Dewey Decimal Classification System)

  • 정연경;최윤경
    • 한국비블리아학회지
    • /
    • 제21권1호
    • /
    • pp.43-57
    • /
    • 2010
  • 본 연구는 문헌분류표를 바탕으로 음식문화 분야와 한식을 고찰하여 음식문화의 다양한 주제를 보다 더 효과적으로 분류할 수 있도록 DDC의 개선 방향을 제시하였다. 이를 위해 동서양의 대표적인 분류 체계인 DDC, UDC, LCC, KDC, NDC, 중국도서관도서분류법을 대상으로 식생활 풍습, 식사 예절, 영양과 식이, 식품과 음료, 식단과 상차림, 음료 기술, 식품 공학으로 나누어 음식문화와 관련된 항목들을 비교분석하였다. 분석 결과, 6개 분류표의 한식에 대한 분류 항목은 거의 없었으며 앞으로 한국 고유의 음식과 상차림 등이 분류표에 반영될 필요성을 확인하였다. 분류표에 새로운 분류 항목이나 주기의 추가를 위해서는 문헌적 타당성을 가져야 하므로 다양한 한식에 관한 조리법이나 간행물을 발간하고 이를 전 세계에 알려야 할 것이다.

기계학습에 기초한 국내 학술지 논문의 자동분류에 관한 연구 (An Analytical Study on Automatic Classification of Domestic Journal articles Based on Machine Learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.37-62
    • /
    • 2018
  • 문헌정보학 분야의 국내 학술지 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히, "정보관리학회지"에 수록된 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 용어 가중치부여 기법, 학습집합 크기, 분류 알고리즘, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 각 요소를 적절하게 적용하는 것이 효과적이며, 보다 단순한 모델의 사용으로 상당히 좋은 수준의 성능을 도출할 수 있었다. 또한, 국내 학술지 논문의 분류는 특정 논문에 하나 이상의 범주를 할당하는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있다. 따라서 이러한 환경을 고려하여 단순하고 빠른 분류 알고리즘과 소규모의 학습집합을 사용하는 최적의 분류 모델을 제안하였다.

Korean Document Classification using Characteristics of Word Information

  • Kim, Seok-Ki;Han, Kyung-Soo;Ahn, Jeong-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권2호
    • /
    • pp.167-175
    • /
    • 2003
  • In document classification, target of analysis is not document itself but words appeared in the document. Word information, therefore, is a significant factor in document classification. In this study, we are dealing with the classification of Korean document based on words and feature vectors. First, we present the performance of document classification using nouns and keywords. Second, we compare to the results for the size of feature vectors.

  • PDF

Classifying Biomedical Literature Providing Protein Function Evidence

  • Lim, Joon-Ho;Lee, Kyu-Chul
    • ETRI Journal
    • /
    • 제37권4호
    • /
    • pp.813-823
    • /
    • 2015
  • Because protein is a primary element responsible for biological or biochemical roles in living bodies, protein function is the core and basis information for biomedical studies. However, recent advances in bio technologies have created an explosive increase in the amount of published literature; therefore, biomedical researchers have a hard time finding needed protein function information. In this paper, a classification system for biomedical literature providing protein function evidence is proposed. Note that, despite our best efforts, we have been unable to find previous studies on the proposed issue. To classify papers based on protein function evidence, we should consider whether the main claim of a paper is to assert a protein function. We, therefore, propose two novel features - protein and assertion. Our experimental results show a classification performance with 71.89% precision, 90.0% recall, and a 79.94% F-measure. In addition, to verify the usefulness of the proposed classification system, two case study applications are investigated - information retrieval for protein function and automatic summarization for protein function text. It is shown that the proposed classification system can be successfully applied to these applications.

Text Classification on Social Network Platforms Based on Deep Learning Models

  • YA, Chen;Tan, Juan;Hoekyung, Jung
    • Journal of information and communication convergence engineering
    • /
    • 제21권1호
    • /
    • pp.9-16
    • /
    • 2023
  • The natural language on social network platforms has a certain front-to-back dependency in structure, and the direct conversion of Chinese text into a vector makes the dimensionality very high, thereby resulting in the low accuracy of existing text classification methods. To this end, this study establishes a deep learning model that combines a big data ultra-deep convolutional neural network (UDCNN) and long short-term memory network (LSTM). The deep structure of UDCNN is used to extract the features of text vector classification. The LSTM stores historical information to extract the context dependency of long texts, and word embedding is introduced to convert the text into low-dimensional vectors. Experiments are conducted on the social network platforms Sogou corpus and the University HowNet Chinese corpus. The research results show that compared with CNN + rand, LSTM, and other models, the neural network deep learning hybrid model can effectively improve the accuracy of text classification.

인터넷 문서의 자동분류 서비스 시스템에 관한 구현 (A Structure on Classification Service System of Internet Documents)

  • 황성하;최광남;이대규;이상호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.66-71
    • /
    • 2005
  • 인터넷 정보를 검색하고 활용하는 것은 쉽고도 어려운 일이다. 많은 정보 중에서 원하는 정보를 얻기 위한 노력은 단순히 검색뿐만 아니라 정보의 수집에서 분류 및 가공, 활용에까지 각 분야별로 그 범위와 용도에서 다양한 기술의 발전이 급속히 진행되고 있다. 특히, 이러한 발전은 다양한 용도의 에이전트와 분류, 변환 등의 가공 기술에서 더욱 두드러지게 나타나고 있다. 또한, 시스템의 자동화를 통한 편리성을 제공한 다면 더욱 효과적인 정보관리가 이루어 질 것이다. 본 논문에서는 이러한 배경에서 인터넷 정보의 수집에서 자동 분류, 검색 서비스까지를 하나의 시스템에서 처리 할 수 있는 인터넷 문서 자동분류 서비스 시스템을 소개한다.

  • PDF

The Application of RS and GIS Technologies on Landslide Information Extraction of ALOS Images in Yanbian Area, China

  • Quan, He Chun;Lee, Byung Gul
    • 대한공간정보학회지
    • /
    • 제23권3호
    • /
    • pp.85-93
    • /
    • 2015
  • This paper mainly introduces the methods of extracting landslide information using ALOS(Advanced Land Observing Satellite) images and GIS(Geographical Information System) technology. In this study, we classified images using three different methods which are the unsupervised the supervised and the PCA(Principal Components Analysis) for extracting landslide information based on characteristics of ALOS image. From the image classification results, we found out that the quality of classified image extracted with PCA supervised method was superior than the other images extracted with the other methods. But the accuracy of landslide information extracted from this image classification was still very low as the pixels were very similar between the landslide and safety regions. It means that it is really difficult to distinguish those areas with an image classification method alone because the values of pixels between the landslide and other areas were similar, particularly in a region where the landslide and other areas coexist. To solve this problem, we used the LSM(Landslide Susceptibility Map) created with ArcView software through weighted overlay GIS method in the areas. Finally, the developed LSM was applied to the image classification process using the ALOS images. The accuracy of the extracted landslide information was improved after adopting the PCA and LSM methods. Finally, we found that the landslide region in the study area can be calculated and the accuracy can also be improved with the LSM and PCA image classification methods using GIS tools.

Novel Image Classification Method Based on Few-Shot Learning in Monkey Species

  • Wang, Guangxing;Lee, Kwang-Chan;Shin, Seong-Yoon
    • Journal of information and communication convergence engineering
    • /
    • 제19권2호
    • /
    • pp.79-83
    • /
    • 2021
  • This paper proposes a novel image classification method based on few-shot learning, which is mainly used to solve model overfitting and non-convergence in image classification tasks of small datasets and improve the accuracy of classification. This method uses model structure optimization to extend the basic convolutional neural network (CNN) model and extracts more image features by adding convolutional layers, thereby improving the classification accuracy. We incorporated certain measures to improve the performance of the model. First, we used general methods such as setting a lower learning rate and shuffling to promote the rapid convergence of the model. Second, we used the data expansion technology to preprocess small datasets to increase the number of training data sets and suppress over-fitting. We applied the model to 10 monkey species and achieved outstanding performances. Experiments indicated that our proposed method achieved an accuracy of 87.92%, which is 26.1% higher than that of the traditional CNN method and 1.1% higher than that of the deep convolutional neural network ResNet50.