• 제목/요약/키워드: information classification

검색결과 8,303건 처리시간 0.03초

A Preliminary Study on Clinical Decision Support System based on Classification Learning of Electronic Medical Records

  • Shin, Yang-Kyu
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권4호
    • /
    • pp.817-824
    • /
    • 2003
  • We employed a hierarchical document classification method to classify a massive collection of electronic medical records(EMR) written in both Korean and English. Our experimental system has been learned from 5,000 records of EMR text data and predicted a newly given set of EMR text data over 68% correctly. We expect the accuracy rate can be improved greatly provided a dictionary of medical terms or a suitable medical thesaurus. The classification system might play a key role in some clinical decision support systems and various interpretation systems for clinical data.

  • PDF

Fuzzy C-means 클러스터링 기법을 이용한 콘 관입 데이터의 해석 (Analysis of Cone Penetration Data Using Fuzzy C-means Clustering)

  • 우철웅;장병욱;원정윤
    • 한국농공학회지
    • /
    • 제45권3호
    • /
    • pp.73-83
    • /
    • 2003
  • Methods of fuzzy C-means have been used to characterize geotechnical information from static cone penetration data. As contrary with traditional classification methods such as Robertson classification chart, the FCM expresses classes not conclusiveness but fuzzy. The results show that the FCM is useful to characterize ground information that can not be easily found by using normal classification chart. But optimal number of classes may not be easily defined. So, the optimal number of classes should be determined considering not only technical measures but engineering aspects.

다채널 뇌파 분류를 위한 주성분 분석 기반 선형동적시스템 (PCA-based Linear Dynamical Systems for Multichannel EEG Classification)

  • Lee, Hyekyoung;Park, Seungjin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2002
  • EEG-based brain computer interface (BCI) provides a new communication channel between human brain and computer. The classification of EEG data is an important task in EEG-based BCI. In this paper we present methods which jointly employ principal component analysis (PCA) and linear dynamical system (LDS) modeling for the task of EEG classification. Experimental study for the classification of EEG data during imagination of a left or right hand movement confirms the validity of our proposed methods.

  • PDF

소리 분류를 위한 NMF특징 추출 (NMF-Feature Extraction for Sound Classification)

  • Yong-Choon Cho;Seungin Choi;Sung-Yang Bang
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.4-6
    • /
    • 2003
  • A holistic representation, such as sparse ceding or independent component analysis (ICA), was successfully applied to explain early auditory processing and sound classification. In contrast, Part-based representation is an alternative way of understanding object recognition in brain. In this paper. we employ the non-negative matrix factorization (NMF)[1]which learns parts-based representation for sound classification. Feature extraction methods from spectrogram using NMF are explained. Experimental results show that NMF-based features improve the performance of sound classification over ICA-based features.

  • PDF

향상된 텍스트 분류 (An Improved Text Classification)

  • 왕광싱;신성윤;신광성;이현창
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.125-126
    • /
    • 2019
  • In this paper, we propose an improved kNN classification method. Through improved the mothed and normalizing the data, the purpose of improving the accuracy is achieved. Then we compared the three classification algorithms and the improved algorithm by experimental data.

  • PDF

교육용 자원 저장소를 위한 의미적 분류 모델 (A Semantic Classification Model for Educational Resource Repositories)

  • 최명회;정동원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.35-45
    • /
    • 2007
  • 이 논문에서는 교육용 저장소 자원의 체계적인 관리를 위한 분류 모델을 제안한다. 생성되는 자원들에 대한 체계적인 저장 및 관리, 정확한 검색, 그리고 활용성을 극대화하기 위해서는 정확한 분류 체계가 요구된다. 그러나 교육용 저장소 자원을 위한 분류 체계나 분류 모델에 대한 연구는 미비한 수준이다. 이는 교육 자원의 비효율적 관리, 부정확한 검색 및 낮은 활용성 등의 문제점을 초래한다. 상품 정보와 관련된 분야에서는 다양한 분류 체계에 대한 연구가 이루어져 왔다. 그러나 교육 자원 정보와 기존연구 분야의 정보는 서로 다른 특성을 지닌다. 따라서 교육용 저장소 내 자원 관리를 위한 분류 체계 및 분류 모델에 대한 연구가 요구된다. 교육 자원들에 대한 효율적이고 편리한 활용을 위해서는 여러 관점을 반영하는 분류 체계에 따라 자원들을 일관성 있게 유지 관리하여야 한다. 이 논문에서는 교육 자원의 체계적인 관리 및 활용성 향상을 위한 분류 모델을 제안한다. 즉, 교육용 저장소의 자원들에 대한 분류 체계를 다양한 관점에 따라 동적으로 유지할 수 있는 분류 모델을 제안한다. 이러한 목적을 위해 먼저 관련된 과학기술분야 분류 체계들을 바탕으로 구현 자원들에 적합한 분류 체계를 정의한다. 특히 정의된 분류 체계를 동적으로 유지 관리할 수 있는 분류 모델을 정의한다. 제안된 분류 체계 및 분류 모델은 보다 정확하고 체계적인 구현 자원에 대한 관리를 가능하게 하며 또한 활용의 용이성을 향상시킨다.

Enhancing Gene Expression Classification of Support Vector Machines with Generative Adversarial Networks

  • Huynh, Phuoc-Hai;Nguyen, Van Hoa;Do, Thanh-Nghi
    • Journal of information and communication convergence engineering
    • /
    • 제17권1호
    • /
    • pp.14-20
    • /
    • 2019
  • Currently, microarray gene expression data take advantage of the sufficient classification of cancers, which addresses the problems relating to cancer causes and treatment regimens. However, the sample size of gene expression data is often restricted, because the price of microarray technology on studies in humans is high. We propose enhancing the gene expression classification of support vector machines with generative adversarial networks (GAN-SVMs). A GAN that generates new data from original training datasets was implemented. The GAN was used in conjunction with nonlinear SVMs that efficiently classify gene expression data. Numerical test results on 20 low-sample-size and very high-dimensional microarray gene expression datasets from the Kent Ridge Biomedical and Array Expression repositories indicate that the model is more accurate than state-of-the-art classifying models.

Korean Traditional Music Genre Classification Using Sample and MIDI Phrases

  • Lee, JongSeol;Lee, MyeongChun;Jang, Dalwon;Yoon, Kyoungro
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권4호
    • /
    • pp.1869-1886
    • /
    • 2018
  • This paper proposes a MIDI- and audio-based music genre classification method for Korean traditional music. There are many traditional instruments in Korea, and most of the traditional songs played using the instruments have similar patterns and rhythms. Although music information processing such as music genre classification and audio melody extraction have been studied, most studies have focused on pop, jazz, rock, and other universal genres. There are few studies on Korean traditional music because of the lack of datasets. This paper analyzes raw audio and MIDI phrases in Korean traditional music, performed using Korean traditional musical instruments. The classified samples and MIDI, based on our classification system, will be used to construct a database or to implement our Kontakt-based instrument library. Thus, we can construct a management system for a Korean traditional music library using this classification system. Appropriate feature sets for raw audio and MIDI phrases are proposed and the classification results-based on machine learning algorithms such as support vector machine, multi-layer perception, decision tree, and random forest-are outlined in this paper.

ANFIS 기반 분류모형의 설계 및 성능평가 (Design and Evaluation of ANFIS-based Classification Model)

  • 송희석;김재경
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.151-165
    • /
    • 2009
  • 퍼지신경망 모형은 인공신경망의 네트워크 구조 표현방법 및 학습알고리듬과 퍼지시스템의 추론방법을 통합한 모형으로 제어 및 예측분야에 성공적으로 적용되고 있다. 본 연구에서는 퍼지신경망 모형 중 우수한 예측정확도로 인해 최근 각광받고 있는ANFIS (Adaptive Network-based Fuzzy Inference System)모형을 기반으로 하는 분류모형을 설계하고 기존의 분류기법(C5.0 의사결정나무)과 비교하여 분류 정확성 관점에서 평가한다. ANFIS 추론의 경우, 최종 결과값이 계급값이 아닌 연속형 변수값을 취하게 되므로 산출된 결과값을 이용하여 적절한 계급값을 할당하는 과정이 필요하다. 본 연구에서는 의사결정나무기법을 이용하여 계급값을 할당하는 방식과 군집분석을 이용하여 계급값을 할당하는 두 가지 방식을 제안하고 두 가지 데이터 세트에 적용하여 ANFIS를 기반으로 한 분류모형의 정확도를 평가하였다.

  • PDF

효과적인 산업재해 분석을 위한 텍스트마이닝 기반의 사고 분류 모형과 온톨로지 개발 (Development of Accident Classification Model and Ontology for Effective Industrial Accident Analysis based on Textmining)

  • 안길승;서민지;허선
    • 한국안전학회지
    • /
    • 제32권5호
    • /
    • pp.179-185
    • /
    • 2017
  • Accident analysis is an essential process to make basic data for accident prevention. Most researches depend on survey data and accident statistics to analyze accidents, but these kinds of data are not sufficient for systematic and detailed analysis. We, in this paper, propose an accident classification model that extracts task type, original cause materials, accident type, and the number of deaths from accident reports. The classification model is a support vector machine (SVM) with word occurrence features, and these features are selected based on mutual information. Experiment shows that the proposed model can extract task type, original cause materials, accident type, and the number of deaths with almost 100% accuracy. We also develop an accident ontology to express the information extracted by the classification model. Finally, we illustrate how the proposed classification model and ontology effectively works for the accident analysis. The classification model and ontology are expected to effectively analyze various accidents.