• 제목/요약/키워드: Data classification

검색결과 7,933건 처리시간 0.032초

운동학적 특징을 이용한 다기능 레이다 표적 분류 (Target Classification for Multi-Function Radar Using Kinematics Features)

  • 송준호;양은정
    • 한국전자파학회논문지
    • /
    • 제26권4호
    • /
    • pp.404-413
    • /
    • 2015
  • 대공 레이다에서 표적의 분류는 대 탄도탄 모드 수행의 가장 중요한 부분 중 하나이다. 대 탄도탄 모드에서는 항공기와 탄도탄을 분류하여 각 표적에 따른 대응 방법을 결정한다. 표적 분류의 속도와 정확도는 적의 공격에 대한 대응 능력과 직접적인 관련이 있으므로, 효율적이고 정확한 표적 분류 알고리즘이 필수적이다. 일반적으로, 레이다는 표적 분류를 위해 JEM(Jet Engine Modulation) 및 HRR(High Range Resolution), ISAR(Inverse Synthetic Array Radar) 영상 등을 사용하는데, 이러한 기법들은 표적 분류를 위한 별도의(광대역 등) 레이다 파형과 DB(Data Base) 및 분류 알고리즘을 요구한다. 본 논문은 별도의 파형 없이 실제 다기능 레이다에서 적용 가능한 표적 분류 기법을 제안한다. 특징 벡터로 추적 시 얻은 표적의 운동학적인 특징(kinematics features)을 이용하여 레이다 하드웨어 및 시간 관점에서 레이다 자원을 아끼고, 구현이 간단하여 빠르고 상대적으로 정확한 퍼지 논리(fuzzy logic)를 분류 알고리즘으로 사용하여 실제 환경에서의 적용성을 높였다. 항공기의 실측 데이터와 탄도탄의 모의 신호를 사용하여 제안한 분류 알고리즘의 성능과 적합성을 증명하였다.

A Clustering Approach for Feature Selection in Microarray Data Classification Using Random Forest

  • Aydadenta, Husna;Adiwijaya, Adiwijaya
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1167-1175
    • /
    • 2018
  • Microarray data plays an essential role in diagnosing and detecting cancer. Microarray analysis allows the examination of levels of gene expression in specific cell samples, where thousands of genes can be analyzed simultaneously. However, microarray data have very little sample data and high data dimensionality. Therefore, to classify microarray data, a dimensional reduction process is required. Dimensional reduction can eliminate redundancy of data; thus, features used in classification are features that only have a high correlation with their class. There are two types of dimensional reduction, namely feature selection and feature extraction. In this paper, we used k-means algorithm as the clustering approach for feature selection. The proposed approach can be used to categorize features that have the same characteristics in one cluster, so that redundancy in microarray data is removed. The result of clustering is ranked using the Relief algorithm such that the best scoring element for each cluster is obtained. All best elements of each cluster are selected and used as features in the classification process. Next, the Random Forest algorithm is used. Based on the simulation, the accuracy of the proposed approach for each dataset, namely Colon, Lung Cancer, and Prostate Tumor, achieved 85.87%, 98.9%, and 89% accuracy, respectively. The accuracy of the proposed approach is therefore higher than the approach using Random Forest without clustering.

A Study on the Classification of Variables Affecting Smartphone Addiction in Decision Tree Environment Using Python Program

  • Kim, Seung-Jae
    • International journal of advanced smart convergence
    • /
    • 제11권4호
    • /
    • pp.68-80
    • /
    • 2022
  • Since the launch of AI, technology development to implement complete and sophisticated AI functions has continued. In efforts to develop technologies for complete automation, Machine Learning techniques and deep learning techniques are mainly used. These techniques deal with supervised learning, unsupervised learning, and reinforcement learning as internal technical elements, and use the Big-data Analysis method again to set the cornerstone for decision-making. In addition, established decision-making is being improved through subsequent repetition and renewal of decision-making standards. In other words, big data analysis, which enables data classification and recognition/recognition, is important enough to be called a key technical element of AI function. Therefore, big data analysis itself is important and requires sophisticated analysis. In this study, among various tools that can analyze big data, we will use a Python program to find out what variables can affect addiction according to smartphone use in a decision tree environment. We the Python program checks whether data classification by decision tree shows the same performance as other tools, and sees if it can give reliability to decision-making about the addictiveness of smartphone use. Through the results of this study, it can be seen that there is no problem in performing big data analysis using any of the various statistical tools such as Python and R when analyzing big data.

Construction of an Internet of Things Industry Chain Classification Model Based on IRFA and Text Analysis

  • Zhimin Wang
    • Journal of Information Processing Systems
    • /
    • 제20권2호
    • /
    • pp.215-225
    • /
    • 2024
  • With the rapid development of Internet of Things (IoT) and big data technology, a large amount of data will be generated during the operation of related industries. How to classify the generated data accurately has become the core of research on data mining and processing in IoT industry chain. This study constructs a classification model of IoT industry chain based on improved random forest algorithm and text analysis, aiming to achieve efficient and accurate classification of IoT industry chain big data by improving traditional algorithms. The accuracy, precision, recall, and AUC value size of the traditional Random Forest algorithm and the algorithm used in the paper are compared on different datasets. The experimental results show that the algorithm model used in this paper has better performance on different datasets, and the accuracy and recall performance on four datasets are better than the traditional algorithm, and the accuracy performance on two datasets, P-I Diabetes and Loan Default, is better than the random forest model, and its final data classification results are better. Through the construction of this model, we can accurately classify the massive data generated in the IoT industry chain, thus providing more research value for the data mining and processing technology of the IoT industry chain.

POTENTIAL OF HYPERSPECTRAL DATA FOR THE CLASSIFICA TION OF VITD SOIL CLASSES

  • Kim Sun-Hwa;Ma Jung-Rim;Lee Kyu-Sung;Eo Yang-Dam;Lee Yong-Woong
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.221-224
    • /
    • 2005
  • Hyperspectral image data have great potential to depict more detailed information on biophysical characteristics of surface materials, which are not usually available with multispectral data. This study aims to test the potential of hyperspectral data for classifying five soil classes defined by the vector product interim terrain data (VITD). In this study, we try to classify surface materials of bare soil over the study area in Korea using both hyperspectral and multispectral image data. Training and test samples for classification are selected with using VITD vector map. The spectral angle mapper (SAM) method is applied to the EO-I Hyperion data and Landsat ETM+ data, that has been radiometrically corrected and geo-rectified. Higher classification accuracy is obtained with the hyperspectral data for classifying five soil classes of gravel, evaporites, inorganic silt and sand.

  • PDF

애완동물 분류를 위한 딥러닝 (Deep Learning for Pet Image Classification)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.151-152
    • /
    • 2019
  • 본 논문에서는 동물 이미지 분류를위한 작은 데이터 세트를 기반으로 개선 된 심층 학습 방법을 제안한다. 첫째, CNN은 소규모 데이터 세트에 대한 교육 모델을 작성하고 데이터 세트를 사용하여 교육 세트의 데이터 세트를 확장하는 데 사용된다. 둘째, VGG16과 같은 대규모 데이터 세트에 사전 훈련 된 네트워크를 사용하여 작은 데이터 세트의 병목을 추출하여 새로운 교육 데이터 세트 및 테스트 데이터 세트로 두 개의 NumPy 파일에 저장하고, 마지막으로 완전히 연결된 네트워크를 새로운 데이터 세트로 학습한다.

  • PDF

진보된 다단계 특징벡터 기반의 분류기 모델 (Advanced Multistage Feature-based Classification Model)

  • 김재영;박동철
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.36-41
    • /
    • 2010
  • 본 논문에서는 다단계 특성벡터 기반의 분류기 모델(Multistage Feature-based Classification Model: MFCM)의 성능을 향상시킨 진보된 형태의 MFCM (Advanced MFCM: AMFCM)을 제안하는데, AMFCM은 MFCM과 같이 주어진 데이터에서 추출된 전체의 특징벡터를 연결하여 이용하지 않고, 같은 성질의 특징벡터들끼리 모아서, 각각의 국지적 학습기를 통하여 분류에 이용한다. 그러나, AMFCM은 MFCM에서 사용되는 각각의 국지적 분류기를 위한 각 특징벡터의 분류기여도를 더욱 섬세하게 조정하여 최종적인 분류의 정확도를 높이는 방안을 제안한다. 제안된 AMFCM의 성능을 검증하기 위하여, 음악장르 분류의 문제에 대한 실험을 진행하였다. 또한, 국지적 분류기로 Self-Organizing Map과 중심 신경망을 사용하여 실험을 수행하였는데, 제안된 AMFCM은 사용된 국지적 분류기의 종류와 사용된 군집의 개수에 따라 기존의 MFCM에 비해 평균 8% - 15% 이상의 성능향상을 보여 준다.

Gait-Based Gender Classification Using a Correlation-Based Feature Selection Technique

  • Beom Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.55-66
    • /
    • 2024
  • 성별 분류 기술은 법의학, 감시 시스템, 인구 통계 연구 등 다양한 분야에서 활용될 수 있기 때문에, 연구자들로부터 많은 관심을 받고 있다. 남성과 여성의 보행 사이에는 서로 구별되는 특징이 있다는 것이 기존 연구들에서 밝혀지면서, 3차원 보행 데이터에서 성별을 분류하는 다양한 기술들이 제안됐다. 하지만, 기존 기술들을 사용해 3차원 보행 데이터로부터 추출한 보행 특징 중에는 서로 유사 또는 중복되거나 성별 분류에 도움이 되지 않는 특징들도 있다. 이에 본 연구에서는 상관관계 기반 특징 선별 기술을 활용해, 성별 분류에 도움이 되는 특징들을 선별하는 방법을 제안한다. 그리고 제안하는 특징 선별 기술의 효용성을 입증하기 위해서, 인터넷상에 공개된 3차원 보행 데이터 세트(Dataset)를 활용하여 제안하는 특징 선별 기술을 적용하기 전과 후에 대해 성별 분류 모델들의 성능을 비교 분석하였다. 실험에는 이진 분류 문제에 적용할 수 있는 여덟 가지의 머신러닝 알고리즘(Machine Learning Algorithms)을 활용하였다. 실험 결과, 제안하는 특징 선별 기술을 사용하면 성별 분류 성능은 유지하면서, 특징의 개수를 82개에서 60개까지, 22개를 줄일 수 있다는 것을 입증하였다.

수도권 도시개발 분석을 위한 규칙기반 영상분류 (A Rule-Based Image Classification Method for Analysis of Urban Development in the Capital Area)

  • 이진아;이성순
    • Spatial Information Research
    • /
    • 제19권6호
    • /
    • pp.43-54
    • /
    • 2011
  • 본 연구는 위성영상 자료(2000-2009)를 이용하여 성남-용인 인근지역의 지표변화를 시계열 분석하기 위해 규칙기반 영상분류 방법을 제안하였다. 도시지역의 연도별 변화 패턴을 파악하기 위해 통계적/수학적 기반의 규칙에 따라 11개 클래스로 구분하였다. 훈련지역을 설정하지 않는 무감독분류 방법으로서 규칙을 적용할 수 있도록 알고리즘을 일반화 하였다. 분석 결과, 택지개발 등에 의하여 연구범위 내 도시지역면적이 약 1.45배 증가하였으며, 2009년 영상의 분류정확도는 98%로 나타났다. 방법 검증을 위하여 선분류 후비교법을 이용한 토지피복 변화분석 결과와 비교하였다. 다중영상 내 가용한 데이터를 최대한 이용할 수 있었고, 목적에 최적화된 분류가 가능해져, 분류정확도의 향상을 기대할 수 있었다. 본 규칙기반 영상분류 방법은 향후 도시개발 주제도 제작 및 도시개발, 환경변화 모니터링 등 영상 시계열 분석에 다양하게 적용될 수 있을 것이다.

프로토타입 선택을 이용한 최근접 분류 학습의 성능 개선 (Performance Improvement of Nearest-neighbor Classification Learning through Prototype Selections)

  • 황두성
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 최근접 이웃 분류에서 입력 데이터의 클래스는 선택된 근접 학습 데이터들 중에서 가장 빈번한 클래스로 예측된다. 최근접분류 학습은 학습 단계가 없으나, 준비된 데이터가 모두 예측 분류에 참여하여 일반화 성능이 학습 데이터의 질에 의존된다. 그러므로 학습 데이터가 많아지면 높은 기억 장치 용량과 예측 분류 시 높은 계산 시간이 요구된다. 본 논문에서는 분리 경계면에 위치한 학습 데이터들로 구성된 새로운 학습 데이터를 생성시켜 분류 예측을 수행하는 프로토타입 선택 알고리즘을 제안한다. 제안하는 알고리즘에서는 분리 경계 영역에 위치한 데이터를 Tomek links와 거리를 이용하여 선별하며, 이미 선택된 데이터와 클래스와 거리 관계 분석을 이용하여 프로토타입 집합에 추가 여부를 결정한다. 실험에서 선택된 프로토타입의 수는 원래 학습 데이터에 비해 적은 수의 데이터 집합이 되어 최근접 분류의 적용 시 기억장소의 축소와 빠른 예측 시간을 제공할수 있다.