• Title/Summary/Keyword: 데이터 특징 추출

Search Result 1,522, Processing Time 0.041 seconds

Applying Speciated GA to Huge-scale Feature Selection in Bioinformatics (생명정보학에서의 거대규모 특징추출을 위한 종분화 GA의 활용)

  • 황금성;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.229-231
    • /
    • 2002
  • 최근 생물 유전자 정보에 대한 관심이 커지면서 이를 위한 효과적인 분석 방법이 요구되고 있다. 특히, 분류기의 데이터로 사용하기 위해서 필요한 특징만을 뽑는 과정인 특징 추출은 대량의 유전자 정보에서 의미 있는 정보를 선별하는 중요한 과정이다. 그러나 유전자 정보는 사용되는 데이터의 특징규모가 매우 크기 때문에 일반적인 데이터 마이닝 기법으로는 분석이 힘들다. 본 논문에서는 효율적인 거대규모 특징 추출을 위해 유전자 알고리즘(GA)파 신경망을 사용한 특징추출 방법을 소개하고, 종분화 기법을 사용한 효과적인 특징추출 방법을 제시한다. 그리고, CAMDA 2000에 공개된 암 DNA Microarray로 안종류를 분류하는 문제에 대하여 성능을 평가하였다.

  • PDF

A Study on PCA using Adaptive Correlation (적응적 상관도를 이용한 주성분 분석에 관한 연구)

  • Ko, Myung-Sook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.13-14
    • /
    • 2020
  • 고차원의 데이터를 처리하기 위해서는 데이터의 성질을 유지하면서 특징을 잘 반영할 수 있는 특징 추출 방법이 필요하며 주성분분석 방법은 대표적인 특징 추출 방법이다. 본 연구에서는 데이터가 고차원인 경우 데이터 특징 추출을 위한 주성분 분석의 주성분 변수 선정시 적응적 상관도(Correlation)를 기반으로 한 주성분 분석 방법을 제안한다. 제안하는 방법은 입력 데이터간의 상관관계를 기반으로 상관도를 적응적으로 반영하여 데이터의 주성분을 분석함으로써 실제 데이터의 특징을 나타내는 세분화 변수 선정 시 데이터 편향성의 영향을 줄이기 위한 방법이다.

A scalable and automated feature data extraction system for AI analysis of computational science data (계산과학 데이터의 인공지능 분석을 위한 확장성 있는 특징 데이터 추출 자동화 시스템)

  • Ahn, Sunil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.102-105
    • /
    • 2020
  • AI 분석 과정에서 특징 데이터 추출은 분석 성능에 큰 영향을 미칠 뿐만 아니라 가장 많은 시간을 소요하는 과정 중의 하나이다. 계산과학 데이터는 HPC를 활용하여 생산되므로 데이터가 크고 복잡할 뿐 아니라 데이터의 수도 방대한 경우가 많다. 이 때문에 계산과학 데이터로부터 특징 데이터 추출하는 과정은 복잡성이 크고, 소요 시간도 매우 크다. 본 논문은 먼저 계산과학 데이터로부터 특징 데이터 추출하는 과정에 대한 요구사항과 이슈들을 분석한다. 그리고 확장성을 고려한 계산과학 데이터의 인공지능 분석을 위한 특징 데이터 추출 자동화 시스템을 제안한다.

A Study on the Feature Extraction using the Wavelet Transform in Satellite Remote Sensing Image (웨이브렛 변환을 이용한 원격탐사 이미지 데이터의 특징 추출에 관한 연구)

  • 전영준;김진일
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.08a
    • /
    • pp.237-240
    • /
    • 2000
  • 본 논문에서는 원격탐사 이미지 데이터의 분석과정중의 하나인 이미지의 분류를 위해서 적용되는 다중분광 영상에서 특징 추출을 위한 효율적인 방법을 제안한다. 즉, 웨이브렛 변환을 이용하여 위성탐사 이미지 데이터의 특성을 분석하여 실제 이미지 분류에 기여도가 높은 특징을 추출하는 방법을 제안하였다. 효과적인 특징을 추출하기 위하여 이미지 데이터의 텍스쳐 특징을 이용하였다.

  • PDF

특징형상 테이터를 이용한 선행관계 추출과 작업순서 결정

  • 이충수;노형민;김성식
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1996.04a
    • /
    • pp.352-357
    • /
    • 1996
  • 특징형상 데이터는 공정설계의 입력 정보로 사용되며, 부품 서술 데이터, 기하학적 데이터, 가공 기술적 데이터로 분류할 수 있다. 또한 공정순서및 작업순서 결정에서 선행관계는 반드시 고려하여 위배되지 않도록 해야하는 중요한 요소이다. 본 연구에서는 작업순서 결정시 만족해야하는 선행관계를 기하형상에 의한 선행관계, 단위 특징형상의 작업내용들간의 선행관계, 가공 경험에 의한 선행관계 등으로 분류/정의하였고, 특징형상 데이터와 가공지식을 이용하여 분류된 선행관계를 자동으로 추출하는 방법을 제안하였다. 그리고 추출한 선행관계를, 공구 교환횟수를 최소로 하는 작업순서 결정 알고리즘에 적용한 사례를 정리하였다.

  • PDF

PCA-based Feature Extraction using Class Information (클래스 정보를 이용한 PCA 기반의 특징 추출)

  • Park Myoung Soo;Na Jin Hee;Choi Jin Young
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.428-432
    • /
    • 2005
  • 영상 데이터와 같은 대용량의 데이터를 분류하고자 할 경우, 입력 데이터의 차원을 줄여서 특징 벡터를 뽑아내는 전처리 과정은 필수적이다. 이 경우 특징 벡터가 입력 데이터의 정보를 최대한 포함하도록 하는 것이 중요하다. 특징 벡터를 뽑는 대표적인 방법으로는 PCA, ICA, LDA, MLP와 같은 특징 추출(feature extraction) 방법을 들 수 있다. PCA와 LDA는 무감독 학습 방식이고, LDA, MLP는 감독 학습 방식에 해당한다. 감독학습 방식의 경우 입력 정보와 함께 클래스 정보를 사용하기 때문에 데이터를 분류하기에 더 좋은 특징들을 뽑아낼 수 있는 장점이 있다. 본 논문에서는 무감독 학습 방식인 PCA에 클래스에 대한 정보를 함께 사용하여 특징을 추출함으로써 데이터 분류에 더욱 적합한 특징들을 뽑는 방법을 제안하였다. 그리고, Yale face database를 사용하여 제안한 알고리즘의 성능을 기존의 알고리즘과 비교, 테스트하였다.

  • PDF

A Contents-Based Image Classification Using Neural Network (신경망을 이용한 내용 기반 이미지 분류)

  • 이재원;김상균
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.177-180
    • /
    • 2001
  • 본 논문에서는 신경망을 이용한 내용 기반 이미지 분류 방법을 제안한다. 분류 대상이미지는 인터넷상의 다양한 이미지들 중 오브젝트 이미지이대 웹 에이전트를 통하여 획득하고 정규화 과정을 거친다. 획득한 이미지를 분류하기 위한 특징은 웨이블릿 변란 후 추출된 질감 특징이다. 추출된 질감 특징을 이용하여 학습패턴을 생성하고 신경망을 학습한다. 그리고 구성된 신경망 분류기로 이미지를 분류한다. 본 연구에서는 다양한 질감 특징들 중에서 대비(contrast), 에너지(energy), 엔트로피(entropy)를 이용하여 특징을 추출한다. 실험에 사용한 데이터는 30종류에 대하여 각각 10개씩, 300개의 이미지들을 학습 데이터, 테스트 데이터로 사용하여 구성된 분류기의 인식률을 실험하였다.

  • PDF

3D Data Dimension Reduction for Efficient Feature Extraction in Posture Recognition (포즈 인식에서 효율적 특징 추출을 위한 3차원 데이터의 차원 축소)

  • Kyoung, Dong-Wuk;Lee, Yun-Li;Jung, Kee-Chul
    • The KIPS Transactions:PartB
    • /
    • v.15B no.5
    • /
    • pp.435-448
    • /
    • 2008
  • 3D posture recognition is a solution to overcome the limitation of 2D posture recognition. There are many researches carried out for 3D posture recognition using 3D data. The 3D data consist of massive surface points which are rich of information. However, it is difficult to extract the important features for posture recognition purpose. Meanwhile, it also consumes lots of processing time. In this paper, we introduced a dimension reduction method that transform 3D surface points of an object to 2D data representation in order to overcome the issues of feature extraction and time complexity of 3D posture recognition. For a better feature extraction and matching process, a cylindrical boundary is introduced in meshless parameterization, its offer a fast processing speed of dimension reduction process and the output result is applicable for recognition purpose. The proposed approach is applied to hand and human posture recognition in order to verify the efficiency of the feature extraction.

Feature vector extraction for NCEP weather data clustering (NCEP 일기도 데이터 클러스터링을 위한 특징 벡터 추출)

  • 이기범;이성환;정창성;황치정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.583-585
    • /
    • 2001
  • 방대한 양의 격자점 데이터 및 일기도 관련 데이터를 효율적으로 저장 및 검색 하기위해서는 데이터들의 유형을 찾아 서로 유형이 비슷한 데이터를 하나의 클러스터로 연관지어 놓으면 효율적인 저장과 검색을 할 수 있다. 클러스터링에서 데이터들의 어떤 특징 벡터를 추출하는가가 클러스터링의 결과에 가장 중요한 영향을 끼친다. 본 논문에서는 격자점, 기압값 데이터로부터 일기도의 특징을 표현할 수 있는 벡터로 변환 한반도도 중심의 8방향에 대한 고/저기압의 분포와 동아시아 지역을 24영역으로 나누어 각 영역별로 고/저기압의 분포 정보를 특징벡터로 추출하여 클러스터링하였다. 클러스터팅 알고리즘으로는 unsupervised mode인 SOM(Self Organizing Map) 기법을 사용하였다.

  • PDF

Data Classification of Visual Quality for Image Recognition (영상인식을 위한 화질의 데이터 분류성)

  • Cho, Jae-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.279-280
    • /
    • 2021
  • 패턴 또는 영상을 인식하기 위하여 먼저 기계 학습 모델을 선택하고, 선택된 모델은 여러 단계의 처리 단계 과정으로써, 학습 데이터 구성과 특징 추출 그리고 분류기 등으로 크게 나눌 수 있다. 기존의 학습 모델의 처리 단계 중 학습 데이터 구성은 첫 번째 중요한 단계이다. 본 논문에서는 학습 데이터들의 특징을 분석하여 데이터 분류성의 척도로 사용될 수 있는지를 검토하여 차후 기계 학습 및 딥 러닝의 인식을 높이고자 한다.

  • PDF