• Title/Summary/Keyword: 분류변수

검색결과 1,538건 처리시간 0.028초

수치지형모델에 있어서 지형분류와 보간에 관한 연구 (A Study on Terrain Classification and Interpolation in Digital Terrain Model)

  • 유복모;권현;김인섭
    • 한국측량학회지
    • /
    • 제7권2호
    • /
    • pp.53-61
    • /
    • 1989
  • 본 연구에서는 규칙격자형태의 자료에서 수치지형모델의 보간법이 적절히 적용될 수 있는 지형의 정량적분류 변수를 제시하고, 이 변수를 사용하여 군집분석함으로써 객관적인 지형분류를 확립하며, 또한 지형의 분류변수에 의한 판별 분석으로 임의의 지형이 분류된 지형군 중 어느 지형에 속하는지 판별하여 지형특성에 적절한 보간법을 적용하는 데에 그 목적이 있다. 본 연구에서 지형분류는 수평면적에 대한 경사면적의 비와 조화벡터량의 두 변수를 사용하여 대상지형을 3개의 지형군으로 나눌 수 있었다. 3개의 지형군은 판별함수식으로 구별할 수 있었으며, 임의 지형에 대해 수평면적에 대한 경사면적의 비와 조화벡터량을 구하고, 판별함수를 이용하여 지형특성에 맞는 보간법을 적용할 수 있었다.

  • PDF

단어선택과 SMOTE 알고리즘을 이용한 불균형 텍스트 데이터의 소수 범주 예측성능 향상 기법 (Improving minority prediction performance of support vector machine for imbalanced text data via feature selection and SMOTE)

  • 김종찬;장성준;손원
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.395-410
    • /
    • 2024
  • 텍스트 데이터는 일반적으로 많은 다양한 단어들로 구성되어 있다. 평범한 텍스트 데이터의 경우에도 수만 개의 서로 다른 단어들을 포함하고 있는 경우를 흔히 관찰할 수 있으며 방대한 양의 텍스트 데이터에서는 수십만 개에 이르는 고유한 단어들이 포함되어 있는 경우도 있다. 텍스트 데이터를 전처리하여 문서-단어 행렬을 만드는 경우 고유한 단어를 하나의 변수로 간주하게 되는데 이렇게 많은 단어들을 각각 하나의 변수로 간주한다면 텍스트 데이터는 매우 많은 변수를 가진 데이터로 볼 수 있다. 한편, 텍스트 데이터의 분류 문제에서는 분류의 목표변수가 되는 범주의 비중에 큰 차이가 나는 불균형 데이터 문제를 자주 접하게 된다. 이렇게 범주의 비중에 큰 차이가 있는 불균형 데이터의 경우에는 일반적인 분류모형의 성능이 크게 저하될 수 있다는 사실이 잘 알려져 있다. 따라서 불균형 데이터에서의 분류 성능을 개선하기 위해 소수집단의 관측값들을 합성하여 소수집단에 포함되는 새로운 관측값을 생성하는 합성과표집기법(synthetic over-sampling technique; SMOTE) 등의 알고리즘을 적용할 수 있다. SMOTE는 k-최근접이웃(k-nearset neighbor; kNN) 알고리즘을 이용하여 새로운 합성 데이터를 생성하는데 텍스트 데이터와 같이 많은 변수를 가진 데이터의 경우에는 오차가 누적되어 kNN의 성능에 문제가 생길 수 있다. 이 논문에서는 변수선택을 통해 변수가 많은 불균형 텍스트 데이터를 오차가 축소된 공간에 표현하고 이 공간에서 새로운 합성 관측값을 생성하여 불균형 텍스트 데이터에서 소수 범주에 대한 SVM 분류모형의 예측 성능을 향상시키는 방법을 제안한다.

이상치를 감안한 확률강우분포의 매개변수 추정방법의 적용성 검토

  • 권유정;서용원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.319-319
    • /
    • 2018
  • 최근 전 세계적으로 극한수문사상의 증가로 인한 피해의 규모와 빈도가 잦아지고 있다. 기후변화에 관한 정부 간 협의체(IPCC)5차 보고서에 따르면 우리나라는 모든 시나리오 하에서 평균 강수량이 증가하는 지역으로 분류되었다. 특히 강우와 태풍피해가 잦은 7월에서 9월의 강우량이 급격히 증가하는 것으로 나타나며 이는 현재보다 극한수문사상이 더욱 빈번하게 일어날 것이라 예상할 수 있다. 하지만 기존의 매개변수 추정방법은 이상치 산정기준을 넘어서는 극치를 제외하고 확률강우량을 산정하고 있는 실정이다. 따라서 본 연구에서는 이러한 기존의 매개변수 추정방법 보다 극한값에 강건한 MDPDE(minimum density power divergence estimator)를 이용한 매개변수 추정을 사용하여 우리나라 60개 강우관측소의 과거 강우관측자료에 대한 최적조율모수에 대한 빈도별 확률강우량을 추정하여 기존의 방법으로 산정한 확률강우량과 비교하였다. 이상치로 분류할 수 있는 극한수문사상이 발생한 우리나라 31개소에 대하여 MDPDE의 적용성을 검토한 결과 기존의 매개변수 추정방법에 비해 이상치를 포함한 100년 빈도 확률강우량이 약13.3% 감소하는 것으로 나타났다.

  • PDF

청각 자극에 의해 유발되는 뇌파신호의 분석 (Analysis of EEG Signal Evoked by Auditory Stimulation)

  • 이동한;김재욱;이종호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.3227-3229
    • /
    • 2000
  • 본 논문은 청각 자극이 제시되었을 때 변화되는 뇌파로부터 의미 있는 특징을 찾아내서 정량화 할 수 있는 변수 추출 및 분류 기법을 제시한다. 건강한 피실험자로부터 방향성 있는 청각 자극을 인가했을 때의 뇌파를 검출, 분류하였다. 뇌파의 변수 추출 방법으로는 짧은 시간영역에서의 신호의 갑작스런 변화량도 정량적으로 분석할 수 있는 Mallat's A1gorithm을 이용한 웨이블릿 변환(wavelet transform)을 적용하였고, 분류 방법으로는 그 결과로 나온 웨이블릿 계수를 변수로 하여 Neural Network을 학습하여 사용하였다. 향후 피실험자의 훈련을 통해서 청각 자극이 없이 순수한 생각만으로 방향을 검출할 수 있는 뇌파분석기를 만든다면 생각만으로도 물체의 방향을 제어할 수 있을 것이다.

  • PDF

Reversible Jump MCMC와 베이지안망 학습에 의한 데이터마이닝 (Data Mining Using Reversible Jump MCMC and Bayesian Network Learning)

  • 하선영;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.90-92
    • /
    • 2000
  • 데이터마이닝 문제는 데이터를 그 속성들에 따라 분류하여 예측하는 것뿐만 아니라 분류된 속성들간의 연관성에 대해 잘 설명할 수 있어야 한다. 일반적으로 변수들간의 연관성을 잘 설명할 수 있으면서도 높은 예측력을 가지는 방법으로는 베이지안 네트웍 분류자(Bayesian network classifier)가 있다. 그러나 이것은 데이터 마이닝과 같은 대용량 데이터에서는 성능이 떨어지는 단점이 있다. 이에 이 논문에서는 최근 RBF 신경망이 입력변수 선정문제에 성공적으로 적용된 Reversible Jump Markov Chain Monte Carlo 방법을 이용하여 최적의 입력변수들만을 선택하여 베이지안 네트웍을 학습하는 Selective BN Augmented Naive-Bayes Classifier를 새로운 방안으로 제안하고 이를 실제 데이터마이닝 문제에 적용한 결과를 제시한다.

  • PDF

베이지안 이론을 이용한 감성 추론 모델에 관한 연구 (A research on Bayesian inference model of human emotion)

  • 김지혜;황민철;김종화;우진철;김치중;김용우
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2009년도 추계학술대회
    • /
    • pp.95-98
    • /
    • 2009
  • 본 연구는 주관 감성에 따른 생리 데이터의 패턴을 분류하고, 임의의 생리 데이터의 패턴을 확인하여 각성-이완, 쾌-불쾌의 감성을 추론하기 위해 베이지안 이론(Bayesian learning)을 기반으로 한 추론 모델을 제안하는 것이 목적이다. 본 연구에서 제안하는 모델은 학습데이터를 분류하여 사전확률을 도출하는 학습 단계와 사후확률로 임의의 생리 데이터의 패턴을 분류하여 감성을 추론하는 추론 단계로 이루어진다. 자율 신경계 생리변수(PPG, GSR, SKT) 각각의 패턴 분류를 위해 1~7로 정규화를 시킨 후 선형 관계를 구하여 분류된 패턴의 사전확률을 구하였다. 다음으로 임의의 사전 확률 분포에 대한 사후 확률 분포의 계산을 위해 베이지안 이론을 적용하였다. 본 연구를 통해 주관적 평가를 실시하지 않고 다중 생리변수 인식을 통해 감성을 추론 할 수 있는 모델을 제안하였다.

  • PDF

기업도산예측을 위한 이진분류기법의 개발 (Developing a Binary Classification Method for Bankruptcy Prediction)

  • 민재형;정철우
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.619-624
    • /
    • 2007
  • 본 연구는 유전 알고리듬에 기반한 새로운 도산예측기법을 개발하고 그 기법의 타당성 및 예측 우수성을 검증하는데 목적이 있다. 본 연구에서 제안하는 이진분류기법은 도산기업과 비도산기업을 대표할 수 있는 가상기업(virtual company)을 설정하고, 그 가상기업과 분류대상 기업 간의 유사도를 측정하여 도산여부를 분류하는 방법론으로, 가상기업의 변수 값과 각 변수의 가중치는 훈련용 자료의 분류정확도를 극대화할 수 있도록 유전 알고리듬을 이용하여 구하게 된다. 본 연구에서 제안하는 기법의 타당성을 검증하기 위해 기존의 도산예측기법과 예측성과를 실험을 통해 비교한 결과, 본 연구에서 개발한 기법의 예측력이 기존의 다변량판별분석, 로지스틱 회귀모형, 의사결정나무, 인공신경망 모형보다 높은 수준을 보이는 것을 확인하였다.

  • PDF

공통요인분석자혼합모형의 요인점수를 이용한 일반화가법모형 기반 신용평가 (A credit classification method based on generalized additive models using factor scores of mixtures of common factor analyzers)

  • 임수열;백장선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.235-245
    • /
    • 2012
  • 로지스틱판별분석은 금융 분야에서 유용하게 사용되고 있는 통계적 기법으로 신용평가 시 해석이 쉽고 우수한 분별력으로 많이 활용되고 있지만 종속변수에 대한 설명변수들의 비선형적인 관계를 설명하는 부분에는 한계점이 있다. 일반화가법모형은 로지스틱판별모형의 장점과 함께 종속변수와 설명변수 사이의 비선형적인 관계도 설명할 수 있다. 그러나 연속형 설명변수의 수가 대단히 많은 경우이 두 방법은 모형에 유의한 변수를 선택해야하는 문제점이 있다. 따라서 본 연구에서는 다수의 연속형 설명변수들을 공통요인분석자혼합모형에 의한 차원축소를 통해 변환된 소수의 요인점수들을 일반화가법모형의 새로운 연속형 설명변수로 사용하여 신용분류를 하는 방법을 제시한다. 실제 금융자료를 이용하여 로지스틱판별모형과 일반화가법모형, 그리고 본 연구에서 제안한 방법에 의한 정분류율을 비교한 결과 본 연구에서 제안한 방법의 분류 성능이 더 우수하였다.

GIS와 퍼지집합을 이용한 산양(Nemorhaedus caudatus)의 서식지적합성모형 개발: 설악산 국립공원을 대상으로 (Goral(Nemorhaedus caudatus) Habitat Suitability Model based on GIS and Fuzzy set at Soraksan National Park.)

  • 최태영;양병이;박종화;서창완
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.472-477
    • /
    • 2003
  • 멸종위기종의 서식지를 효율적으로 관리하기 위해서는 해당 종의 서식 가능한 지역의 분포를 알아야 한다. 본 연구의 목적은 GIS와 퍼지집합을 이용하여 산양(Nemorhaedus caudatus)의 서식지적합성모형을 개발하여 멸종 위기종의 서식지를 관리하기 위한 정보를 제공하는 것이다. 산양의 서식지적합성모형 개발을 위한 본 연구의 주요내용은 다음과 같다. 첫째, 산양 서식지 이용에 관한 기존 연구를 바탕으로 산양의 잠재적 서식지 환경변수를 분류하였으며, 분석 대상지의 산양 흔적 조사를 통해 서식지 환경변수의 재분류 및 x²검정(Chi-square test)을 통한 변수들의 유용성을 파악하고, 쌍체비교를 통한 환경변수별 가중치를 계산하였다. 둘째, 기존 부울논리(boolean logic)의 단점을 보완하기 위해 현장 조사의 결과를 바탕으로 퍼지논리(fuzzy logic)에 의한 산양 서식지의 각 환경변수별 주제도를 작성하고, 주제도들의 상관관계를 분석하여 상호 관련성이 높은 변수들의 중복을 피하였다. 셋째, 환경변수별 주제도와 변수별 가중치를 바탕으로 다기준평가기법(MCE, Multi-Criteria Evaluation)을 이용하여 분석대상지의 산양 서식지적합성모형을 개발하였다. 마지막으로, 개발된 서식지적합성모형의 타당성을 검증하기 위해 분석대상지 외부 지역을 대상으로 검증을 실시하였다. 분석 결과 분석대상지의 분류정확도는 서식가능성 0.5를 기준으로 93.94%의 매우 높은 분류정확도를 나타내었으며, 검증대상지에서는 95.74%의 분류정확도를 나타내어 본 모형의 분류정확도는 일관성이 높은 것으로 판단되었다. 또한 전체 공원구역에서 서식가능성 0.5이상의 면적은 59%를 차지하였다.퇴적이 우세한 것으로 관측되었다.보체계의 구축사업의 시각이 행정정보화, 생활정보화, 산업정보화 등 다양한 분야와 결합하여 보다 큰 시너지 효과와 사용자 중심의 서비스 개선을 창출할 수 있는 기반을 제공할 것을 기대해 본다.. 이상의 결과를 종합해볼 때, ${\beta}$-glucan은 고용량일 때 직접적으로 또는 $IFN-{\gamma}$ 존재시에는 저용량에서도 복강 큰 포식세로를 활성화시킬 뿐 아니라, 탐식효율도 높임으로써 면역기능을 증진 시키는 것으로 나타났고, 그 효과는 crude ${\beta}$-glucan의 추출조건에 따라 달라지는 것을 알 수 있었다.eveloped. Design concepts and control methods of a new crane will be introduced in this paper.and momentum balance was applied to the fluid field of bundle. while the movement of′ individual material was taken into account. The constitutive model relating the surface force and the deformation of bundle was introduced by considering a representative prodedure that stands for the bundle movement. Then a fundamental equations system could be simplified considering a steady state of the process. O

  • PDF