• 제목/요약/키워드: Feature Evaluation and Selection

검색결과 82건 처리시간 0.041초

Support Vector Regression에 기반한 전력 수요 예측 (Electricity Demand Forecasting based on Support Vector Regression)

  • 이형로;신현정
    • 산업공학
    • /
    • 제24권4호
    • /
    • pp.351-361
    • /
    • 2011
  • Forecasting of electricity demand have difficulty in adapting to abrupt weather changes along with a radical shift in major regional and global climates. This has lead to increasing attention to research on the immediate and accurate forecasting model. Technically, this implies that a model requires only a few input variables all of which are easily obtainable, and its predictive performance is comparable with other competing models. To meet the ends, this paper presents an energy demand forecasting model that uses the variable selection or extraction methods of data mining to select only relevant input variables, and employs support vector regression method for accurate prediction. Also, it proposes a novel performance measure for time-series prediction, shift index, followed by description on preprocessing procedure. A comparative evaluation of the proposed method with other representative data mining models such as an auto-regression model, an artificial neural network model, an ordinary support vector regression model was carried out for obtaining the forecast of monthly electricity demand from 2000 to 2008 based on data provided by Korea Energy Economics Institute. Among the models tested, the proposed method was shown promising results than others.

지능적 탐지 모델을 위한 악의적인 코드의 특징 정보 추출 및 분류 (Extraction and classification of characteristic information of malicious code for an intelligent detection model)

  • 황윤철
    • 산업융합연구
    • /
    • 제20권5호
    • /
    • pp.61-68
    • /
    • 2022
  • 최근에는 발전하는 정보통신 기술을 이용하여 악의적인 코드들이 제작되고 있고 이를 기존 탐지 시스템으로는 탐지하는게 역부족인 실정이다. 이러한 지능적이고 악의적인 코드를 정확하고 효율성 있게 탐지하고 대응하기 위해서는 지능적 탐지 모델이 필요하다. 그리고, 탐지 성능을 최대로 높이기 위해서는 악의적인 코드의 주요 특징 정보 집합으로 훈련하는 것이 중요하다. 본 논문에서는 지능적 탐지 모델을 설계하고 모델 훈련에 필요한 데이터를 변환, 차원축소, 특징 선택 단계를 거쳐 주요 특징 정보 집합으로 생성하는 기법을 제안하였다. 그리고 이를 기반으로 악의적인 코드별로 주요 특징 정보를 분류하였다. 또한, 분류된 특징 정보들을 기반으로 변형되거나 새로 등장하는 악의적인 코드를 분석하고 탐지하는데 사용할 수 있는 공통 특징 정보를 도출하였다. 제안된 탐지 모델은 제한된 수의 특성 정보로 학습하여 악의적인 코드를 탐지하기에 탐지 시간과 대응이 빨리 이루어져 피해를 크게 줄일 수 있다. 그리고, 성능 평가 결과값은 학습 알고리즘에 따라 약간 차이가 나지만 악의적인 코드 대부분을 탐지할 수 있음을 평가로 알 수 있었다.

유전 알고리즘을 이용한 무선 메쉬 네트워크에서의 라우팅 프로토콜 설계 (Using Genetic Algorithms in Wireless Mesh Network Routing Protocol Design)

  • 윤창표;유황빈
    • 정보처리학회논문지C
    • /
    • 제18C권3호
    • /
    • pp.179-186
    • /
    • 2011
  • 무선 메쉬 네트워크 기술은 유선과 비슷한 전송속도를 갖는 무선 네트워크망을 구축하는 기술을 의미하며, 기존 유선 네트워크와 비교해서 네트워크 구축에 보다 향상된 유연성을 제공한다. 또한 노드의 이동성이 적고 에너지 영향에도 제약이 적게 따른다는 특징을 갖고 있다. 그러나 다중 경로 설정 및 선택 시에 발생할 수 있는 시스템 오버헤드와 같은 고려되어야 하는 사항들이 많아지게 된다. 따라서 이러한 네트워크 특성과 경로 설정 기술이 반영될 수 있는 네트워크의 설계 및 최적화에 주목하게 된다. 본 논문에서는 다중 경로 설정에 효과적으로 대응하기 위해 유전 알고리즘의 적합성 평가 함수에 링크의 성능과 로드를 고려한 노드의 트래픽 상황과 데이터 손실률 그리고 대역폭 및 링크의 홉수를 이용한 노드의 서비스 평가 값을 적용함으로써 무선 메쉬 네트워크 라우팅의 경로 설정에 대한 해결 방법을 제안한다.

잠재의미색인(LSI) 기법을 이용한 kNN 분류기의 자질 선정에 관한 연구 (Evaluation of the Feature Selection function of Latent Semantic Indexing(LSI) Using a kNN Classifier)

  • 박부영;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.163-166
    • /
    • 2004
  • 텍스트 범주화에 관한 선행연구에서 자주 사용되면서 좋은 성능을 보인 자질 선정 기법은 문헌빈도와 카이제곱 통계량 등이다. 그러나 이들은 단어 자체가 갖고 있는 모호성은 제거하지 못한다는 단점이 있다. 본 연구에서는 kNN 분류기를 이용한 범주화 실험에서 단어간의 상호 관련성이 자동적으로 유도됨으로써 단어 자체 보다는 단어의 개념을 분석하는 잠재의미색인 기법을 자질 선정 방법으로 제안한다.

  • PDF

복지사각지대 예측을 위한 속성 선택 및 평가 기법 (A Method of Feature Selection and Evaluation for Resolving Estrangement of Welfare)

  • 이건수;박준호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.671-673
    • /
    • 2019
  • 복지사각지대 발굴은 복지 서비스가 필요하지만 수혜를 받지 못하고 있는 국민을 찾아내서 지원해주는 정부 시스템이다. 본 연구는 이 복지사각지대 발굴 관리 시스템의 효용성을 높이기 위해, 발굴 예측 모델의 정확도를 높이기 위한 방법으로, 발굴 과정에서 사용하는 속성을 선택하고 평가하기 위한 방법을 제안한다. 제안 방법은 각 속성의 유효성을 검증하고, 검증된 속성 집합을 선택한 뒤, 예측 기준을 결정하는 세 단계로 구성되며, 이 방법을 통해 기존 복지사각지대 예측 모델의 개선에 적용할 수 있을 것으로 기대할 수 있다.

러프집합이론과 사례기반추론을 결합한 기업신용평가 모형 (Integration rough set theory and case-base reasoning for the corporate credit evaluation)

  • 노태협;유명환;한인구
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제14권1호
    • /
    • pp.41-65
    • /
    • 2005
  • The credit ration is a significant area of financial management which is of major interest to practitioners, financial and credit analysts. The components of credit rating are identified decision models are developed to assess credit rating an the corresponding creditworthiness of firms an accurately ad possble. Although many early studies demonstrate a priori which of these techniques will be most effective to solve a specific classification problem. Recently, a number of studies have demonstrate that a hybrid model integration artificial intelligence approaches with other feature selection algorthms can be alternative methodologies for business classification problems. In this article, we propose a hybrid approach using rough set theory as an alternative methodology to select appropriate attributes for case-based reasoning. This model uses rough specific interest lies in lthe stable combining of both rough set theory to extract knowledge that can guide dffective retrevals of useful cases. Our specific interest lies in the stable combining of both rough set theory and case-based reasoning in the problem of corporate credit rating. In addition, we summarize backgrounds of applying integrated model in the field of corporate credit rating with a brief description of various credit rating methodologies.

  • PDF

차원별 Eigenvoice와 화자적응 모드 선택에 기반한 고속화자적응 성능 향상 (Performance Improvement of Fast Speaker Adaptation Based on Dimensional Eigenvoice and Adaptation Mode Selection)

  • 송화전;이윤근;김형순
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.48-53
    • /
    • 2003
  • Eigenvoice 방법은 고속화자적응에 적합하다고 알려져 있지만, 이 방법은 발화수가 증가하더라도 추가적인 인식성능향상이 이루어지지 않는 단점이 있다. 본 논문에서는 이 문제를 해결하기 위해 음성 특징벡터의 차원별로 eigenvoice의 가중치를 구하여 적응시키는 방법과 또한 적응 데이터 수에 따라 높은 인식률을 얻는 적응 방식을 선택하는 방식을 제안한다. 화자독립모델 및 eigenvoice들을 구성하기 위해 POW (Phonetically Optimized Words)데이터베이스를 사용하였으며, PBW(Phonetically Balanced Words) 452단어 중50개까지 발화 수를 변화시키면서 교사방식 (Supervised mode)로 적응에 사용하고 나머지 중 400개를 인식실험에 사용하였다. 차원별 eigenvoice 방법이 발화수가 증가함에 따라 기존의 eigenvoice 나 MLLR 방법보다 높은 성능을 보였으며, eigenvoice와 차원별 eigenvoice방법 사이의 적응 모드 선택을 통해 기존의 eigenvoice 방식에 비해 최고 26%의 단어 오인식률 감소를 얻었다.

데이터의 공간적 분포를 고려한 퍼지 이산화와 특징선택에의 응용 (Fuzzy discretization with spatial distribution of data and Its application to feature selection)

  • 손창식;신아미;이인희;박희준;박형섭;김윤년
    • 한국지능시스템학회논문지
    • /
    • 제20권2호
    • /
    • pp.165-172
    • /
    • 2010
  • 임상 데이터마이닝에서 최적의 특징 집합을 선택하는 것은 주어진 데이터로부터 생성된 모델의 복잡성을 줄일 뿐만 아니라 유용성을 향상시키는 데에 매우 중요하고, 선택된 특징들의 임계값은 질병의 감별진단을 위해 임상 전문가의 결정기준으로 사용된다. 본 논문에서는 데이터의 공간적인 분포, 즉 중첩영역에서 중복 속성값을 포함하는 데이터의 분리성 정도를 평가함으로써 연속형 속성을 가진 데이터에 대한 퍼지 이산화기법을 제안한다. 제안된 방법에서 중복 속성값의 가중치 평균값은 각 특징의 임계값(즉 경계값)을 결정하기 위해서 사용되었고, 러프집합은 전체 특징들 중에서 중요특징들의 집합을 선택하기 위해서 이용하였다. 제안된 방법의 타당성을 검증하기 위해 호흡곤란을 주호소로 내원한 668명의 환자 데이터를 근거로 3가지 이산화방법과 제안된 이산화방법에 대한 실험을 수행하였다. 실험결과, 퍼지분할을 기반으로 한 이산화방법이 하드분할을 기반으로 한 이산화방법에 비해서 평균 분류정확도와 G-mean 성능에서 보다 좋은 결과를 제공함을 확인하였다.

지방부 국도에서의 보도설치 우선순위 결정을 위한 방법론 개발 (일반국도 적용사례 중심으로) (Methodology for Prioritizing Sidewalk Construction among 100 Candidate Sites on Rural National Highways)

  • 전우훈;양충헌;윤정은;양인철
    • 한국도로학회논문집
    • /
    • 제17권4호
    • /
    • pp.127-133
    • /
    • 2015
  • PURPOSES: The purpose of this study is to develop a methodology to prioritize sidewalk construction on rural national highways. METHODS : In order to determine an appropriate prioritization for sidewalk construction, we developed a specific methodology. The proposed methodology includes three main steps: 1) Analytic Hierarchy Process (AHP) methods, 2) Subjective evaluation of relevant road agencies for the candidate sidewalks along rural national highways, and 3) Field study conduction. Each step has four phases. The primary feature of this methodology is the addition of expert consultation and survey data, as well as a field study. In addition, the method could guarantee flexibility in selection for evaluation criteria. As a result, the proposed methodology could be used as a general procedure for application to other roadway classifications when considering sidewalk construction. RESULTS: In order to demonstrate the reasonableness of the proposed methodology, a case study was performed for exactly 100 candidate sites for sidewalk construction on rural national highways. All required evaluation scores were properly produced for each candidate site. By doing so, decision-makers can determine the priority for sidewalk construction at these sites by reviewing quantitatively and qualitatively considered data. CONCLUSIONS: The results of the case study can be applied to a long-term fundamental plan for sidewalk construction on rural national highways. Furthermore, this methodology could be employed to prioritize a small-scale SOC project(e. g. bicycle or pedestrian roads).

공기행렬의 질감특성치들에 대한 평가와 적정 적용해상도에 관한 연구 (A Study of Evaluation of the Feature from Cooccurrence Matrix and Appropriate Applicable Resolution)

  • 권오형;김용일;어양담
    • 대한공간정보학회지
    • /
    • 제8권1호
    • /
    • pp.105-110
    • /
    • 2000
  • 고해상도 위성영상의 출현으로 인해 인간이 사용하는 다양한 판독기재를 영상판독에 적용할 가능성이 넓어졌고, 컴퓨터비전, 패턴인식, 인공지능, 원격탐사 등 많은 분야에서 이런 가능성들을 연구해왔다. 이중 질감은 '영상의 밝기와 색조간의 공간적 분포와 관계'된 양으로 영상판독에 중요한 역할을 한다. 특히 통계적 모델을 기초로 질감정보을 얻는 방법이 많이 연구되어 왔고, 이러한 기법 중 공기행렬을 이용하여 질감을 측정한 연구는 다른 기법에 비해 계산이 간편하며 위성영상과 항공사진에 적용되어 높은 분류정확도를 나타내어 좋은 질감측정치로 평가되었다 하지만 기존의 논문들에서 특성치의 선택에 관한 연구 없이 임의적으로 특성치가 선택되었고, 또한 공기행렬이 질감을 잘 표현할 수 있는 적정해상도에 판한 연구가 부족했다. 따라서 본 연구에서는 첫째, 질감측정의 방법으로 공기행렬의 개념을 소개하고, 둘째, 위성영상으로부터 도출된 공기행렬로부터 얻어질 수 있는 여러 가지 특성치들의 유용성을 평가하여 컴퓨터를 이용한 분류 시 적절한 특성치를 선정할 수 있는 근거를 마련하며, 셋째, 여러 특성치들의 공간해상도에 따른 변화추이를 조사하여 공기행렬이 적용될 수 있는 적정해상도를 제시하고자 한다.

  • PDF