• Title/Summary/Keyword: 선택실험법

Search Result 806, Processing Time 0.046 seconds

A Study on Variable Selection Bias in Data Mining Software Packages (데이터마이닝 패키지에서 변수선택 편의에 관한 연구)

  • 송문섭;윤영주
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.475-486
    • /
    • 2001
  • 데이터마이닝 패키지에 구현된 분류나무 알고리즘 가운데 CART, CHAID, QUEST, C4.5에서 변수 선택법을 비교하였다. CART의 전체탐색법이 편의를 갖는다는 사실은 잘알려졌으며, 여기서는 상품화된 패키지들에서 이들 알고리즘의 편의와 선택력을 모의실험 연구를 통하여 비교하였다. 상용 패키지로는 CART, Enterprise Miner, AnswerTree, Clementine을 사용하였다. 본 논문의 제한된 모의실험 연구 결과에 의하면 C4.5와 CART는 모두 변수선택에서 심각한 편의를 갖고 있으며, CHAID와 QUEST는 비교적 안정된 결과를 보여주고 있었다.

  • PDF

Cancer Classification with Gene Expression Profiles using Forward Selection Method (전진 선택법을 이용한 유전자 발현정보 기반의 암 분류)

  • Yoo, Si-Ho;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.293-296
    • /
    • 2003
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 microarray상에서 측정한 것으로 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에, 유전발현 데이터를 통하여 암을 분류할 수 있다. 하지만 분류에 모든 유전자가 관여하지는 않으므로 관련성 있는 유전자만을 선별해내는 작업인 특징 선택방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선택하고 분류하는 방법을 제안한다. 실험데이터는 대장암 데이트를 사용하였고, 분류기는 KNN을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택 방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징 선택방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다.

  • PDF

Empirical Comparisons between Partial-Order Planning and Graph Planning in Freight Transportation Domain (화물운송 영역에서의 부분순서 계획법과 그래프 계획법에 대한 실험적 비교)

  • 이상기;정용규;김인철
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.325-333
    • /
    • 1999
  • 본 논문에서는 응용범위가 넓고 비교적 복잡도가 높은 화물운송 계획문제들을 대상으로 몇 가지 실험을 통해 대표적인 인공지능 계획방식인 부분순서 계획법과 그래프 계획법의 성능을 비교 분석하였다. 또 동시에 이러한 실험을 통해 DVO 및 LPVO와 같은 대표적인 제어전략들을 중심으로 이들이 그래프 계획법의 성능에 미치는 효과를 비교 분석하여 보았다. 본 연구의 실험을 통해서는 부분순서 계획법에 비해 그래프 계획법이 메모리 사용량이나 CPU 계산시간 면에서 월등히 우수한 성능을 보여주었으며 비교적 복잡도가 큰 계획문제에서도 좋은 결과를 보여주었다. 하지만 도출된 해 계획의 질적인 면에서는 부분순서 계획법이 대부분 최적의 해를 찾아낸 것에 반해 그래프 계획법은 사용된 제어전략과 최적화 방법에 따라 해 계획의 질이 크게 달라질 수 있음을 보였다. 한편 그래프 계획법에서는 부속목표 선택 전략인 DVO는 그 효과를 뚜렷이 보이지 못한 반면 동작 선택 전략인 LPVO는 도출된 해 계획의 질적인 면이나 계산속도 면에서 모두 뛰어난 효과를 보여주었다.

  • PDF

Empirical Comparisons between Partial-Order Planning and Graph Planning in Freight Transportation Domain (화물운송 영역에서의 부분순서 계획법과 그래프 계획법에 대한 실험적 비교)

  • 이상기;정용규;김인철
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.325-333
    • /
    • 1999
  • 본 논문에서는 응용범위가 넓고 비교적 복잡도가 높은 화물운성 계획문제들을 대상으로 몇 가지 실험을 통해 대표적인 인공지능 계획방식인 부분순서 계획법과 그래프 계획법의 성능을 비교 분석하였다. 또 동시에 이러한 실험을 통해 DVO 및 LPVO와 같은 대표적인 제어전략들을 중심으로 이들이 그래프 계획법의 성능에 미치는 효과를 비교 분석하여 보았다. 본 연구의 실험을 통해서는 부분순서 계획법에 비해 그래프 계획법이 메모리 사용량이나 CPU 계산시간 면에서 월등히 우수한 성능을 보여주었으며 비교적 복잡도가 큰 계획문제에서도 좋은 결과를 보여주었다. 하지만 도출된 해 계획의 질적인 면에서는 부분순서 계획법이 대부분 최적의 해를 찾아낸 것에 반해 그래프 계획법은 사용된 제어전략과 최적화 방법에 따라 해 계획의 질이 크게 달라질 수 있음을 보였다. 한편 그래프 계획법에서는 부속목표 선택 전략인 DVO는 그 효과를 뚜렷이 보이지 못한 반면 동작 선택 전략인 LPVO는 도출된 해 계획의 질적인 면이나 계산속도 면에서 모두 뛰어난 효과를 보여주었다.

  • PDF

Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method (전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류)

  • 유시호;조성배
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.3
    • /
    • pp.83-92
    • /
    • 2004
  • Gene expression profile is numerical data of gene expression level from organism measured on the microarray. Generally, each specific tissue indicates different expression levels in related genes, so that we can classify cancer with gene expression profile. Because not all the genes are related to classification, it is needed to select related genes that is called feature selection. This paper proposes a new gene selection method using forward selection method in regression analysis. This method reduces redundant information in the selected genes to have more efficient classification. We used k-nearest neighbor as a classifier and tested with colon cancer dataset. The results are compared with Pearson's coefficient and Spearman's coefficient methods and the proposed method showed better performance. It showed 90.3% accuracy in classification. The method also successfully applied to lymphoma cancer dataset.

The Structure and Processing of the Korean functional category (한국어 기능범주의 정보처리)

  • 황유미;문영선;박혜성;남기춘
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.273-278
    • /
    • 2000
  • 본 연구는 한국어 기능 범주(functional category)의 처리를 살펴보기 위하여 실문법증 환자를 대상으로 실시되었다. 일반적으로 수형도에서 기능 범주는 보문소구(Complementizer Phrase), 시제구(Tenxe Phrase), 일치소구(Agreement Phrase)의 순으로 구성되어 있다. 본 실험은 Grodzinsky(1997)의 수형도 가지치기 가설과 실문법증의 엄밀성 척도를 바탕으로 한국어 기능 범주의 처리에 있어서도 두 가지 가설의 적용이 타당한지 여부를 검증하기 위해 실시되었다. 실험 1은 일치소(Agr)의 처리를 살펴보기 위하여 실시되었는데, 국어의 존칭 선어말 어미를 중심으로 살펴보았다. 국어의 존칭선어말 어미는 크게 '-시-'삽입에 의한 존칭과 다른 어휘로 대체하는 보충법에 의한 존칭으로 구분된다. '-시-'삽입에 의한 존칭은 AgrP의 범주로 보충법에 의한 존칭은 동사구(Verb Phrase)의 범주로 설정하여 문법에 어려움을 보이는 실문법증의 경우 어휘부에 혹하는 보충법에 의한 존칭을 문법범주에 속하는 '-시-'삽입의 존칭보다 더 잘 할 것으로 가정하였다. 실험 2는 AgrP의 범주인 '-시-'선택의 장애가 TPqja주인 시제 선택에 역시 영향을 미칠 것이라는 가정아래 설계되었다. 수형도 상에서 '-시-'는 일치소(Agr)로서 시제(TP)의 아래에 위치하므로 실험 3은 '-시-'삽입 존칭과 시제에서 어려움이 보문소(CP)의 선택에 역시 영향을 미칠 것이라는 가정하에서 실시되었다. 실험 1의 결과 '-시-'삽입에 의한 존칭을 처리하는데 보충법에 의한 존칭보다 어려움을 보였다. 실험 2의 결과 '-시-'삽입 존칭에 어려움을 보인 환자는 시제 선어말 어미를 선택하는데도 어려움을 보임이 확인되었다. 실험 3 역시 실험 1과 실험2에서와 동일하게 처리의 어려움을 보였다. 이러한 실험 결과들은 국어의 존칭과 시제 선어말 어미가 통사부에서 구(XP)와 결합하여 새로운 구를 형성하는 통사적 접사로 해석할 수 있으며 Grodzinsky의 가설을 지지하는 결과를 보여 줌으로서 국어에서도 AgrP, TP, CP 사이의 통사적 위계가 있음을 뒷받침하는 증거가 된다.

  • PDF

A Bid Selection Heuristic for Combinatorial Auction (조합 경매에서의 비드 선택 휴리스틱)

  • 송진우;양성봉
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.283-285
    • /
    • 2002
  • 조합 경매는 구매자들이 원하는 상품들을 조합해서 입찰할 수 있는 경매다. 그러나 판매자의 이익을 최대로 하는 승자를 결정하는 문제는 NP-complete이다. 분기 한정법(branch and bound)을 사용해서 최적의 승자를 찾을 때, 어떤 비드(bid)를 선택해서 분기할 것인가를 결정해야 한다. 이 때, 비드를 선택하는 휴리스틱이 분기 한정법의 성능을 결정하는 중요한 역할을 한다. 본 논문에서는 조합경매의 승자를 결정하기 위해서 분기 한정법과 Linear Programming을 사용할 때, 분기할 비드와 충돌하는 비드들을 동시에 고려하는 비드 선택 휴리스틱을 제안한다. 실험을 통해서 제시하는 휴리스틱의 성능이 우수함을 보였다.

  • PDF

Estimating the Vewing Value, Landscape Value, and Net Visit Value of Windpower Turbines in Mountain Areas in Korea Using a Choice Experimentation Method (선택실험법을 사용한 풍력발전소의 산악지역 방문가치 영향 추정: 관람가치, 경관가치, 그리고 순방문가치)

  • Han, Taek-Whan
    • Environmental and Resource Economics Review
    • /
    • v.27 no.3
    • /
    • pp.421-461
    • /
    • 2018
  • Windpower turbines have positive values for visitors with regard to tourism and learning. On the other hand, it is clear that windpower turbines have negative impact on the landscape, particularly when the level of landscape is high. The impact of windpower turbines on the visitor's value is composed of two elements: the viewingvalue which is independent of the level of landscape and the landscape value which varies with the level of landscape. The net visitor's value of windpower turbines is the sum of these two values with opposite signs. This study used a choice experimentation method to value the impact of windpower turbine construction in the mountainous area in Korea. This study estimated the viewing value, the landscape value and the visit value as the sum of the two values. The estimated results demonstrated a significantly positive viewing value, a significantly negative landscape value, and weakly negative net visit value in average.

Evaluation of Alternative Benefit Using Choice Experiment Method and Alternative Evaluation Index (실험선택법과 대안 평가지수를 이용한 대안의 편익산정)

  • Chung, Eun-Sung;Kong, Ki-Seo;Lee, Kil-Seong;Yoo, Jin-Chae
    • Journal of Korea Water Resources Association
    • /
    • v.41 no.1
    • /
    • pp.101-113
    • /
    • 2008
  • Cost-benefit analysis was conducted to propose the best alternatives for integrated watershed management. Benefits of all alternatives were estimated combining results of choice experiment method with alternative evaluation index (AEI). Choice experiment which is a kind of stated preference techniques was applied to six regions since the Anyangcheon watershed was divided into six according to spatial characteristics and conditions (potential hazard and location). Alternative of NB > 0 must be considerable since they are economically and technically feasible.