• 제목/요약/키워드: Nested Partition

검색결과 9건 처리시간 0.02초

다종 형태 데이터를 위한 요소선택 방법 (Feature Selection for Mixed Type of Data)

  • 양재경;이태한
    • 산업경영시스템학회지
    • /
    • 제33권1호
    • /
    • pp.114-120
    • /
    • 2010
  • 데이터마이닝의 사전 단계에서 데이터의 차원(Dimensionality)을 줄이기 위한 단계로서 많은 요소선택(Feature Selection) 방법들이 개발되었다. 이 방법은 결과를 예측하거나 데이터를 설명하고자 할 때 어떤 요소들이 관련이 있는지를 결정하는 과정을 포함한다. 또한 이 방법은 데이터의 크기에 대한 확장성 (Scalability)를 향상시키며 학습 모델을 더욱 이해하기 쉽도록 줄 수 있다. 이 논문에서는 NP(Nested Partition) 방법을 사용한 최적화 기반의 새로운 요소선택 방법을 NP 구조의 기본적인 이론 근거와 함께 제안한다. 또 한 편으로 많은 요소선택 방법들이 다중 형태의 데이터를 처리하는데 한계를 가지고 있는데, NP 기반의 요소선택 방법에 다중 형태의 데이터를 처리할 수 있도록 하는 요소 성능 평가도구(Evaluators)를 도입하여 이를 극복하고자 한다. 또한 어떤 평가도구가 특정 데이터 형태에서 더욱 좋은 결과를 보이는지를 실험 결과와 함께 제시하였다.

Enhanced Region Partitioning Method of Non-perfect nested Loops with Non-uniform Dependences

  • Jeong Sam-Jin
    • International Journal of Contents
    • /
    • 제1권1호
    • /
    • pp.40-44
    • /
    • 2005
  • This paper introduces region partitioning method of non-perfect nested loops with non-uniform dependences. This kind of loop normally can't be parallelized by existing parallelizing compilers and transformations. Even when parallelized in rare instances, the performance is very poor. Based on the Convex Hull theory which has adequate information to handle non-uniform dependences, this paper proposes an enhanced region partitioning method which divides the iteration space into minimum parallel regions where all the iterations inside each parallel region can be executed in parallel by using variable renaming after copying.

  • PDF

확장 가능한 요소선택방법을 위한 분석적 접근 (Analytical Approach for Scalable Feature Selection)

  • 양재경;이태한
    • 산업경영시스템학회지
    • /
    • 제29권2호
    • /
    • pp.75-82
    • /
    • 2006
  • 본 연구에서 조합 최적화(Combinatorial Optimization) 이론에 바탕을 두고 있는 네스티드 분할(Nested Partition, 이하 NP) 방법을 이용한 최적화 기탄 요소선택 방법(Feature Selection)을 제안한다. 이 새로운 방법은 좋은 요소 부분집합을 찾는 휴리스틱 탐색 절차를 채용하고 있으며 데이터의 인스턴스(Instances 또는 Records)의 무작위 추출(Random Sampling)을 이용하여 이 요소선택 방법의 처리시간 관점에서의 성능을 항상 시키고자 한다. 이 새로운 접근 방법은 처리시간 향상을 위해 2단계 샘플링 방법을 채용하여 근접 최적해로의 수렴(Convergence)을 보장하는 샘플 사이즈를 결정한다. 이는 앨고리듬이 유한한 시간내에 끝이날 때 최종 요소 부분집합 해의 질(Qualtiy)에 관한 정확한 설명을 할 수 있는 이론적인 배경을 제시한다. 중요 결과를 예시하기 위해서 다양한 형태의 다섯 개의 데이터 셋을 이용하였으며 다섯 번의 반복 실험을 통한 실험 결과가 제시되며, 이 새로운 접근 방법이 기존의 단순 네스티드 분할 방법 기반의 요소선택 방법보다 처리시간 관점에서 더욱 효율적임을 보여준다.

On Flexible Bayesian Test Criteria for Nested Point Null Hypotheses of Multiple Regression Coefficients

  • Jae-Hyun Kim;Hea-Jung Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.205-214
    • /
    • 1996
  • As flexible Bayesian test criteria for nested point null hypotheses of multiple regression coefficients, partial and overall Bayes factors are introduced under a class of intuitively meaningful prior. The criteria lead to a simple method for considering different prior beliefs on the subspaces that constitute a partition of the coefficient parameter space. A couple of tests are suggested based on the criteria. It is shown that they enable us to obtain pairwise comparisons of hypotheses of the partitioned subspaces. Through a Monte Carlo simulation, performance of the tests based on the criteria are compared with the usual Bayesian test (based on Bayes factor)in terms of their respective powers.

  • PDF

새로운 점진적 인스턴스 기반 학습기법 (A New Incremental Instance-Based Learning Algorithm)

  • 한진철;윤충화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.477-480
    • /
    • 2005
  • 메모리 기반 추론 기법에서 기억공간의 효율적 사용과 분류 시간을 줄이기 위한 다양한 방법들이 연구되고 있으며, NGE(Nested Generalized Exemplar) 이론을 예로 들 수 있다. 본 논문에서는 학습 패턴 집합으로부터 대표패턴을 생성하는 RPA(Recursive Partition Averaging) 기법과 점진적으로 대표패턴을 추출하는 IRPA(Incremental RPA) 기법을 제안한다.

  • PDF

비규칙 종속성을 가진 루프의 확장된 세지역 분할 방법 (Extended Three Region Partitioning Method of Loops with Irregular Dependences)

  • 정삼진
    • 한국융합학회논문지
    • /
    • 제6권3호
    • /
    • pp.51-57
    • /
    • 2015
  • 본 논문은 비규칙 종속성을 가진 내포된 루프의 수행 속도를 향상시키기 위해서 Extended Three Region Partitioning Method 라는 효과적인 루프 분할 방법에 대해서 연구하였다. 본 논문에서 제안된 루프 분할 방법은 변수 재명명에 의해서 역종속성을 가진 내포된 루프를 제거한 후 네 개의 선중에 하나 혹은 그 이상의 적절한 선을 선택하는 알고리즘을 개발한다. 한 개의 선이 선택되면 선택된 선에 의해서 전체 영역은 두 개의 병렬지역으로 분할된다. 한 개 이상의 선이 선택되면 그 선들에 의해서 하나의 순차지역과 두 개의 병렬지역으로 분할한다. 제안된 분할 방법은 기존의 분할 방법보다 성능이 우수함을 성능 분석에서 보여준다.

재귀분할을 이용한 새로운 점진적 인스턴스 기반 학습기법 (A New Incremental Instance-Based Learning Using Recursive Partitioning)

  • 한진철;김상귀;윤충화
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.127-132
    • /
    • 2006
  • 인스턴스 기반 학습의 대표적인 알고리즘인 k-NK(K-Nearest Neighbors)은 단순히 전체 학습패턴을 메모리에 저장한 다음, 분류할 때 학습 패턴들과의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 테스트 패턴을 분류한다. K-NN 기법은 만족할 만한 분류성능을 보여주지만, 학습패턴의 개수가 늘어나면 메모리와 분류 시간이 증가하는 문제점을 가지고 있다. 그러므로, 메모리의 효율적 사용과 분류 시간을 단축시키기 위한 다양한 연구들이 발표되었으며, 그 대표적인 예로 NGE(Nested Generalized Exemplar) 이론을 들 수 있다. 본 논문에서는 학습패턴의 집합으로부터 대표패턴을 생성하는 RPA(Recursive Partition Averaging)기법과 점진적으로 대표패턴을 추출하는 IRPA(Incremental RPA)기법을 제안하였다. RPA기법은 전체 학습패턴의 공간을 재귀적으로 분할하면서 대표패턴을 생성하며, IRPA 기법은 RPA 기법의 특성상 패턴의 특징 개수가 많은 경우, 과도한 분할로 인하여 생성되는 많은 개수의 대표패턴을 줄이기 위하여 점진적으로 대표패턴을 추출하는 알고리즘이다. 본 논문에서 제안한 기법은 기존의 k-NN 기법과 비교하여 현저하게 줄어든 대표패턴을 이용하석 유사한 분류 성능을 보여주며, NGE 이론을 구현한 EACH 시스템과 비교하여 탁월한 분류 성능을 보여준다.

역 물류 환경 인터넷 경매를 위한 요소 선택응용 추천 시스템 (Feature Selection Applied to Recommender Systems for Reverse Logistics Internet Auction)

  • 양재경;유우연
    • 산업경영시스템학회지
    • /
    • 제29권1호
    • /
    • pp.76-86
    • /
    • 2006
  • 다양한 데이터 마이닝 기법들의 발전과 더불어, 속성(Feature 또는 Attribute)의 범위(Dimension)를 줄이기 위해 많은 요소 선택 방법이 개발되었다. 이는 확장성(Scalability)을 향상시킬 수 있고 학습 모델(Learning Model)을 더욱 쉽게 해석할 수 있도록 한다. 이 논문에서는 네스티드 분할(Nested Partition, 이하 NP)을 이용한 새로운 최적화 기반 속성 선택 방법을 NP 기본 구조와 다양한 실험 문제의 수치적 결과들과 함께 제시하여 어떻게 NP의 최적화 구조가 속성 선택 과정에 기여를 하고 있는지 보여준다. 그리고 이 새로운 지능적인 분할 방법이 어떻게 매우 효율적인 분할을 수행하는지를 제시한다. 이 새로운 속성 선택 방법은 필터(Filter)방법과 래퍼(Wrapper)방법 두 가지로 구현될 수 있다. 사례 연구로서, B2B e-비즈니스 시스템에서 효과적으로 사용될 수 있는 추천 시스템(Recommender System)을 제안하였다. 이 추천 시스템은 분류 기법(Classification Rule)과 제시된 NP 기반 요소 선택 방법을 사용하고 있다. 이 추천 시스템은 사용자의 인터넷 경매 참여를 추천하는데 사용되며, 이 때 제안된 요소 선택 앨고리듬은 추천 규칙들이 쉽게 이해될 수 있도록 모델을 간략화 하는데 사용된다.

영상정보를 이용한 병렬 프로그램내의 병행성 판별 (Check of Concurrency in Parallel Programs using Image Information)

  • 박명철;하석운
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2132-2139
    • /
    • 2006
  • 내포 병렬성을 포함하는 병렬 프로그램은 복잡한 수행 양상을 가지며, 태스크들은 병행적으로 수행되는 경향이 있다. 이러한 병행성은 대부분의 오류을 유발하는 근본적인 원인이 된다. 본 논문은 병렬 프로그램 수행양상을 영상화하여 두 태스크간의 병행성을 판별할 수 있는 새로운 방법을 제안한다. 기존의 방법들은 전역적인 구조를 보이는데 제약이 있고 과다한 추상화로 인하여 수행양상의 직관성을 저해하는 경향이 있다. 본 논문에서 제안한 기법은 영상 가시화에 적합한 레이블링 기법을 제안하고, 제안한 레이블링 기법을 적용하여 산출된 각 태스크의 레이블정보를 2차원 평면상에서 분할된 영역으로 표현한다. 이를 토대로 각 태스크의 순서화 관계를 식별할 수 있는 독립된 영상을 생성한다. 결과로 생성된 영상은 관련 태스크의 의미론적 분석을 간소화하고 전체 프로그램의 전역적 수행 구조의 개요를 사용자에게 효과적으로 제공한다.