• Title/Summary/Keyword: 가중치분석

Search Result 2,159, Processing Time 0.041 seconds

Weight Adjustment Methods Based on Statistical Information for Fuzzy Weighted Mean Classifiers (퍼지 가중치 평균 분류기를 위한 통계적 정보 기반의 가중치 설정 방안)

  • Shin, Sang-Ho;Cho, Jae-Hyun;Woo, Young-Woon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.25-30
    • /
    • 2009
  • 패턴 인식에서 분류기 모형으로 많이 사용되는 퍼지 가중치 평균 분류기는 가중치를 적절히 설정함으로써 뛰어난 분류 성능을 얻을 수 있다는 장점이 있다. 그러나 일반적으로 가중치는 인식 문제 분야의 특성이나 해당 전문가의 지식이나 주관적 경험을 기반으로 설정되므로 설정된 가중치의 일관성과 객관성을 보장하기가 어려운 문제점을 갖고 있다. 따라서 이 논문에서는 퍼지 가중치 평균 분류기의 가중치를 설정하기 위한 객관적 기준을 제시하기 위하여 특징값들 간의 통계적 정보를 이용한 가중치 설정 기법들을 제안하였다. 제안한 기법들을 이용하여 UCI machine learning repository 사이트에서 제공되는 표준 데이터들 중의 하나인 Iris 데이터 세트를 이용하여 실험하고 그 결과를 비교, 분석하였다.

  • PDF

A New Learning Algorithm for Rare Class Classification (희귀 목적값 분류를 위한 학습 알고리즘)

  • Lee, Kwang-Ho;Lee, Chang-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.39-42
    • /
    • 2006
  • 본 논문에서는 데이터 마이닝에서 발생되는 희귀 데이터를 분석하기 위한 희귀 목적값 분석의 새로운 알고리즘을 제시한다. 이를 위하여 속성들이 가지는 속성의 가중치 값과 속성값이 목적 속성에 미치는 가중치값을 정보이론에 입각하여 가중치 계산을 하고, 계산된 가중치값을 사용하여 스코어링 함으로써 희귀 목적값에 속한 데이터 예측/분류에 사용하는 방법을 제시하였다. 실험을 통해 본 알고리즘의 성능을 입증함은 물론 제안된 알고리즘이 희귀 데이터의 분류/학습에 좀 더 효과적이다는 것을 보였다.

  • PDF

Term Weighting Method for Natural Language Query Sentence (자연언어 질의 문장의 용어 가중치 부여 기법)

  • Kang, Seung-Shik;Lee, Ha-Gyu;Son, So-Hyun;Moon, Byung-Joo;Hong, Gi-Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

Component Extraction Method Using Weight Analysis between Use Cases and Classes (Use Case 및 클래스의 가중치 분석에 의한 컴포넌트 추출 기법)

  • Yu, Yeong-Ran;Kim, Su-Dong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.8
    • /
    • pp.537-549
    • /
    • 2001
  • 소프트웨어의 생산성과 유지보수 비용을 줄여줄 수 있는 기법으로 다양한 컴포넌트 기반의 개발 방법론이 제안되고 있다. 그러나 컴포넌트 기반의 시스템에서 재사용성과 독립성이 높은 컴포넌트의 식별은 가장 중요한 성공 요소 중의 하나임에도 불구하고, 대부분의 컴포넌트 기반 방법론들에서는 직관적이고 분석자의 경험에 의존적인 컴포넌트 식별 방법만을 제공하고 있을 따름이다. 본 논문에서는 분석 단계의 산출물인 시스템의 기능 모델 Use Case 모델과 자료 모델인 클래스 모델에 기반 하여 체계적인 컴포넌트 식별 기법과 지침들을 제안한다. 먼저 클래스에 대한 Use Case의 자료 접근값을 정의하고, 정의된 접근값을 기반으로 Use Case별로 접근되는 클래스의 가중치와 클래스별 동일 접근값을 가지는 Use Case들의 가중치를 계산하다. 두 가중치를 곱하여 최종적인 Use Case&클래스 가중치를 계산하여 후보 컴포넌트 식별의 기준으로 삼는다.

  • PDF

Comparative Analysis of Unweighted Sample Design and Complex Sample Design Related to the Exploration of Potential Risk Factors of Dysphonia (잠재적 위험요인의 탐색에 관한 단일표본분석과 복합표본분석의 비교)

  • Byeon, Hae-Won
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.13 no.5
    • /
    • pp.2251-2258
    • /
    • 2012
  • This study compared the unweighted sample design, frequency weighted sample design and complex sample design to using 2009 Korea National Health and Nutrition Examination Survey in an effort to identify whether or not there is any difference in potential risk factors. Pearson chi-square test and Rao-scott chi-square test were applied to the analytic methods. As a result of analyses, all the variables were overestimated as significant risk factors in case of the unweighted sample design to which only the frequency weights were applied. In addition, there were differences in the confidence levels and results from the simple random sampling analysis and complex sample design to which no weight was applied. It is necessary to carry out the complex sample design rather than the analysis to which the frequency weights are applied, in order to ensure the findings to represent the whole population when our national statistics data is used.

Supervised Feature Weight Optimization for Data Mining (데이터마이닝에서 교사학습에 의한 속성 가중치 최적화)

  • 강명구;차진호;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.244-246
    • /
    • 2001
  • 최근 군집화와 분류기법이 데이터 마이닝에 중요한 도구로 많은 응용분야에 사용되고 있다. 따라서 이러한 기법을 이용하는데 있어서 각각의 속성의 중요도가 달라 중요하지 않은 속성에 의해 중요한 속성이 왜곡되거나 때로는 마이닝의 결과가 잘못되는 결과를 얻을 수 있으며, 또한 전체 데이터를 사용할 경우 마이닝 과정을 저하시키는 문제로 속성 가중치과 속성선택에 과한 연구가 중요한 연구의 대상이 되고 있다. 최근 연구되고 있는 알고리즘들은 사용자의 의도와는 상관없이 데이터간의 관계에만 의존하여 가중치를 설정하므로 사용자가 마이닝 결과를 쉽게 이해하고 분석할 수 없는 문제점을 안고 있다. 본 논문에서는 클래스 정보가 있는 데이터뿐 아니라 클래스 정보가 없는 데이터를 분석할 경우 사용자의 의도에 따라 학습할 수 있도록 각 가중치를 부여하는 속성가중치 알고리즘을 제안한다. 또한 사용자가 의도한 정보를 이용하여 속성간의 가장 최적화 된 가중치를 찾아주며, Cramer's $V^2$함수를 적합도 함수로 하는 유전자 알고리즘을 사용한다. 알고리즘의 타당성을 검증하기 위해 전자상거래상의 실험 데이터와 몇 가지 벤치마크 데이터를 이용하여 본 논문의 타당성을 보인다.

  • PDF

The Advanced Power System Security Index Considering weighting factors (가중치를 고려한 전력시스템의 안전도 지수에 관한 연구)

  • Song Sung Hwan;Jung Seung Wan;Moon Seung Il;Yoon Yong Tae
    • Proceedings of the KIEE Conference
    • /
    • summer
    • /
    • pp.79-81
    • /
    • 2004
  • 본 논문에서는 전력시스템의 정적 안전도수준(Steady-state Security Level)을 평가할 수 있는 안전도 지수를 전력시스템의 영향을 반영하는 가중치를 고려하여 보다 개선된 안전도 지수를 제안한다. 먼저, N-1선로사고를 가정하여 각 선로가 계통에 미치는 영향과 각 선로의 사고로 인해 모선 전압의 변동량을 분석하여 각각 안전도 지수들의 가중치를 산정한다. 이때, 가중치의 표준화를 위해 분포도(Distribution Chart)를 활용한다. 가중치가 적용된 안전도 지수는 이를 고려하지 않은 안전도 지수보다 더욱 계통상황을 잘 반영할 것이며, 전력계통 운영 상태를 나타내는 중요한 지표로서 활용될 수 있을 것이다.

  • PDF

School of Electronic and Electrical Engineering, Hong Ik University (균일분포 신경회로망을 이용한 얼굴인식 시스템)

  • 조성원;박준하
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1997.11a
    • /
    • pp.171-175
    • /
    • 1997
  • 본 논문에서는 LVQ(Learning Vector Quentization) 신경회로망의 새로운 가중치 초기화법을 제안하고 이를 얼굴인식 시스템에 적용하였다. 제안한 방법은 초기가중치를 패턴 결정 경계면 주변에 설정함으로써 인식율을 높이는 방법이다. 얼굴인식의 특징 추출 방법으로서는 주성분 분석, 모멘트, 푸리에 기술자, 모멘트+주성분 분석 및 푸리에 기술자+주성분 분석 등을 사용하여 실험하였으며, 인식부의 LVQ 신경회로망에 제안된 방법을 적용하여 기존의 방법과 비교 실험하였다. 실험 결과 초기가중치를 최초 패턴으로 가지는 경우, 평균값을 취하는 경우, 랜덤하게 사용하는 경우 등에 비해서 우수한 인식율을 보임을 알 수 있었다.

  • PDF

Landslide Danger Mapping using Spatial Information Technology (공간정보기술을 이용한 산사태 위험도 매핑)

  • Jo, Myung-Hee;Jo, Yun-Won;Kim, Sung-Jae
    • 한국방재학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.353-356
    • /
    • 2008
  • 최근 대규모 산림재해로 인한 산림환경 훼손 및 산림 농가의 피해는 물론 산림생태계에도 나쁜 영향을 미치고 있으며 이는 사회적으로 매우 민감한 환경문제로서 국민의 주요 관심사가 되고 있다. 본 연구에서는 울진군 전체를 대상으로 GIS 및 RS 기법을 이용하여 다양한 산사태 관련 인자들을 추출 하여 이를 기반으로 GIS 중첩 및 가중치 분석을 통하여 울진군의 산사태 발생 가능 위험지역의 분포도를 작성하고자 한다.

  • PDF

Determination of AHP-based factor weights for quantification of regional mega-drought resilience (지역별 메가가뭄 복원력 정량화를 위한 AHP기반 인자 가중치 결정)

  • Lee, Chanwook;Moon, Gihoon;Yoo, Do Guen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.361-361
    • /
    • 2021
  • 가뭄의 경우 타 자연재난에 비해 발생경로, 피해범위, 발생기간 등이 매우 다양해 다각적인 측면에서의 대응책 마련이 필요하다. 따라서, 극한가뭄에 대비한 지자체별 가뭄 역량 평가를 수행하는 것은 재난관리에 있어서 최우선이라고 할 수 있다. 현재 국내외적으로 가뭄과 관련된 지역적 복원력을 평가한 사례는 매우 적다. 가뭄은 지진, 홍수 등과 같은 타 자연재난에 비하여 지속기간이 길고, 그 지속기간에 따라 피해의 영향 또한 파급력이 달라지므로 복원력 산정을 위한 항목, 복원력 곡선의 저하 형태 및 양상 역시 가뭄의 특성에 맞춰 도출되어야 한다. 본 연구에서는 지자체별 극한가뭄에 대한 복원력 정량화를 위하여 가뭄과 관련된 내구성, 대체성, 신속성, 자원동원력의 세부인자를 정성인자와 정량인자로 구분하여 총 18개 항목으로 구성하였다. 구성된 18가지 항목이 정량인자 뿐만 아니라 정성인자로 구성됨에 따라, 모든 인자를 동일한 가중치로 평가할 경우 최종결과가 상대적 중요도의 미 고려로 인해 왜곡될 가능성이 존재한다. 따라서 계층적분석기법(AHP, Analytic Hierarchy Process)을 통해 내구성, 대체성, 신속성, 그리고 자원동원력에 대한 가중치와 내구성, 대체성, 그리고 신속성에 대한 세부 지표별 가중치를 도출하여 지역별 메가가뭄 복원력을 정량화 하였다. 분석결과를 동일한 가중치를 적용한 결과와 비교분석하였으며, 과거 가뭄사례를 통해 검토하였다.

  • PDF