• 제목/요약/키워드: 가중치분석

검색결과 2,161건 처리시간 0.029초

퍼지 가중치 평균 분류기를 위한 통계적 정보 기반의 가중치 설정 방안 (Weight Adjustment Methods Based on Statistical Information for Fuzzy Weighted Mean Classifiers)

  • 신상호;조재현;우영운
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.25-30
    • /
    • 2009
  • 패턴 인식에서 분류기 모형으로 많이 사용되는 퍼지 가중치 평균 분류기는 가중치를 적절히 설정함으로써 뛰어난 분류 성능을 얻을 수 있다는 장점이 있다. 그러나 일반적으로 가중치는 인식 문제 분야의 특성이나 해당 전문가의 지식이나 주관적 경험을 기반으로 설정되므로 설정된 가중치의 일관성과 객관성을 보장하기가 어려운 문제점을 갖고 있다. 따라서 이 논문에서는 퍼지 가중치 평균 분류기의 가중치를 설정하기 위한 객관적 기준을 제시하기 위하여 특징값들 간의 통계적 정보를 이용한 가중치 설정 기법들을 제안하였다. 제안한 기법들을 이용하여 UCI machine learning repository 사이트에서 제공되는 표준 데이터들 중의 하나인 Iris 데이터 세트를 이용하여 실험하고 그 결과를 비교, 분석하였다.

  • PDF

희귀 목적값 분류를 위한 학습 알고리즘 (A New Learning Algorithm for Rare Class Classification)

  • 이광호;이창환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.39-42
    • /
    • 2006
  • 본 논문에서는 데이터 마이닝에서 발생되는 희귀 데이터를 분석하기 위한 희귀 목적값 분석의 새로운 알고리즘을 제시한다. 이를 위하여 속성들이 가지는 속성의 가중치 값과 속성값이 목적 속성에 미치는 가중치값을 정보이론에 입각하여 가중치 계산을 하고, 계산된 가중치값을 사용하여 스코어링 함으로써 희귀 목적값에 속한 데이터 예측/분류에 사용하는 방법을 제시하였다. 실험을 통해 본 알고리즘의 성능을 입증함은 물론 제안된 알고리즘이 희귀 데이터의 분류/학습에 좀 더 효과적이다는 것을 보였다.

  • PDF

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

Use Case 및 클래스의 가중치 분석에 의한 컴포넌트 추출 기법 (Component Extraction Method Using Weight Analysis between Use Cases and Classes)

  • 유영란;김수동
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권8호
    • /
    • pp.537-549
    • /
    • 2001
  • 소프트웨어의 생산성과 유지보수 비용을 줄여줄 수 있는 기법으로 다양한 컴포넌트 기반의 개발 방법론이 제안되고 있다. 그러나 컴포넌트 기반의 시스템에서 재사용성과 독립성이 높은 컴포넌트의 식별은 가장 중요한 성공 요소 중의 하나임에도 불구하고, 대부분의 컴포넌트 기반 방법론들에서는 직관적이고 분석자의 경험에 의존적인 컴포넌트 식별 방법만을 제공하고 있을 따름이다. 본 논문에서는 분석 단계의 산출물인 시스템의 기능 모델 Use Case 모델과 자료 모델인 클래스 모델에 기반 하여 체계적인 컴포넌트 식별 기법과 지침들을 제안한다. 먼저 클래스에 대한 Use Case의 자료 접근값을 정의하고, 정의된 접근값을 기반으로 Use Case별로 접근되는 클래스의 가중치와 클래스별 동일 접근값을 가지는 Use Case들의 가중치를 계산하다. 두 가중치를 곱하여 최종적인 Use Case&클래스 가중치를 계산하여 후보 컴포넌트 식별의 기준으로 삼는다.

  • PDF

잠재적 위험요인의 탐색에 관한 단일표본분석과 복합표본분석의 비교 (Comparative Analysis of Unweighted Sample Design and Complex Sample Design Related to the Exploration of Potential Risk Factors of Dysphonia)

  • 변해원
    • 한국산학기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.2251-2258
    • /
    • 2012
  • 본 연구는 잠재적 위험요인을 탐색하는 방법으로 단순임의추출분석(unweighted sample design), 빈도 가중치를 적용한 단일표본분석(frequency weighted sample design), 가중치를 층화하여 적용한 복합표본분석(complex sample design)을 비교하고, 도출된 결과에 통계적인 차이가 있는지를 파악하고자 수행되었다. 자료원은 2009 국민건강영양조사의 이비인후과 검진 자료를 이용하였다. 분석 방법은 피어슨의 교차검정(Pearson chi-square test)과 라오-스콧교차검정(Rao-scott chi-square test)을 이용하였다. 분석 결과, 빈도 가중치만을 적용한 단일표본분석의 경우에는 모든 변수가 유의한 위험요인으로 과대 예측 되었고, 가중치를 적용하지 않은 단순임의추출 분석과 복합표본분석은 유의수준 및 결과에 차이가 있었다. 국가통계자료를 이용할 때, 연구의 결과가 전체 인구집단을 대표할 수 있도록 의미를 부여하기 위해서는 층화변수와 집락변수를 사용하여 가중치를 적용하는 복합표본분석이 필요하다. 나아가, 빈도 가중치만을 적용하는 경우에는 연구 결과에 대한 과잉해석의 가능성이 높기 때문에 각별한 주의가 요구된다.

데이터마이닝에서 교사학습에 의한 속성 가중치 최적화 (Supervised Feature Weight Optimization for Data Mining)

  • 강명구;차진호;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2001
  • 최근 군집화와 분류기법이 데이터 마이닝에 중요한 도구로 많은 응용분야에 사용되고 있다. 따라서 이러한 기법을 이용하는데 있어서 각각의 속성의 중요도가 달라 중요하지 않은 속성에 의해 중요한 속성이 왜곡되거나 때로는 마이닝의 결과가 잘못되는 결과를 얻을 수 있으며, 또한 전체 데이터를 사용할 경우 마이닝 과정을 저하시키는 문제로 속성 가중치과 속성선택에 과한 연구가 중요한 연구의 대상이 되고 있다. 최근 연구되고 있는 알고리즘들은 사용자의 의도와는 상관없이 데이터간의 관계에만 의존하여 가중치를 설정하므로 사용자가 마이닝 결과를 쉽게 이해하고 분석할 수 없는 문제점을 안고 있다. 본 논문에서는 클래스 정보가 있는 데이터뿐 아니라 클래스 정보가 없는 데이터를 분석할 경우 사용자의 의도에 따라 학습할 수 있도록 각 가중치를 부여하는 속성가중치 알고리즘을 제안한다. 또한 사용자가 의도한 정보를 이용하여 속성간의 가장 최적화 된 가중치를 찾아주며, Cramer's $V^2$함수를 적합도 함수로 하는 유전자 알고리즘을 사용한다. 알고리즘의 타당성을 검증하기 위해 전자상거래상의 실험 데이터와 몇 가지 벤치마크 데이터를 이용하여 본 논문의 타당성을 보인다.

  • PDF

가중치를 고려한 전력시스템의 안전도 지수에 관한 연구 (The Advanced Power System Security Index Considering weighting factors)

  • 송성환;정승완;문승일;윤용태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 하계학술대회 논문집 A
    • /
    • pp.79-81
    • /
    • 2004
  • 본 논문에서는 전력시스템의 정적 안전도수준(Steady-state Security Level)을 평가할 수 있는 안전도 지수를 전력시스템의 영향을 반영하는 가중치를 고려하여 보다 개선된 안전도 지수를 제안한다. 먼저, N-1선로사고를 가정하여 각 선로가 계통에 미치는 영향과 각 선로의 사고로 인해 모선 전압의 변동량을 분석하여 각각 안전도 지수들의 가중치를 산정한다. 이때, 가중치의 표준화를 위해 분포도(Distribution Chart)를 활용한다. 가중치가 적용된 안전도 지수는 이를 고려하지 않은 안전도 지수보다 더욱 계통상황을 잘 반영할 것이며, 전력계통 운영 상태를 나타내는 중요한 지표로서 활용될 수 있을 것이다.

  • PDF

균일분포 신경회로망을 이용한 얼굴인식 시스템 (School of Electronic and Electrical Engineering, Hong Ik University)

  • 조성원;박준하
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 춘계학술대회 학술발표 논문집
    • /
    • pp.171-175
    • /
    • 1997
  • 본 논문에서는 LVQ(Learning Vector Quentization) 신경회로망의 새로운 가중치 초기화법을 제안하고 이를 얼굴인식 시스템에 적용하였다. 제안한 방법은 초기가중치를 패턴 결정 경계면 주변에 설정함으로써 인식율을 높이는 방법이다. 얼굴인식의 특징 추출 방법으로서는 주성분 분석, 모멘트, 푸리에 기술자, 모멘트+주성분 분석 및 푸리에 기술자+주성분 분석 등을 사용하여 실험하였으며, 인식부의 LVQ 신경회로망에 제안된 방법을 적용하여 기존의 방법과 비교 실험하였다. 실험 결과 초기가중치를 최초 패턴으로 가지는 경우, 평균값을 취하는 경우, 랜덤하게 사용하는 경우 등에 비해서 우수한 인식율을 보임을 알 수 있었다.

  • PDF

공간정보기술을 이용한 산사태 위험도 매핑 (Landslide Danger Mapping using Spatial Information Technology)

  • 조명희;조윤원;김성재
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2008년도 정기총회 및 학술발표대회
    • /
    • pp.353-356
    • /
    • 2008
  • 최근 대규모 산림재해로 인한 산림환경 훼손 및 산림 농가의 피해는 물론 산림생태계에도 나쁜 영향을 미치고 있으며 이는 사회적으로 매우 민감한 환경문제로서 국민의 주요 관심사가 되고 있다. 본 연구에서는 울진군 전체를 대상으로 GIS 및 RS 기법을 이용하여 다양한 산사태 관련 인자들을 추출 하여 이를 기반으로 GIS 중첩 및 가중치 분석을 통하여 울진군의 산사태 발생 가능 위험지역의 분포도를 작성하고자 한다.

  • PDF

지역별 메가가뭄 복원력 정량화를 위한 AHP기반 인자 가중치 결정 (Determination of AHP-based factor weights for quantification of regional mega-drought resilience)

  • 이찬욱;문기훈;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.361-361
    • /
    • 2021
  • 가뭄의 경우 타 자연재난에 비해 발생경로, 피해범위, 발생기간 등이 매우 다양해 다각적인 측면에서의 대응책 마련이 필요하다. 따라서, 극한가뭄에 대비한 지자체별 가뭄 역량 평가를 수행하는 것은 재난관리에 있어서 최우선이라고 할 수 있다. 현재 국내외적으로 가뭄과 관련된 지역적 복원력을 평가한 사례는 매우 적다. 가뭄은 지진, 홍수 등과 같은 타 자연재난에 비하여 지속기간이 길고, 그 지속기간에 따라 피해의 영향 또한 파급력이 달라지므로 복원력 산정을 위한 항목, 복원력 곡선의 저하 형태 및 양상 역시 가뭄의 특성에 맞춰 도출되어야 한다. 본 연구에서는 지자체별 극한가뭄에 대한 복원력 정량화를 위하여 가뭄과 관련된 내구성, 대체성, 신속성, 자원동원력의 세부인자를 정성인자와 정량인자로 구분하여 총 18개 항목으로 구성하였다. 구성된 18가지 항목이 정량인자 뿐만 아니라 정성인자로 구성됨에 따라, 모든 인자를 동일한 가중치로 평가할 경우 최종결과가 상대적 중요도의 미 고려로 인해 왜곡될 가능성이 존재한다. 따라서 계층적분석기법(AHP, Analytic Hierarchy Process)을 통해 내구성, 대체성, 신속성, 그리고 자원동원력에 대한 가중치와 내구성, 대체성, 그리고 신속성에 대한 세부 지표별 가중치를 도출하여 지역별 메가가뭄 복원력을 정량화 하였다. 분석결과를 동일한 가중치를 적용한 결과와 비교분석하였으며, 과거 가뭄사례를 통해 검토하였다.

  • PDF