• 제목/요약/키워드: 가중치법

검색결과 599건 처리시간 0.031초

Okapi BM25 단어 가중치법 적용을 통한 문서 범주화의 성능 향상 (A Research on Enhancement of Text Categorization Performance by using Okapi BM25 Word Weight Method)

  • 이용훈;이상범
    • 한국산학기술학회논문지
    • /
    • 제11권12호
    • /
    • pp.5089-5096
    • /
    • 2010
  • 문서 범주화는 정보검색 시스템의 중요한 기능중의 하나로 문서들을 어떤 기준에 의해 그룹화를 하는 것을 말한다. 범주화의 일반적인 방법은 대상 문서에서 중요한 단어들을 추출하고 가중치를 부여한 후에 분류 알고리즘에 따라 문서를 분류한다. 따라서 성능과 정확성은 분류 알고리즘에 의해 결정됨으로 알고리즘의 효율성이 중요하다. 본 논문에서는 단어 가중치 계산 방법을 개선하여 문서분류 성능을 향상시키는 것을 소개하였다. Okapi BM25 단어 가중치법은 일반적인 정보검색분야에서 사용되어 검색 결과에 좋은 결과를 보여주고 있다. 이를 적용하여 문서 범주화에서도 좋은 성능을 보이는지를 실험하였다. 비교한 단어 가중치법에는 가장 일반적인 TF-IDF법와 문서분류에 최적화된 가중치법 TF-ICF법, 그리고 문서요약에서 많이 사용되는 TF-ISF법을 이용하여 4가지 가중치법에 따라 결과를 측정하였다. 실험에 사용한 문서로는 Reuter-21578 문서를 사용하였으며 분류기 알고리즘으로는 Support Vector Machine(SVM)와 K-Nearest Neighbor(KNN)알고리즘을 사용하여 실험하였다. 사용된 가중치법 중 Okapi BM25 법이 가장 좋은 성능을 보였다.

레이더 자료를 이용한 시공간적 변동성을 고려한 강우의 결측치 추정 (Estimation of Missing Rainfall Data Considering Spatio-Temporal Variation Using Radar Data)

  • 송창우;송창준;김병식;;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1196-1200
    • /
    • 2010
  • 본 논문에서는 지점 강우의 결측치를 추정하기 위해 전통적인 통계학적 내삽기법을 이용한 역거리가중치법(IDWM), 역지수가중치법(IEWM), 상관계수가중치법(CCWM)과 패턴 인식의 일종인 인공신경망(ANN)기법 그리고 시공간적 강우분포의 측정이 가능한 레이더 자료를 이용해 결측치를 추정하여 각각의 방법을 비교하였다. 임진강 유역의 15개 지상관측소를 대상으로 교차검정(Cross validation) 분석을 실시해 본 결과, CCWM 방법과 ANN기법에 의한 RMSE가 0.46~1.79의 범위를 보였고, 보정레이더를 이용하여 결측치를 추정한 경우RMSE가 0.05~2.26의 범위를 보여 기존의 전통적 결측치 추정방법보다 실측치에 가까운 결과를 보였다. 이는 레이더자료가 지점 강우자료와는 달리 강우의 시공간적 변동성을 고려한 공간분포의 정보를 지니고 있기 때문인 것으로 판단된다.

  • PDF

홍수위험도 평가인자의 가중치 추정 (Estimation of Weights for Flood Vulnerability Indicators)

  • 이규민;정은성;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.415-415
    • /
    • 2012
  • 유역의 홍수위험도를 평가하기 위하여 선행 연구로서 DPSIR framework를 적용한 인자를 선정하였다. 이때 인자의 범위를 사회적, 경제적, 환경적 분야로 구분하고 각 분야에 대하여 홍수로 인하여 야기되는 유역의 다양한 영향요소를 포함하여 인자를 선정하였다. 본 연구에서는 이를 대상으로 각 인자의 가중치를 선정하기 위하여 패널식 조사연구기법인 Delphi 방법을 적용하였다. Delphi 기법은 델파이 절차가 반복되는 동안 조사 참여자에게 전회의 조사 결과, 즉 통계적 집단 반응을 피드백하며 참여자는 이를 참고하여 자신의 판단을 수정 보완 할 수 있는 방법이다. 따라서 1차 설문조사를 통하여 각 패널은 홍수위험도 평가 인자에 대해서 주관적인 가중치를 선정하고 이를 분석한 결과를 피드백 받아 참고한 후 2차 설문조사에 응하여 가중치를 재선정하게 된다. 조사에 참여할 패널의 선정은 수자원분야의 전문가를 대상으로 하였다. 또한 각 인자에 대한 가중치를 수집하는 방법을 다양하게 설정하여 기법에 따른 영향을 검토하였다. 수집기법은 상대적 가중치 결정법 중에서 가장 많이 사용되는 순위법과 직접입력법, 절대적인 기준에 대한 가중치를 수집하기 위하여 Fuzzy 가중치 입력법을 사용하였으며 이 때 각 인자가 소속되는 분야와 DPSIR framework 요소에 대해서도 별도로 가중치를 수집하여 최종적인 인자의 가중치를 결정하였다. 본 연구는 추가 연구를 통해 남한강에 적용되며 인자의 자료는 문헌조사, 통계자료 조사 및 수리학적 수치모형 등의 분석을 통해 수집될 예정이다. 이를 통하여 사회, 경제, 문화, 환경적인 측면을 고려한 인자들을 반영한 하천의 구간별 상대적 홍수취약도를 정량적으로 제시할 수 있으며 하천 구간별 치수관리 우선순위를 결정하는데 적극적으로 활용될 수 있다.

  • PDF

차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구 (A Study on Weighted Spectral Subtraction Using Adaptive Threshold In Car Noise Environment)

  • 전선도
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.185-188
    • /
    • 1998
  • 실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구 (A Study on Weighted Spectral Subtraction Using Adaptive Threshold in Car Noise Environment)

  • 전선도;강철호;김종찬;김순협
    • 한국음향학회지
    • /
    • 제17권8호
    • /
    • pp.73-77
    • /
    • 1998
  • 본 연구는 자동차내 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재 한다. 이러한 이유는 본 연구는 잡음 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화시키는 차감법을 제안한다. 이 방법은 추정된 잡음 신호의 변화율을 이용하 여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 적용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

시공간적 변동성을 고려한 강우의 결측치 추정 방법의 비교 (The Comparison of Estimation Methods for the Missing Rainfall Data with spatio-temporal Variability)

  • 김병식;노희성;김형수
    • 한국습지학회지
    • /
    • 제13권2호
    • /
    • pp.189-197
    • /
    • 2011
  • 본 논문에서는 지상강우의 결측치를 추정하는 방법들 중 역거리 가중치법(IDWM), 역지수 가중치법(IEWM), 상관계수가중치법(CCWM), 인공신경망(ANN)기법, 레이더 자료를 이용한 결측치 추정 방법을 비교하여 각각의 적용성을 검토하였다. 임진강 유역을 대상지역으로 하여 각 방법을 적용한 결과, 강우의 결측치 추정에 있어서 기존의 방법 중 상관계수 가중치법(CCWM)과 인공신경망(ANN)기법에 의한 RMSE가 0.46~1.79의 범위를 보였고, 레이더자료를 이용하여 강우의 결측치를 추정한 경우 RMSE가 0.05~2.26의 범위를 보였다. 레이더 강우자료가 지점 강우자료와 달리 강우의 공간상관성을 반영하고 있음을 볼 때, 지점강우 자료를 이용한 결측치 추정 기법보다 레이더자료를 이용한 결측치의 추정기법이 그 적용성에서 우수하다고 판단되어진다.

2-점 보간법 필터에서의 가중치 결정 (Determining of Weighting Factor for Two-Point Interpolation Filters)

  • 하미령;유훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.217-219
    • /
    • 2013
  • 본 논문은 다양한 값의 가중치간 적용한 두 포인트 보간 필터를 제안한다. 기존 방법은 선행 보간 필터에 변형 함수와 가중치를 적용한 일반선행 보간 공식을 이용해 영상의 화질을 향상시켰지만 제안된 보간법은 일반 선형 보간 공식에 가중치 값을 다양하게 적용하여 2 점 보간법에서 실질적인 가중치 결정을 제공한다. 실험 결과에서는 제안된 방법이 기존 보간법보다 더 우수한 성능을 보여주는 것을 알 수 있다.

  • PDF

RMS-AV 검파 방식과 가전기기 적용에 대한 고려

  • 김인석;조희곤;안희성
    • 한국전자파학회지:전자파기술
    • /
    • 제22권1호
    • /
    • pp.52-62
    • /
    • 2011
  • 본고에서는 최근 디지털 통신 시스템에 대한 국제 표준으로 도입된 RMS-AV 가중치 측정법을 CISPR F쪽으로의 도입 문제가 거론되는 상황에서 현존하는 가중치 측정법에 관련된 기본적인 내용을 검토하고, 참고문헌 [13]에서 제시하였던 방법을 이용하여 와인 냉장고와 두 종류의 전기 드릴에 대하여 RMS-AV 가중치 측정법을 전도성 방출 특성과 복사성 방출 특성을 AM 방송 송출시, 방송 중단 시, 차폐 실내 등의 다양한 환경에서 측정하여 EMI 수신기에서 적용되고 있는 가중치를 실험적으로 비교하였다. 비교 결과, 다양한 가중치 측정법이 동일한 결과를 제시하지 못하여 RMS-AV 측정법이 CISPR F쪽으로의 도입은 좀 더 연구가 필요한 주제로 판단되었고, 결론 부분에서 RMS-AV 측정법에 대한 여러 가지 문제점을 고려해 보았다.

새로운 거리 가중치와 지역적 패턴을 고려한 적응적 선형보간법 (Adaptive Linear Interpolation Using the New Distance Weight and Local Patterns)

  • 김태양;전영균;정제창
    • 한국통신학회논문지
    • /
    • 제31권12C호
    • /
    • pp.1184-1193
    • /
    • 2006
  • 영상 보간은 영상 처리 분야에서 전통적으로 많이 연구되어 왔고 널리 사용되고 있다. 그에 따라 다양한 보간 능력과 계산 복잡도를 갖는 보간법들이 많이 시도되고 있다. 이 논문에서는 기존의 선형 보간법을 위한 새로운 거리 가중치 개념과 보간되는 값의 상하, 좌우 지역적 패턴을 고려하여 반영하는 적응적 선형 보간법(New Adaptive Linear Interpolation : NAL Interpolation)을 제안한다. 새로운 거리 가중치는 기존의 거리에 선형적으로 비례하는 가중치의 개념에서 벗어나 가까운 화소에 더욱 더 영향을 많이 받는 특성을 이용하여 거리 가중치를 2차, 3차 다항식으로 개선한 것이다. 또한 NAL 보간법은 보간되는 화소의 상하, 좌우 패턴을 고려하는 선형 보간법으로 MF(magnification factor)의 변화에 따라 보다 선명한 이미지를 쉽게 얻기 위해서 보간하기 전 MF에 따라 패턴을 반영하는 정도를 결정하는 패턴 가중치를 이용한다. 실험 결과에서 제안된 보간법은 계산 복잡도 면에서 기존의 bicubic 보간법 보다 훨씬 간단할 뿐만 아니라 더 좋은 PSNR(peak signal-to-noise ratio)를 갖고 보다 선명한 화질의 영상으로 보간하였다.

전산감리의 항목별 연관관계가 계량화에 미치는 영향에 관한 연구 (A Study on the Effect of the Relation-by-Item of the Computer Audit to the Quantification)

  • 신승중;김현수
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.435-444
    • /
    • 1999
  • 현재까지 연구되고 있던 정보보호관련분야의 계량화방법을 좀 더 다른 방법으로 접근하여, 정보시스템 환경 하에서 보안 및 관리 운영 평가 지수에 계량화하여 1차 집단과 2차 집단간의 차이를 연구하였다. 정보화 관련항목에 대하여 빈도 분석을 적용함으로서 군별, 항목별 분류를 통한 항목 비례 가중치법을 산출하였다. 또한, 선지정 가중치법을 이용하여, 보호지수와 관리운용지수에 따른 상관관계를 조사하여 안전관리 지수를 계량화하였다.

  • PDF