• 제목/요약/키워드: 변수가중치

검색결과 365건 처리시간 0.027초

표본조사에서 무응답 가중치 조정층 구성방법에 따른 효과 (Forming Weighting Adjustment Cells for Unit-Nonresponse in Sample Surveys)

  • 김영원;남시주
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.103-113
    • /
    • 2009
  • 표본조사에서 무응답은 비 표본추출오차를 발생시키는 중요한 원인 중 하나이다. 단위무응답이 발생하는 경우 무응답에 의한 편향을 줄이는 동시에 추정의 정도를 향상시키기 위해 단위무응답 조정층을 구성해 무응답 가중치 조정을 하는 것이 일반적이다. 본 연구에서는 무응답 조정층 구성과 관련된 기존의 이론들을 정리하고 어업총조사 자료를 이용한 실증적인 모의실험을 통해 효과적으로 무응답 조정층을 구성하는 방안에 대해 살펴본다. 모의실험결과 응답성향에 따른 조정층 구성보다는 예측평균을 기준으로 한 조정층 구성이 효율성 측면에서 효과적인 것으로 나타났으며, 아울러 다른 관심변수에도 적용될 수 있는 로버스트한 조정층 구성을 위해서는 예측평균만을 고려하는 것보다 응답성향과 예측평균을 모두 고려한 조정층 구성방법이 효과적인 것으로 나타났다. 한편 무응답 조정을 위한 응답률 산출에 있어서 설계가중치의 적용 필요성에 대해 살펴본 결과 설계가중치 적용 여부는 추정결과에 거의 영향을 주지 않는다는 사실을 확인할 수 있었다.

NMF 기반의 용어 가중치 재산정을 이용한 문서군집 (Document Clustering using Term reweighting based on NMF)

  • 이주홍;박선
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.11-18
    • /
    • 2008
  • 문서군집은 정보검색의 많은 응용분야에 사용되는 중요한 문서 분석 방법이다. 본 논문은 비음수 행렬 분해(NMF, non-negative matrix factorization)를 기반한 용어 가중치 재산정 방법을 이용하여서 사용자의 요구에 적합한 군집결과를 얻도록 하는 새로운 군집모델을 제안한다. 제안된 모델은 군집형태에 대한 사용자 요구와 기계에 의한 군집 형태의 차이를 최소화하기 위하여 사용자 피드백에 의한 가중치가 재계산된 용어를 이용한다. 또한 제안방법은 용어의 가중치 재계산과 문서군집에 문서집합의 내부구조를 나타내는 의미특징행렬과 의미변수행렬 이용하여 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 적용하지 않은 문서군 방법에 비하여 좋은 성능을 보인다.

  • PDF

레이더강우 보정을 위한 SOA방법의 가중치 산정 및 수문학적 정확성 평가 (Estimation of SOA Weighting Factors for Radar Rainfall Adjustment and Evaluation of Hydrologic Accuracy)

  • 노희성;강나래;신현석;김병식;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.155-155
    • /
    • 2012
  • 최근 집중호우에 따른 자연재해가 크게 증가하여 수문 및 기상분야에서 강우를 관측 및 예측하기 위한 레이더 활용성이 증대되고 있으며, 이에 따라 정부 각 관련부처에서는 레이더의 도입 및 확충을 위한 방안을 계획 제시하고 있다. 특히, 레이더강우 자료는 수문해석분야에서의 GIS 등 디지털정보를 이용하여 유역매개변수를 추정함에 따라 더 정확하고 상세한 수문자료 확보가 가능하게 되어, 격자기반의 분포형 강우-유출모형 등을 이용하여 수문해석을 하는데 있어 그 활용성이 크게 증가하고 있다. 그러나 레이더강우 자료의 정확성은 아직까지 만족할 만한 수준에 이르지 못하고 있기 때문에, 그 불확실성으로 인하여 레이더강우 자료의 활용 및 적용에 한계를 가지고 있는 실정이다. 본 연구에서는 지상강우를 이용한 레이더강우 보정을 위하여 SOA(Statistical Objective Analysis)보정방법을 이용하였으며, 기존 SOA방법에서의 거리에 따른 가중치($_{kd}$)와 함께 지형(고도)에 따른 가중치($W_{ike}$), 바람의 영향에 따른 가중치($W_{ikw}$)를 추가로 산정하여 적용하였으며, 이를 통하여 보정된 강우장을 생성하였다. SOA방법을 통해 생성된 강우장이 어느 정도의 강우정확도를 가지고 강우분포를 재현하는지 검증하기 위하여 2011년 7~9월의 수문학적 분석에 활용 가능한 강우사상과 낙동강유역을 대상으로, 분포형모형인 $Vflo^{TM}$ 모형을 이용하여 산정된 유출량과 관측 유출량과의 비교를 실시하였다. 또한, 유출량에 대한 오차 및 ME(Model Efficiency)를 통해 레이더강우 자료의 유출모형에서의 효율성을 검토하고자 하였다. 본 연구에서 수행된 보정 강우장에 따른 유출량 비교를 통해 레이더 강우의 정확도에 대한 정량적 평가 방법 도출이 가능할 것으로 판단된다.

  • PDF

도로교통안전도 비교평가지수 산정연구 (Evaluation of the Highway Traffic Safety Exposure Measures)

  • 김기용;김원철;장명순
    • 대한교통학회지
    • /
    • 제31권5호
    • /
    • pp.26-36
    • /
    • 2013
  • 지역단위 도로교통안전도에 대한 거시적 평가는 인구, 자동차대수, 도로연장 등의 거시적 노출변수(Macroscopic Exposure Measures)에 기반한 사고율을 노출지표로 이용하는 것이 일반적이나, 노출지표를 이용한 도로교통안전도 평가에 노출지표들이 미치는 영향이 각기 다르기 때문에 결과적으로 각각의 개별노출지표별 평가시 평가결과가 서로 상이하게 되는 문제가 있으며, 이는 예산투자의 효율적 집행을 위한 교통안전정책의 결정과정에 방해요인으로 작용하게 된다. 따라서 본 연구에서는 최소제곱법 및 가중치를 일정단위로 변화시키는 시뮬레이션을 이용하여 노출지표별 최적의 가중치를 도출하였으며, 이를 종합적으로 반영할 수 있는 도로교통안전도 비교평가지수 산정방법을 개발하였다. 지수를 구성하는 노출지표별 가중치는 인구당사고율이 0.29, 자동차등록대수당사고율이 0.52, 도로연장당 사고율이 0.19로 도출되었으며, 개발된 방법을 적용하여 전국 기초지자체별로 도로교통안전도 비교평가지수를 산정하였다. 본 연구에서 제시한 방법을 통해 노출지표별로 평가결과가 상이해지는 문제를 해결할 수 있으며, 교통안전예산의 투자효율성을 높이기 위한 교통안전정책의 합리적인 결정방법으로 활용될 수 있을 것으로 판단된다.

TOPSIS를 이용한 남·북한 지역별 기후변화에 대한 수자원 취약성 지수 비교 (Comparison of Water Resources Vulnerability Index of South and North Korea Using TOPSIS)

  • 송재열;정은성;정성훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.643-643
    • /
    • 2015
  • 최근 북한의 수자원에 대한 관심과 연구가 활발히 이루어지고 있다. 또한, 수자원 취약성과 지속가능한 개발과 관련된 지수에 대한 연구도 꾸준히 이루어지고 있으며, 이 지수를 이용하여 현재 또는 미래의 수자원 취약성을 판단하고 대비하고 있다. 본 연구는 기상청, 통계청, 환경부에서 제공하는 자료 중에서 북한의 지역별 자료의 확보 가능한 자료를 대상으로 기후변화에 대한 기후노출, 민감도, 적응능력을 나타내는 지표들을 선정하여 남한과 북한의 26개 광역자치단체에 대하여 수자원 취약성 순위를 도출하였다. 기후변화를 고려한 지표들은 각각 홍수피해와 물부족을 반영하는 지표인 일최대강수량, 일강수량이 80mm 이상인 날의 수, 연최대 연속강우일수, 3일주기 최대 강수량, 6-9월 강수량, 12-2월 증발산량, 3-5월 증발산량, 12-2월 강수량, 3-5월 강수량, 연속적인 무강우일 수의 최대값, 총인구, 인구밀도를 선택하였으며, 변수들의 가중치 결정은 객관적 가중치 산정 방법인 Shannon의 entropy 기법과 주관적 가중치인 환경부(2012)에서 전문가를 대상으로 유도한 가중치를 적용하여 치수와 이수분야에 대한 취약성을 각각 평가하였다. 수자원 취약성의 정량적 평가를 위하여 TOPSIS (Technique for Order Preference by Similarity to Ideal Solution) 기법을 적용하여 남 북한 지역별 수자원 취약성을 지수화하고 취약성 순위를 도출하였다. 산정된 수자원 취약성 지수가 낮을수록 취약함의 정도가 심각한 것으로 정의할 수 있으며, 연구결과 남 북한을 통틀어서 서울이 가장 취약한 지역으로 나타났으며, 치수 분야에서는 북한의 양강도가 취약성이 낮은 것으로 나타났고, 이수분야에서는 북한의 양강도와 남한의 제주도가 취약성이 낮은 것으로 나타났다. 따라서 본 연구는 남 북한의 지역별 취약성 순위를 통해 우리나라와 북한 수자원의 현황을 제시하며, 미래의 국가 수자원 계획 수립 및 대책을 제시할 수 있는 자료로 활용할 수 있을 것이다.

  • PDF

REC 개정과 의무공급량이 국내 태양광 설비량에 미치는 영향 분석 (Analysis of the Effect on Domestic PV Capacity under the REC Revision and Mandatory Supply)

  • 백훈;김태성
    • 한국융합학회논문지
    • /
    • 제12권6호
    • /
    • pp.139-150
    • /
    • 2021
  • 현재 국내 신재생에너지 보급 정책은 RPS(Renewable Portfolio Standard; 공급의무화제도)이다. 대용량 발전사업자는 신재생 의무공급량을 직접 생산하거나 REC(Renewable Energy Certificates; 공급인증서) 구매를 통해서 확보한다. 정부는 신재생 에너지원의 경제적, 사회적 가치를 평가하여 각 에너지원에 가중치를 매기는 REC 가중치를 여러 차례 개정했으며 의무공급 비율도 점차 증가하도록 개정했다. 본 연구는 정부의 정책이 관련 산업에 미치는 영향을 확인하는 데 도움이 된다. 태양광발전에 관한 REC 가중치 개정과 신재생 의무공급량이 태양광 설비량에 미치는 영향을 분석하기 위해 태양광 설비량을 종속변수로 시계열 분석과 의무공급량에 대한 회귀분석을 수행하였다. 결과적으로 REC 가중치 개정과 의무공급량 증가는 태양광 설비량 증가에 유의미한 영향을 미친다는 것을 확인하였다.

텍스트 마이닝에서 심층 신경망을 이용한 문서 분류 (Document classification using a deep neural network in text mining)

  • 이보희;이수진;최용석
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.615-625
    • /
    • 2020
  • 문서-용어 빈도행렬은 그룹정보가 존재하는 문서들의 용어를 추출한 것으로 일반적인 텍스트 마이닝에서의 자료이다. 본 연구에서는 연구 분야 성격에 따른 문서 분류를 위해 문서-용어 빈도행렬을 생성하고, 전통적인 용어 가중치 함수인 TF-IDF와 최근 잘 알려진 용어 가중치 함수인 TF-IGM을 적용하였다. 또 용어 가중치가 적용된 문서-용어 가중행렬에 문서분류 정확도 향상을 위해 핵심어를 추출하여 문서-핵심어 가중행렬을 생성하였다. 핵심어가 추출된 행렬을 바탕으로, 심층 신경망을 이용해 문서를 분류하였다. 심층 신경망에서 최적의 모델을 찾기 위해 매개변수인 은닉층과 은닉노드수를 변화해가며 문서 분류 정확도를 확인하였다. 그 결과 8개의 은닉층을 가진 심층 신경망 모델이 가장 높은 정확도를 보였으며 매개변수 변화에 따른 모든 TF-IGM 문서 분류 정확도가 TF-IDF 문서 분류 정확도보다 높은 것을 확인하였다. 또한 개별 범주에 대한 문서 분류 분석 결과를 서포트 벡터 머신과 비교했을 때 심층 신경망이 대부분의 결과에서 더 좋은 정확도를 보임을 확인하였다.

조류의 공간적 농도 분포 예측을 위한 수치적 연구 (Numerical Study on Spatial Prediction of Algae Concentration)

  • 김준성;서일원;류시완;곽성현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.92-92
    • /
    • 2017
  • 본 연구에서는 수치모델을 이용하여 대하천서 발생되는 조류의 공간적 농도 분포를 예측하였고, 현장실험을 통해 모델을 검증하였다. 국내하천은 다수의 지류가 본류로 유입됨에 따라 오염물질의 생산과 공급이 지속적으로 발생하고, 하천의 유로연장과 하폭에 비해 수심이 낮은 지형학적 특성을 지닌다. 따라서 지류 유입 이후 발생되는 조류의 거동 특성을 분석하기 위해 수심 적분된 2차원 이송-확산 모델을 사용하였다. 광합성 성장을 이루는 조류의 성장속도 계산을 위해 영양염류, 수온, 일사량과 수심 등을 변수로 하는 성장속도 함수들을 위의 모델과 결합하였다. 본 연구의 대상구간은 낙동강과 금호강 합류부를 포함한 강정고령보 하류 약 9.2 km 구간으로 모델 검증을 위한 현장실험을 수행하였다. 2차원 이송-확산 모델의 입력 값인 유속 및 수심을 계산하는 수리동역학 모델 검증을 위해 미국 Sontek사의 M9을 이용하여 낙동강과 금호강 각각 32개, 12개 측선에 대하여 수리량을 측정하였다. 수리량 측정결과, 금호강과 낙동강의 평균 유량은 각각 $240m^3/s$, $60m^3/s$로 측정되었고 측정된 유량을 모델의 상류단 경계조건으로 사용하여 측정 유속 및 수심과 유사한 결과를 모델로부터 취득할 수 있었다. 조류 농도 측정을 위해 독일 bbe사의 AlgaeTorch 10을 사용하였으며, 수리량 측정과 동일한 측선서 총 조류 세포수(cells/ml)를 측정하였다. 농도 측정결과, 하류로 내려감에 따라 조류의 농도가 증가하는 경향이 나타났고 금호강 합류 후 최대농도는 측정구간 최하류 우안서 4,460 cells/ml로 나타났다. 주 흐름이 발생하는 하천 중앙부에 비해 유속이 느린 하안서 상대적으로 높은 농도가 측정되었으며, 이와 같은 경향은 하류로 내려감에 따라 강하게 나타났다. 측정된 조류 농도를 이용한 2차원 이송-확산 모델 검증결과, 합류부 최상류 측선서 MAPE = 10.5 %의 최대오차가 발생하였고 최하류 측선서 MAPE = 6.7 %의 최소오차가 발생하였다. 인과 질소와 같은 영양염류의 농도가 높고 횡 방향 수온 분포가 균일한 대상구간의 특성상 영양염류 함수와 수온 함수로부터 계산된 성장속도 가중치 범위는 각각 0.8~1.0, 0.91~1.09로 공간적 변동성이 크게 나타나지 않은 반면, 수심을 변수로 하는 일사량 함수의 성장속도 가중치 범위는 0.05~1.00으로 상대적으로 매우 높은 공간적 변동성이 나타났다. 수심이 4 m 이하인 하천 양안서 0.8 이상의 가중치가 나타났으며, 수심이 7 m 이상인 하천 중앙서 0.4 이하의 가중치가 나타났다. 본 연구의 수치모의 결과, 수리동역학 모델로부터 계산된 수심이 모델 결과 값에 큰 영향을 미치는 것으로 판단된다.

  • PDF

ART1과 Delta-Bar-Delta 방법을 이용한 개선된 자가 생성 지도 학습 알고리즘 (Enhanced Self-Generation Supervised Learning Alrorithm Using ARTI and Delta-Bar-Delta Method)

  • 백인호;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.71-75
    • /
    • 2003
  • 오류 역전파 학습 알고리즘을 이용하여 영상 인식에 적용 할 경우에는 은닉층의 노드 수를 경험적으로 설정하므로, 학습시간과 지역최소화 및 정체현상이 발생한다. 그리고 ARTI 알고리즘은 입력 패턴과 저장 패턴간의 측정 방법인 유사성 검증 방법과 경계 변수의 설정에 따라 인식률이 좌우된다. 경계 변수의 값이 크면 입력 패턴과 저장 패턴사이에 약간의 차이만 있어도 새로운 카테고리(Category)로 분류하고, 반대로 경계 변수의 값이 적으면 입력 패턴과 저장 패턴 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 패턴들을 대략적으로 분류한다. 따라서 ART1 알고리즘을 영상 인식에 적용하기 위해서는 경계 변수를 경험적으로 설정하므로 인식률에 부정적인 영향을 갖는 문제점이 있다. 따라서 본 논문에서는 개선된 ART1 알고리즘과 지도 학습 방법을 결합하여 신경망의 은닉층 노드를 동적으로 변화시키는 자가 생성지도 학습 알고리즘을 제안한다. 제안된 신경망에서 입력층과 은닉층의 학습 구조에는 ART1 알고리즘을 개선하여 적용하고, 은닉층과 출력층의 학습 구조에는 은닉층에서 승자로 선택된 노드와 출력층 노드와 연결된 가중치만을 조정하고 Delta-Bar-Delta 알고리즘을 적용한다. 제안된 방법의 학습 성능을 분석하기 위하여 학생증 영상에서 추출한 학번 패턴 분류에 적용한 결과, 기존의 신경망 학습 알고리즘보다 학습 성능이 개선됨을 확인하였다.

  • PDF

DEA모형을 이용한 공공기관 효율성분석에 관한 사례연구: 일선우체국을 중심으로

  • 김태웅
    • 재무관리논총
    • /
    • 제6권1호
    • /
    • pp.47-65
    • /
    • 2000
  • 효율성은 산출물의 가치와 그 산출물을 창출해 내기 위해 생산과정에서 소비한 투입물 가치의 비율로 나타낸다 투입물이나 산출물의 시장가격이 존재하는 경우 이 값을 가중치로 이용하여 산출물과 투입물의 가치를 계산할 수 있다. 그러나 투입물과 산출물의 종류가 다양한 경우에는 투입물의 가치를 적절히 평가하기가 쉽지 않다. Data Envelopment Analysis(DEA)모형은 효율성을 여러 가지 투입물의 가중평균에 대한 여러 가지 산출요소의 가중평균의 비율로 표시하며, 특정 의사결정단위의 효율성 정도는 유사한 투입 산출구조를 가지는 준거집단과 비교하여 상대적으로 측정하고자 하는 방법이다. 본 논문에서는 DEA모형의 구조와 이론적 근거, 그리고 적용상의 장단점에 대해 알아 본 뒤 국내 일선우체국의 운영자료를 토대로 하여 공공적인 성격을 띠는 기관의 운영효율성 측정에의 적용사례를 제시하였다. 투입자료로는 '98년 우정사업자료를 중심으로 공통영업비, 우편영업비, 금융영업비, 직원수, 관할가구수, 관할면적, 고정자산 등 7개 변수와 우편영업수익, 금융영업수익, 보험수지차, 배달 및 중계 우편물량, 현금출납 취급건수, 연평잔실적의 6개 변수를 각각 투입물과 산출물 변수로 설정하여 모형을 구축하였다. 분석대상으로 삼은 64개 우체국 전체의 효율성 평균은 82.14%으로 나타났으며 DEA모형의 효율성결과와 기존에 이미 발표된 정보통신부 평가결과와의 상관관계는 0.46291로 강하지는 않지만 두 변수간에는 정(正)의 상관관계가 있음을 알 수 있었다.

  • PDF