• 제목/요약/키워드: 변수가중치

Search Result 363, Processing Time 0.026 seconds

Document Clustering using Term reweighting based on NMF (NMF 기반의 용어 가중치 재산정을 이용한 문서군집)

  • Lee, Ju-Hong;Park, Sun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.4
    • /
    • pp.11-18
    • /
    • 2008
  • Document clustering is an important method for document analysis and is used in many different information retrieval applications. This paper proposes a new document clustering model using the re-weighted term based NMF(non-negative matrix factorization) to cluster documents relevant to a user's requirement. The proposed model uses the re-weighted term by using user feedback to reduce the gap between the user's requirement for document classification and the document clusters by means of machine. The Proposed method can improve the quality of document clustering because the re-weighted terms. the semantic feature matrix and the semantic variable matrix, which is used in document clustering, can represent an inherent structure of document set more well. The experimental results demonstrate appling the proposed method to document clustering methods achieves better performance than documents clustering methods.

  • PDF

Estimation of SOA Weighting Factors for Radar Rainfall Adjustment and Evaluation of Hydrologic Accuracy (레이더강우 보정을 위한 SOA방법의 가중치 산정 및 수문학적 정확성 평가)

  • Noh, Hui-Seong;Kang, Na-Rae;Shin, Hyun-Seok;Kim, Byung-Sik;Kim, Hung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.155-155
    • /
    • 2012
  • 최근 집중호우에 따른 자연재해가 크게 증가하여 수문 및 기상분야에서 강우를 관측 및 예측하기 위한 레이더 활용성이 증대되고 있으며, 이에 따라 정부 각 관련부처에서는 레이더의 도입 및 확충을 위한 방안을 계획 제시하고 있다. 특히, 레이더강우 자료는 수문해석분야에서의 GIS 등 디지털정보를 이용하여 유역매개변수를 추정함에 따라 더 정확하고 상세한 수문자료 확보가 가능하게 되어, 격자기반의 분포형 강우-유출모형 등을 이용하여 수문해석을 하는데 있어 그 활용성이 크게 증가하고 있다. 그러나 레이더강우 자료의 정확성은 아직까지 만족할 만한 수준에 이르지 못하고 있기 때문에, 그 불확실성으로 인하여 레이더강우 자료의 활용 및 적용에 한계를 가지고 있는 실정이다. 본 연구에서는 지상강우를 이용한 레이더강우 보정을 위하여 SOA(Statistical Objective Analysis)보정방법을 이용하였으며, 기존 SOA방법에서의 거리에 따른 가중치($_{kd}$)와 함께 지형(고도)에 따른 가중치($W_{ike}$), 바람의 영향에 따른 가중치($W_{ikw}$)를 추가로 산정하여 적용하였으며, 이를 통하여 보정된 강우장을 생성하였다. SOA방법을 통해 생성된 강우장이 어느 정도의 강우정확도를 가지고 강우분포를 재현하는지 검증하기 위하여 2011년 7~9월의 수문학적 분석에 활용 가능한 강우사상과 낙동강유역을 대상으로, 분포형모형인 $Vflo^{TM}$ 모형을 이용하여 산정된 유출량과 관측 유출량과의 비교를 실시하였다. 또한, 유출량에 대한 오차 및 ME(Model Efficiency)를 통해 레이더강우 자료의 유출모형에서의 효율성을 검토하고자 하였다. 본 연구에서 수행된 보정 강우장에 따른 유출량 비교를 통해 레이더 강우의 정확도에 대한 정량적 평가 방법 도출이 가능할 것으로 판단된다.

  • PDF

Evaluation of the Highway Traffic Safety Exposure Measures (도로교통안전도 비교평가지수 산정연구)

  • Kim, Ki Yong;Kim, Won Chul;Chang, Myungsoon
    • Journal of Korean Society of Transportation
    • /
    • v.31 no.5
    • /
    • pp.26-36
    • /
    • 2013
  • Highway traffic safety evaluation of area on the basis of the accident rate has a limitation, thus its result is dependent on the exposure variables. It works an obstacle to decision making for effective budget execution. In this paper, we developed a methodology of taking simultaneously macroscopic exposure indicators into account in evaluating the safety using least squares method. The weight of exposure indicators to make up of highway traffic safety evaluation index is that accident rate per population, accident rate per registration vehicle and accident rate per length of road is 0.29, 0.52 and 0.19 respectively and calculated the highway traffic safety index of total local governments in Korea. The methodology to calculate highway traffic safety evaluation index proposed in this paper can be utilized in executing the traffic safety policies to increase the efficiency of investment about traffic safety budget.

Comparison of Water Resources Vulnerability Index of South and North Korea Using TOPSIS (TOPSIS를 이용한 남·북한 지역별 기후변화에 대한 수자원 취약성 지수 비교)

  • Song, Jae Yeol;Chung, Eun-Sung;Jeong, Sunghun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.643-643
    • /
    • 2015
  • 최근 북한의 수자원에 대한 관심과 연구가 활발히 이루어지고 있다. 또한, 수자원 취약성과 지속가능한 개발과 관련된 지수에 대한 연구도 꾸준히 이루어지고 있으며, 이 지수를 이용하여 현재 또는 미래의 수자원 취약성을 판단하고 대비하고 있다. 본 연구는 기상청, 통계청, 환경부에서 제공하는 자료 중에서 북한의 지역별 자료의 확보 가능한 자료를 대상으로 기후변화에 대한 기후노출, 민감도, 적응능력을 나타내는 지표들을 선정하여 남한과 북한의 26개 광역자치단체에 대하여 수자원 취약성 순위를 도출하였다. 기후변화를 고려한 지표들은 각각 홍수피해와 물부족을 반영하는 지표인 일최대강수량, 일강수량이 80mm 이상인 날의 수, 연최대 연속강우일수, 3일주기 최대 강수량, 6-9월 강수량, 12-2월 증발산량, 3-5월 증발산량, 12-2월 강수량, 3-5월 강수량, 연속적인 무강우일 수의 최대값, 총인구, 인구밀도를 선택하였으며, 변수들의 가중치 결정은 객관적 가중치 산정 방법인 Shannon의 entropy 기법과 주관적 가중치인 환경부(2012)에서 전문가를 대상으로 유도한 가중치를 적용하여 치수와 이수분야에 대한 취약성을 각각 평가하였다. 수자원 취약성의 정량적 평가를 위하여 TOPSIS (Technique for Order Preference by Similarity to Ideal Solution) 기법을 적용하여 남 북한 지역별 수자원 취약성을 지수화하고 취약성 순위를 도출하였다. 산정된 수자원 취약성 지수가 낮을수록 취약함의 정도가 심각한 것으로 정의할 수 있으며, 연구결과 남 북한을 통틀어서 서울이 가장 취약한 지역으로 나타났으며, 치수 분야에서는 북한의 양강도가 취약성이 낮은 것으로 나타났고, 이수분야에서는 북한의 양강도와 남한의 제주도가 취약성이 낮은 것으로 나타났다. 따라서 본 연구는 남 북한의 지역별 취약성 순위를 통해 우리나라와 북한 수자원의 현황을 제시하며, 미래의 국가 수자원 계획 수립 및 대책을 제시할 수 있는 자료로 활용할 수 있을 것이다.

  • PDF

Analysis of the Effect on Domestic PV Capacity under the REC Revision and Mandatory Supply (REC 개정과 의무공급량이 국내 태양광 설비량에 미치는 영향 분석)

  • Beak, Hun;Kim, Taesung
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.6
    • /
    • pp.139-150
    • /
    • 2021
  • Currently, the RPS(Renewable Portfolio Standard) is the policy which supplies new and renewable energy. Power generation companies with large capacity should produce renewable energy or secure through the purchase of REC (Renewable Energy Certificates) as mandatory. The government has revised the REC weight several times, which weights each energy source by evaluating the economic and social value of renewable energy sources, and revised the mandatory supply ratio to gradually increase. This study helps to find the impact of policies on related industries. In this study, time-series analysis and regression analysis on the capacity of PV(Photovoltaics) facilities as a dependent variable were performed to analyze the effect of the revision of the REC weight for photovoltaic power generation and the amount of mandatory supply for renewable energy. As a result, it was statistically assessed that the revision of the REC weight and the increase in the mandatory supply has a significant effect on the increase in the amount of PV facilities.

Document classification using a deep neural network in text mining (텍스트 마이닝에서 심층 신경망을 이용한 문서 분류)

  • Lee, Bo-Hui;Lee, Su-Jin;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.5
    • /
    • pp.615-625
    • /
    • 2020
  • The document-term frequency matrix is a term extracted from documents in which the group information exists in text mining. In this study, we generated the document-term frequency matrix for document classification according to research field. We applied the traditional term weighting function term frequency-inverse document frequency (TF-IDF) to the generated document-term frequency matrix. In addition, we applied term frequency-inverse gravity moment (TF-IGM). We also generated a document-keyword weighted matrix by extracting keywords to improve the document classification accuracy. Based on the keywords matrix extracted, we classify documents using a deep neural network. In order to find the optimal model in the deep neural network, the accuracy of document classification was verified by changing the number of hidden layers and hidden nodes. Consequently, the model with eight hidden layers showed the highest accuracy and all TF-IGM document classification accuracy (according to parameter changes) were higher than TF-IDF. In addition, the deep neural network was confirmed to have better accuracy than the support vector machine. Therefore, we propose a method to apply TF-IGM and a deep neural network in the document classification.

Numerical Study on Spatial Prediction of Algae Concentration (조류의 공간적 농도 분포 예측을 위한 수치적 연구)

  • Kim, Jun Song;Seo, Il Won;Lyu, Siwan;Kwak, Sunghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.92-92
    • /
    • 2017
  • 본 연구에서는 수치모델을 이용하여 대하천서 발생되는 조류의 공간적 농도 분포를 예측하였고, 현장실험을 통해 모델을 검증하였다. 국내하천은 다수의 지류가 본류로 유입됨에 따라 오염물질의 생산과 공급이 지속적으로 발생하고, 하천의 유로연장과 하폭에 비해 수심이 낮은 지형학적 특성을 지닌다. 따라서 지류 유입 이후 발생되는 조류의 거동 특성을 분석하기 위해 수심 적분된 2차원 이송-확산 모델을 사용하였다. 광합성 성장을 이루는 조류의 성장속도 계산을 위해 영양염류, 수온, 일사량과 수심 등을 변수로 하는 성장속도 함수들을 위의 모델과 결합하였다. 본 연구의 대상구간은 낙동강과 금호강 합류부를 포함한 강정고령보 하류 약 9.2 km 구간으로 모델 검증을 위한 현장실험을 수행하였다. 2차원 이송-확산 모델의 입력 값인 유속 및 수심을 계산하는 수리동역학 모델 검증을 위해 미국 Sontek사의 M9을 이용하여 낙동강과 금호강 각각 32개, 12개 측선에 대하여 수리량을 측정하였다. 수리량 측정결과, 금호강과 낙동강의 평균 유량은 각각 $240m^3/s$, $60m^3/s$로 측정되었고 측정된 유량을 모델의 상류단 경계조건으로 사용하여 측정 유속 및 수심과 유사한 결과를 모델로부터 취득할 수 있었다. 조류 농도 측정을 위해 독일 bbe사의 AlgaeTorch 10을 사용하였으며, 수리량 측정과 동일한 측선서 총 조류 세포수(cells/ml)를 측정하였다. 농도 측정결과, 하류로 내려감에 따라 조류의 농도가 증가하는 경향이 나타났고 금호강 합류 후 최대농도는 측정구간 최하류 우안서 4,460 cells/ml로 나타났다. 주 흐름이 발생하는 하천 중앙부에 비해 유속이 느린 하안서 상대적으로 높은 농도가 측정되었으며, 이와 같은 경향은 하류로 내려감에 따라 강하게 나타났다. 측정된 조류 농도를 이용한 2차원 이송-확산 모델 검증결과, 합류부 최상류 측선서 MAPE = 10.5 %의 최대오차가 발생하였고 최하류 측선서 MAPE = 6.7 %의 최소오차가 발생하였다. 인과 질소와 같은 영양염류의 농도가 높고 횡 방향 수온 분포가 균일한 대상구간의 특성상 영양염류 함수와 수온 함수로부터 계산된 성장속도 가중치 범위는 각각 0.8~1.0, 0.91~1.09로 공간적 변동성이 크게 나타나지 않은 반면, 수심을 변수로 하는 일사량 함수의 성장속도 가중치 범위는 0.05~1.00으로 상대적으로 매우 높은 공간적 변동성이 나타났다. 수심이 4 m 이하인 하천 양안서 0.8 이상의 가중치가 나타났으며, 수심이 7 m 이상인 하천 중앙서 0.4 이하의 가중치가 나타났다. 본 연구의 수치모의 결과, 수리동역학 모델로부터 계산된 수심이 모델 결과 값에 큰 영향을 미치는 것으로 판단된다.

  • PDF

Enhanced Self-Generation Supervised Learning Alrorithm Using ARTI and Delta-Bar-Delta Method (ART1과 Delta-Bar-Delta 방법을 이용한 개선된 자가 생성 지도 학습 알고리즘)

  • 백인호;김태경;김광백
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.71-75
    • /
    • 2003
  • 오류 역전파 학습 알고리즘을 이용하여 영상 인식에 적용 할 경우에는 은닉층의 노드 수를 경험적으로 설정하므로, 학습시간과 지역최소화 및 정체현상이 발생한다. 그리고 ARTI 알고리즘은 입력 패턴과 저장 패턴간의 측정 방법인 유사성 검증 방법과 경계 변수의 설정에 따라 인식률이 좌우된다. 경계 변수의 값이 크면 입력 패턴과 저장 패턴사이에 약간의 차이만 있어도 새로운 카테고리(Category)로 분류하고, 반대로 경계 변수의 값이 적으면 입력 패턴과 저장 패턴 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 패턴들을 대략적으로 분류한다. 따라서 ART1 알고리즘을 영상 인식에 적용하기 위해서는 경계 변수를 경험적으로 설정하므로 인식률에 부정적인 영향을 갖는 문제점이 있다. 따라서 본 논문에서는 개선된 ART1 알고리즘과 지도 학습 방법을 결합하여 신경망의 은닉층 노드를 동적으로 변화시키는 자가 생성지도 학습 알고리즘을 제안한다. 제안된 신경망에서 입력층과 은닉층의 학습 구조에는 ART1 알고리즘을 개선하여 적용하고, 은닉층과 출력층의 학습 구조에는 은닉층에서 승자로 선택된 노드와 출력층 노드와 연결된 가중치만을 조정하고 Delta-Bar-Delta 알고리즘을 적용한다. 제안된 방법의 학습 성능을 분석하기 위하여 학생증 영상에서 추출한 학번 패턴 분류에 적용한 결과, 기존의 신경망 학습 알고리즘보다 학습 성능이 개선됨을 확인하였다.

  • PDF

DEA모형을 이용한 공공기관 효율성분석에 관한 사례연구: 일선우체국을 중심으로

  • Kim, Tae-Ung
    • The Korean Journal of Financial Studies
    • /
    • v.6 no.1
    • /
    • pp.47-65
    • /
    • 2000
  • 효율성은 산출물의 가치와 그 산출물을 창출해 내기 위해 생산과정에서 소비한 투입물 가치의 비율로 나타낸다 투입물이나 산출물의 시장가격이 존재하는 경우 이 값을 가중치로 이용하여 산출물과 투입물의 가치를 계산할 수 있다. 그러나 투입물과 산출물의 종류가 다양한 경우에는 투입물의 가치를 적절히 평가하기가 쉽지 않다. Data Envelopment Analysis(DEA)모형은 효율성을 여러 가지 투입물의 가중평균에 대한 여러 가지 산출요소의 가중평균의 비율로 표시하며, 특정 의사결정단위의 효율성 정도는 유사한 투입 산출구조를 가지는 준거집단과 비교하여 상대적으로 측정하고자 하는 방법이다. 본 논문에서는 DEA모형의 구조와 이론적 근거, 그리고 적용상의 장단점에 대해 알아 본 뒤 국내 일선우체국의 운영자료를 토대로 하여 공공적인 성격을 띠는 기관의 운영효율성 측정에의 적용사례를 제시하였다. 투입자료로는 '98년 우정사업자료를 중심으로 공통영업비, 우편영업비, 금융영업비, 직원수, 관할가구수, 관할면적, 고정자산 등 7개 변수와 우편영업수익, 금융영업수익, 보험수지차, 배달 및 중계 우편물량, 현금출납 취급건수, 연평잔실적의 6개 변수를 각각 투입물과 산출물 변수로 설정하여 모형을 구축하였다. 분석대상으로 삼은 64개 우체국 전체의 효율성 평균은 82.14%으로 나타났으며 DEA모형의 효율성결과와 기존에 이미 발표된 정보통신부 평가결과와의 상관관계는 0.46291로 강하지는 않지만 두 변수간에는 정(正)의 상관관계가 있음을 알 수 있었다.

  • PDF

Calibration of the Ridge Regression Model with the Genetic Algorithm:Study on the Regional Flood Frequency Analysis (유전알고리즘을 이용한 능형회귀모형의 검정 : 빈도별 홍수량의 지역분석을 대상으로)

  • Seong, Gi-Won
    • Journal of Korea Water Resources Association
    • /
    • v.31 no.1
    • /
    • pp.59-69
    • /
    • 1998
  • A regression model with basin physiographic characteristics as independent variables was calibrated for regional flood frequency analysis. In case that high correlations existing among the independent variables the ridge regression has been known to have capability of overcoming the problems of multicollinearity. To optimize the ridge regression model the cost function including regularization parameter must be minimized. In this research the genetic algorithm was applied on this optimization problem. The genetic algorithm is a stochastic search method that mimic the metaphor of natural biological heredity. Using this method the regression model could have optimized and stable weights of variables.

  • PDF