Search | Korea Science

A Study on the Relationship between Class Similarity and the Performance of Hierarchical Classification Method in a Text Document Classification Problem (텍스트 문서 분류에서 범주간 유사도와 계층적 분류 방법의 성과 관계 연구)

Jang, Soojung;Min, Daiki
- The Journal of Society for e-Business Studies
- /
- v.25 no.3
- /
- pp.77-93
- /
- 2020
The literature has reported that hierarchical classification methods generally outperform the flat classification methods for a multi-class document classification problem. Unlike the literature that has constructed a class hierarchy, this paper evaluates the performance of hierarchical and flat classification methods under a situation where the class hierarchy is predefined. We conducted numerical evaluations for two data sets; research papers on climate change adaptation technologies in water sector and 20NewsGroup open data set. The evaluation results show that the hierarchical classification method outperforms the flat classification methods under a certain condition, which differs from the literature. The performance of hierarchical classification method over flat classification method depends on class similarities at levels in the class structure. More importantly, the hierarchical classification method works better when the upper level similarity is less that the lower level similarity.
https://doi.org/10.7838/jsebs.2020.25.3.077 인용 PDF KSCI

Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means (비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약)

Park, Sun;Lee, Ju-Hong
- Journal of KIISE:Software and Applications
- /
- v.35 no.4
- /
- pp.255-264
- /
- 2008
This paper proposes a novel method using K-means and Non-negative matrix factorization (NMF) for topic -based multi-document summarization. NMF decomposes weighted term by sentence matrix into two sparse non-negative matrices: semantic feature matrix and semantic variable matrix. Obtained semantic features are comprehensible intuitively. Weighted similarity between topic and semantic features can prevent meaningless sentences that are similar to a topic from being selected. K-means clustering removes noises from sentences so that biased semantics of documents are not reflected to summaries. Besides, coherence of document summaries can be enhanced by arranging selected sentences in the order of their ranks. The experimental results show that the proposed method achieves better performance than other methods.
PDF KSCI

설계가중치를 이용한 유사 최량선형 비편향 예측

신동윤;신민웅
- Proceedings of the Korean Statistical Society Conference
- /
- 2004.11a
- /
- pp.161-164
- /
- 2004
You 와 Rao (2002)는 소지역 추정시 유사 최량선형 비편향 예측에서 설계 가중 값을 사용하는 방법을 발전시켰다. 특히 소지역 평균들을 추정하기 위하여 유사-최량선형 비편향 예측 추정량을 제안하였다. 우리는 소지역 추정에서 실용적으로 이용되는 몇 가지 추가적인 성질을 연구하였다.
PDF

Development and application of cohesive sediment transport model (점착성 유사의 이동 모형화 및 적용)

Son, Min-Woo;Lee, Guan-Hong
- Proceedings of the Korea Water Resources Association Conference
- /
- 2011.05a
- /
- pp.331-335
- /
- 2011
흔히 진흙으로 불리는 점착성 유사는 모래 등의 비점착성 유사와는 다른 특성을 보인다. 가장 큰 특징은 점착력에 의해 서로 엉겨 붙어 큰 덩어리(플럭)를 형성하고 다시 큰 플럭이 파괴되는 과정인 응집현상(Flocculation Process)을 보인다는 것이다. 이 응집현상의 과정을 통해 플럭은 크기 및 밀도를 지속적으로 변화시킨다. 크기 및 밀도의 변화는 플럭의 침강속도를 변화시켜 점착성 유사의 부유, 퇴적, 이송, 확산의 과정에 직접적인 영향을 미친다. 응집현상은 플럭의 침강속도 뿐 아니라 부피농도와 질량농도 사이의 비선형적 관계를 야기하여 흐름 운동량 방정식 유도, 난류의 모형화 등에서도 비점착성 유사와 다른 방향으로 진행된다. 점착성 유사가 우세한 지역의 또 다른 특성은 자기하중에 의한 압밀현상에 따라 발생하는 가변적인 한계소류력이다. 따라서 점착성 유사의 이동을 모형화 하는 과정에서는 가변적인 침식율의 가정 등을 통해 이에 대한 고려가 반드시 이루어져야 한다. 흐름의 운동량 방정식 및 난류 모형에서는 플럭의 부피 농도와 질량농도가 각 항의 물리적 의미에 부합하도록 개별적으로 선택 및 적용되어야 질량보존의 문제 등으로 발생할 수 있는 계산상의 오류를 배제할 수 있다. 적용 결과, 점착성 유사가 우세한 지역에서 나타나는 높은 부유 및 흐름정체기에서의 부유사 존재 등의 특성이 점착성 유사 이동을 위한 모형에서 보다 합리적으로 계산된다는 사실이 확인되었다. 그리고 비점착성 유사에 적합한 이동 모형이 점착성이 우세한 지역에 적용될 경우, 상황에 따라 유사량을 과대 및 과소 산정할 수 있다는 결론이 도출되었다. 조류의 영향이 존재하는 하구부의 경우에는 조류의 형태와 비대칭성에 따라 유사량의 차이가 큰 것으로 나타났다. 조류의 형태는 주로 하구부의 지형에 의해 결정되므로 준설, 매립, 확폭 등과 같은 하구부에서의 사업이 진행되는 경우, 유사량 변화에 대한 고려가 반드시 이루어져야 할 것으로 판단된다.
PDF

Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance (다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법)

Nam, Seungchan;Choi, Yong-Seok
- The Korean Journal of Applied Statistics
- /
- v.30 no.4
- /
- pp.567-578
- /
- 2017
Grouped multivariate data can be tested for differences between two or more groups using multivariate analysis of variance (MANOVA). However, this method cannot be used if several assumptions of MANOVA are violated. In this case, multidimensional scaling (MDS) and analysis of distance (AOD) can be applied to grouped dissimilarities based on the various distances. A permutation test is a non-parametric method that can also be used to test differences between groups. MDS is used to calculate the coordinates of observations from dissimilarities and AOD is useful for finding group structure using the coordinates. In particular, AOD is mathematically associated with MANOVA if using the Euclidean distance when computing dissimilarities. In this paper, we study the between and within group structure by applying MDS and AOD to the grouped dissimilarities. In addition, we propose a new test statistic using the group structure for the permutation test. Finally, we investigate the relationship between AOD and MANOVA from dissimilarities based on the Euclidean distance.
https://doi.org/10.5351/KJAS.2017.30.4.567 인용 PDF KSCI

Development of Methods for Estimating Sediment Yield Rate(II) - Development of Models - (비유사량(比流砂量) 추정방법의 개발(II) - 모형 개발 및 검토 -)

Kim, Chang Wan;Kim, Hyoung Seop;Yu, Kwon Kyu;Woo, Hyo Seop
- KSCE Journal of Civil and Environmental Engineering Research
- /
- v.13 no.1
- /
- pp.131-140
- /
- 1993
The major objective of this study is to develop practical methods for estimating sediment yield rates of medium size watersheds of which areas range from 200 to $2,000km^2$ In the first phase of the study that were presented in the companion paper followed by this paper, a methodology for estimating sediment yield rate was introduced and a total of 13 data points including eight sampled river-sediment data and five reservoir deposit data were collected. In this study, a three-parameter empirical model and a six-parameter rating model, both of which are based on empiricism, have been developed. By limited comparisons, the models developed in this study appear to be more reliable and applicable than the existing ones. According to the sediment yield data collected and the estimations by the models, meanwhile, the lowest value for the sediment yield rate of medium size watersheds in Korea is estimated to be about $100tons/km^2/yr$, and the maximum to be about $1,000tons/km^2/yr$.
PDF

Analysis of specific sediment yield characteristics using sediment prediction models developed for ungauged watersheds (미계측유역 유사량 예측 모델을 이용한 비유사량 특성분석)

Park, Sang Deok;Ahn, Taejin;Lim, Kyoung Jae;Kim, Jeongkon;Shin, Seung Sook
- Proceedings of the Korea Water Resources Association Conference
- /
- 2017.05a
- /
- pp.33-33
- /
- 2017
수문모형들은 유역차원의 저감대책 수립 및 평가에 유용하게 사용될 수 있고 이를 활용한 합리적인 예측이 가능하다. 한국의 미계측 유역에 대한 유사발생량 예측을 모델을 개발하였다. 본 연구에서 개발한 예측모형의 특징은 신뢰할 수 있는 관측 자료를 활용하여 단계별 다중회귀분석을 이용하여 매개변수를 결정하였으며, 최소한의 입력자료를 이용하여 전국 규모의 연평균 유사발생량을 예측할 수 있다는 것이다. 본 연구에서 개발된 모형을 활용하여 4대강 유역의 중권역별 유사량을 추정하였다. 수자원장기 종합에서 사용한 중권역별 강우 자료를 활용하여 모의를 수행하였다. 2001년부터 2015년 까지 15년까지 모의결과 4대강 유역 전체적으로 연 강우량의 변동에 따라 유사발생량도 증감하는 패턴을 나타내고 있으며, 그 주기는 약 8년 정도로 추정되었다. 4대강 주요 중권역을 대상으로 2010년에 추정된 비유사량을 K-DRUM 예측값 및 유량조사사업단 추정값과 비교하여 모델의 활용성을 검토하였다. 유사량 예측의 불확실성을 감안할 때 본 연구에서 개발된 모델을 이용하여 1차 스크리닝 수준에서 미계측 유역에 대한 비유사량 예측이 가능할 것으로 판단되며, 향후 미계측 유역에 대한 유사관리계획 수립에 활용될 수 있을 것으로 판단된다.
PDF

A Novel Linkage Metric for Overlap Allowed Hierarchical Clustering (중복을 허용하는 계층적 클러스터링 기법에서 클러스터 간 유사도 평가)

Jeon, Joon-Woo;Song, Kwang-Ho;Kim, Yoo-Sung
- 한국어정보학회:학술대회논문집
- /
- 2016.10a
- /
- pp.157-161
- /
- 2016
본 논문에서는 클러스터 간의 중복을 허용한 계층적 클러스터링(hierarchical clustering) 기법에 적합한 클러스터 간 유사도 평가방법(linkage metric)을 제안하였다. 클러스터 간 유사도 평가방법은 계층적 클러스터링에서 클러스터를 통합하거나 분해하는데 쓰이며 사용된 방법에 따라 클러스터링의 결과가 다르게 형성된다. 기존의 클러스터 간 유사도 평가방법인 single linkage, complete linkage, average linkage 중 single linkage와 complete linkage는 클러스터 간 중복이 허용된 환경에서 정확도가 낮은 문제점이 있고, average linkage는 정확도가 두 방법에 비해 높지만 계산 시간 소요가 크다는 단점이 있다. 따라서 본 논문에서는 기존의 average linkage를 개선하여 중복된 데이터에 의한 필요 계산량을 크게 줄임으로써 시간적 성능이 우수한 클러스터 간 유사도 평가방법을 제안하였다. 또한, 제안된 방법을 기존 방법들과 비교실험하여 중복을 허용하는 계층적 클러스터링 환경에서 정확도는 비슷하거나 더 높고, average linkage에 비해 계산량이 감소됨을 확인하였다.
PDF

Understanding sediment characteristics and developing empirical model for specific degradation in South Korean river (국내 하천 유사 특성 이해와 유사량 추정을 위한 경험적 모델 개발)

Woochul Kang
- Proceedings of the Korea Water Resources Association Conference
- /
- 2023.05a
- /
- pp.133-133
- /
- 2023
풍화작용에 의해 생성된 유사는 자연 매체에 의해 이동하고 하천에 도달하기 이전이나 이후 퇴적되며, 해당 과정 중에서 하상변동, 홍수위 상승, 제방 안정성, 두부 침식, 생태환경 변화, 수질문제 등 다양한 침식과 퇴적 관련 문제들이 발생한다. 이러한 유사 문제의 해결과 지속적인 하천관리를 위해서는 유사의 생성, 이송, 그리고 퇴적 과정에 대한 충분한 이해와 정량적인 유사량을 파악하는 것이 필수적이다. 다양한 연구들을 통해서 유사량을 정량적으로 파악하기 위해 여러 종류의 모델과 공식들이 제안 되어져 왔다. 그 중 경험적 모델의 경우 실제로 관측된 값을 기반으로 하며, 복잡한 계산이나 요구하는 자료가 다른 종류의 모델들 보다 적어 쉽게 접근이 가능하다. 이러한 경험적 모델은 유사에 영향을 주는 인자를 규명하거나 특정 유역이나 지역에서 이송 및 퇴적 되는 유사의 출처와 특성을 규명하는 초기 단계에서 유용하게 이용된다. 국내 하천의 경우 여름에 강우가 집중되고 대부분의 국토가 산지로 이루어져있어 상류에서 침식이 주로 발생한다. 또한, 본류 및 하류 지역의 하천은 유사의 퇴적이 주로 일어나서 하천의 형태와 물길이 형성된 충적 하천 형태로 발전 되어있기 때문에 국내 하천에서는 전반적으로 국부적이며 다양한 형태의 유사 관련 문제가 발생한다. 국내 하천에서 발생하는 유사 관련 문제를 해결하기 위해 국내 하천의 유사량을 추정하는 다양한 경험적 모델들이 지속적으로 개발되어왔다. 하지만 과거에 개발된 모델들의 경우 계측 자료가 충분하지 않은 시기에 개발 되었으며, 현재에는 활용하기 불가능하다. 본 연구에서는 국내 하천의 비유사량을 예측하는 동시에 국내 하천의 유사 특성을 이해하기 위해 과거에 국내 하천을 대상으로 비유사량을 추정하기 위해 개발되었던 경험적 모델을 개선하였다. 본 연구를 통해 기존 경험 모델의 경우 주기적인 업데이트가 필요함을 확인하였으며, 개발된 모델의 경우 국내 하천 유사 관리를 위해 미래 유사량 예측하는 등 다양한 방면으로 활용 관리가 가능할 것으로 보인다.
PDF

Analysis on Sediment Transport Characteristics for River in Korea based on Measured Sediment Discharge Databas (실측 유사량 데이터베이스를 기반으로 한 국내 하천의 유사이송 특성 분석)

Jang, Eun Kyung;Ji, Un;Yeo, Woon Kwang
- Proceedings of the Korea Water Resources Association Conference
- /
- 2017.05a
- /
- pp.3-3
- /
- 2017
하천에서 발생하는 유사량은 공급능력이 흐름의 이송능력보다 지배적인 경우 같은 유량이 발생하더라도 유사량이 다르게 관측될 수 있다. 특히 국내 하천과 같이 홍수기가 특정기간에 편중되어 연중 유량발생 편차가 매우 크게 나타나는 경우 이와 같은 현상이 더욱 두드러지게 발생한다. 즉, 대부분의 연중발생 유사량이 홍수시에 이동하고 홍수발생 초기와 후기의 유사 공급능력의 차이가 나타나는 국내하천의 경우 이를 기존의 유사이송공식으로 정량적인 유사량 값을 추정하는데는 한계가 있음을 의미한다. 따라서 본 연구에서는 국내 하천에서 실측한 유사량 자료를 종합하고 주요 지점별, 연도별, 계절별, 하천 유역별로 분류한 후 이를 분석하여 국내하천의 유사량 발생 특성을 규명하였다. 실측 유사량 데이터베이스는 국내 하천의 주요지점에서 2007년부터 2012년까지 측정한 자료로 구성되어 있으며 총 26개 지점 1,283개의 자료를 포함하고 있다. 4대강의 본류 대표지점으로 선정된 여주, 왜관, 공주, 나주지점을 대상으로 유량-총유사량 관계를 비교한 결과, 여주지점의 유량 증가에 따른 총유사량 증가 폭이 다른 대표지점들에 비해 가장 크게 나타나는 반면, 나주지점의 경우 제일 작은 값을 보인다. 또한 본류의 유량-유사량 관계식의 지수 값이 본류와 지류를 모두 포함한 관계식에 비해 더 크게 나타나는데 이는 지류에서는 본류보다 적은 유량이 발생하더라도 유사 이송량은 상대적으로 크게 발생한다는 것을 의미하며 그 이유는 본류와 지류에서 유사 이송이 지배적으로 발생하는 유량범위가 상이하기 때문에 나타나는 결과로 추정할 수 있다. 대표지점별 부유사 농도를 분석한 결과, 7월과 8월 부유사 농도에 비해 9월에 발생하는 부유사 농도가 현저히 낮은 값을 보이는데 이는 연중 홍수기 전반기에 유사 공급량이 상대적으로 많아 나타나는 현상으로 판단된다.
PDF

Search Result 8,148, Processing Time 0.037 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)