An Empirical Comparison and Verification Study on the Containerports Clustering Measurement Using K-Means and Hierarchical Clustering(Average Linkage Method Using Cross-Efficiency Metrics, and Ward Method) and Mixed Models

K-Means 군집모형과 계층적 군집(교차효율성 메트릭스에 의한 평균연결법, Ward법)모형 및 혼합모형을 이용한 컨테이너항만의 클러스터링 측정에 대한 실증적 비교 및 검증에 관한 연구

  • Received : 2018.05.21
  • Accepted : 2018.09.28
  • Published : 2018.09.30

Abstract

The purpose of this paper is to measure the clustering change and analyze empirical results. Additionally, by using k-means, hierarchical, and mixed models on Asian container ports over the period 2006-2015, the study aims to form a cluster comprising Busan, Incheon, and Gwangyang ports. The models consider the number of cranes, depth, birth length, and total area as inputs and container twenty-foot equivalent units(TEU) as output. Following are the main empirical results. First, ranking order according to the increasing ratio during the 10 years analysis shows that the value for average linkage(AL), mixed ward, rule of thumb(RT)& elbow, ward, and mixed AL are 42.04% up, 35.01% up, 30.47%up, and 23.65% up, respectively. Second, according to the RT and elbow models, the three Korean ports can be clustered with Asian ports in the following manner: Busan Port(Hong Kong, Guangzhou, Qingdao, and Singapore), Incheon Port(Tokyo, Nagoya, Osaka, Manila, and Bangkok), and Gwangyang Port(Gungzhou, Ningbo, Qingdao, and Kasiung). Third, optimal clustering numbers are as follows: AL(6), Mixed Ward(5), RT&elbow(4), Ward(5), and Mixed AL(6). Fourth, empirical clustering results match with those of questionnaire-Busan Port(80%), Incheon Port(17%), and Gwangyang Port(50%). The policy implication is that related parties of Korean seaports should introduce port improvement plans like the benchmarking of clustered seaports.

본 논문에서는 K-Means 군집모형과 계층적 군집모형, 혼합모형으로, 아시아 38개 컨테이너항만 들의 2006년부터 2015년까지의 자료와 선석길이, 수심, 총면적, 크레인 수를 투입물, 컨테이너화물처리량을 산출물로 하여 국내대표 컨테이너항만 들(부산, 인천, 광양항)이 클러스터링 해야만 하는 항만들을 적출해 내는 측정방법을 보여 주고 비교, 분석, 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 10년간의 자료를 이용한 분석에서 클러스터링 후의 효율성 증가폭이 큰 순서대로 살펴보면 평균연결법[average linkage(AL)]은 42.04% 상승, Mixed Ward는 35.01% 상승, 경험법칙[rule of thumb(RT)]&Elbow는 30.47% 상승, Ward는23.65% 상승, Mixed AL는 23.25% 상승의 순서였다. 둘째, RT와 Elbow모형에 의한 국내항만들의 클러스터링을 살펴보면 (1)부산항은 두바이, 홍콩, 광저우, 칭타오, 포트 클랑, 싱가포르, 림찬방 (2)인천항은 하이파, 포트슐탄 카부스, 담만, 크호르 파칸, 탄중프리옥, 탄중퍼락, 동경, 나고야, 오사카, 카라치, 오아심, 마닐라, 다바오, 콜롬보, 킬롱, 방콕, (3)광양항은 아카바, 크호르 파칸, 광정우, 닝보, 칭타오, 포트 클랑, 카오슝, 림찬방 항과 클러스터링 해야만 하는 것으로 나타났다. 셋째, 최적 군집 수를 살펴보면 AL(6개), Mixed Ward(5개), RT&ELBOW (4개), Ward(5개), Mixed AL(6개)가 최적 군집 수인 것으로 나타났다. 넷째, 전문가 그룹에 의해서 선호되는 항만들과 본 실증분석결과에 의해서 도출된 국내항만들의 클러스터링 되는 항만들과의 일치성 여부는 부산항은 80%, 인천항은 17%, 광양항은 50%수준에서 일치하는 것으로 검증되었다. 본 논문이 제안하고 있는 정책적인 측면의 의미는 첫째, 항만정책입안자, 항만운영관리자들이 본 연구에서 사용한 모형들을 항만의 클러스터링에 도입하여 벤치마킹항만들을 선정해야만 한다. 둘째, 실증분석의 결과로서 도출된, 국내항만들의 참조항만, 클러스터링항만들에 대하여, 그들 항만들의 항만개발, 운영방안 등에 대한 내용을 비교 분석하고 벤치마킹이 필요한 부분은 신속하게 도입하여 실시하는 것이 필요하다는 점이다.

Keywords

References

  1. 고용기.이상현(2005), 항만클러스터의 결정요인에 관한 연구-우리나라 부산항과 인천항을 대상으로, 영상저널, 제13집, 영남대학교 산경연구소, 301-325.
  2. 김우생.김수영(2014), 주성분분석과 K평균알고리즘을 이용한 문서군집방법, 한국정보통신학회논문지, 제18집 제3호, 625-630.
  3. 김기현.윤유식.윤명혜(2014),"방한 외국인 쇼핑관광 서비스품질에 따른 시장세분화연구," 호텔경영학연구, 제23권 제4호, 한국호텔외식관광경영학회, 181-186.
  4. 김종훈.이정학(2014),"스포츠 전문채널 미디어 수용자의 라이프 스타일에 따른 시장세분화," 한국체육학회지, 제53권 제3호, 455-468.
  5. 김한수.강중혁.배영규(2013), "고속철도 열차지연 유형의 구분지표 및 기준," 한국경영과학회지, 제38권 제3호, 한국경영과학회, 2013, 37-50.
  6. 류제웅.조남익(2014), K-평균 클러스터링을 이용한 필기 문서 영상의 단어분리법, 한국방송미디어 공학회, 한국방송공학회 학술발표대회 논문집, 38-41.
  7. 문지원(2006), K-Means 군집분석을 이용한 U-도시 유형분류에 관한 연구, 성균관대학교 대학원 석사학위논문.
  8. 박노경(2017), 메타프론티어 DEA모형과 정수계획모형을 이용한 항만클러스터링 측정에 대한 실증적 비교 및 검증연구, 한국항만경제학회지, 제33집 제2호, 53-82.
  9. 박노경(2016), "메타프론티어와 교차효율성 모형을 통한 클러스터링의 실증적 검증소고," 무역연구, 제41권 제3호, 27-42.
  10. 박노경(2013a),"교차효율성 모형을 이용한 컨테이너항만의 효율성 측정방법", 무역연구 제9권 제4호, 279-294.
  11. 박노경(2013b), "컨테이너항만의 클러스터링 측정방법 소고-DEA참조집단모형과 교차효율성 모형을 이용-", 무역연구, 제9권 제7호, 한국무역연구원, 439-456.
  12. 박노경(2009), "계층적 군집분석과 DEA Tier 분석에 의한 클러스터링 측정방법: 은행산업적용," 한국산업경제저널, 제1권 제2호, 전북대학교 산업경제연구소, 107-130.
  13. 박노경(2015a), "교차효율성 모형과 정수계획법을 이용한 한국주요항만의 클러스터링 및 효율성 변화 측정 소고," 무역통상학회지, 제15권 제2호, 한국무역통상학회, 1-25.
  14. 박노경(2015b), "메타프론티어와 교차효율성 모형을 통한 클러스터링의 실증적 검증," 2015 한국무역학회동계학술대회 발표논문집, 2015년12월18일, 한국무역학회, 67-77.
  15. 박노경(2016a), "부트스트랩 DEA모형과 게임교차효율성 모형을 이용한 항만클러스터링 측정에 대한 실증적 비교연구," 한국항만경제학회지, 제32집 제1호, 29-58.
  16. 박노경(2016b), "평택항 컨테이너 터미널의 효율성 측정을 통한 국제경쟁력 및 클러스터링 측정," 한국항만경제학회 2016년 평택항 개항 30주년 기념 국제세미나 발표논문집, 257-284.
  17. 방희석.김새로나(2004), "우리나라 항만클러스터 특성과 발전에 관한 연구," 한국무역학회 국제학술대회논문집, 159-179.
  18. 신동혁.안광규.최성춘.최형기(2016), "K-평균클러스터링을 이용한 네트워크 유해 트래픽 탐지", 한국통신학회논문지, 제41집 제2호, 277-284.
  19. 이성규.홍성언.박수홍(2006), "평균연결법과 K-Means 혼합클러스터링 기법을 이용한 공시지가 유사가격 권역의 설정," 대한지리학회지, 대한지리학회, 제41집 제1호, 121-135.
  20. 이신원(2012), "K-means 클러스터링에서 초기 중심선정 방법비교," 한국인터넷정보학회논문지, 제13집 제6호, 1-8.
  21. 이준호.박광호(2012), "군집분석을 통한 중소기업 온라인 마케팅 지원 수혜기업의 세분화 전략에 관한 연구," e비즈니스연구, 제13권 제4호, 169-194.
  22. 이학식.임지훈(2017), SPSS 매뉴얼, 집현재.
  23. 한철환(2003), "우리나라 항만클러스터 구축방안에 관한 연구", 한국항만경제학회지, 제19집 제1호, 1-22.
  24. Banitaan, S., A.B. Nassif, and M. Azzeh(2015), "Class Decomposition Using K-Means and Hierarchical Clustering," Proceedings of 2015 IEEE, 14th International Conference on Machine Learning and Application, 1263-1267.
  25. Blashfield, R. K.(1976), "Mixture Model Tests of Cluster Analysis: Accuracy of Four Agglomerative Hierarchical Methods," The Psycological Bulletin, 83, 377-388.
  26. Celebi, M. E., & Kingravi, H. A. (2012), "Deterministic initialization of the k-means algorithm using hierarchical clustering," International Journal of Pattern Recognition and Artificial Intelligence, 26(07), 1250018.
  27. Cook, W. D., and J. Zhu(2007), "Classifying Inputs and Outputs in Data Envelopment Analysis", European Journal of Operational Research, 180, 692-699.
  28. Defay, D.(1977), "An Efficient Algorithm for Complete Link Method", The Computer Journal, Vol. 20, No.4, British Computer Society, 364-366.
  29. Ferreira, L, and D.B. Hitchcock, "A Comparison of Hierarchical Methods for Clustering Functional Data," Memeo, 1-31.
  30. Hong, X., J. Wang, and G. Qi(2014), "Comparison of Spectral Clustering, K-Clustering, and Hierarchical Clustering on e-Nose Data Sets: Application to the Recognition of Material Freshness, Adulteration Levels and Pretreatment Approaches for Tomato Juices," Chemometrics and Intelligent Laboratory Systems, 133 ,17-24.
  31. Kaufamn, L., and P.J. Rousseeuw(1990), Finding Group in Data: An Introduction to Cluster Analysis, Wiley.
  32. Khanmohammadi, S., N. Adibeig, S. Shanehbandy(2017), "An Improved Overlapping K-Means Clustering Method for Medical Applications," Expert Systems with Applications, 67, 12-18.
  33. Kuiper, F. K., and Fisher, L., "A Monte Carlo Comparison of Six Clustering Procedure," Biometrics, 31, 777-783.
  34. Land, A.H. and A.G. Doig(1969),"An Automatic Method of Solving Discrete Programming Problems," Econometrica, 28, 497-520.
  35. Legendre, P.(2012), and Legendre, L., Numerical Ecology, 3rd English ed., Amsterdam, Elsevier, 2012.
  36. Luczak, M.(2016), "Hierarchical Clustering of Time Series Data with Parametric Derivative, Dynamic Time Wrapping," Export Systems with Application, 62, 116-130.
  37. Liang, L., J. Wu, W.D. Cook, and J. Zhu(2008), "The DEA Game Cross-Efficiency Model and Its Nash Equilibrium," Operations Research, Vol.56, No.5, 1278-1288.
  38. Lu, J.F., J.B. Tang, Z.M. Tang, and J.Y.Yang(2008), "Hierarchical Initialization Approach for K-Means Clustering," Pattern Recognition Letters, 29(6), 787-795.
  39. Ma, C., D. Liu, Z. Zhou, W. Zhao, W. Liu(2014),"Game Cross-Efficiency for Systems with Two-Stage Structures", Journal of Applied Mathematics, 2014s(Special Issue 2013),1-8.
  40. MacQueen, J.(1967), "Some Methods for Classification and Analysis of Multivariate Observations," Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, University of California Press, 281-297.
  41. Murthy, V.S., E. Vamsidhar, J.N.V.R.S. Kumar, and P.S. Rao(2010), "Content Based Image Retrieval Using Hierarchical and K-Means Clustering Techniques," International Journal of Engineering Science and Technology, 2(3), 209-212.
  42. Murtagh, F.(1985), Multidimensional Clustering Algorithms, Vienna, Physica-Verlag, 1985.
  43. Murtagh, F. and P. Legendrec(2014), "Ward's Hierarchical Agglomerative Clustering Method: Which Algorithms Implement Ward's Criterion," Journal of Classification, 31, 274-295.
  44. Po, R. W., Guh, Y. Y., & Yang, M. S. (2009), "A New Clustering Approach Using Data Envelopment Analysis," European Journal of Operational Research, 199(1), 276-284.
  45. Praven, P., and B. Rama(2016), An Empirical Comparison of Clustering Using Hierarchical Methods, and K-Means, Proceedings of IEEZ, 2nd International Conference on Advances in Electrical, Electronics, Information, Communication and Bio-Informatics(AEEICB 16), 445-449.
  46. Punj, G., and D.W. Steward(1983), "Cluster Analysis in Marketing Research; Review and Suggestions for Application," Journal of Marketing Research, 20(2), 134-148.
  47. Rios, C.A.M. and R.F.D. Sousa(2014), "Cluster Analysis of the Competitiveness of Container Ports in Brazil," Transportation Research Part A, 69, 423-431.
  48. Sarkis, J., and Talluri, S.(2004), "Performance Based Clustering for Benchmarking of US Airports," Transportation Research Part A, 38, 329-346.
  49. Sarma, M.J. and S.J. Yu(2009),"Performance based Stratification and Clustering for Benchmarking of Container Terminals," Expert Systems with Application, 36, 5016-5022.
  50. Sakthivel, K., R. Abinaya, I.Nivetha, R.A. Kumar(2014), Region Based Image Retrieval Using K-Means and Hierarchical Clustering Algorithms, 3, Special Issue.
  51. Sibson, R.(1973), "SLINK: An Optimally Efficient Algorithm for the Single-Link Cluster Method," The Computer Journal, Vol. 16, No.1, British Computer Society, 30-34.
  52. Ulucan, A., and Atici, K.B.(2010), "Efficiency Evaluation with Context-Dependent and Measure-Specific Data Envelopment Approach: An Application in a World Bank Supported Project", Omega, 38, 68-83.
  53. Wang, S.W., and Y. Fang (2012), "Regularized K-means Clustering of High-dimensional Data and its Asymptotic Consistency," Electronic Journal of Statistics, 6, 148-167.
  54. Ward, J.H.(1963), "Hierarchical Grouping to Optimize and Objective Function," Journal of American Statistics Association, Vol.69, 86-101.
  55. Wishart, D.(1969)," An Algorithm for Hierarchical Classifications," Biometrics, Vol.25, 1969, pp.165-170.
  56. Worner, S.P., M.Gevrey, R. Eschen, M.Kenis, D. Paini, S.Singh, K.Suiter, and M.J. Watts(2013), Prioritizing the Risk of Plant Pests by Clustering Methods; Self-Organising Maps, K-Means, and Hierarchical Clustering, NeoBiota, 18, 83-102
  57. Wu, J., Liang, L. and Song, M.(2010)," Performance Based Clustering for Benchmarking of Container Ports: An Application of DEA and Cluster Analysis Technique," International Journal of Computational Intelligence Systems, Vol. 3, No.6, 709-722.
  58. Wu, J., and Goh, M.G.(2010),"Container Port Efficiency in Emerging and More Advanced Market," Transportation Research Part E, Vol.46, 1030-1042.
  59. Wu, J., Liang, L., Wu, D. and Yang, F.(2008)," Olympics Ranking and Benchmarking Based on Cross Efficiency Evaluation Method and Cluster Analysis: The Case of Sydney 2000," International Journal of Enterprise Network Management, Vol. 2, No. 4, 377-392.
  60. Wu, J., Liang, L. and Yang, F.(2009)," Achievement and Benchmarking of Countries at the Summer Olympics Using Cross Efficiency Evaluation Method," European Journal of Operational Research, Vol. 197, 722-730.
  61. http://www.busanpa.com
  62. http://www.hansung.ac.kr/web/jsum/508214
  63. http://www.icpa.or.kr
  64. https://ko.wikipedia.org
  65. http://www.ygpa.or.kr