• 제목/요약/키워드: Gap 클러스터링

검색결과 13건 처리시간 0.026초

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링 (Clustering of Web Objects with Similar Popularity Trends)

  • 노웅기
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.485-494
    • /
    • 2008
  • 인터넷이 광범위하게 활용됨에 따라 검색 키워드, 멀티미디어 객체, 웹 페이지, 블로그 등의 다양한 웹 객체들이 크게 증가하고 있다. 이러한 웹 객체들의 인기도는 시간에 따라 변화하며, 그러한 웹 객체 인기도의 시간적 패턴에 대한 마이닝이 여러 가지 웹 응용에 필요한 중요한 연구 과제가 되고 있다. 예를 들어, 검색 키워드에 대한 인기도 패턴의 분석은 앞으로 인기가 높아질 키워드를 미리 예측할 수 있게 하여 광고주들에게 키워드를 판매하기 위한 가격을 결정하는 데에 중요한 자료가 될 수 있다. 하지만, 웹 객체 인기도가 시간에 따라 변화하고 웹 객체의 개수가 매우 방대하다는 특성으로 인하여 웹 객체 인기도에 대한 분석은 매우 어려운 문제이다. 본 논문에서는 웹 객체 인기도의 시간적 패턴을 마이닝하기 위한 효율적인 알고리즘을 제안한다. 본 논문은 웹 객체 인기도를 시계열로 표현하고, 두 웹 객체 인기도 간의 유사성을 측정하기 위하여 gap 척도를 제안한다. gap 척도의 효율적인 계산을 위하여 FFT를 활용한 알고리즘을 제안하고, 밀도기반 클러스터링 알고리즘을 이용하여 유사한 인기도 추세를 갖는 웹 객체들의 클러스터를 생성한다. 본 논문에서는 웹 객체 인기도가 특정 분포를 따르거나 주기적이라고 가정하지 않는다. Google Trends 웹 사이트로부터 구한 검색 키워드 인기도를 이용한 실험을 통하여, 제안된 알고리즘이 실세계 응용에서 유용함을 보인다.

실수최적화 진화 알고리즘을 위한 새로운 세대차 모델 (New Generation Gap Models for Evolutionary Algorithm in Real Parameter Optimization)

  • 최준석;서기성
    • 한국지능시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.62-68
    • /
    • 2009
  • 수정된 PCX(parent-centric recombination) 연산자와 결합한 두 가지 새로운 세대차 모델이 제안된다. 첫째, 자가적응 세대차 모델(SGG, self-adaptation generation gap)은 자손에 의한 부모의 대치 확률을 일정한 수준으로 유지하는 제어 방식이다. 둘째, 가상 클러스터 세대차(VCGG, virtual cluster generation gap)는 클러스터링을 통해 부모간의 거리를 조정해 주며, 이로 인해 개체들이 다양화 될 수 있다. 이 모델에서 부모간의 거리는 클러스터의 크기로 조절된다. 제안된 두 가지 접근법의 효용성을 입증하기 위해서 3 가지 표준적인 문제에 대한 실험이 수행되었다. 가장 최근의 경쟁력 있는 접근법인 CMA-ES와 G3-PCX와 비교한 결과, 제안된 두 기법 모두 기존의 접근법들 보다 우수함을 보여준다.

메타프론티어와 교차효율성 모형을 통한 항만 클러스터링의 실증적 검증소고 (A Brief Empirical Investigation of Seaport Clustering by Using Meta-Frontier and Cross-efficiency Models)

  • 박노경
    • 무역학회지
    • /
    • 제41권3호
    • /
    • pp.27-42
    • /
    • 2016
  • 본 논문에서는 아시아 13개 항만의 2009년, 2010년, 2013년의 자료와, 3개의 투입요소(수심, 총면적 크레인 수)와 1개의 산출요소(컨테이너화물 총 처리량)를 이용하여 교차효율성모형과 메타프론티어 분석방법으로 개별효율성과 그룹효율성, 기술 갭을 측정함으로써, 교차효율성모형에 의해서 측정된 클러스터링이 국내항만들의 메타효율성을 증진시켰는지를 실증적으로 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 2010년과 2013년의 경우에는 부산, 인천, 광양항만 모두 그룹효율성이 증가하였다. 둘째, 중국의 항만들이 국내 항만들에 비해서 메타효율성과 그룹효율성 측면에서 더 높은 것으로 나타났다. 셋째, 기술갭 측면에서 보았을 때, 광양항의 기술 격차의 왜곡이 부산항이나 인천항에 비해서 작은 것으로 나타났다. 넷째, 광양항은 2009년(닝보, 칭타오, 토쿄, 카오슝항)과 2013년(두바이항)과 클러스터링을 통해서 효율성을 증진시킬 수 있었다. 부산항은 2010년에 2그룹, 2013년에 1그룹항만, 인천항은 2010년과 2013년에 2그룹 항만들과 클러스터링을 통해서 효율성을 증진시킬 수 있었다. 다섯째, 교차효율성 모형과 메타효율성 분석방법을 통해서 부산, 인천, 광양항은 효율성을 증진시킬 수 있다는 것이 실증적으로 검증되었다. 본 논문의 정책적인 함의는 본 연구에서 실증적으로 검증된 아시아 항만들 간의 클러스터링 방법[부산항은 홍콩, 상하이, 싱가포르항, 인천항과 광양항은 칭타오, 나고야, 닝보, 토쿄, 카오슝항과 클러스터링]을 국내항만들이 적극적으로 정책적인 도입을 해야만 한다.

  • PDF

메타프론티어 DEA모형과 정수계획모형을 이용한 항만클러스터링 측정에 대한 실증적 비교 및 검증연구 (An Empirical Comparison and Verification Study on the Seaport Clustering Measurement Using Meta-Frontier DEA and Integer Programming Models)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제33권2호
    • /
    • pp.53-82
    • /
    • 2017
  • 본 논문에서는 메타프론티어 DEA모형과 정수계획모형으로, 아시아 38개 컨테이너항만들의 10년간(2005-2014) 자료를 4개의 투입요소(선석길이, 수심, 총면적, 크레인 수), 1개의 산출요소(컨테이너화물처리량)를 이용하여 국내항만(부산, 인천, 광양항)들이 어떤 항만들과 클러스터링 해야만 하는지에 대한 측정방법을 실증적으로 보여 주고 비교, 분석, 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 2005년부터 2014년까지 전체자료를 이용한 메타프론티어 DEA효율성 측정의 주요한 결과를 살펴보면, 중국항만들의 메타효율성과 그룹효율성이 높게 나타났으며, 순위는 상해, 홍콩, 닝보, 칭타오, 광저우 순서였으며, 국내항만은 부산, 인천, 광양항의 순서였다. 둘째, 정수계획모형에 의한 국내항만들의 클러스터링을 살펴보면 (1)부산항은 두바이, 홍콩, 상해, 광저우, 닝보, 칭타오, 싱가포르, 카오슝 항과 클러스터링하고, (2)인천항과 광양항은 사히드 라자이, 하이파, 크호르 파칸, 탄중 퍼락, 오오사카, 키룽, 방콕 항과 클러스터링 하는 것이 좋은 것으로 나타났다. 셋째, 정수계획모형을 통한 클러스터링이 메타프론티어 DEA모형의 그룹효율성을 부산항을 제외하고 인천항은 401.84%, 광양항은 354.25%만큼 대폭적으로 상승시켰다. 넷째, 효율성 순위를 검정한 윌콕슨부호순위검정에서는 두 가지 모형[메타프론티어 DEA모형과 정수계획모형에 의한 클러스터링 전과 후의 그룹효율성(57.88%), 기술 갭 효율성(80.93%)]사이에 순위에 차이가 없는 것으로 나타났다. 본 논문이 갖는 정책적인 함의는 첫째, 항만정책입안자들이 본 연구에서 사용한 두 가지 모형을 항만의 클러스터링 정책에 도입하여 해당항만이 발전할 수 있는 전략을 수립하고 이행해 나가야만 한다는 점이다. 둘째, 본 논문의 실증분석결과 국내항만들의 참조항만, 클러스터링항만들로서 나타난 아시아항만들에 대하여, 그들 항만들의 항만개발, 운영에 대한 내용을 정밀하게 분석하고 도입하여 실시하는 것이 필요하다.

투영 프로파일, GaP 및 특수 기호를 이용한 텍스트 영역의 어절 단위 분할 (Decomposition of a Text Block into Words Using Projection Profiles, Gaps and Special Symbols)

  • 정창부;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1121-1130
    • /
    • 2004
  • 본 논문에서는 인쇄체 텍스트 영상에 대한 문자열 분리 방법과 어절 분리 방법을 제안한다. 문자열 분리 방법은 수평 투영 프로파일을 분석하고, 오분리된 문자열에 대하여 재귀적 투영 프로파일 (Recursive Projection Profile) 분석을 수행한다. 어절 단위 분리는 문자열에 대한 연결요소 분석을 통하여 gap을 검출한 후, 계층적 군집화 기법에 의해 어절과 어절 사이에 존재하는 gap을 판별하여 어절 분리점을 결정한다. 또한 어절과 어절 사이에 존재하는 특수기호를 검출하여 어절 분리점을 추가하기 위해서, 연결요소의 종횡비와 골격선(skeleton)의 형태적 특징을 고려한다. 제안 방법의 성능 평가를 위하여 총 84 개의 텍스트 영상에 대하여 실험하였고, 국내 상용 OCR 소프트웨어인 아르미와 성능 비교하였다. 최종 어절 분리에 대하여 제안 방법과 아르미가 각각 99.92%와 97.58%의 성능으로 측정됨으로써 제안 방법이 아르미에 비해 우수함을 보였다.

클러스터링에 기초한 자기부상시스템의 퍼지제어기 모델링 (Fuzzy Controller Modeling for Electromagnetic Levitation Systems based on Clustering Algorithm)

  • 김민수;변윤섭;이관섭
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2006년도 추계학술대회 특별세미나 특별세션
    • /
    • pp.145-159
    • /
    • 2006
  • This paper describes the development of a clustering based fuzzy controller of an electromagnetic suspension vehicle using gain scheduling method and Kalman filter for a simplified single magnet system. Electromagnetic suspension vehicle systems are highly nonlinear and essentially unstable systems For achieving the levitation control of the DC electromagnetic suspension system, we considered a fuzzy system modeling method based on clustering algorithm which a set of input/output data is collected from the well defined Linear Quadratic Gaussian(LQG) controller. Simulation results show that the proposed clustering based fuzzy controller methodology robustly yields uniform performance with adequate gap response over the mass variation range.

  • PDF

클러스터링을 이용한 시소러스 브라우저의 설계에 대한 이론적 연구 (A Theoretical Study of Designing Thesaurus Browser by Clustering Algorithm)

  • Seo, Hwi
    • 한국도서관정보학회지
    • /
    • 제30권3호
    • /
    • pp.427-456
    • /
    • 1999
  • This paper deals with the problems of information retrieval through full-test database which arise from both the deficiency of searching strategies or methods by information searcher and the difficulties of query representation, generation, extension, etc. In oder to solve these problems, we should use automatic retrieval instead of manual retrieval in the past. One of the ways to make the gap narrow between the terms by the writers and query by the searchers is that the query should be searched with the terms which the writers use. Thus, the preconditions which should be taken one accorded way to solve the problems are that all areas of information retrieval such as should taken one accorded way to solve the problems are that all areas of information retrieval such as contents analysis, information structure, query formation, query evaluation, etc. should be solved as a coherence way. We need to deal all the ares of automatic information retrieval for the efficiency of retrieval thought this paper is trying to solve the design of thesaurus browser. Thus, this paper shows the theoretical analyses about the form of information retrieval, automatic indexing, clustering technique, establishing and expressing thesaurus, and information retrieval technique. As the result of analyzing them, this paper shows us theoretical model, that is to say, the thesaurus browser by clustering algorithm. The result in the paper will be a theoretical basis on new retrieval algorithm.

  • PDF

무선 센서 네트워크의 최적화 노드배치에 관한 연구 (A Study On The Optimum Node Deployment In The Wireless Sensor Network System)

  • 최원갑;박형무
    • 전기전자학회논문지
    • /
    • 제11권3호
    • /
    • pp.100-107
    • /
    • 2007
  • 무선 센서 네트워크에서 중요한 문제 중 하나는 센서 노드들의 최적 배치, 즉 측정하고자 하는 지역을 모두 커버할 수 있는 최소 센서 노드 수를 산출하고 배치 위치를 결정하는 일이다. 본 논문에서는 이러한 문제를 해결하기 위한 방법으로 제안한 Fuzzy C-Means 클러스터링을 이용하여 측정하고자 하는 지역에서의 최적의 노드 배치와 최소 노드의 수를 시뮬레이션을 통해 도출하였고, 실험을 통하여 검증하였다. 시뮬레이션은 3가지 타입의 2차원 지역을 모델로 하여 수행하였다. 모델링한 지역은 6M${\times}$10M의 직사각형, 50M${\times}$20M의 직사각형, 100M${\times}$80M의 ‘L’ 자 형태의 지역으로 하였으며, 각각 9개, 9개, 15개 노드의 위치를 결정하였다. 실제 실험결과 각 지역에 대해서 94.6%, 92.2%, 95.7%의 정확도를 가진 통신 연결을 확인할 수 있었다.

  • PDF

기계학습을 이용한 뿌리산업 작업 환경 위험도 피크레벨 결정방법 (A Method for Determining the Peak Level of Risk in Root Industry Work Environment using Machine Learning)

  • 이상민;김준영;강석찬;김경준
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.127-136
    • /
    • 2024
  • 뿌리산업의 유해한 작업 환경과 높은 작업 강도는 작업자의 건강에 영향을 미칠 수 있기 때문에 기존에는 유해한 물질로부터 현장 작업자를 보호하기 위해 반년 단위로 작성한 환경을 측정하여 규제하고 있다. 그러나 작업환경 외에 작업자 건강 상태 등에 대해서는 정량화된 관련 기준이 부재하여 상시로 피해를 주는 임계치 이하 유해 물질의 지속적인 노출에 따른 직업병을 예방하는데 어려움이 상존하고 있다. 따라서 본 논문에서는 기계학습을 이용한 뿌리산업 작업 환경의 위험도 피크레벨 결정방법을 제안하고 이를 토대로 작업장의 실시간 안전 평가를 가능하게 하였다.

클러스터링에 기반한 학업성적의 등급화 방법 (A Grading Method for Student′s Achievements Based on the Clustering Technique)

  • 박은진;정홍;장덕성
    • 한국지능시스템학회논문지
    • /
    • 제12권2호
    • /
    • pp.151-156
    • /
    • 2002
  • 학업성적 평가방법에는 일반적으로 절대평가와 상대평가가 있다. 이들 방법은 각기 장점들을 가지고 있으나 평가기준이 너무 일률적이거나 아니면 학습자간에 지나친 경쟁을 유발하는 등 일부 한계점들을 내포하고 있다. 본 논문에서는 일률적인 기준이 아닌 학습자들의 점수와 발생빈도를 감안한 등급화를 통해 학업성적을 평가하는 방법을 제안한다. 즉 전체 학습자의 학업성적을 적합도(goodness)를 감안하여 몇 개의 클래스로 분할하고 이를 등급으로 하는 것이다. 이를 위해 본 논문은 RE(Relaxation Error)를 적용하여 적합도를 구하고 이를 바탕으로 성적을 등급화 한다. 제안된 방법은 학업성적의 분포와 발생빈도를 고려한 적합도 측정에 의해 등급기준을 정하고 이에 따라 학업성적을 등급화 하므로 근소한 차고 등급이 구분되는 사례가 거의 없게 되며, 학교간 학생들의 학업 성적도를 차별화 할 수 있고, 실제적인 우수자나 부진아 선발 및 수준별 이동식 수업을 위한 평가에 유용하므고 기존의 두 방법을 보완하는 특성을 갖고 있다.