• 제목/요약/키워드: 클러스터링 계수

검색결과 67건 처리시간 0.037초

유전자 알고리즘과 Feature Wrapping을 통한 마이크로어레이 데이타 중복 특징 소거법 (Removing Non-informative Features by Robust Feature Wrapping Method for Microarray Gene Expression Data)

  • 이재성;김대원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권8호
    • /
    • pp.463-478
    • /
    • 2008
  • 본 논문에서는 유전자 사이의 상관계수가 높은 마이크로어레이 데이타에 대하여 제안하는 알고리즘을 통해 상관계수가 낮은 유전자들의 부집합을 만들고, 이에 대해 적합 함수를 통한 평가로 기존 방법론이 가지는 한계를 극복할 수 있도록 하였다. 기존 방법론은 개별 특징의 평가를 통해 중복 특징을 제거하며, 상관계수에 대한 고려가 없어 선택된 유전자 부집합들의 상관계수가 논은 문제가 있었다. 이에 따라 제안하는 알고리즘은 특징간의 관계를 평가하는 Feature Wrapping 기법을 활용하여, 추출된 유전자 부집합에 포함된 유전자 사이의 상관관계가 낮고, 클래스 구분력이 높은 특징을 갖도록 하였다.

한국의 기술혁신 연구자 관계구조 분석 : 사회네트워크 관점 (Coauthorship Analysis of Innovation Studies in Korea : A Social Network Perspective)

  • 남수현;설성수
    • 기술혁신학회지
    • /
    • 제10권4호
    • /
    • pp.605-628
    • /
    • 2007
  • 본 논문은 사회네트워크분석 방법론을 이용하여 연구자간의 관계구조를 분석한 것이다. 분석대상은 기술혁신 분야의 두 학술저널인 ${\ulcorner}$기술혁신연구(JTI)와 ${\ulcorner}$기술혁신학회지(KTIS)${\lrcorner}$ 에 발표된 모든 논문의 저자들이다. 우리나라의 기술혁신 연구자 네트워크인 KTIS와 JTI의 일반적 특성은 네트워크의 분절화가 심하여 링크 밀도가 낮으나 KTIS는 네트워크의 중심에 131명의 연구자 그룹으로 형성된 큰 컴포넌트를 형성하고 있어 공동연구망이 견실하다. 연구분야별로는 기술정책분야가 가장 낮고, KTIS의 기술경영분야의 밀도가 가장 높게 나타났다. 또한 연구자의 소속을 대학과 대학외로 나누어 분석한 결과, 두 그룹의 평균 링크 수에 대한 차이는 통계적 유의성이 없었다. 구조적 틈새와 클러스터링계수의 피인용횟수에 대한 설명력은 구조적 틈새는 유효하나 클러스터링계수는 유의하지 않아 기존의 경영정보 분야에 대한 연구와 동일한 결과를 보였다.

  • PDF

게임교차효율성모형을 이용한 컨테이너항만의 효율성 및 클러스터링 측정방법 소고 (A Brief Efficiency and Clustering Measurement Way of Containerport by Using the Game Cross-efficiency Model)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제30권4호
    • /
    • pp.151-168
    • /
    • 2014
  • 본 논문에서는 첫째, 국내의 기존연구에서는 전혀 다루어지지 않았던 게임교차효율성 모형에 대해서 설명하였으며, 둘째, 게임교차효율성모형을 이용하여 2009년, 2010년, 2013년과 13개 항만을 대상으로 3개의 투입요소(수심, 총면적, 크레인 수), 1개의 산출요소(컨테이너화물 처리량)를 이용하여 실증분석을 하고 효율성 순위를 측정하였다. 셋째, 또한 기존의 교차효율성 모형에 의한 효율성 및 CCR모형에 의해 효율성을 측정하고 그 효율성 수치에 의한 순위를 측정하였으며, ANOVA분석을 통해서 그러한 순위가 게임교차효율성 모형과 모형 간에 차이가 있는지를 검증하였다. 넷째, 게임교차효율성 메트릭스의 상관계수 값을 구한 후에 평균연결을 사용한 덴드로그램에 의한 방법으로 클러스터링을 측정하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 게임교차효율성 모형에 의한 효율성 순위를 3개년도의 효율성 수치 평균값에 근거하여 평균적으로 순위를 측정해 보면, 4번(닝보항), 2번(홍콩항), 3번(상해항), 1번(두바이항)(12번; 싱가포르항), 5번(칭타오항), 13번(카오슝항), 8번(부산항), 6번(토쿄항), 9번(인천항), 7번(나고야항)(11번; 마닐라항), 10번(광양항) 항만의 순서였다. 교차효율성모형과 CCR모형에 의한 순위도 유사한 것으로 나타났다. 둘째, 효율성 순위를 검정한 ANOVA검정분석에서는 세 가지 모형[게임교차효율성모형, 교차효율성 모형, CCR모형]사이에 순위에 차이가 없는 것으로 나타났다. 셋째, 클러스터링 분석에서는 그룹별로 공통적(3개년 또는 2개년)으로 클러스터링되는 항만들을 살펴보면, A그룹에서는 3번(상해항), 8번(부산항)항만, B그룹에서는 4번(닝보항), 7번(나고야항)항만, C그룹에서는 9번(인천항), 11번(마닐라항)항만들로 나타났다. 본 논문이 갖는 정책적인 함의는 다음과 같다. 첫째, 본 논문의 실증분석결과, 클러스터링항만들로서 나타난 항만들에 대한 항만개발, 운영에 대한 내용을 세밀하게 검토하고 해당항만들의 장점 부분은 도입하여 실시하는 것이 필요하다. 둘째, 특히 부산항은 상해항과 인천항은 마닐라항과 전략적인 제휴관계를 맺고, 컨테이너화물처리 면에서의 혜택을 부여해야만 한다.

PSO를 이용한 FCM 기반 RBF 뉴럴네트워크의 최적화 (Optimization of FCM-based Radial Basis Function Neural Network using PSO)

  • 최정내;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1857-1858
    • /
    • 2008
  • 본 논문에서는 FCM 기반 RBF 뉴럴네트워크(FCM-RBFNN) 구조를 제안하고 PSO를 이용한 FCM-RBFNN의 구조 및 파라미터의 최적화 방법을 제시한다. 클러스터링 알고리즘은 퍼지 뉴럴 네트워크에서 멤버쉽함수의 중심점과 반경 등을 결정하는 학습에 일반적으로 사용된다. 제안된 FCM-RBFNN서는 방사기저함수로써 가우시안, 삼각형 타입 등의 정해진 형태를 사용하지 않고 데이터들 사이의 거리에 관계된 계산을 수행하는 FCM에 의해 결정된다. 기존의 RBFNN에서 후반부는 상수형태로써 방사기저함수의 선형결합으로써 표현되는 반면에 제안된 FCM-RBFNN의 후반부는 상수형, 선형, 2차식 등의 다양한 형태의 다항식으로 표현될 수 있으며 다항식의 계수는 WLSE를 이용하여 추정한다. FCM 기반 RBF 뉴럴 네트워크의 성능은 퍼지규칙의 수, 후반부 다항식의 차수 FCM의 퍼지화 계수에 의하여 결정기 때문에 FCM-RBFNN의 구조와 파라미터의 최적화가 요구된다. 본 논문에서는 PSO를 이용하여 FCM-RBFNN의 구조에 관련된 퍼지 규칙의 수, 후반부 다항식의 차수와 파라미터에 관련된 퍼지화 계수를 최적화한다. 또한 후반부 다항식의 계수는 WLSE를 사용하여 추정한다.

  • PDF

투영 변환 블록 계수를 이용한 피부 색소 침착 검출 (Skin Pigmentation Detection Using Projection Transformed Block Coefficient)

  • 류양;이석환;권성근;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1044-1056
    • /
    • 2013
  • 본 논문에서는 피부 색소 침착 영역을 검출하고 침착 정도를 측정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 먼저 훈련 영상(training image)의 통계적 분석을 통해 피부 영역에 대한 GMM-EM 클러스터링 기반 컬러 모델을 구축하고 이를 통해 피부 영역을 추출한 후, 형태학적 처리(morphological processing)를 통해 피부 영역에 존재하는 잡음을 제거한다. 이후 ICA (independent component analysis) 알고리즘을 통해 피부 영역을 헤모글로빈 및 멜라닌 성분으로 분리하고, 각 성분에 대한 투영 변환 블록 계수에 의하여 색소 침착 영역 및 크기를 결정한다. 성능 평가를 위한 모의실험으로부터 제안한 색소 침착 검출 알고리즘은 피부 색소 침착 영역의 크기 및 침착 정도를 정확하게 검출할 수 있음을 확인하였다.

클러스터링 방법을 이용한 TSK 퍼지추론 시스템의 설계 및 해석 (Design and Analysis of TSK Fuzzy Inference System using Clustering Method)

  • 오성권
    • 한국정보전자통신기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.132-136
    • /
    • 2014
  • 본 논문에서는 주어진 데이터 전처리를 통한 새로운 형태의 TSK기반 퍼지 추론 시스템을 제안한다. 제안된 모델은 주어진 데이터의 효율적인 처리를 위해 클러스터링 기법인 Fuzzy C-Means 클러스터링 방법을 이용하였다. 제안된 새로운 형태의 퍼지추론 시스템의 전반부는 FCM 을 통하여 정규화된 멤버쉽 함수와 클러스터 수를 결정하기 때문에, 멤버쉽함수의 형태 및 개수를 정의할 필요가 없어, 모델의 구조 또한 간단한 형태를 이룬다. 본 논문에서 사용된 후반부는 4가지 형태로-간략추론, 1차선형추론, 2차선형추론, 변형된 2차선형추론-가 있으며, 이는 효율적인 후반부구조를 찾는데 주도적인 역할을 한다. 또한 제안된 모델의 후반부 파라미터 계수는 Weighted Least Squares Estimation(WLSE)을 사용하여 동정하며, Least Squares Estimation(LSE)를 적용한 모델의 성능과 비교한다. 마지막으로, Boston housing 데이터를 사용하여 제안된 모델의 성능을 평가하였다.

주성분 분석법과 선형판별 분석법을 이용한 최적화된 방사형 기저 함수 신경회로망 분류기의 설계 (Design of Optimized Radial Basis Function Neural Networks Classifier with the Aid of Principal Component Analysis and Linear Discriminant Analysis)

  • 김욱동;오성권
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.735-740
    • /
    • 2012
  • 본 연구에서는 주성분 분석법 및 선형 판별 분석법을 이용한 다항식 방사형 기저 함수 신경회로망 분류기의 설계 방법론을 소개한다. 주성분 분석법과 선형판별 분석법을 사용하여 주어진 데이터의 정보 손실을 최소화한 특징데이터를 생성하고 이를 다항식 방사형 기저함수 신경회로망의 입력데이터로 사용한다. 방사형 기저 함수 신경회로망의 은닉층은 FCM 클러스터링 알고리즘으로 구성되며 연결가중치는 1차 선형식을 사용하였다. 최적의 분류기 설계를 위해서 최근에 제안된 Artificial Bee Colony(ABC) 최적화 알고리즘을 사용하여 구조 및 파라미터를 동조하였다. ABC 알고리즘을 통해 주성분 분석법과 선형판별 분석법의 고유벡터의 수 및 FCM 클러스터링 알고리즘의 퍼지화 계수등의 파라미터를 동조한다. 제안된 분류기는 대표적인 Machine Learning(ML) 데이터를 사용하여 성능을 평가하며 기존 분류기와 성능을 비교한다.

퍼지 추론 메커니즘에 기반 한 다항식 네트워크 패턴 분류기의 설계와 이의 최적화 (The Design of Polynomial Network Pattern Classifier based on Fuzzy Inference Mechanism and Its Optimization)

  • 김길성;박병준;오성권
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.970-976
    • /
    • 2007
  • 본 연구에서는 퍼지 추론 메커니즘에 기반 한 다항식 네트워크 패턴 분류기(Polynomial Network Pattern Classifier; PNC)를 설계하고 Particle Swarm Optimization 알고리즘을 이용하여 PNC 파라미터, 즉, 학습률, 모멘텀 계수, FCM 클러스터링의 퍼지화 계수(fuzzification Coefficient)를 최적화한다. 제안된 PNC 구조는 FCM 클러스터링에 기반한 분할 함수를 활성 함수로 사용하며, 다항식 함수로 구성된 연결가중치를 사용함으로서 기존 신경회로망 분류기의 선형적인 특성을 개선한다. PNC 구조는 언어적 해석관점에서 "If-then"의 퍼지 규칙으로 표현되며 퍼지 추론 메커니즘에 의해 구동된다. 즉 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 나뉘어 네트워크 구조가 형성된다. 조건부는 FCM 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 마지막으로, 네트워크의 최종출력은 추론부의 퍼지추론에 의한다. 제안된 PNC는 다항식 기반 구조의 퍼지 추론 특성으로 인해 출력 공간상에 비선형 판별 함수(nonlinear discernment function)가 생성되어 분류기로서의 성능을 높인다.

텍스처 분석 기반 칼라 텍스처 이미지 워터마킹 알고리즘 (Color-Texture Image Watermarking Algorithm Based on Texture Analysis)

  • 강명수;트룩 뉘엔;딘 뉘엔;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.35-43
    • /
    • 2013
  • 텍스처 이미지가 다양한 산업 애플리케이션 분야에 널리 사용됨에 따라, 이러한 이미지들의 저작권 보호는 중요한 이슈가 되어왔다. 이러한 이유로, 본 논문은 이미지에 내재한 텍스처 특성을 이용한 칼라 텍스처 이미지 워터마킹 알고리즘을 제안한다. 제안한 알고리즘은 퍼지 클러스터링을 위한 입력으로써 그레이 레벨 동시발생 행렬의 에너지와 동질성 특징을 사용하여 워터마크를 삽입하기 위한 적당한 블록들을 선택한다. 워터마크를 삽입하기 위해 먼저 선택된 블록들에 이산 웨이블릿 변환을 수행하고, 이산 웨이블릿 변환의 서버밴드들의 하나를 선택한다. 그런후에 이 워터마크를 중간 대역의 이산 코사인 변환 계수에 삽입한다. 또한, 본 논문은 워터마크 삽입 후 비인지성과 다양한 형태의 워커마킹 공격에 대해 강인성이 뛰어난 이득 계수들과 이산 웨이블릿 변환의 서버밴드들의 효과를 탐색한다. 모의실험 결과, 제안한 알고리즘은 이득 계수가 42이고 HH 밴드에 워터마크를 삽입하였을 때 높은 PSNR 값 (47.66 dB to 48.04 dB) 및 낮은 M-SVD 값 (8.84 to 15.6)을 얻었다. 또한 제안한 알고리즘은 노이즈 첨가, 필터링, 잘라내기 및 JPEG 압축과 같은 다양한 이미지 처리 공격에서도 높은 상관 값 (0.7193 to 1)을 보였다.

유사성 계수에 의한 문서 클러스터링 시스템 개발 (Development of Similarity-Based Document Clustering System)

  • 우훈식;임동순
    • 한국산업경영시스템학회:학술대회논문집
    • /
    • 한국산업경영시스템학회 2002년도 춘계학술대회
    • /
    • pp.119-124
    • /
    • 2002
  • Clustering of data is of a great interest in many data mining applications. In the field of document clustering, a document is represented as a data in a high dimensional space. Therefore, the document clustering can be accomplished with a general data clustering techniques. In this paper, we introduce a document clustering system based on similarity among documents. The developed system consists of three functions: 1) gatherings documents utilizing a search agent; 2) determining similarity coefficients between any two documents from term frequencies; 3) clustering documents with similarity coefficients. Especially, the document clustering is accomplished by a hybrid algorithm utilizing genetic and K-Means methods.

  • PDF