• 제목/요약/키워드: 비 클러스터링 방법

검색결과 280건 처리시간 0.031초

K-means 클러스터링을 이용한 데이터 분류 (Data classification using K-means clustering)

  • 임선자;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1087-1088
    • /
    • 2020
  • 본 논문에서는 특징 추출 분석, 관심 영역을 추출하기 위한 몇 가지 종래의 이미지 전처리 방법과 K-means 클러스터링 및 이미지 분할방법을 통해서 얻어진 결과를 정상적인 세포와 비정상 세포를 추출하는 기법을 제안한다. 그 결과 97.8% 분류로 우수한 성능을 보여주었다.

컨텍스트의존 모형 및 측정특유 모형을 이용한 아시아항만들의 클러스터링 측정 및 추세분석에 관한 실증적 연구 (An Empirical Study on the Clustering Measurement and Trend Analysis among the Asian Ports Using the Context-dependent and Measure-specific Models)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제28권1호
    • /
    • pp.53-82
    • /
    • 2012
  • 본 논문에서는 아시아 항만들 간의 클러스터링 추세를 분석하기 위해서 첫째, 기존연구에서는 다루지 못한 새로운 방법인 컨텍스트의존모형과 측정특유모형에 대해서 이론적으로 설명하였으며, 둘째, 컨텍스트의존모형에 의한 항만들의 매력도와 진전도 측정방법 및 실제적용, 셋째, 아시아 38개 항만들의 10년간 자료를 4개의 투입요소(선석길이, 수심, 총면적, 크레인수), 1개의 산출요소(컨테이너화물처리량)를 이용하여 효율성의 단계별로 효율적인 항만들을 대상으로 클러스터링하는 방법을 실증적으로 보여 주고 분석하였다. 또한 매력도, 진전도, 벤치마킹쉐어의 측정방법도 보여 주었다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 2009년도 자료를 이용한 매력도측정결과는 Degree 1부터 Degree 7까지의 각 Degree별 랭킹을 살펴보면, 광저우항, 두바이항, 홍콩항, 닝보항, 상하이항의 순서였다. 둘째, 2009년도 단계1에 속한 항만들의 등급별 진전도를 측정한 결과를 보면, 베이루트항, 포트술탄항, 아덴항과 같이 낮은 등급의 점수에 해당하는 항만들은 그 전 등급의 항만을 벤치마킹해야만 한다. 셋째, 효율적인 항만들의 벤치마킹 쉐어에 대한 측정결과를 보면, 두바이항(선석길이), 홍콩항(수심, 총면적, 크레인수)이 다른 비효율적인 항만들의 효율성에 미친 영향이 큰 것으로 나타났다. 넷째, 컨텍스트의존모형과 측정특유모형에 의한 클러스터링 결과는 동일하게 나타났다. 그 가장 큰 이유는 투입-산출 자료의 특성 때문이라고 판단된다. 다섯째, 10년동안의 클러스터링 추세를 분석결과는 다음과 같다. (1) 가장 효율적인 단계(1단계, 2단계)의 클러스터링은 홍콩항, 상하이항, 싱가포르항. 닝보항, 광저우항, 카오슝항으로 나타났다. (2) 효율적인 단계(2단계, 3단계)의 클러스터링은 두바이항, 크호르 파칸항, 첸나이항, 부산항, 콜롬보항, 키롱항, 탄중펠프스항으로 나타났다. (3) 중정도의 효율적인 단계(4단계, 5단계, 6단계)의 클러스터링은 사히드 라자이항, 탄중프리옥항, 하이파항, 탄중퍼락항, 토쿄항, 요코하마항, 코베항, 나고야항, 오사카항, 인천항, 카라치항, 마닐라항, 방콕항, 담만항으로 나타났다. (4) 하위의 효율적인 단계(7단계, 8단계)의 클러스터링은 포트술탄카부스항, 제다항, 아덴항으로 나타났다. (5) 효율적인 단계로 진전되어 클러스터링된 항은 닝보항, 첸나이항, 탄중펠프스항으로 나타났다. 본 논문이 갖는 정책적인 함의는 항만정책입안자들은 컨텍스트의존모형과 측정특유모형을 항만의 클러스터링에 도입하여 해당항만이 발전할 수 있는 전략을 수립하고 이행해 나가야만 한다는 점이다.

클러스터링 기반의 무선 인터넷 프록시 서버 (A Clustering based Wireless Internet Proxy Sewer)

  • 우재용;곽후근;정윤재;박홍주;김동승;정규식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.76-78
    • /
    • 2003
  • 기존 유선 인터넷과 달리 무선 인터넷은 낮은 대역폭. 빈번하게 접속이 끊기는 현상, 단말기내의 낮은 컴퓨팅 파워 및 작은 화면, 사용자의 이동성 등의 특성에 따른 많은 제약점들을 갖고 있다. 또한 무선 인터넷 서버는 급증하는 사용자에 따른 대용량 트래픽을 처리할 수 있도록 확장성이 있어야 한다. 이에 위의 문제를 캐싱(Caching)과 압축(Transcoding, Distillation)으로 해결하는 방법으로 무선 프록시 서버를 사용한다. TranSend는 클러스터링 기반의 무선 프록시 서버로 제안된 것이나 시스템적인(Systematic) 방법으로 확장성을 보장하지 못하는 단점을 가진다. 이에 본 논문에서는 시스템적인 방법으로 확장성을 보장하는 클러스터링 기반의 무선 인터넷 프록시 서버를 제안한다. 16대의 컴퓨터를 사용하여 실험을 수행하였고 실험 결과 TranSend 시스템에 비해 32.17%의 성능 향상을 보였다.

  • PDF

데이타마이닝 기법을 이용한 효율적인 전문 용어 클러스터링 (An Efficient Terminology Clustering Method Using Datamining Technique)

  • 이정화;남상엽;문현정;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.210-215
    • /
    • 2000
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 일반적인 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 대량의 문서로부터 유용한 지식 정보를 찾기 위하여 의미적으로 연관된 전문 용어들끼리 클러스터링 하기 위한 방법을 제안하였다. 학술 논문을 대상으로 전문 용어를 추출하여 관련된 용어들끼리 클러스터를 구성하는 실험을 통하여 제안된 방법의 효율성을 보였다.

  • PDF

주요 항목 집합을 이용한 문서 클러스터링 및 연관 탐사 기법 (Clustering and Association Rule Mining of Transactions using Large Items)

  • 서성보;김선철;이준욱;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.169-171
    • /
    • 2000
  • 현재 광범위한 웹 문서를 검색하기 위해서 많은 사용자들이 여러 종류의 검색엔진을 사용하고 있다. 하지만 대부분의 사용자는 검색엔진에 의해 검색된 문서의 순서화가 된 긴 리스트의 검색 문서들과 이들이 갖는 낮은 신뢰도에 대해 검색된 문서 중에 자신이 원하는 타당한 문서를 검색하는 불편함이 있어 왔다. 정보 검색에서 문서의 클러스터링은 검색된 결과를 재구성하는 효율적이고 선택적인 방법이다. 이 연구에서는 문서를 트랜잭션 관점에서 해석하여 하나의 클러스터에 대해 유사성을 측정하기 이해 주요항목과 비 주요항목으로 구분하여 각 트랜잭션의 최소 비용 계산을 통해 자동화된 문서 클러스터링 기법을 제안한다. 또한 클러스터링 단계에서 주요 항목간의 연관 규칙을 생성하기 위하여 문서 클러스터링을 위한 디스크 엑세스 동안 키워드간의 연관성을 찾을 수 있는 효율적인 검색 기법을 제시한다.

  • PDF

CORBA 로드밸런싱 서비스를 사용한 범용 클러스터링 시스템 (General-purpose Clustering System Using Standard CORBA Load Balancing Service)

  • 차현철;최정호;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.451-453
    • /
    • 2003
  • 인터넷과 개인컴퓨터가 대중화되어 사용자층이 넓어지고, 컴퓨터 기술이 다양화됨에 따라 점차 고가용성 서버에 대한 관심이 높아지면서 낮은 비용에 높은 성능을 만족시켜줄 수 있는 클러스터링 시스템이 인기를 끌고 있다. 하지만 기존의 클러스터링 시스템은 높은 성능에 비해 특정 플랫폼에 종속적이거나 특정 어플리케이션을 위한 구성이기 때문에 하나의 클러스터링 시스템을 여러 가지 플랫폼에서 다양한 목적으로 사용하기에는 부적절하다. 특정 장치 및 프로토콜 혹은 플랫폼에 의존적인 시스템은 유지보수 및 확장성의 제약을 받게 되기 때문에 이질적 컴포넌트들을 유기적으로 결합할 수 있는 방법이 요구되며 이러한 시스템을 효과적으로 구현하기 위해서는 표준 기반의 COTS (commercial-off-the-shelf) 미들웨어의 적용이 반드시 필요하다. 본 논문에서는 미들웨어로서 분산객체컴퓨팅의 표준인 CORBA 로드 밸런싱 서비스를 이용하여 유지보수 및 확장성이 용이하고 다양한 플랫폼에서 사용이 가능하며 여러 종류의 어플리케이션의 수행을 위한 클러스터 노드의 동적 추가/삭제가 가능한 범용 클러스터링 시스템을 설계하고 구현한다.

  • PDF

밀도 기반 클러스터링을 이용한 효과적인 공간 특성화 방법의 설계 및 구현 (Design and Implementation of Effective Spatial Characterization using Density-Based Clustering)

  • 유재현;이주홍;전석주;박상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.148-150
    • /
    • 2005
  • 최근 유비쿼터스 컴퓨팅의 관심이 증대되면서, 방대하고 다양한 형태의 데이터에 대한 효율성과 효과성을 고려한 지식 탐사방법연구의 필요성이 제기되었다. 기존의 지식 탐사방법에 대한 연구들은 방대한 비공간 데이터들의 지식을 효율적으로 탐사하고자 하였다. 그러나 기존의 연구는 탐사된 지식의 효율성안을 고려하여 유용한 지식탐사를 보장하지 못하는 문제점을 가진다. 따라서 본 논문은 공간 데이터 타입을 포함하는 대용랑의 데이터들로부터 효과성을 보장하는 특성화 지식 탐사방법을 제안한다. 본 논문에서 제안하는 특성화 지식 탐사기법은 공간 및 비공간 데이터들의 특성을 나타내는 요약된 지식을 제공하며, 밀도 기반의 클러스터링 기법을 적용하여 특성화 지식 탐사의 효과성을 높인다.

  • PDF

낮은 신호 대 잡음비 환경에서의 퍼지 소속도 천이 C-means 클러스터링을 이용한 음성구간 검출 알고리즘 (Voice Activity Detection Algorithm using Fuzzy Membership Shifted C-means Clustering in Low SNR Environment)

  • 이기현;이윤정;조진호;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제17권3호
    • /
    • pp.312-323
    • /
    • 2014
  • 음성구간 검출은 음성과 잡음이 섞인 신호에서 음성과 잡음이 섞인 신호에서 음성구간을 찾는 과정으로 잡음제거나 음성 향상을 위한 신호처리에서 매우 중요한 과정이다. 지금까지 음성구간 검출에 관한 많은 연구가 있었지만, 낮은 신호 대 잡음비 환경에서 문장형태의 음성신호에 대해서는 좋은 성능을 보이지 못하였다. 본 논문에서는 신호의 엔트로피를 이용한 초기 VAD과정을 거친 후, 퍼지 소속도 천이 c-means 클러스터링 방법을 이용해 주 VAD과정을 거치는 새로운 VAD알고리즘을 제안한다. 제안한 알고리즘의 성능을 비교 평가하기 위하여 백색잡음의 다양한 신호 대 잡음비 환경에서 실험을 수행하였으며 실험결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.

웹 트랜잭션 클러스터링의 정확성을 높이기 위한 흥미가중치 적용 유사도 비교방법 (Similarity Measurement with Interestingness Weight for Improving the Accuracy of Web Transaction Clustering)

  • 강태호;민영수;유재수
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.717-730
    • /
    • 2004
  • 최근 들어 원 사이트 개인화(Web Personalization)에 관한 연구가 활발히 진행되고 있다. 웹 개인화는 클러스터링과 같은 데이터 마이닝 기법을 이용하여 가 사용자에게 가장 흥미를 가질만한 URL 집합을 예측하는 것이라 할 수 있다. 기존의 클러스터링을 이용한 방식에서는 웹 트랜잭션들을 웹 사이트의 각 URL들에 방문했는지 안했는지를 나타내는 비트 벡터(bit vector)로 표현하였다. 그리고 이들 비트 벡터의 방문 패턴이 일치하는 정도에 따라 유사성을 결정하였다. 하지간 이것은 유사한 성향을 가지는 웹 트랜잭션을 클러스터링 하는데 있어 사용자의 흥미를 배제하고 단순히 방문 여부만을 반영하게 되는 문제점이 발생하게 된다. 즉 방문 목적 또는 성향이 유사하지 않은 웹 트랜잭션들을 같은 그룹으로 분류할 가능성이 존재하게 된다 이에 본 논문에서는 기존의 비트 벡터를 이용한 트랜잭션 모델을 사용자의 흥미도(Interestingness)를 반영할 수 있도록 보완하여 새로운 점 트랜잭션 모델을 제시하고 흥미가중치를 적용한 유사도 비교방법을 제안한다. 그리고 성능평가를 통하여 제안만 방법이 기졸 방법에 비해 클러스터링의 정확성을 높임을 보인다.

클러스터링 기반의 무선 인터넷 프록시 서버 (A Clustering based Wireless Internet Proxy Server)

  • 곽후근;우재용;정윤재;김동승;정규식
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권1호
    • /
    • pp.101-111
    • /
    • 2004
  • 기존 유선 인터넷과 달리 무선 인터넷은 낮은 대역폭, 빈번하게 접속이 끊기는 현상, 단말기내의 낮은 컴퓨팅 파워 및 작은 화면, 사용자의 이동성 등의 특성에 따른 많은 제약점들을 갖고 있다. 또한 무선 인터넷 서버는 급증하는 사용자에 따른 대용량 트래픽을 처리할 수 있도록 확장성이 있어야 한다. 이에 위의 문제를 캐싱(Caching)과 압축(Transcoding, Distillation)으로 해결하는 방법으로 무선 프록시서버를 사용한다. TranSend는 클러스터링 기반의 무선 프록시 서버로 제안된 것이나 시스템적인(Systematic) 방법으로 확장성을 보장하지 못하는 단점을 가진다. 이에 본 논문에서는 시스템적인 방법으로 확장성을 보장하는 클러스터링 기반의 무선 인터넷 프록시 서버를 제안한다. 16대의 컴퓨터를 사용하여 실험을 수행하였고 실험 결과 TranSend 시스템에 비해 32.17%의 성능 향상을 보였다.