• 제목/요약/키워드: Classification of Clusters

검색결과 349건 처리시간 0.025초

자산변동 좌표 클러스터링 기반 게임봇 탐지 (Game-bot detection based on Clustering of asset-varied location coordinates)

  • 송현민;김휘강
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1131-1141
    • /
    • 2015
  • 본 논문에서는 MMORPG에서 각 캐릭터의 소지금 증가/감소 이벤트 로그 데이터를 위주로 플레이어의 액션 로그 데이터를 조사하여 게임봇을 탐지하는 기계 학습 기반의 새로운 접근 방법을 제안한다. 게임봇 계정과 일반 계정을 구분하는 주요 피쳐를 추출하기 위해 밀도 기반 군집화 알고리즘의 하나인 DBSCAN (Density Based Spatial Clustering of Application with Noise)를 이용하였다. DBSCAN 알고리즘을 통해 각 플레이어의 소지금 증가/감소 위치 좌표를 클러스터링하고, 그 결과 생성된 클러스터의 수, 코어 포인트의 비율, 멤버 포인트의 비율, 노이즈 포인트의 비율과 같은 공간적 특성을 나타내는 값들을 추출하였다. 해당 피쳐들을 사용하면 게임봇 개발자들이 게임봇 탐지 시스템의 원리를 알더라도 넓은 지역을 돌아다니며 사냥을 하도록 게임봇 프로그램을 제작하는 것은 매우 비효율적이기 때문에 탐지 시스템을 우회하기 어렵게 된다. 결과적으로, 게임봇은 소지금 변동 좌표 데이터로부터 추출한 공간적 특성에서 일반유저와 명확한 차이를 보였다. 예를 들면, DBSCAN 클러스터링 결과 중 노이즈 포인트의 비율에서 게임봇은 5% 이하의 낮은 값을 가지는 반면에 일반 유저들은 대부분 높은 값을 갖는다. 실제 MMORPG의 액션 로그 데이터를 이용한 게임봇 탐지에서, 본 논문에서 제안된 시스템은 높은 탐지율의 우수한 성능을 보였다.

Oral manifestations and their correlation to baseline CD4 count of HIV/AIDS patients in Ghana

  • Frimpong, Paul;Amponsah, Emmanuel Kofi;Abebrese, Jacob;Kim, Soung Min
    • Journal of the Korean Association of Oral and Maxillofacial Surgeons
    • /
    • 제43권1호
    • /
    • pp.29-36
    • /
    • 2017
  • Objectives: Acquired immunodeficiency syndrome (AIDS) is a disease of the human immune system caused by the human immunodeficiency virus (HIV). People with AIDS are much more vulnerable to infections, including opportunistic infections and tumors, than people with a healthy immune system. The objective of this study was to correlate oral lesions associated with HIV/AIDS and immunosuppression levels by measuring clusters of differentiation 4 (CD4) cell counts among patients living in the middle western regions of Ghana. Materials and Methods: A total of 120 patients who visited the HIV clinic at the Komfo Anokye Teaching Hospital and the Regional Hospital Sunyani of Ghana were consecutively enrolled in this prospective and cross-sectional study. Referred patients' baseline CD4 counts were obtained from medical records and each patient received an initial physician assessment. Intraoral diagnoses were based on the classification and diagnostic criteria of the EEC Clearinghouse, 1993. After the initial assessment, extra- and intraoral tissues from each enrolled patient were examined. Data analyses were carried out using simple proportions, frequencies and chi-square tests of significance. Results: Our study included 120 patients, and was comprised of 42 (35.0%) males and 78 (65.0%) females, ranging in age from 21 to 67 years with sex-specific mean ages of 39.31 years (males) and 39.28 years (females). Patient CD4 count values ranged from 3 to 985 cells/mL with a mean baseline CD4 count of 291.29 cells/mL for males and 325.92 cells/mL for females. The mean baseline CD4 count for the entire sample was 313.80 cells/mL. Of the 120 patients we examined, 99 (82.5%) were observed to have at least one HIV-associated intraoral lesion while 21 (17.5%) had no intraoral lesions. Oral candidiasis, periodontitis, melanotic hyperpigmentation, gingivitis and xerostomia were the most common oral lesions. Conclusion: From a total of nine oral lesions, six lesions that included oral candidiasis, periodontitis, melanotic hyperpigmentation, gingivitis, xerostomia and oral hairy leukoplakia were significantly correlated with declining CD4 counts.

산업용 CR영상의 기하학적 구도분석과 영역분할 (Geometric Scheme Analysis and Region Segmentation for Industrial CR Images)

  • 황중원;황재호
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.124-131
    • /
    • 2009
  • 방사선영상의 신뢰할 만한 영역검출은 용접부위 결함탐지 이전의 중요한 작업 중의 하나이다. 추출되는 특징들은 각 분할된 영상에 대하여 서로 다른 군집으로 분류되어야한다. 그러나 종래의 분할 기법으로는 방사선영상 고유의 색도중첩과 낮은 SN비로 인해 만족할 만한 결과를 얻기가 쉽지 않다. 전체나 국부처리로는 잡음제거에 취약할 뿐만 아니라 영역분류도 어렵다. 이 논문은 산업용 CR 영상에서 영역기반실현의 분할을 위한 적절한 기법을 제시한다. 강판튜브에서 용접과 비용접 구간의 기하학적 차이가 영상화 과정을 통해 배경부, 두께부, 중간부 및 용접부 영역을 생성하고 계층 구조적 배열을 형성한다. 비록 그 구조가 잡음에 훼손되기는 하지만 영역구분 구도 각 영역의 차별된 기하학적 특성에 근거한 국부군집화에 의해 선별이 가능하다. 관련 영역의 기하학적 속성에 의해 그에 따른 영역이 계층별로 선별되어 실제 구분이 영역간 경계를 반영하기 때문에 직경과 길이방향의 군집화는 각 계층의 구별을 명확케 한다. 그리고 산업용 강판튜브 CR영상에 다양한 분할 방식으로 비교 실험을 실시하여 이 기법의 효과를 보였다.

Quantitative Flood Forecasting Using Remotely-Sensed Data and Neural Networks

  • Kim, Gwangseob
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2002년도 학술발표회 논문집(I)
    • /
    • pp.43-50
    • /
    • 2002
  • Accurate quantitative forecasting of rainfall for basins with a short response time is essential to predict streamflow and flash floods. Previously, neural networks were used to develop a Quantitative Precipitation Forecasting (QPF) model that highly improved forecasting skill at specific locations in Pennsylvania, using both Numerical Weather Prediction (NWP) output and rainfall and radiosonde data. The objective of this study was to improve an existing artificial neural network model and incorporate the evolving structure and frequency of intense weather systems in the mid-Atlantic region of the United States for improved flood forecasting. Besides using radiosonde and rainfall data, the model also used the satellite-derived characteristics of storm systems such as tropical cyclones, mesoscale convective complex systems and convective cloud clusters as input. The convective classification and tracking system (CCATS) was used to identify and quantify storm properties such as life time, area, eccentricity, and track. As in standard expert prediction systems, the fundamental structure of the neural network model was learned from the hydroclimatology of the relationships between weather system, rainfall production and streamflow response in the study area. The new Quantitative Flood Forecasting (QFF) model was applied to predict streamflow peaks with lead-times of 18 and 24 hours over a five year period in 4 watersheds on the leeward side of the Appalachian mountains in the mid-Atlantic region. Threat scores consistently above .6 and close to 0.8 ∼ 0.9 were obtained fur 18 hour lead-time forecasts, and skill scores of at least 4% and up to 6% were attained for the 24 hour lead-time forecasts. This work demonstrates that multisensor data cast into an expert information system such as neural networks, if built upon scientific understanding of regional hydrometeorology, can lead to significant gains in the forecast skill of extreme rainfall and associated floods. In particular, this study validates our hypothesis that accurate and extended flood forecast lead-times can be attained by taking into consideration the synoptic evolution of atmospheric conditions extracted from the analysis of large-area remotely sensed imagery While physically-based numerical weather prediction and river routing models cannot accurately depict complex natural non-linear processes, and thus have difficulty in simulating extreme events such as heavy rainfall and floods, data-driven approaches should be viewed as a strong alternative in operational hydrology. This is especially more pertinent at a time when the diversity of sensors in satellites and ground-based operational weather monitoring systems provide large volumes of data on a real-time basis.

  • PDF

GIS를 활용한 도심 공간기능분석과 유형화에 관한 연구 (The Study on the Downtown Spatial Functional Analysis and Downtown Classification using GIS)

  • 김흥관;신용은;백태경;강기철;정희수;오주헌;여성준
    • 한국지리정보학회지
    • /
    • 제10권4호
    • /
    • pp.75-86
    • /
    • 2007
  • 부산시의 도심(축)에 속하는 15개 동을 대상으로 2000년, 2005년 두 개 연도를 LQ지수와 군집분석을 통해 도심의 공간기능에 대하여 연구하였다. 2000년도의 LQ지수를 분석한 결과 2차산업은 재래시장과 대규모 상권이 형성된 지역에 특화되어 나타나고 있으며, 3차산업은 금융권이 집중되어 있는 지역에서 특화되어 나타나고 있다. 2005년도의 LQ지수는 2000년도의 LQ지수와 거의 변화가 없었으나, 3차산업에 속하는 도심의 중심업무기능이 구도심에서 급격히 쇠퇴하고 신도심으로 대변되는 서면지역에서 높게 나타나 특화되고 있었다. 이는 과거 구도심의 중심업무기능이 신도심으로 이동함에 따라, 구도심의 도심의 성격을 지닌 주요 기능이 쇠퇴하고 있음을 나타낸다. 그 다음으로 LQ지수를 이용하여 군집분석을 실시한 결과, 3개 군집으로 분류 할 수 있었다. 먼저 1군집은 도심 쇠퇴현상이 나타나는 구도심지역이고, 2군집은 주거기능이 강하게 나타나는 지역이며, 3군집은 현재, 도심의 공간기능이 매우 활발히 일어나고 있는 지역이다. 이에 본 연구에서는 다음과 같은 결과가 도출되었다. 첫째, 구도심의 쇠퇴를 억제할 수 있는 다양한 도심재생방안 수립과 신도심에 대한 종합적이고 체계적인 계획의 수립이 필요할 것이다. 둘째, 산업별 특화도에 따라서 도심 공간기능이 배치되므로 이에 지역에 적합한 산업의 도입과 함께 발전을 할 수 있는 기반의 조성이 필요할 것이다.

  • PDF

초위성 마커를 이용한 감(Diospyros kaki Thunb.)의 유연관계 분석 (Evaluation of Genetic Diversity among Persimmon Cultivars (Diospyros kaki Thunb.) Using Microsatellite Markers)

  • 황지현;박여옥;김성철;이용재;강점순;최영환;손병구;박영훈
    • 생명과학회지
    • /
    • 제20권4호
    • /
    • pp.632-638
    • /
    • 2010
  • 총 20개의 감 SSR primer set을 사용하여 완전단감(PCNA) 12품종, 불완전단감(PVNA) 13품종, 불완전 떫은감(PVA) 15품종, 완전 떫은감(PCA) 8품종 등, 총 48개 유전자원의 유전적 연관성을 분석하였다. 획득된 114개의 다형성 밴드를 이용하여 UPGMA 방식으로 유사도 및 집괴분석을 수행한 결과 48개 품종들은 크게 2개의 그룹(cluster)으로 나뉘어졌으며, 제 1 cluster는 다시 4개의 subcluster를 형성하였다. 이는 탈삽의 특성을 기준으로 분류한 품종군과 대체로 일치 함을 알 수 있고, 품종군간의 유연관계에 있어서는 완전단감군은 불완전 단감군과, 그리고 완전 떫은감은 불완전 떫은감군과 유연관계가 더욱 높은 것으로 관찰되었다. 평균 유사도의 값은 0.499였고 품종간 가장 높은 유사도 값(0.954)를 나타낸 것은 '청도반시'와 '함안반시'였고, 가장 낮은 유사도 값(0.192)를 나타낸 것은 '대마반'과 '애탕'이었다. 본 연구에 사용된 2SSR primer 들은 유럽 감품종으로부터 개발되어 보고되었지만, 일본 및 국내 품종의 연구에서도 효과적으로 사용될 수 있었고, 이들 마커들을 통해, 48개 품종 중 청도반시(Cheongdo-Bansi)와 경산반시(Gyeongsan-Bansi)를 제외한 모든 품종간 구별이 가능하였다. 이는 향후 신품종 개발시 품종보호를 위한 품종 특이적 마커로 효율적으로 사용될 수 있음을 보여준다.

매립물 특성 조사를 위한 다변량 통계분석 기법의 응용 (Application of Multivariate Statistical Analysis Technique in Landfill Investigation)

  • 권병두;김차섭
    • 한국지구과학회지
    • /
    • 제18권6호
    • /
    • pp.515-521
    • /
    • 1997
  • 난지도 매립장 매립물의 특성을 조사하기 위해서 중력, 자력, LandSat TM 열적외선 밴드 자료, 매립장의 표면에서 측정한 침하량 자료 등을 다변량 통계분석기법을 응용하여 분석하였다. 분석에 이용한 자료들은 각기 상이한 깊이에 관한 정보를 제공하기 때문에 측정된 총 자력자료와 중력자료는 자극화변환된 자력이상과 매립장의 3차원 밀도분포로 각기 전환하였으며, 본 연구에서는 이 중 매립장의 상부층에 관한 정보를 이용하였다. 통계분석은 침하량 측정 지점들을 대상으로 수행하였으며, 이들 지점에서의 자극화변환 자력이상, 매립물의 밀도, LandSat TM 열적외선 밴드 값들은 내삽방법을 이용하여 구하였다. 자료분석에 사용한 다변량 통계분석 기법은 개체간의 기하학적인 거리를 이용하여 군집화하는 집락분석으로, 개체간의 거리 계산시 각 자료간의 상이한 측정단위가 주는 효과를 제거하기 위해서 사전에 표준화를 실시하였다. 군집화는 체계적 군집화 방법을 이용하여 수행하였다. 물리적 특성을 바탕으로 분류된 최적의 군집수는 수상도에서 나타난 결과에 따르면 총 6개의 군집으로 나타났다. 본 연구의 결과는 통합된 지구물리자료에 다변량 통계분석 기법을 적용함으로써 복합적 인 쓰레기 매립장의 특성 규명이 가능함을 시사한다.

  • PDF

성인 여성의 기성복 치수를 위한 체형 분류 (Classification of Body Types for sizes of Ready-to-Wear-focusing on Korean female aged from 18 to 24)

  • 김경화;남윤자
    • 복식
    • /
    • 제53권6호
    • /
    • pp.145-159
    • /
    • 2003
  • The purpose of this study was to classify body type for ready-to-wear sizes. The subjects were 300 women ages of 18-24. they were measured direct anthropometry. The body types for sizing system were divided by Rohrer Index. KS drop value and ISO drop value. The results of this study were as follows. 1. By adapting the Rohrer Index. we classify 3 types from anthropometric measurements. The thin type covered 39.3%, the standard type 51.0% and the obesity type 18.7%. The characteristics of clusters were as follows. Thin type was characterized by tall. slender type and slim. The standard type was characterized by middle sized. The obesity type was characterized by short. fat type. and large bust. 2. By adapting the KS system drop value. we classify 3 types from anthropometric measurements. The H type(drop 0) covered 25.6%. the N type(drop 6) 65.2% and the A type(drop 12) 9.2%. Type H was slightly tall large bust. and curved from waist to hip. Type A was slightly thin. large hip and smaller bust than type N. Principal factor components were bust size. The height could be divided into three groups. The Petite(l50cm) covered 5.5%. the Regular(l60cm) 64.7% and the Tall(l70cm) 29.8%. Through the crosstab of height and body type. we extracted regular height by N type 46.2% the largest cell. The body type was the higher order of N type. H type and A type. The tall was the higher order of Regular. Tall and Petite. 3. By adapting the ISO system drop value. we classify 3 types from anthropometric measurements. The H type(drop 0) covered 15.0%. the M type(drop 6) 41.0% and the A type(drop 12) 44.0%. Type H was slightly short. slightly fat and large bust. Type A was slightly tall. slight thin than type M. The height could be divided into three groups. We adjust the height section after allow for height distribution. The Short(152cm) covered 12.8%. the Regular(160cm) 66.9% and the Long(168cm) 20.3%. Through the crosstab of height and body type, we extracted regular height by M type 29.3% the largest cell. The body type was the higher order of M type, A type and H type. The tall was the higher order of Regular, Long and short.

쑥 수집종의 형태적 형질과 RAPD분석에 의한 분류 (Classification of Artemisia spp. Collections Based on Morphological Characters and RAPD Analysis)

  • 박상규;정봉환;김홍식;조용구
    • 한국약용작물학회지
    • /
    • 제13권6호
    • /
    • pp.278-286
    • /
    • 2005
  • 쑥 수집종 80개를 대상으로 형태적 형질과 RAPD 분석을 하였고, 유전적 다양성을 이용하여 유연관계를 분석하고 이를 기초로 품종군을 분류하였다. 주요 형태적 형질을 이용하여 쑥 수집종에 대한 군집분석 결과, 군집간의 치대거리 0.82를 기준으로 하여 분류하였을 때 5개 군으로 분류하였는데, I군에 10개 (15%), II군에 30개 (37.5%), III군에 20개 (25%), IV군에 3개 (4%), V군에 4개 (5%)를 나타내었다. RAPD분석에 이용한 10-mer primer 에 대하여 98개의 밴드를 얻었고, 그 중 다형성을 보인 밴드는 68개로 69%였는데, 선발된 Primer에서 증폭된 밴드 수는 $8{\sim}11$개로 다양하였으며, 평균 9.8개였다. RAPD에 의한 군집 분석에서 유연계수 0.63을 기준으로 하여 구분한 결과 6개의 군으로 분류되었다. I, II군이 각각 전체의 34%, 36%를 차지하여 가장 큰 군으로 분류되었고, 나머지 $III{\sim}V$군은 모두 소군으로 15%가 속하였다. 특히 I군에는 약쑥이 많았고, II군에는 뺑쑥이 많이 분포하였다.

에너지 절감형 서버 클러스터에서 급변하는 부하 처리를 위한 유연한 다중 임계치 기반의 서버 전원 모드 제어 (A Flexible Multi-Threshold Based Control of Server Power Mode for Handling Rapidly Changing Loads in an Energy Aware Server Cluster)

  • 안태준;조성철;김석구;천경호;정규식
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권9호
    • /
    • pp.279-292
    • /
    • 2014
  • 에너지 절감형 서버 클러스터에서는 에너지절감을 고려하지 않는 기존 환경에서만큼의 서비스 품질을 보장하면서 전력소비를 최대로 절감하는 것이 목표이다. 에너지 절감형 서버 클러스터에 관한 기존 연구에서는 현재의 사용자요청을 처리하는데 필요한 최소한의 서버 대수를 계산하여 해당 서버만을 활성화하도록 서버 전원 모드를 일정주기마다 제어한다. 부하가 급격하게 변하는 상황에서는 서버 수를 빨리 증가하지 못하기 때문에 기존 연구에서는 서비스품질이 떨어진다. 이 문제를 해결하기 위해, 본 논문에서는 부하추세를 급증, 증가, 완만, 감소, 급감하는 5가지 상황으로 분류하여 필요한 서버 대수를 계산할 때 각 상황에 맞는 다중 임계치를 적용한다. 또한 부하추세를 5등급으로 나누는 기준을 서버가 부하를 추가로 감당할 수 있는 잔여용량에 따라 유연하게 조정하는 방법을 추가로 사용한다. 실험은 서버 15대로 클러스터를 구성하여 수행하였다. SPECweb이라는 전문 벤치마킹 툴을 이용하여 부하가 급격하게 변화하는 패턴들을 생성하여 사용하였다. 실험 결과는 서비스품질은 에너지절감을 고려하지 않는 기존의 클러스터링 방식 수준으로 향상되었으며, 소비전력은 부하 패턴에 따라 최대 약 50% 절감되었음을 보여준다.