• 제목/요약/키워드: pattern similarity

검색결과 556건 처리시간 0.023초

B-Corr Model for Bot Group Activity Detection Based on Network Flows Traffic Analysis

  • Hostiadi, Dandy Pramana;Wibisono, Waskitho;Ahmad, Tohari
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4176-4197
    • /
    • 2020
  • Botnet is a type of dangerous malware. Botnet attack with a collection of bots attacking a similar target and activity pattern is called bot group activities. The detection of bot group activities using intrusion detection models can only detect single bot activities but cannot detect bots' behavioral relation on bot group attack. Detection of bot group activities could help network administrators isolate an activity or access a bot group attacks and determine the relations between bots that can measure the correlation. This paper proposed a new model to measure the similarity between bot activities using the intersections-probability concept to define bot group activities called as B-Corr Model. The B-Corr model consisted of several stages, such as extraction feature from bot activity flows, measurement of intersections between bots, and similarity value production. B-Corr model categorizes similar bots with a similar target to specify bot group activities. To achieve a more comprehensive view, the B-Corr model visualizes the similarity values between bots in the form of a similar bot graph. Furthermore, extensive experiments have been conducted using real botnet datasets with high detection accuracy in various scenarios.

순차 패턴 마이닝을 사용한 두 XML 문서간 최대 유사 경로 추출 (Extracting Maximal Similar Paths between Two XML Documents using Sequential Pattern Mining)

  • 이정원;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.553-566
    • /
    • 2004
  • 최근 XML 저장 기법, 질의 최적화, 인덱싱 등의 XML 관련 기술이 활발히 연구되고 있다. 이와 관련하여 하나의 DTD나 XML Schema로 정의된 고정 구조를 공유하는 문서 집합이 아니라 다양한 구조를 가진 문서 집합인 경우 다중 문서간의 구조적 유사성이나 차이점 등을 파악할 필요가 있다. 예를 들어 서로 다른 사이트나 문서 관리 시스템에서 도출된 문서들을 합병하거나 분류할 필요가 있을 때, 문서를 처리하기 위해 공유 구조를 발견하는 일은 매우 중요하다. 본 연구에서는 다양한 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘(1)을 변형하여 두 XML 문서간 최대 유사 경로를 추출한다. 몇 가지 실험을 통해 본 논문에서 제안한 변형된 순차패턴 마이닝 알고리즘이 두 문서간의 최대 유사 경로를 찾아내고 또한 두 문서간의 정확한 공유 경로 및 최대 유사 경로를 정확히 찾을 수 있음을 보인다. 또한 실험 결과 분석을 위해 최대 유사 경로를 기반으로 정의된 유사성 척도가 XML 문서를 정확하게 분류할 있음을 보인다.

어휘망(U-WIN)의 구문관계 자동구축 (Automatic Construction of Syntactic Relation in Lexical Network(U-WIN))

  • 임지희;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.627-635
    • /
    • 2008
  • 본 연구에서는 사용자 어휘지능망(U-WIN)의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 구문관계를 형성할 수 있는 후보명사를 용언의 용례에서 문형 정보를 기준으로 추출함으로써, 용언의 세분화된 의미별로 정확하고 다양한 후보명사를 추출할 수 있다. 그러나 추출된 후보명사는 다양한 의미를 지니고 있으므로, 어휘간의 명확한 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 정확한 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문 패턴, 의미 유사도, 빈도 정보 등을 이용하여 후보명사의 의미를 분별한다. 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

대기전력 차단시점 발견을 위한 모델링과 그룹생성 알고리즘 구현 (Modeling for Discovery the Cutoff Point in Standby Power and Implementation of Group Formation Algorithm)

  • 박태진;김수도;박만곤
    • 한국멀티미디어학회논문지
    • /
    • 제12권1호
    • /
    • pp.107-121
    • /
    • 2009
  • 대기전력(Standby power) 소모가 발생하는 첫 번째 요인은 전원에서 IC로 들어오면서 거쳐야하는 기동전압 때문이며 나머지 하나는 IC가 동작할 때의 전류 때문이다. 본 논문에서는 대기전력 상태와 차단 시점의 패턴분석을 통해서 자동 On/Off할 수 있도록 하는 간단한 모듈장치 구성과 알고리즘 적용에 목적을 두었다. 이를 위해서 전력 신호분석과 모델링에 근간을 두었으며 대기전력 절감을 위해서 On/Off 차단기준을 마련했다. On/Off 차단 시점을 찾기 위해서 $1^{st}$ SCS와 $2^{nd}$ SCS의 차분값(subtraction value), 그리고 콘센트로부터 유입된 초당 샘플링 계수에 대한 중간값(median value)을 중요한 파라미터로써 정의한 다음 대기전력 상태에서의 유사그룹 및 유력패턴 그룹 생성 알고리즘을 수행했다.

  • PDF

차종 시퀀스 패턴을 이용한 구간통행시간 계측 (Measurement of Travel Time Using Sequence Pattern of Vehicles)

  • 임중선;최경현;오규삼;박종헌
    • 한국ITS학회 논문지
    • /
    • 제7권5호
    • /
    • pp.53-63
    • /
    • 2008
  • 교본 연구는, 구간속도 검지를 위한 기존의 방법인 프로브차량 방식과 차량 번호판 인식 방식의 문제점을 보완할 수 있는 대안으로써, 도로 구간 시.종점에서의 차량 시퀀스 패턴을 이용하여 구간속도 검지가 가능토록 하는 알고리즘을 개발, 제시하였다. 본 알고리즘은 구간 시.종점에서의 차량들을 '차종 순차(Precedence)패턴을 순서대로 나열한 일정한 길이의 시퀀스 그룹'으로 인식하고, 종점에서의 특정 시퀀스에 대응하는, 시점에서의 시퀀스를 탐색하여 가장 유사도가 높은 시퀀스를 동일 그룹으로 간주하여 해당 구간의 통행 시간을 산출하였다. 유사도 비용의 정의에 따라 세 가지의 모델을 제시하였으며, 차량 유출입에 의한 이상치를 제거하고 가공함으로써 정보제공 주기에 가장 적합한 구간 대표 통행시간을 산출할 수 있도록 하였다. 컴퓨터 모의 실험을 통해 구간길이와 통과차량 수를 증가시키면서 차종별, 시.종점의 시퀀스 길이별로 반복 시뮬레이션 한 결과, 평균 최대 오차율 3.46%로서 현장 적용성에서 뛰어난 가능성을 보였다.

  • PDF

질적, 양적 접근방법에 의한 연화문, 사문의 분류원형 추출 (Prototype Extraction for the Categorization of Lotus and Crane Patterns Using Qualitative and Quantitative Approaches)

  • 장수경;김재숙
    • 한국의류학회지
    • /
    • 제20권6호
    • /
    • pp.1016-1026
    • /
    • 1996
  • The purpose of this study was to extract protypes from features and concrete images of Lotus and Crane patterns. A qualitative and a quantitative methods were used. Qualitative informations were obtained from depth Interviews for pattern selection and feature extraction, and quantitative informations from a quail-experiment for pattern caregorization. The subjects were 20 female design students and non-design, students in Teajon. The results were summerized into a similarity metrix which was interpreted by the cluster analysis and the multi-dimensional scling(MDS). The patterns for the study were grouped into 8 clusters. Four dimensions were chosen for the MDS. The location of each pattern was visualized in a 2-dimesional spaces and the location of each cluster in a 3-dimensional spaces. The first dimension, "Lotus" vs "Crane" refired to pattern types, and the second dimension, "realistic" vs "transformable", the transformability. The third dimension, "simple" vs "complex", refired to the degree of simplification, and the forth dimension, "continuous" vs "discontinuous", continuity. The results of the Quantitative analysis could be summerized into 3-level prototype hiararchy In the first level, the patterns were devided clearly into two groups. Lotus and Crane by pattern types. In the second levelk, each group was devided into twosubgroups by continuity. In the third, each subgroup was divided into four subgroups by transformability and the degree of simplification. Four protypes, the final targets of the present study, were extracted from the third level. The are Stylized, Realistic, Decorative, Abstract types.d from the third level. The are Stylized, Realistic, Decorative, Abstract types.

  • PDF

Effect of Growth Conditions on Saponin Content and Ginsenoside Pattern of Panax ginseng

  • Lee, Mee-Hyoung;Park, Hoon;Lee, Chong-Hwa
    • 고려인삼학회:학술대회논문집
    • /
    • 고려인삼학회 1987년도 Proceedings of Korea-Japan Panax Ginseng Symposium 1987 Seoul Korea
    • /
    • pp.89-107
    • /
    • 1987
  • For the elucidation of significance of saponin as quality criterion of ginseng ginsenoside content(GC) and ginsenoside pattern similarity(GPS) by simple correlation were investigated in relation to red ginseng quality factors, age, plant part, harvest season, mineral nutrition, soil physical characteristics, growth light and temperature, shading material, growth location, physiological disease and crop stand through survey of ginseng plantstions, field experiments, water culture and phytotron experiments. Effect of tissue culture was also reviewed. GC was negatively correlated with good quality of red ·ginseng and positively with bad quality. Age did not show any consistency with GC but GPS was less with the increase of age difference. GPS was less or not significant between taproot that is lowest in GC and epidermis highest, and significant between leaf and taproot. Harvest season marked with the lowest GC and Pattern was also different. Nutrient imbalance, the increase of hazardous soil nutrient and physical condition to growth increased GC, but GPS was little different. The higher the growth lights intensity and temperature the higher the GC but GPS was little changed. Root rust increased GC, but root scab decreased it. Sponge-like and inside cavity phenomena increased GC. Ginsenoside pattern of cultured tissues and rootlet showed great variation. These results strongly indicate that there are optimum saponin content and ginsenoside pattern and that these are accomplished under the optimum growth condition.

  • PDF

User Modeling Using User Preference and User Life Pattern Based on Personal Bio Data and SNS Data

  • Song, Hyejin;Lee, Kihoon;Moon, Nammee
    • Journal of Information Processing Systems
    • /
    • 제15권3호
    • /
    • pp.645-654
    • /
    • 2019
  • The purpose of this study was to collect and analyze personal bio data and social network services (SNS) data, derive user preference and user life pattern, and propose intuitive and precise user modeling. This study not only tried to conduct eye tracking experiments using various smart devices to be the ground of the recommendation system considering the attribute of smart devices, but also derived classification preference by analyzing eye tracking data of collected bio data and SNS data. In addition, this study intended to combine and analyze preference of the common classification of the two types of data, derive final preference by each smart device, and based on user life pattern extracted from final preference and collected bio data (amount of activity, sleep), draw the similarity between users using Pearson correlation coefficient. Through derivation of preference considering the attribute of smart devices, it could be found that users would be influenced by smart devices. With user modeling using user behavior pattern, eye tracking, and user preference, this study tried to contribute to the research on the recommendation system that should precisely reflect user tendency.

범주형 속성 기반 군집화를 위한 새로운 유사 측도 (A New Similarity Measure for Categorical Attribute-Based Clustering)

  • 김민;전주혁;우경구;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.71-81
    • /
    • 2010
  • 데이터의 군집을 찾아내는 문제는 패턴 인식, 이미지 처리, 시장 조사 등 많은 응용 분야에서 널리 사용되고 있다. 군집의 질을 결정하는 핵심 요소로는 유사 측도, 차원의 개수 등이 있다. 유사 측도는 데이터의 특성을 반영하여 다르게 정의되어야 하는데, 대부분 기존의 연구들은 데이터를 특징 지어주는 속성이 수치형으로 주어진 경우에 국한되어 있었다. 속성이 범주형으로 주어진 경우도 실생활에 많이 존재하지만, 범주형 변수에 대한 속성값의 유사성은 값의 순서가 고유하게 정해지지 않아서 정의하기 어렵다. 이에 더하여, 고차원 데이터에 대해서는 데이터 점들이 희박하게 위치하여 가까운 점과 먼 점간의 차이가 거의 없고, 군집화 결과가 좋지 않을 수 있다. 이 문제를 해결하기 위해 부분 차원 군집화 방법이 제안되어 왔다. 부분 차원 군집화 방법은 각 군집을 발견하기에 적합한 부분 차원을 선택하면서 군집화를 수행하는 방법이다. 본 논문에서는 범주형 속성으로 특징지어진 고차원 데이터를 부분 차원 군집화하기 위한 새로운 유사 측도를 제안한다. 유사 측도는 각 군집은 다른 군집과 구별되는 특정 정보를 잘 표현할 수 있어야 한다는 기본적인 가정 하에 속성들 사이의 상관성을 반영하여 정의되었다. 이들 모두를 반영한 유사측도는 기존에 존재하지 않았다는 점에서 본 연구는 의미가 있다. 실제 데이터 집합을 군집화하는 실험을 통해 제안하는 방법이 다른 군집화 방법보다 저차원 데이터와 고차원 데이터 모두에 대해 좀 더 정확한 군집 결과를 얻을 수 있음을 보였다.

균일 두께로 자성유체가 피막된 평면 벽 주의의 축대칭 정체 유동 (AXISYMMETRIC STAGNATION FLOW NEAR A PLANE WALL COATED WITH A MAGNETIC FLUID OF UNIFORM THICKNESS)

  • 고형종;김경훈;김세웅
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2007년도 추계 학술대회논문집
    • /
    • pp.39-44
    • /
    • 2007
  • A similarity solution of the Navier-Stokes equation for the axisymmetric stagnation flow near a plane wall coated with a magnetic fluid of uniform thickness is constructed. The shape functions representing the flow in two (magnetic and normal) fluid layer are determined from a third order boundary value problem, which is solved by the Runge-Kutta method with two shooting parameters. Features of the flow including streamline pattern and interface velocity are investigated for the varying values of density ratio, viscosity ratio, and Reynolds number. The results for the interface and wall shear stress, boundary layer and displacement thickness are also presented.

  • PDF