• 제목/요약/키워드: Similarity Pattern Group

검색결과 63건 처리시간 0.031초

협업 필터링과 빈발 패턴을 이용한 개인화된 그룹 추천 (Personalized Group Recommendation Using Collaborative Filtering and Frequent Pattern)

  • 김정우;박광현
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.768-774
    • /
    • 2016
  • 본 논문에서는 개인화 서비스를 제공하기 위해 책, 음악, 영화 등과 같이 단일 항목을 추천하는 기존 방법의 한계를 극복하고, 패션, 요리 등과 같이 연관성에 따른 항목의 조합, 즉 그룹을 추천하는 방법을 다룬다. 협업 필터링은 사용자 간의 유사도를 측정하여 비슷한 성향의 사용자들이 선택한 항목을 추천하는 방법이며, 사용자의 성향을 예측할 수 있다는 장점이 있다. 본 논문에서는 이러한 협업 필터링과 연관 규칙을 바탕으로 빈발 항목 집합을 생성하고, 그룹 간의 유사도에 따라 그룹을 추천하는 알고리즘을 제안한다. 제안하는 방법의 타당성을 검증하기 위하여 의류 전자상거래에서 4개월 동안 소비자가 구매한 목록 데이터로 실험을 수행하였다.

상대유사도를 이용한 새로운 무감독학습 신경망 및 경쟁학습 알고리즘 (A New Unsupervised Learning Network and Competitive Learning Algorithm Using Relative Similarity)

  • 류영재;임영철
    • 한국지능시스템학회논문지
    • /
    • 제10권3호
    • /
    • pp.203-210
    • /
    • 2000
  • 본 논문에서는 패턴분류문제를 해결하기 위한 새로운 무감독학습 신경망 및 경쟁학습 알고리즘을 제한한다. 제아하는 신경망은 입력 데이터의 군집을 분류하기 위한 거리측도로서 군집들 상호간의 상대유사도(relative similarity)를 기반으로 하고 있다. 이러한 까닭에 제안하는 신경망과 알고리즘을 상대유사 신경망 (relative similarity network; RSN)및 학습 알고리즘이라 이름한다. 상대유사도를 정의하고 가중벡터 학습 규칙을 구성함으로써, RSN의 구조를 설계하고 학습알고리즘을 구현하기 의한 의사코드를 기술한다. 일반적인 패턴분류에 RSN을 적용한 결과, 초기 학습률이 없음에도 불구하고 기존이 경쟁학습 신경망인 WTAdlsk SOM고 동등한 성능을 나타내었다. 반면 기존 경쟁학습 신경망의 분류성능이 저하되었던 군집이 경걔가 불분명한 패턴, 그리고 군집이 밀집도와 군집의 크기가 다른 패턴들에 대한 실험에서는 기존의 경쟁학습망보다 효과적인 분류결과를 나타내었다.

  • PDF

B-Corr Model for Bot Group Activity Detection Based on Network Flows Traffic Analysis

  • Hostiadi, Dandy Pramana;Wibisono, Waskitho;Ahmad, Tohari
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4176-4197
    • /
    • 2020
  • Botnet is a type of dangerous malware. Botnet attack with a collection of bots attacking a similar target and activity pattern is called bot group activities. The detection of bot group activities using intrusion detection models can only detect single bot activities but cannot detect bots' behavioral relation on bot group attack. Detection of bot group activities could help network administrators isolate an activity or access a bot group attacks and determine the relations between bots that can measure the correlation. This paper proposed a new model to measure the similarity between bot activities using the intersections-probability concept to define bot group activities called as B-Corr Model. The B-Corr model consisted of several stages, such as extraction feature from bot activity flows, measurement of intersections between bots, and similarity value production. B-Corr model categorizes similar bots with a similar target to specify bot group activities. To achieve a more comprehensive view, the B-Corr model visualizes the similarity values between bots in the form of a similar bot graph. Furthermore, extensive experiments have been conducted using real botnet datasets with high detection accuracy in various scenarios.

A Study on Extracting Car License Plate Numbers Using Image Segmentation Patterns

  • Jang, Eun-Gyeom
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.87-94
    • /
    • 2018
  • This paper proposes a method of detecting the license plates of vehicles. The proposed technology applicable to different formats of license plates detects the numbers by standardizing the images at edge points. Specifically, in accordance with the format of each license plate, the technology captures the image in the character segment, and compares it against the sample model to derive their similarity and identify the numbers. Characters with high similarities are used to form a group of candidates and to extract the final characters. Analyzing the experimental results found the similarity of the extracted characters exceeded 90%, whereas that of less identifiable numbers was markedly lower. Still, the accuracy of the extracted characters with the highest similarity was over 80%. The proposed technology is applicable to extracting the character patterns of certain formats in diverse and useful ways.

인삼 신품종의 뿌리부위별 진세노사이드 함량 및 패턴비교 (Comparison of Ginsenoside Contents and Pattern Similarity Between Root Parts of New Cultivars in Panax ginseng C.A. Meyer)

  • 안인옥;이성식;이장호;이미자;조병구
    • Journal of Ginseng Research
    • /
    • 제32권1호
    • /
    • pp.15-18
    • /
    • 2008
  • 인삼의 부위별 진세노사이드 패턴 유사성과 상관관계를 알아보고자 본 시험을 수행하였다. 진세노사이드 단위함량과 총함량은 고풍이 각각 18.9 mg/g, 596 mg/g으로 가장 높았고 연풍, 금풍, 선풍이 뒤를 이었으며, 천풍은 각각 8.0 mg/g, 209.5 mg/g으로 고풍의 절반에도 미치지 못하였다. 부위별로 보면 뇌두의 진세노사이드 단위함량과 총함량은 연풍이 가장 높았으며, 동체와 지근 및 세근에서는 고풍이 높았다. 뿌리와 각 부위의 진세노사이드 패턴 유사성은 지근과 뇌두가 각기 0.95, 0.94로 높았으며 동체와 세근은 각기 0.78, 0.80으로 다소 낮았다. 지근에서 품종별 진세노사이드 패턴 유사성을 보면 천풍, 연풍, 고풍, 금풍이 각기 0.98, 0.98, 0.96, 0.98로 아주 높았으며, 선풍은 0.87로 다소 낮았다. 뿌리와 각 부 위의 진세노사이드 상관계수는 지근에서 0.843으로 가장 높았으며 동체, 세근, 뇌두 순으로 낮아졌다. 또한 단위함량과 총 함량의 상관계수는 0.933으로 매우 높게 나타났다.

대기전력 차단시점 발견을 위한 모델링과 그룹생성 알고리즘 구현 (Modeling for Discovery the Cutoff Point in Standby Power and Implementation of Group Formation Algorithm)

  • 박태진;김수도;박만곤
    • 한국멀티미디어학회논문지
    • /
    • 제12권1호
    • /
    • pp.107-121
    • /
    • 2009
  • 대기전력(Standby power) 소모가 발생하는 첫 번째 요인은 전원에서 IC로 들어오면서 거쳐야하는 기동전압 때문이며 나머지 하나는 IC가 동작할 때의 전류 때문이다. 본 논문에서는 대기전력 상태와 차단 시점의 패턴분석을 통해서 자동 On/Off할 수 있도록 하는 간단한 모듈장치 구성과 알고리즘 적용에 목적을 두었다. 이를 위해서 전력 신호분석과 모델링에 근간을 두었으며 대기전력 절감을 위해서 On/Off 차단기준을 마련했다. On/Off 차단 시점을 찾기 위해서 $1^{st}$ SCS와 $2^{nd}$ SCS의 차분값(subtraction value), 그리고 콘센트로부터 유입된 초당 샘플링 계수에 대한 중간값(median value)을 중요한 파라미터로써 정의한 다음 대기전력 상태에서의 유사그룹 및 유력패턴 그룹 생성 알고리즘을 수행했다.

  • PDF

DNA 염기서열과 미각패턴 분석을 이용한 사상자와 벌사상자의 감별 (Comparison between Torilis japonica and Cnidium monnieri Using DNA Sequencing and Taste Pattern Analysis)

  • 김영화;김영선;채성욱;이미영
    • 대한본초학회지
    • /
    • 제28권6호
    • /
    • pp.9-14
    • /
    • 2013
  • Objectives : Cnidii Fructus is prescribed as the fruit of Cnidium monnieri (L.) Cusson or Torilis japonica (Houtt.) DC. in Korea pharmacopoeia. Although there are differences in the composition of useful components, two species have been used without distinction. In order to discriminate them, DNA sequencing and taste pattern analysis were used in this study. Methods : Primers ITS 1 and ITS 4 were used to amplify the intergenic transcribed spacer(ITS) region of nuclear ribosomal DNA from seven T. japonica and six C. monnieri samples. Taste pattern of samples were measured by using taste-sensing system SA402B equipped with five foodstuff sensors(CT0, C00, AAE, CA0, and AE1). The five initial taste(sourness, bitterness, astringency, umami, and saltiness) and three aftertaste(aftertaste of bitterness, astringency, and umami) of two species were compared. Results : According to the results of ITS region sequence analysis, two species showed 94 base pairs differences. The similarity of two sequences was 85%. From the taste pattern analysis, sourness, bitterness, aftertaste of bitterness(aftertaste-B), and umami showed a different pattern. Especially, bitterness and aftertaste-B of C. monnieri were significantly higher than T. japonica. In addition, two species were shown to have two markedly different clustering by these two flavors. Conclusion : T. japonica and C. monnieri were effectively discriminated using DNA sequencing and taste pattern analysis. These methods can be used to identify the origin of traditional medicine in order to maintain therapeutic efficacy.

빈발 패턴 네트워크에서 아이템 클러스터링을 통한 연관규칙 발견 (Discovering Association Rules using Item Clustering on Frequent Pattern Network)

  • 오경진;정진국;하인애;조근식
    • 지능정보연구
    • /
    • 제14권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 데이터 마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템(item) 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량의 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 많이 제안되어 왔다. 연관규칙을 발견하기 위한 기존의 연구들은 모든 규칙을 찾아내지만, 사람이 분석하기에 너무 많은 규칙이 생성되기 때문에 규칙을 분석하기 위한 일 또한 많은 과정을 거쳐야 한다. 본 논문에서는 빈발 패턴 네트워크(Frequent Pattern Network)라 부르는 자료 구조를 제안하고 이를 활용하였다. 네트워크는 정점과 간선으로 구성되며 정점은 아이템을 표현하고, 간선은 두 아이템 집합을 표현한다. 아이템의 빈도수를 이용하여 빈발 패턴 네트워크를 구성하고, 아이템 사이의 유사도를 측정한다. 그리고 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 클러스터를 생성한다. 클러스터를 이용해 연관규칙을 생성하고 실험을 통해 Apriori와 FP Growth 알고리즘과의 성능을 비교를 하였다. 그 결과 빈발 패턴 네트워크에서 신뢰도 유사도를 이용하는 것이 클러스터의 정확성을 높여줌을 볼 수 있었다. 그리고 전통적인 방법과 비교를 통해 빈발 패턴 네트워크를 이용하는 것이 최소지지도에 유연성을 가짐을 알 수 있었다.

  • PDF

다변량기법을 활용한 용담호 수질측정지점 유사성 연구 (A Study on Measuring the Similarity Among Sampling Sites in Lake Yongdam with Water Quality Data Using Multivariate Techniques)

  • 이요상;권세혁
    • 환경영향평가
    • /
    • 제18권6호
    • /
    • pp.401-409
    • /
    • 2009
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data and understand the characteristics of classified clusters have been discussed for the optimal water quality monitering network. For empirical study, data of two years (2005, 2006) at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in Yongdam reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

저수지 수질조사 지점간 유사성 분석 (A Study on Measuring the Similarity Among Sampling Sites in Lake)

  • 이요상;고덕구;이현석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.957-961
    • /
    • 2010
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data. For empirical study, data of two years at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

  • PDF