• 제목/요약/키워드: SIMILARITY ANALYSIS

검색결과 3,153건 처리시간 0.028초

A Tracking Method of Same Drug Sales Accounts through Similarity Analysis of Instagram Profiles and Posts

  • Eun-Young Park;Jiyeon Kim;Chang-Hoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.109-118
    • /
    • 2024
  • 전 세계 소셜 미디어 사용자가 증가하면서 다양한 범죄의 수단으로 소셜 미디어가 악용되는 사례가 증가하고 있다. 특히, 소셜 미디어를 통한 마약 유통은 마약 판매자와 소비자의 높은 접근성으로 인해 청소년들의 마약 호기심을 자극하고, 구매를 용이하게 한다는 점에서 심각한 사회문제로 대두되고 있다. 본 논문에서는 다양한 소셜 미디어 중, 국내 19세에서 24세 청소년이 가장 많이 사용하는 인스타그램을 대상으로 프로필 사진, 소개글, 게시물 사진과 게시글을 수집하고, 각 정보의 유사도 분석을 통해 수집한 다수의 계정을 활용하여 마약을 유통하는 마약사범 추적 기술을 개발한다. 4개 수집 정보 중, 이미지 형태의 프로필 사진 및 게시물 사진은 SSIM(Structural Similarity Index Measure) 기반으로 유사도를 분석하고, 텍스트 형태의 소개글 및 게시글은 자카드 유사도 및 코사인 유사도 기법을 사용하여 유사도를 분석한다. 이와 같은 유사도 분석을 통해, 각 수집 정보별 계정 간의 유사도를 측정할 수 있으며 유의수준 이상의 유사성을 갖는 계정들에 대해 동일 마약 유통 계정으로 판단할 수 있다. 또한, 수집한 4개 정보에 대해 로지스틱 회귀분석을 수행하여 게시물 사진을 제외한 프로필 사진, 소개글, 게시글이 동일 마약 판매 계정을 추적하는 데에 유효한 정보임을 확인하였다.

수문지형특성 및 시간응답특성의 상사성을 이용한 Nash 모형 해석 (Analysis of the Nash Model Using the Similarities of Hydrogeomorphologic and Time Response Characteristics)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제30권2호
    • /
    • pp.97-106
    • /
    • 1997
  • Nash 모형의 매개변수를 유역의 수문지형특성과 시간응답의 상사성을 이용하여 분석하고 이를 미계측 유역에 대한 추정방법으로 적용하여 보았다. 유역의 수문지형특성의 상사성은 유역의 지형학적 동질성에 대한 검증방법인 자기상사성을 통해 파악하였으며 시간응답의 상사성은 Nash 모형의 매개변수들과 지체시간 및 도달시간과의 관계를 수립하여 이용하였다. 위천유역의 경우 이러한 상사성에 대한 주목할만한 특징이 발견되었는데 이를 미계측 유역에 대한 매개변수 측정에 이용한 결과 좋은 성과를 얻을 수 있었다.

  • PDF

Similarity Measure Construction for Non-Convex Fuzzy Membership Function

  • 박현정;김성신;이상혁
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.145-149
    • /
    • 2008
  • The similarity measure is constructed for non-convex fuzzy membership function using well known Hamming distance measure. Comparison with convex fuzzy membership function is carried out, furthermore characteristic analysis for non-convex function are also illustrated. Proposed similarity measure is proved and the usefulness is verified through example. In example, usefulness of proposed similarity is pointed out.

Self-Similar 트래픽하에서 ATM 스위치 큐의 적응성에 관한 연구 (A Study on Adaptation of ATM Switch Queue under Self-Similar Traffic)

  • 진성호;임재홍;김동일
    • 정보처리학회논문지C
    • /
    • 제8C권3호
    • /
    • pp.327-334
    • /
    • 2001
  • 네트워크를 설계하고 서비스를 구현하는데 있어서 중요한 변수중의 하나는 트래픽의 특성을 파악하는 것이다. 기존의 트래픽 예측과 분석은 포아송(Poisson) 또는 마코비안(Markovian)을 기본으로 하는 모델을 사용하였다. LAN, WAN 및 VBR(Variable Bit Rate) 트래픽 특성에 관한 최근의 실험적 연구들은 기존의 포아송 가정에 의한 모델들이 네트워크 트래픽의 장기간 의존성 및 self-similar 특성들을 과소평가 함으로써 실제 트래픽의 특성을 제대로 나타낼 수 없다는 것을 지적해 왔다. 따라서 최근 실제 트래픽 모델과 유사한 모델로서 self-similarity 특성을 이용한 접근법이 대두되고 있다. 본 논문에서는 self-similarity 트래픽의 정의에 대해서 논한다. 그리고 실제 트래픽을 수집하고, 인위적으로 self-similarity한 트래픽과 포아송 모델을 적용시킨 트래픽을 발생시켜 비교한 다음 ATM 스위치의 큐(Queue)에 적용하였다. 본 논문에서는 ATM 스위치의 큐에 self-similarity 트래픽을 적용했을 경우 low bound상에서 버퍼 오버플로우 확률 및 셀 손실 확률에 대해 평가하였다.

  • PDF

협력필터링의 데이터 희소성 해결을 위한 자카드 지수 반영의 유사도 성능 분석 (Performance Analysis of Similarity Reflecting Jaccard Index for Solving Data Sparsity in Collaborative Filtering)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제19권4호
    • /
    • pp.59-66
    • /
    • 2016
  • 협력 필터링 시스템에서 데이터 희소성 문제의 해결을 위해 공통평가항목수를 반영하는 방법이 연구되었다. 이러한 방법으로 널리 알려진 자카드 지수는 기존의 유사도 척도와 결합되어 성능을 개선할 수 있었다. 그러나, 다양한 데이터 환경에서 여러 유사도 척도들과 각각 결합했을 때의 성능 개선 효과에 대한 분석 연구는 미미하므로, 본 연구는 이에 대한 분석을 목적으로 한다. 우선 자카드 지수 자체를 유사도 척도로 사용했을때 희소한 데이터셋 상에서 전통적인 척도들보다 월등한 예측 성능을 보였고 추천 성능도 매우 우수하였다. 자카드 지수를 결합함으로써 기존 유사도 척도는 데이터 특성에 상관없이 성능이 대개 향상되었고, 특히 코사인 유사도는 희소한 데이터셋에서 가장 큰 향상을 이루었으나, 평균차이 제곱(Mean Squared Difference)의 유사도는 밀집된 데이터셋에서 오히려 저하된 예측 성능을 보였다. 따라서, 자카드 지수를 결합하여 사용하기 위해 데이터 환경 특성과 유사도 척도를 고려할 필요가 있다.

위치 종속 유사도 스펙트럼을 이용한 단백질 서열의 아미노산 조성 추정 (Estimating Amino Acid Composition of Protein Sequences Using Position-Dependent Similarity Spectrum)

  • 지상문
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.74-79
    • /
    • 2010
  • 단백질의 아미노산 조성은 생물정보학의 여러 문제를 해결하기 위한 기초적인 정보로 자주 활용된다. 본 논문에서는 아미노산간의 진화적인 연관성을 정의한 BLOSUM 행렬에서 유도한 유사도 함수를 사용하여 아미노산 조성을 결정한다. 이러한 방법은 생물학적인 연관성이 있는 단백질 서열일수록 비슷한 아미노산 조성을 갖도록 한다. 또한 단백질의 구조와 기능에 중요한 역할을 하는 위치-특이적인 아미노산의 분포를 추정하기 위해서 레이더나 음성 신호의 스펙트럼 분석에 사용되는 개념인 시간-종속 분석, 시간 해상도와 주파수 해상도의 개념을 적용하였다. 제안한 방법을 단백질의 세포내 위치예측에 적용하여 기존의 아미노산 조성 추정 방법을 사용하는 것보다 크게 향상된 성능을 보임을 확인하였다.

키워드를 기반으로 마이너와 코사인 유사도를 이용한 컴퓨터 네트워크 관련 컨퍼런스 분석 (The Analysis of the Conferences for the Computer Network Using the Miner and the Cosine Similarity based upon Keywords)

  • 권영빈;이승도;양현;주요한
    • 한국IT서비스학회지
    • /
    • 제11권1호
    • /
    • pp.223-238
    • /
    • 2012
  • We have been provided with a plenty of information about IT through the conferences. However, it is hard to find enough information or the latest trends from conferences because there are too many conferences. In this situation, we analyzed the latest trends related to the field of IT by exploiting the Netminer which is one of the software for analysis of social networks and measuring the Cosine Similarity between conferences, based upon keywords which are included in the conferences. We analyzed keywords of 24 conferences related to the computer network part of the IEEE (Institute of Electrical and Electronics Engineers) in the case of foreign conferences. We also analyze keywords of the KIISE (Korean Institute of Information Scientists and Engineers) conferences in the case of domestic conferences, during 2009-2010. We identified the trends through the frequency of keywords, the change of top 10 keywords ranking and the similarity between conferences.

A Comparative Analysis of Music Similarity Measures in Music Information Retrieval Systems

  • Gurjar, Kuldeep;Moon, Yang-Sae
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.32-55
    • /
    • 2018
  • The digitization of music has seen a considerable increase in audience size from a few localized listeners to a wider range of global listeners. At the same time, the digitization brings the challenge of smoothly retrieving music from large databases. To deal with this challenge, many systems which support the smooth retrieval of musical data have been developed. At the computational level, a query music piece is compared with the rest of the music pieces in the database. These systems, music information retrieval (MIR systems), work for various applications such as general music retrieval, plagiarism detection, music recommendation, and musicology. This paper mainly addresses two parts of the MIR research area. First, it presents a general overview of MIR, which will examine the history of MIR, the functionality of MIR, application areas of MIR, and the components of MIR. Second, we will investigate music similarity measurement methods, where we provide a comparative analysis of state of the art methods. The scope of this paper focuses on comparative analysis of the accuracy and efficiency of a few key MIR systems. These analyses help in understanding the current and future challenges associated with the field of MIR systems and music similarity measures.

Similarity analysis of pixelated CdTe semiconductor gamma camera image using a quadrant bar phantom for nuclear medicine: Monte Carlo simulation study

  • Park, Chan Rok;Kang, Seong-Hyeon;Lee, Youngjin
    • Nuclear Engineering and Technology
    • /
    • 제53권6호
    • /
    • pp.1947-1954
    • /
    • 2021
  • In the nuclear medicine imaging, quality control (QC) process using quadrant bar phantom is fundamental aspect of evaluating the spatial resolution. In addition, QC process of gamma camera is performed by daily or weekly. Recently, Monte Carlo simulation using the Geant4 application for tomographic emission (GATE) is widely applied in the pre-clinical nuclear medicine field for modeling gamma cameras with pixelated cadmium telluride (CdTe) semiconductor detector. In this study, we modeled a pixelated CdTe semiconductor detector and quadrant bar phantom (0.5, 1.0, 1.5, and 2.0 mm bar thicknesses) using the GATE tool. Similarity analysis based on correlation coefficients and peak signal-to-noise ratios was performed to compare image qualities for various source to collimator distances (0, 2, 4, 6, and 8 cm) and collimator lengths (0.2, 0.4, 0.6, 0.8, and 1.0 cm). To this end, we selected reference images based on collimator length and source to collimator distance settings. The results demonstrate that as the collimator length increases and the source to collimator distance decreases, the similarity to reference images improves. Therefore, our simulation results represent valuable information for the modeling of CdTe-based semiconductor gamma imaging systems and QC phantoms in the field of nuclear medicine.

군집분석을 이용한 방목초지 식물군락의 유사성 비교 (Comparison of the Similarity Among the Plant Communities of the Grazing Pasture by the Cluster-Analysis)

  • 박근재
    • 한국초지조사료학회지
    • /
    • 제24권4호
    • /
    • pp.293-300
    • /
    • 2004
  • 방목초지 식물군학에 대한 생태적 특성을 결정하고 군집분석을 이용하여 군락간의 유사성을검정하고자, 1998년 8월부터 10월까지 독일의 중부지역인 Witzenhausen 근교에서 조사한 초지 식물군락을 Kassel 대학교 초지생태 연구소에서 컴퓨터 프로그램을 이용하여 분석하였다. 16개 지역의 초지에서 조사한 식생을 군강(Class)으로 분류한 식물군락은 대부분 Molinio-Arrhenatheretea 및 Festuco-Brometea 초지군락 이었으며, 반건조지 식물군락을 제외한 초지 식물군락의 생태적 반응과 사료가는 군락에 따라 다소 차이가 있었으나 조사료 생산에 적당하였다. 식물군락간 정의 상관은 14과 12번 군락이 가장 높았고, 7번과 9번 군락간에는 상관이 없었으며, 반건조지 식물군락은 다른 군락과 부의 상관을 나타내었다. 완전연관법에 의한 군집분석의 유사성 검정 측도는 유클러드 거리계수를 이용하는 것이 좋았으며, 식생구성이 비슷한 군락이 서로 군집을 형성하였다. 유사성이 높은 중소집단은 교란된 식물군락 (16, 15), 반건조지 초지군락 (14, 12, 11, 13), 중상급초지군락 (8, 7, 6) 중하급초지군락 (10, 9, 5), 중급 (4, 3), 상급초지군락 (2, 1) 등 6개 집단으로 분류되었다.