• 제목/요약/키워드: similarity weight

검색결과 376건 처리시간 0.025초

메소드 참조 빈도와 매니페스트 정보를 이용한 안드로이드 애플리케이션들의 유사도 측정 (Measuring Similarity of Android Applications Using Method Reference Frequency and Manifest Information)

  • 김규식;마수드;조성제;김성백
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권3호
    • /
    • pp.15-25
    • /
    • 2017
  • 소프트웨어 가치와 중요성이 커짐에 따라 소프트웨어의 도용이 증가하고 있어 이에 대한 대책으로 소프트웨어 도용을 정확히 탐지하는 방안이 필요하다. 특히 안드로이드 앱의 경우, 소프트웨어 도용이 상대적으로 용이한 반면 안드로이드 마켓 상에서는 불법 앱에 대한 적절한 검수를 수행하지 않고 있다. 이에 본 논문에서는 소프트웨어 도용을 탐지하기 위해 실행파일 수준에서 안드로이드 앱 간의 유사도를 효과적으로 측정하는 기법을 제안한다. 제안 기법은 유사도 측정을 위한 주요 특징정보로, 안드로이드 앱의 실행파일을 정적으로 분석하여 메소드 참조 빈도와 매니페스트 정보를 추출한다. 각 앱을 이 두 가지 특징정보들의 n-차원 벡터로 표시하고, 코사인 유사도를 사용하여 두 앱의 유사도를 측정한다. 제안 기법을 검증하기 위해 대표적인 소스코드 기반의 유사도 측정 기법과 본 논문에서 제안한 기법을 비교 평가한다. 소스파일과 실행파일이 함께 주어진 안드로이드 앱을 대상으로 진행한 실험에서, 본 논문에서 제안한 실행파일 수준의 유사도 측정 결과와 기존의 잘 알려진 소스파일 수준의 유사도 측정 결과가 동등한 수준으로 나왔다.

단어 빈도와 α-cut에 의한 연관 웹문서 분류를 이용한 추천 시스템 (Recommendation System using Associative Web Document Classification by Word Frequency and α-Cut)

  • 정경용;하원식
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.282-289
    • /
    • 2008
  • 협력적 필터링을 개선하기 위하여 많은 기술들이 개발되고 실용화되었으나 아이템의 연관 관계를 정확하게 반영하지는 못한다. 본 논문에서는 협력적 필터링의 문제점을 보완하기 위하여 단어 빈도와 ${\alpha}$-cut에 의한 연관 웹문서 분류를 이용한 추천 시스템을 제안한다. 제안된 방법은 형태소 분석을 통한 웹문서에서 단어를 추출하고 빈도 가중치를 계산한다. 추출된 단어를 Apriori 알고리즘을 이용해서 연관 규칙을 생성하고 신뢰도에 단어 빈도 가중치를 적용한다. 그리고 연관 규칙 하이퍼그래프 분할을 이용하여 연관 단어간의 유사도를 계산한다. 마지막으로 유사 클래스를 기반으로 연관 웹문서를 ${\alpha}$-cut을 이용하여 분류하고 개선된 코사인 유사도를 이용하여 유사도를 계산한다. 실험 결과 제안한 방법이 기존의 방법들보다 우수함을 확인하였다.

CRITIC 방법을 이용한 형상유사도 기반의 면 객체 자동매칭 방법 (A new method for automatic areal feature matching based on shape similarity using CRITIC method)

  • 김지영;허용;김대성;유기윤
    • 한국측량학회지
    • /
    • 제29권2호
    • /
    • pp.113-121
    • /
    • 2011
  • 본 연구에서는 기하학적 정보를 바탕으로 생성된 유사도 기반의 면 객체 자동매칭 방법을 제안하였다. 이를 위하여 서로 다른 공간자료에서 교차되는 후보 매칭 쌍을 추출하고, CRITIC방법을 이용하여 연동 기준별 가중치를 자동으로 생성하여 선형조합으로 추출된 후보매칭 쌍 간의 형상유사도를 측정하였다. 이때, 훈련자료에서 조정된 상자도표의 특이점 탐색을 적용하여 도출된 임계값 이상인 경우가 매칭 쌍으로 탐색된다. 제안된 방법을 이종의 공간자료(수지치도 2.0과 도로명주소 기본도)의 일부지역에 적용한 결과, 시각적으로 형상이 유사하고 교차되는 면적이 넓은 건물객체가 매칭 되었으며, 통계적으로 F-Measure가 0.932로 높게 나타났다.

복합적인 영상 특성을 이용한 영상 검색 시스템 구현 (Implementation of Image Retrieval System using Complex Image Features)

  • 송석진;남기곤
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1358-1364
    • /
    • 2002
  • 현재 방송 및 인터넷분야에서는 멀티미디어 정보가 급격히 증가하고 있다. 본 논문에서는 멀티미디어 정보 중에서 정지영상 검색을 위해 사용자가 질의(query)를 원하는 물체영역을 선택한 후 유사물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상으로부터 우선 컬러특성을 추출하기 위해 제안한 방법으로 색상을 HSV 변환한 후 히스토그램을 구해 데이터베이스영상과 히스토그램 인터섹션을 통해 유사치를 구한다 또한 질의영상을 그레이영상으로도 변환시켜 웨블릿 변환한 후 밴디드 오토코릴로그램과 GLCM을 통해 공간적 그레이분포와 질감특성을 추출하여 유사치를 구한다. 그리고 2개의 유사치를 더하여 최종 유사도를 결정하는데 이때 각 유사치에 가중치를 적용하였다. 질의영상으로부터 컬러영상 특성뿐만 아니라 그레이영상 특성도 파악하여 단점을 보완하였고 실험결과에서도 소환성(recall) 및 정확성(precision)이 향상됨을 볼 수 있었다. 또한 가중치를 적용함으로써 검색효율이 개선되었다.

ITS를 위한 개인화 학습코스 추천 모델 개발 (Development of Personalized Learning Course Recommendation Model for ITS)

  • 한지원;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.21-28
    • /
    • 2018
  • 학습코스 선정에 많은 어려움과 시행착오를 겪고 있는 사용자들에게 수준별 학습코스를 제공하기 위해, ITS(Intelligence Tutoring System)를 위한 동적인 학습자 맞춤형 학습코스 추천 모델을 개발하였다. 이를 위해, 개인화 학습코스 추천모델에서는 먼저 학습자 프로파일을 분석하고, 단어별 가중치를 계산하여 핵심 키워드를 추출한다. 추출된 단어는 Cosine Similarity 기법을 통해 유사도를 측정하고, 최종적으로 유사도가 높은 상위 3개 과정이 학습자에게 추천된다. 추천모델의 효과를 분석하기 위해, 경기도 소재 교육기관에 추천모델을 적용하였고, 만족도 조사를 통하여 설문 항목별 평균, 표준편차, 왜도, 첨도 값을 계산하였다. 실험결과, 정확성, 새로움, 자기참조, 유용성에서 높은 만족도를 보였으며, 추천모델의 실효성을 검증했다. 본 연구는 그동안 국내 외에서 충분히 다뤄지지 않았던 기계학습 중심의 맞춤형 학습코스를 추천했다는 점에서 의미가 있다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

Extraction of Motor Modules by Autoencoder to Identify Trained Motor Control Ability

  • LEE, Jae-Hyuk
    • 웰빙융합연구
    • /
    • 제5권2호
    • /
    • pp.15-19
    • /
    • 2022
  • Purpose: This pilot study aimed to clarify features of motor module during walking in exercise experts who experienced lately repeated training for sports skill. To identify motor modules, autoencoder machine learning algorithm was used, and modules were extracted from muscle activities of lower extremities. Research design, data and methodology: A total of 10 university students were participated. 5 students did not experience any sports training before, and 5 students did experience sports training more than 5 years. Eight muscle activities of dominant lower extremity were measured. After modules were extracted by autoencoder, the numbers of modules and spatial muscle weight values were compared between two groups. Results: There was no significant difference in the minimal number of motor modules that explain more than 90% of original data between groups. However, in similarity analysis, three motor modules were shown high similarity (r>0.8) while one module was shown low similarity (r<0.5). Conclusions: This study found not only common motor modules between exercise novice and expert during walking, but also found that a specific motor module, which would be associated with high motor control ability to distinguish the level of motor performance in the field of sports.

처방 유사도 분석의 효율성 향상에 관한 연구 (A Study on Prescription Similarity Analysis for Efficiency Improvement)

  • 黃秀敬;禹東賢;金基郁;李丙旭
    • 대한한의학원전학회지
    • /
    • 제35권4호
    • /
    • pp.1-9
    • /
    • 2022
  • Objectives : This study aims to increase efficiency of the prescription similarity analysis method that uses drug composition ratio. Methods : The controlled experiment compared result generation time, generated data quantity, and accuracy of results between previous and new analysis method on the 12,598 formulas and 61 prescription groups. Results : The control group took 346 seconds on average and generated 768,478 results, while the test group took 24 seconds and generated 241,739 results. The test group adopted a selective calculation method that only used overlapping data between two formulas instead of analyzing all number of cases. It simplified the data processing process, reducing the quantity of data that is required to be processed, leading to better system speed, as fast as 14.47 times more than previous analysis method with equal results. Conclusions : Efficiency for similarity analysis could be improved by reducing data span and simplifying the calculation processes.

소프트웨어 복제도 감정기법의 표준화 모델에 관한 연구 (A Study on the Research Model for the Standardization of Software-Similarity-Appraisal Techniques)

  • 방효근;차태원;정태명
    • 정보처리학회논문지D
    • /
    • 제13D권6호
    • /
    • pp.823-832
    • /
    • 2006
  • 소프트웨어(SW) 복제도 감정의 목적은 두 프로그램 사이의 동일 또는 유사성 정도를 판단하는 것으로, 컴퓨터프로그림 저작권 관련 분쟁해결의 주요한 기술적 판단근거를 제시하는 제도라 할 수 있다. SW감정을 진행함에 있어서 중요한 점은 감정인의 주관적 판단에 편중되지 않도록 하고, 신속 객관적인 감정의 수행으로 정확한 감정결과를 도출해내는 것이다. 그러나 현재까지 체계적인 감정기법의 표준화 연구 및 개발은 미비한 상태이며, SW감정 분야별(유형별) 감정기법 조차 전문 감정인들에 따라 그 접근방법이 천차만별이어서 뚜렷한 표준안이 제시되지 못하고 있다. 또한, 기 수행되었던 감정사례에 대한 실증적 분석 결과, 기존 감정 절차 및 기법의 오류 또는 감정인의 전문지식 결여 등의 문제가 잠재하여 일부 감정결과에 대한 객관성 및 정확성에 손상이 있음을 알 수 있다. 본 논문에서는 감정인에 따라 동일한 평가 항목에 대하여 서로 다른 결과가 도출될 수 있는 오차의 허용치를 감소시키기 위한 객관적인 평가 방법과 정형화된 SW복제도 감정기법의 표준화 모델을 제시한다. 특히, 기존 감정기법의 문제점 해결 및 보완 연구를 기반으로 감정범위의 설정, 감정기준 및 방법, 단위작업 프로세스 기준의 감정영역 및 감정항목 설정, 가중치 부여, 논리적 복제도와 물리적 복제도 산출 등에 초점을 맞추어 감정기법을 분석 평가한다. 따라서 SW복제도 감정 기법의 표준화 모델은 감정인의 주관적 판단에 의한 오류의 가능성을 최소화하고, 감정결과의 객관성 및 신뢰성을 한층 제고하기 위한 도구를 제공할 것이다.

베이지안 기법을 적용한 일회성 장비의 경제적 시험 수량 연구 (A Study of Economical Sample Size for Reliability Test of One-Shot Device with Bayesian Techniques)

  • 이연호;이계신;이학재;김상문;문기성
    • 한국신뢰성학회지:신뢰성응용연구
    • /
    • 제14권3호
    • /
    • pp.162-168
    • /
    • 2014
  • This paper discusses the application of Bayesian techniques with test data on similar products for performing the Economical Reliability Test of new one-shot device. Using the test data on similar products, reliability test required lower sample size currently being spent in order to demonstrate a target reliability with a specified confidence level. Furthermore, lower sample size reduces cost, time and various resources on reliability test. In this paper, we use similarity as calculating weight of similar products and analyze similarity between new and similar product for comparison of the essential function.