• Title/Summary/Keyword: 유사도 분석

Search Result 12,877, Processing Time 0.039 seconds

Product Planning using Similarity Analysis Technique Based on Word2Vec Model (Word2Vec 모델 기반의 유사도를 이용한 상품기획 모델)

  • Ahn, Yeong-Hwi;Park, Koo-Rack
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.11-12
    • /
    • 2021
  • 소비자가 남긴 댓글이나 상품평은 상품기획의 주요 정보가 될 수 있다. 본 논문에서는 버티컬 무소음 마우스 7,300개에 대한 온라인 댓글을 딥러닝 기술인 Word2Vec을 이용하여 유사도 분석을 시행하였다. 유사도 분석결과 클릭 키워드에 대한 장점으로 소리(.975), 버튼(.972), 무게(.971)가 분석되었으며 단점은 가볍다(.959)이었다. 이는 구매 상품에 대한 소비자의 의견, 태도, 성향 및 서비스에 대한 포괄적인 의견들을 데이터화 하여 상품의 특징을 분석할 수 있는 의미있는 과정 이라고 볼 수 있다. 상품기획 프로세스에 딥러닝 기술을 통한 소비자의 감성분석자료 포함시키는 전략을 적용한다면 상품기획의 시간과 비용투자의 경제성을 높일 수 있고 나아가 빠르게 변화하는 소비자의 요구사항을 적기에 반영할 수 있을 것으로 생각된다.

  • PDF

Relation Analysis of Disease and Biomarker based on Google Scholar (구글 학술 검색 기반의 질병과 바이오마커 관계 분석)

  • Oh, Byoung-Doo;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 하며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

Relation Analysis of Disease and Biomarker based on Google Scholar (구글 학술 검색 기반의 질병과 바이오마커 관계 분석)

  • Oh, Byoung-Doo;Kim, Yu-Seop
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 히며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

An Analysis Scheme Design of Customer Spending Pattern using Text Mining (텍스트 마이닝을 이용한 소비자 소비패턴 분석 기법 설계)

  • Jeong, Eun-Hee;Lee, Byung-Kwan
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.11 no.2
    • /
    • pp.181-188
    • /
    • 2018
  • In this paper, we propose an analysis scheme of customer spending pattern using text mining. In proposed consumption pattern analysis scheme, first we analyze user's rating similarity using Pearson correlation, second we analyze user's review similarity using TF-IDF cosine similarity, third we analyze the consistency of the rating and review using Sendiwordnet. And we select the nearest neighbors using rating similarity and review similarity, and provide the recommended list that is proper with consumption pattern. The precision of recommended list are 0.79 for the Pearson correlation, 0.73 for the TF-IDF, and 0.82 for the proposed consumption pattern. That is, the proposed consumption pattern analysis scheme can more accurately analyze consumption pattern because it uses both quantitative rating and qualitative reviews of consumers.

Development of Sediment Discharge Computation System for Characteristic Analysis of River Sediment Discharge (하천유사량 특성분석을 위한 유사량산정시스템 개발)

  • Lee, Yeon-Kil;Go, Ju-Yeon;Lee, Jin-Won;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.723-727
    • /
    • 2009
  • 본 연구에서는 유사량 측정의 적절성과 산정결과에 대한 정확성을 도모하고자 총유사량과 하상토유사량을 일관적으로 계산하고, 분석 및 관리할 수 있는 유사량산정시스템(Sediment Discharge Computation System; SDCS)을 개발하였다. 유사량산정시스템(SDCS)은 Microsoft사의 Excel VBA(Visual Basic for Applications)로 개발되어져 실행 및 분석이 간단 용이하고, 또한 유사량 산정결과를 저장하고 관리할 수 있는 DBFPAD가 내재되어 있다. 본 시스템은 크게 총유사량과 하상토유사량 산정 모듈로 구성되어 있어 각각의 모듈에서 유량규모에 대응하는 유사량과 농도를 산정할 수 있다. 총유사량 산정 모듈은 대표적인 확산-이송형 모형이라 할 수 있는 Modified Einstein 공식을 토대로 하였으며, 하상토유사량 산정 모듈은 Einstein, Ackers & White, Engelund & Hansen, Yang의 유사량 공식을 근간으로 되었다. 본 시스템은 크게 총 5개의 모듈을 가지며, 총 20개의 부프로그램(Subroutine Program)과 23개의 사용자정의함수 구문으로 개발되었다. 또한 단면의 특성변화 분석모듈과 DBFPAD 저장 및 관리모듈이 포함되어 있어 산정된 결과를 용이하게 비교 분석할 수 있고, 기존 자료와의 비교도 쉽게 수행할 수 있도록 구성하였다.

  • PDF

k-means clustering analysis of a movie poster colors using OpenCV, and recommendation system (OpenCV를 활용한 k-means clustering 기반의 포스터 색감 분석 기법 및 추천 시스템)

  • Kim, Tae Hong;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.569-572
    • /
    • 2018
  • 본 연구는 영화 포스터를 대상으로 OpenCV를 활용하여 k-means clustering 기반의 색감을 분석하는 기법을 제안한다. 또한 이를 활용하여 영화 포스터 간의 유사도를 구하고 특정 영화와 대표색을 가지는 영화를 추천하는 시스템을 제안한다. 이를 위해 본 연구에서 다음과 같은 가정을 기반으로 한다. 첫 번째, 포스터는 해당 영화를 가장 잘 나타내는 이미지로, 포스터의 색감은 영화의 전반적인 분위기를 가진다. 두 번째, 영화 사이에 유사한 색감을 가진다면, 해당 영화들은 유사한 분위기를 가진다. 본 연구에서는 2단계로 나누어 연구를 진행한다. 우선 k-means clustering 기법을 통하여 데이터를 전처리 하여 영화별 대표색을 선정한다. 이 때, 선정된 대표색을 이용하여 각 영화간 색감 유사도를 분석한 결과를 통해, 같은 장르의 영화도는 유사도가 높음을 확인할 수 있었다. 다음으로 앞의 색감 유사도 분석을 통하여 특정 영화와 높은 유사도를 가지는 영화를 추천한다. 본 연구에서 추천된 영화는 기존의 영화 선택 기준에 비하여 사용자 본인의 취향을 반영한다. 본 연구 내용이 영화를 추천하는 과정에서 반영된다면 추천 시스템의 정확도와 사용자 만족도 향상에 기여할 것으로 기대된다.

A study on the Sediment Specific Properties of the Basin of Im-Jin River (임진강 유역의 유사특성에 관한 연구)

  • Shin, Sang-Ik;Park, Ji-Hyun;Lee, Eun-Tae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1670-1676
    • /
    • 2007
  • 본 연구는 임진강 유역을 대상유역으로 대표지점을 선정하고 각 지점의 하상변동 예측, 저수지 퇴사량 추정, 유사 유출량 추정, 하상 상승 및 유수소통단면 축소에 따른 홍수범람규모의 증대, 저수지 용량 감소 및 상수원 취수구 매몰 등의 원인인 유사퇴적에 대한 신뢰성 있는 자료를 실측하여 제시하고자 한다. 실측된 유사량의 특성을 알아보고자 각 대표지점 별로 동일한 유량 시 유사량을 비교하여 유사량과 각 지형 인자들과의 상관관계를 분석함으로써 임진강 유역의 특성이 반영된 유사량 산정에 관한 기초이용 자료로 활용 제시하여 수자원 개발 및 관리에 보다 효율적으로 적용하는데 목적이 있다. 임진강 유역의 대표지점으로는 적성, 군남, 전곡지점을 선정하였고, 임진강 유역 대표지점의 특성으로는 적성지점(유역면적:$6,800.2km^2$, 유로연장:224.5km), 군남지점(유역면적:$4,228.5km^2$, 유로연장:204.9km), 전곡지점(유역면적:$2,152.9km^2$, 유로연장:133.0km)이다. 총유사량의 산정은 부유사와 소류사의 양을 더하여 산정하는 것이 가장 이상적이나 소류사의 채취가 어렵고 정확도가 떨어지기 때문에 채취한 부유사량에 수정 아인쉬타인 방법 등을 이용하여 구한 소류사를 더해 총유사량을 추정하는 것이 일반적이다. 따라서 본 연구에서는 임진강 유역에서는 실측한 부유사량에 수정 아인쉬타인 방법으로 추정한 소류사량을 더한 총유사량을 구하여 분석하였고, 기타 다른 유사량산정 공식들과 비교 분석하여 보았다. 부유사 농도분석 방법으로는 저농도(10,000ppm)인 시료에 적합한 여과법을 이용하여 분석하였으며, 유사 입경분포 분석방법으로는 BW관 방법을 이용하여 분석하였다. 현재까지 국내 외적으로 하천 유사량 산정과 관련된 많은 경험식들이 제시되고 있다. 하지만, 외국의 충적하천에 기초하여 개발되어진 유사량 공식들을 우리나라 하천에 무분별하게 적용하는 것은 위험스러우며, 유사량 산정 결과의 신뢰성을 높이기 위해서는 무엇보다 우리나라 하천의 지형, 수리, 수문학적 요소들이 유사 특성에 미치는 영향을 알아야 한다. 그러므로, 본 연구에서는 실측을 통한 유사량 값을 하천의 지형, 수리, 수문학적 요소들과 비교 분석하여우리나라 하천에 맞는 유사특성을 알아보고, 기타 총유사량산정 공식을 이용하여 실측한 유사량과 비교 분석하고자 한다.

  • PDF

2021 Sediment discharge survey and analysis of characteristics (2021년 유사량 조사 및 특성분석)

  • Lee, Dae Wung;Lee, Jung Hun;Choi, Hong Yun;Lee, Chung Dea;Lee, Sin Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.427-427
    • /
    • 2022
  • 하천에서 유사량 자료는 하천의 이·치수 목적으로 활용할 수 있는 기본 자료중 하나로서 하상 변동 예측, 저수지 퇴사량 추정, 하도 계획과 설계, 유사조절 계획 수립 및 기타 구조물 등의 영향 평가 등 다양하게 활용할 수 있다. 본 연구에서는 신뢰성 높은 유사량 자료를 생산하기 위하여 국가유사량관측망 중 27개 지점에 대하여 유사량의 측정 및 특성분석을 수행하였다. 유사량 측정과정은 사전조사, 현장측정, 실험실분석, 모형적용(총유사량 산정) 단계로 구분할 수 있다. 사전조사 단계에서는 현장관련 정보를 수집하여 현장측정 계획 및 현장 안전대책을 수립하고, 현장측정 단계에서는 사전조사 단계에서 수립한 계획을 바탕으로 유사량을 측정하였다. 유사량 측정시 측선은 ISO 기준 이상의 5~7개로 측선을 나누어 측정하였고, 측정장비는 D-74, DH-48 부유사 채취기를 이용하여 왕복수심적분법으로 수행하였다. 실험실분석은 한국수자원조사기술원 유사량 실험실에서 채취시료에 대한 농도, 레이저회절법을 이용한 입도분석, 하상토분석(체분석), 비중실험을 수행하였다. 총유사량 산정을 위한 모형적용 단계에서는 수정-아인슈타인법(Modified Einstein Method)을 적용하였다. 또한, 유량-부유사량 농도 변화양상과 부유사량 특성 분석을 이용한 부유사량 측정결과를 평가하였고 각 지점의 부유사량특성을 잘 나타낼 수 있는 지수식(Qss = aQb)을 이용하여 유량-부유사량관계곡선식을 개발하였다.

  • PDF

A Study on Similarity Analysis of SNMP MIB File (SNMP MIB 파일의 유사도 분석에 관한 연구)

  • Chun, Byung-Tae
    • Journal of Software Assessment and Valuation
    • /
    • v.15 no.1
    • /
    • pp.37-42
    • /
    • 2019
  • Many similarity analysis methods, one of the dispute resolution methods for computer programs, have been studied. This paper is about quantitative similarity analysis of MIB (Management Information Base) file. Quantitative similarity means that the source codes of two computers are analyzed and the results are compared with a certain standard. The source code to analyze is a program that provides network device management functions such as configuration management, fault management, and performance management using SNMP protocol for WiMAX CPE devices. Here, WiMAX refers to the IEEE 802.16 wireless network standard protocol and can be classified into fixed WiMAX and mobile WiMAX. WiMAX CPE is a wireless Internet terminal that is fixedly used in a customer's home or office. In this paper, we analyze the similarity between MIB file of company A and company B. We will analyze whether the MIB file leaked from the damaged company is not just a list to describe the product specifications, but whether the property value can be recognized.

Classifying Musical Form by Melodic Similarity Analysis (선율간 유사도 분석에 의한 악곡 양식 판별)

  • Seo, Jung-Bum;Bae, Jae-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.683-686
    • /
    • 2005
  • 주어진 악곡의 성격을 파악하거나 악곡속의 주요정보를 추출하기 위해서는 해당 악곡의 양식파악이 선행되어야 한다. 이에 본 논문에서는 선율간 유사도 분석을 통하여 악곡의 양식을 판별하는 방안을 모색하였다. 선율간의 유사도를 분석하기 위한 방법으로 Hofmann-Engl 의 Conceptual Framework을 사용하였다.

  • PDF