• Title/Summary/Keyword: 유사도 비

Search Result 8,127, Processing Time 0.043 seconds

A Sequence Similarity Measure Considering the Product Taxonomy in Transaction Data (구매이력 데이터에서 상품 분류 체계를 고려한 시퀀스 유사도 측정 기법)

  • Yang, Yu-Jeong;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.367-370
    • /
    • 2019
  • 본 논문은 구매이력 데이터에서 상품간의 분류 체계를 고려하여 시퀀스 간의 유사도를 계산하는 새로운 방법을 제안한다. 시퀀스란 두 항목간의 순서가 존재하는 데이터를 의미한다. 항목 간의 선후관계가 중요한 시퀀스 데이터에서는 두 시퀀스 간의 유사도를 정확히 정의하는 것이 중요하다. 본 논문에서는 대표적인 시퀀스 유사도 측정 알고리즘인 편집 거리 알고리즘을 활용하여 구매이력 데이터에서 시퀀스 간의 유사도를 정의한다. 상품은 상품의 특성에 따라 항목 분류 체계에서 여러 범주로 분류된다. 이 경우 기존의 편집 거리 알고리즘에서 문자의 일치유무에 따라 단순히 0 또는 1을 부여하는 것은 부정확하다. 따라서 본 논문은 편집 거리 알고리즘의 수정 연산 중 대체 연산 비용 계산 시 항목 분류 트리를 사용하여 연산 비용이 0 에서 1 사이의 값을 가지도록 세분화하였다. 실험 결과 제안 방법은 대체 연산 비용 계산 시 두 문자가 다르면 단순히 1 을 부여하는 기존의 편집 거리 알고리즘에 비해 시퀀스 간의 유사도를 더 정확하게 계산함을 확인하였다.

Image Data Classification using a Similarity Function based on Second Order Tensor (2차 텐서 기반 유사도 함수를 이용한 영상 데이터 분류)

  • Yoon, Dong-Woo;Lee, Kwan-Yong;Park, Hye-Young
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.8
    • /
    • pp.664-672
    • /
    • 2009
  • Recently, studies on utilizing tensor expression on image data analysis and processing have been attracting much interest. The purpose of this study is to develop an efficient system for classifying image patterns by using second order tensor expression. To achieve the goal, we propose a data generation model expressed by class factors and environment factors with second order tensor representation. Based on the data generation model, we define a function for measuring similarities between two images. The similarity function is obtained by estimating the probability density of environment factors using a matrix normal distribution. Through computational experiments on a number of benchmark data sets, we confirm that we can make improvement in classification rates by using second order tensor, and that the proposed similarity function is more appropriate for image data compared to conventional similarity measures.

Sentence Similarity Measurement Method Using a Set-based POI Data Search (집합 기반 POI 검색을 이용한 문장 유사도 측정 기법)

  • Ko, EunByul;Lee, JongWoo
    • KIISE Transactions on Computing Practices
    • /
    • v.20 no.12
    • /
    • pp.711-716
    • /
    • 2014
  • With the gradual increase of interest in plagiarism and intelligent file content search, the demand for similarity measuring between two sentences is increasing. There is a lot of researches for sentence similarity measurement methods in various directions such as n-gram, edit-distance and LSA. However, these methods have their own advantages and disadvantages. In this paper, we propose a new sentence similarity measurement method approaching from another direction. The proposed method uses the set-based POI data search that improves search performance compared to the existing hard matching method when data includes the inverse, omission, insertion and revision of characters. Using this method, we are able to measure the similarity between two sentences more accurately and more quickly. We modified the data loading and text search algorithm of the set-based POI data search. We also added a word operation algorithm and a similarity measure between two sentences expressed as a percentage. From the experimental results, we observe that our sentence similarity measurement method shows better performance than n-gram and the set-based POI data search.

Extracting Korean-English Parallel Sentences based on Measure of Sentences Similarity Using Sequential Matching of Heterogeneous Language Resources (이질적인 언어 자원의 순차적 매칭을 이용한 문장 유사도 계산 기반의 위키피디아 한국어-영어 병렬 문장 추출 방법)

  • Cheon, Juryong;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.127-132
    • /
    • 2014
  • 본 논문은 위키피디아로부터 한국어-영어 간 병렬 문장을 추출하기 위해 이질적 언어 자원의 순차적 매칭을 적용한 유사도 계산 방법을 제안한다. 선행 연구에서는 병렬 문장 추출을 위해 언어 자원별로 유사도를 계산하여 선형 결합하였고, 토픽모델을 이용해 추정한 단어의 토픽 분포를 유사도 계산에 추가로 이용함으로써 병렬 문장 추출 성능을 향상시켰다. 하지만, 이는 언어 자원들이 독립적으로 사용되어 각 언어자원이 가지는 오류가 문장 간 유사도 계산에 반영되는 문제와 관련이 적은 단어 간의 분포가 유사도 계산에 반영되는 문제가 있다. 본 논문에서는 이질적인 언어 자원들을 이용해 순차적으로 단어를 매칭함으로써 언어 자원들의 독립적인 사용으로 각 자원의 오류가 유사도에 반영되는 문제를 해결하였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용함으로써 관련이 적은 단어의 분포가 반영되는 문제를 해결하였다. 실험을 통해, 언어 자원들을 이용해 순차적으로 매칭한 유사도 계산 방법은 선행 연구에 비해 F1-score 48.4%에서 51.3%로 향상된 성능을 보였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용한 방법은 약 10%에서 34.1%로 향상된 성능을 얻었다. 마지막으로, 제안한 유사도 방법들을 결합함으로써 선행연구의 51.6%에서 2.7%가 향상된 54.3%의 성능을 얻었다.

  • PDF

Column - 도대체 어디까지가 유사상표란 말인가?

  • Jeon, So-Jeong
    • 발명특허
    • /
    • v.37 no.5
    • /
    • pp.18-21
    • /
    • 2012
  • 지난달 편에 이어서 상표의 유사 여부를 판단할 때 가장 중요한 기준이 되는 '칭호'의 유사 여부 판단기준에 대해 이번 달에 좀 더 자세히 알아보고자 한다. 상표의 유사 여부를 판단할 때에는 상표의 칭호만 고려하는 것이 아니라, 상표의 외관, 칭호, 관념을 함께 고려해야 하는 것이 사실이나 상표가 일반수요자 사이에서 '칭호'로 전달되는 측면이 많다는 점에서 '칭호'의 유사 여부가 가장 중요한 기준이 된다. 칭호의 유사 여부는 거래 실제에 있어서 경험칙에 비추어 자연적, 구체적으로 판단해야 하는데, 두 개의 상표를 호칭할 때 두 개의 상표가 구별되어 들리지 않고 들릴 가능성이 있다면 두 개의 상표는 칭호가 유사하다고 판단된다. 이러한 칭호의 유사 여부는 일반수요자를 기준으로 판단하나 막상 두 개 상표의 칭호가 유사한 지 여부를 대비할 때에는 상당히 많은 가능성들을 고려하고 판단해야 하므로 출원 전에 상표의 칭호 유사 여부를 가늠하기 어려울 때가 많은 것이 사실이다. 따라서, 상표를 네이밍하기 전에 또는 출원하기 전에 상표 칭호의 유사 여부를 대비하는 데 가장 보편적으로 적용되는 기준들을 이하에서 먼저 소개하고자 한다.

  • PDF

Development and Evaluation of Alternative Nutrition Signposting Concepts (알기 쉬운 영양성분 전면표시 시안 개발 및 평가)

  • Oh, Se-Young;Kim, Woo-Kyung;Ahn, Hye-Jin;Lee, Ji-Won;Park, Hye-Kyung
    • Journal of Nutrition and Health
    • /
    • v.41 no.8
    • /
    • pp.851-859
    • /
    • 2008
  • To promote the adoption of healthier eating patterns, this study was aimed to develop and evaluate alternative front of pack nutrition signposting concepts. Based on previous research, we developed two signposting concepts, Multiple Traffic Light (MTL) and Multiple Traffic Light with % Daily Value (MTL-%DV). The signposts featured three key nutrients, total sugar, saturated fat, and sodium. Actual food packaging with no front of pack signposting (NoSP) was included in the evaluation to act as a benchmark against which to compare the performance of the different signposting options. Using an interviewer administered method, we assessed the degree of understanding and time to interpret on a total of 534 subjects (194 elementary, 108 middle, and 103 high schoolers, 128 adults). In the individual product evaluations, MTL (87.0%) obtained the highest level of correct responses, followed by MTL-%DV (83.1%) and NoSP (52.2%). Except for signposting concepts, age, gender and living area were not associated with the degree of correct responses in multivariate analyses. When used to compare products with different colors of nutrient contents, correct responses were more than 90% for MTL-%DV (91.5%) and MTL (90.3%). The middle and high schoolers revealed the lower likelihood of correct response compared to the other two groups. In case of comparing products with same colors of nutrient contents, the proportion of correct responses was the highest in NoSP (90%), followed by MTL%DV (77.4%) and MTL (48.5%). In terms of time to interpret, MTL-%DV and MTL performed better than NoSP in the individual product evaluation and the comparison of two products with different colors of nutrient contents. NoSP performed the best in the comparison of two products with same colors of nutrient contents. A majority of the participants preferred MTL-%DV (78%) most and thought it the most useful in helping them make healthier food choices. Based on these findings, MTL-%DV was considered to most closely meet the objectives of the initiatives.

A Shape feature extracting of WBC using UNL Fourier transform (UNL Fourier Transform을 이용한 백혈구 모양 특징 추출)

  • 이성환;김지윤;유채곤;황치정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.505-507
    • /
    • 2000
  • 현재 백혈병 진단에서 사용중인 방법은 골수영상을 획득하고 이를 관찰하여 비정상의 백혈구의 형태, 백혈구 핵의 크기와 추출된 골수에서의 백혈구가 차지하는 비율을 이용하여 진단하고 있다. 비정상적인 모양을 띠고 있는 백혈구의 검출은 백혈병 진단에 있어 중요한 정보로 사용된다. 백혈구의 이상 형태중 다수의 구멍이 있는 백혈구는 검출하기 위해 골수영상에서 백혈구 영역을 추출하고 이에 대해 UNL transform을 이용하여 모양 특징을추출하였다. UNL Fourier transform은 원영상의 이동(translation), 회전(rotation), 확대/축소(scale)에 대해 불변인 성질을 지니므로 이를 이용해 백혈구의 모양 특징을 추출하고 유사도 검색을 통해 비정상의 백혈구를 검출하였다.

  • PDF

Intelligent Surveillance System with Multi-Camera on the Internet (Multi-Camera를 이용한 인터넷 기반의 지능적 감시 시스템)

  • 정도준;이창우;김항준
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2003.06a
    • /
    • pp.50-53
    • /
    • 2003
  • 본 논문에서는 multi-camera를 이용한 인터넷 기반의 지능적 감시 시스템을 제안한다. 제안된 시스템은 두 종류의 카메라, static camera와 pan-tilt camera, 를 이용하여 출입구를 감시하고, 비인가자를 추적한다. static camera는 출·입을 검출하고 출입자를 인가자와 비인가자로 분류하는데 이용되고, pan-tilt camera는 비인가자로 분류된 출입자를 추적하는데 이용된다. 제안된 시스템은 세 가지 단계: 출입구 감시, 출입자 검출 및 분류(인가자/비인가자), 비인가자 추적으로 구성된다 출입구 감시는 출입문의 밝기값 변화를 이용한다 출입자 검출 및 분류는 skin color 모델과 얼굴 크기, 위치와 관련된 휴리스틱을 이용하여 얼굴을 검출하고, PCA(Principal Component Analysis)를 이용한 eigenspace상에서의 유클리디언 디스턴스로 템플릿 얼굴과 입력 얼굴의 유사도를 계산하여 인가자인지 비인가자인지 분류한다. 비인가자 추적은 pan-tilt 카메라를 이용하여, static camera에서 분류된, 비인가자의 움직임을 검출하고 카메라를 제어함으로써 추적한다 제안된 시스템은 무인 감시 상황에서 비인가자의 출입시 감시자에게 경고 신호를 제공하고, 감시지역에서 사건 발생시, 사건의 개요를 파악하는 중요한 정보를 빠른 시간에 제공할 수 있다는 장점을 가진다.

  • PDF

Design of a Low-rise RC Building with Damping System (저층 철근콘크리트 건축물의 제진 구조 설계)

  • Lee, Eun-Jin;Hyoun, Chang-Kook;Choi, Ki-Sun;You, Young-Chan
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2011.04a
    • /
    • pp.454-457
    • /
    • 2011
  • 본 논문에서는 국내에서 아직 기준이 마련되지 않은 제진설계에 대한 접근을 소개하였다. ASCE 7-05 기준에 근거하여 국내 5층 규모의 철근콘크리트 신축 건물에 제진 설계를 수행하였다. 우리나라의 현행 기준을 만족하면서 효과적인 제진 시스템 설계를 위한 방법을 소개한다. ASCE 7-05 기준에서는 제진 구조물 해석 시 부재력이 공칭강도의 1.5배를 초과하지 않은 경우 경계비선형 해석을 허용하고 있다. 이 때의 제진 설계 프로세스는 기존의 중력하중 및 등가정적하중의 75%에 의한 단면을 가정하여 부재설계를 실시하고, 선형 시간이력 해석을 통해 제진장치 및 가새를 설계한다. 이후 우리나라 실정에 맞도록 보정된 인공 지진파를 입력하여 경계비선형 해석을 실시하고, 밑면 전단력 및 층간변위 등의 만족여부를 검토한다. 이 때 목표성능을 완전탄성설계 또는 유사탄성설계로 정하여 목표성능을 만족하는지도 검토하여야 한다. 본 논문에 적용한 신축 건물은 유사탄성 설계를 위해 경계비선형 해석을 실시하였고, 가장 효과적인 제진 설계를 위해 댐퍼의 종류, 설치방법, 개수, 변위 증폭비 등을 변수로 한 case study를 진행하였다. 해석 결과 목표성능을 만족하는 범위 내에서 가장 효과적인 제진 설계는 점성댐퍼, 이층 토글형태, 증폭비 2.0, 총 8개의 댐퍼를 설치하는 것으로 나타났다.

  • PDF

Analysis of the transport and sedimentation processes of cohesive and non-cohesive sediments induced into a navigational river (주운하천으로 유입하는 점착성 및 비점착성 유사의 3차원 이송.퇴적 해석)

  • Ryoo, Jae-Il;Chung, Se-Woong;Chung, Jin-Woong;Kim, Hyun-Cheol
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.183-187
    • /
    • 2011
  • 본 연구에서는 3차원 수리해석과 함께 유사의 이송, 침식, 퇴적 현상을 연동하여 모의할 수 있는 유한차분 수치모형인 EFDC(Environmental Fluid Dynamics Code)를 이용하여 주운하천 구간으로 유입되는 다입경 혼합유사의 입경별 시 공간적 퇴적분포 특성을 고찰하고, 하상변동 예측에 있어서 유사의 밀도와 모델의 유한차분 격자 구조에 의한 불확실성 해석을 수행하였다. 유입 유사의 입경별 공간적 퇴적특성은 하천 하류부와 단면 확대부에서 발생하는 3차원적 수리현상과 매우 밀접한 상관성을 보였으며, 굴포천과 합류하는 주운수로 유입부에서는 대부분 입경이 큰 비점착성 유사($63{\mu}m$ 이상)인 사질(sand)입자들이 주로 퇴적되는 것으로 나타났으며, 주운하천 합류부로부터 하류구간까지는 $4\sim63{\mu}m$ 입자의 실트질(silt) 유사가 대부분 이송되어 퇴적되는 것으로 분석되었다. 점착성 유사인 $4{\mu}m$ 이하의 점토(clay)는 단면이 확대되어 유속이 매우 느린 구간이나 사수역을 중심으로 퇴적되는 것으로 나타났다. 단면 횡방향 분포특성은 굴포천과 주운하천이 합류하는 합류부 구간의 주흐름 방향 남쪽에서 흐름의 정체구간이 발생되어 퇴적이 발생하고, 단면 급확대부 양안에서 사수역이 형성되므로 퇴적이 지배적으로 발생되었다. 하상변동 예측의 불확실성 해석을 위해 유사 밀도값에 대한 민감도 분석결과, 하상변동량은 유사밀도($1.3ton/m^3\sim2.65ton/m^3$)가 감소됨에 따라 약 2배까지 증가하는 것으로 분석되어 민감도가 매우 크게 나타났다. 또한 수치격자 구조의 민감도 분석결과, 수층을 3개 층으로 분석한 결과가 단일층 분석결과보다 최대 6배의 하상변동량이 많게 산정되었다. 이는 수심방향의 유속과 부유사 농도의 불균등 분포특성이 실제 자연현상에 더 가깝게 모의되기 때문으로 판단되었다.

  • PDF