• 제목/요약/키워드: similarity weight

검색결과 376건 처리시간 0.03초

새로운 N-ary 관계 디자인 기반의 온톨로지 모델을 이용한 문장의미결정 (A Semantic Similarity Decision Using Ontology Model Base On New N-ary Relation Design)

  • 김수경;안기홍;최호진
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.43-66
    • /
    • 2008
  • 시맨틱 웹 기술의 제안과 더불어 다양한 분야에 온톨로지의 특징을 적용한 기술 개발 연구가 많이 진행되고 있다. 인간이 소유한 개념을 가장 적절하게 표현하기 위해 현재에도 OWL, RDF와 같은 온톨로지 언어의 표현력을 확장시키기 위해 N-ary 관계나 모델-이론 의미론과 같은 개발이 진행되고있다. 본 연구는 한국어에 있어 문장이 내포하는 의미를 정확하게 결정하기 위해 문장의 구조에 따라 달라지는 단어의 의미를 연관할 수 있도록 N-ary 관계와 디자인 기반이 적용된 온톨로지의 지식 표현 방법을 연구하였다. 특히 다양한 지식 영역을 포함하는 다의어(polysemy)와 동의어(synonym)의 특징을 갖는 단어에 있어 각 지식 영역으로 분류되어 각 지식 영역에 있는 유사한 의미를 가진 단어로 확장되어 유사한 의미를 가진 단어가 포함된 문장의 경우 까지도 확장할 수 있는 표현 방법을 연구하였다. 연구의 검증을 위해 사용자가 입력한 병증 문장을 제안된 방법에 따라 구축된 온톨로지내 지식 관계와 의미 결정을 위한 추론 표현 방법을 이용하여 병증의 의미를 결정하고 그에 따른 진단을 제공하는 실험 시스템을 구현하였고, 한국어가 갖고 있는 문장의 유의성, 모호성, 복합성 의 특징을 보유한 증상문들의 실험 결과 의미 결정과 유사 의미 확장에 있어 우수한 성능을 보여주었다.

사석방파제 위에 피복한 Rakuna-IV의 안정공식 (Stability Formula for Rakuna-IV Armoring Rubble-Mound Breakwater)

  • 서경덕;이태훈;;남홍기
    • 한국해안·해양공학회논문집
    • /
    • 제25권4호
    • /
    • pp.181-190
    • /
    • 2013
  • 본 연구에서는 사석 방파제 위에 피복한 Rakuna-IV에 대하여 파랑조건과 구조물의 경사를 변화시키며 51가지 실험을 수행하여 안정공식을 유도하였다. 안정공식에서 안정수는 상대피해, 파의 개수, 구조물 경사 및 surf similarity parameter의 함수로 표시된다. 안정공식은 권파와 쇄기파에 대하여 따로따로 유도되었으며, 둘 중 안정수를 크게 계산하는 공식을 사용한다. 또한 권파와 쇄기파의 경계가 되는 critical surf similarity parameter를 제시하였다. 마지막으로, Hudson 공식에서 사용되는 안정계수에 익숙한 기술자들에게 Rakuna-IV의 안정성을 설명하기 위하여, 대표적인 권파와 쇄기파 조건에 대하여 유의파고의 변화에 따른 Rakuna-IV의 소요중량을 계산하고, 이를 몇몇 다른 안정계수를 사용한 Hudson 공식의 결과와 비교하였다.

개체 중의성 해소를 위한 사용자 유사도 기반의 트윗 개체 링킹 기법 (Tweet Entity Linking Method based on User Similarity for Entity Disambiguation)

  • 김서현;서영덕;백두권
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1043-1051
    • /
    • 2016
  • 트위터 문서는 웹 문서에 비해 길이가 짧기 때문에 웹 기반의 개체 링킹 기법을 그대로 적용시킬 수 없어 사용자 정보나 집단의 정보를 활용하는 방법들이 시도되고 있다. 하지만, 트윗의 개수가 충분하지 않은 사용자의 경우 데이터 희소성 문제가 여전히 발생하고 관련이 없는 집단의 정보를 사용할 경우 링킹의 결과에 악영향을 미칠 수 있다. 본 논문에서는 기존 연구의 문제를 해결하기 위해 단일 트윗 내의 의미 관련도 뿐만 아니라 사용자의 트윗 집합과 다른 사용자들의 트윗 집합까지 고려하여 데이터 희소성을 해결하고, 관련성이 높은 사용자들의 트윗 정보에 가중치를 주어 트윗 개체 링킹의 성능을 높이고자 한다. 실제 트위터 데이터를 활용한 실험을 통해 제안하는 트윗 개체 링킹 기법이 기존의 기법에 비해 높은 성능을 가지며, 유사도가 높은 사용자의 정보를 사용하는 것이 트윗 개체 링킹에서 데이터 희소성 해결과 링킹 정확도 향상에 연관성이 있음을 보였다.

LOD-기반 추천 시스템에서 LOD 그래프에 가중치를 사용한 의미 거리 측정 모델 (A Semantic Distance Measurement Model using Weights on the LOD Graph in an LOD-based Recommender System)

  • 허원회
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.53-60
    • /
    • 2021
  • LOD-기반 추천 시스템은 보통 DBpedia와 같은 LOD 데이터세트 내에서 사용가능한 데이터를 활용하여 최종 사용자에게 영화, 책, 음악과 같은 아이템을 추천한다. 이러한 시스템은 링크드 데이터 리소스 쌍 간의 일치 정도를 측정하는 의미 유사도 알고리즘을 사용한다. 이 논문에서는 LOD 그래프의 링크에 사용자 평가 등급을 변환한 가중치를 할당하여 LOD-기반 추천 시스템에서 의미 거리를 측정하는 새로운 접근방식을 제안했다. 이 논문에서 제안된 의미 거리 측정 모델은 가중치 계산을 통해 그래프가 사용자에게 개인화되는 처리 단계와 이러한 가중치를 LDSD에 적용하는 방법을 기반으로 한다. 실험 결과는 다른 유사한 방법들과 비교하여 제안된 방법이 더 높은 정확도를 보였으며, 추천 시스템의 의미 거리 측정의 범위를 넓혀서 유사도 향상에 기여하였다. 향후 연구로는 다른 방법의 LOD-기반 유사도 측정을 사용하여 모델에 미치는 영향을 분석하는 것을 목표로 한다.

Time-aware Item-based Collaborative Filtering with Similarity Integration

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.93-100
    • /
    • 2022
  • 인터넷 상의 정보 과부하 시대에 필수 불가결한 기능인 추천 시스템은 사용자가 선호할 만한 상품을 추천하는 서비스로서 여러 상업용 사이트에서 성공적으로 제공되고 있다. 최근 대표적인 추천 기법인 협력 필터링의 성능 개선을 위하여 항목 평가 시간을 반영하려는 연구가 활발하다. 이 연구들의 핵심 아이디어는 과거에 평가한 항목일수록 기하급수적으로 낮은 가중치를 두어 추천 결과를 산출하는 것이다. 그러나 이는 항목의 특성에 따른 사용자들의 선호도 변화를 고려하지 않고 모든 항목들에 대하여 일률적인 시간 함수를 적용한다는 단점을 가진다. 본 연구는 시간에 따른 항목 간의 유사도값 변화를 가중합으로 통합하는 새로운 유사도 척도를 개발함으로써 기존과 전혀 다른 관점의 시간 인지 협력 필터링 기법을 제안한다. 실험 결과, 제안 방법의 예측 성능과 추천 성능은 기존의 대표적 시간 인지 방법과 전통적 방법들에 비해 월등하게 우수하였다.

베이지안 추정치가 부여된 유사도 가중치와 연관 사용자 군집을 이용한 선호도 예측 시스템 (Preference Prediction System using Similarity Weight granted Bayesian estimated value and Associative User Clustering)

  • 정경용;최성용;임기욱;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.316-325
    • /
    • 2003
  • 기존의 협력적 필터링 기술을 이용한 사용자 선호도 예측 방법에서는 피어슨 상관 계수에 의해 사용자의 유사도를 구하고, 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하였다. 본 논문에서는 기존의 사용자 선호도 예측 방법의 문제점을 보완하기 위하여 베이지안 추정치가 부여된 유사도 가중치와 연관 사용자 군집을 이용한 선호도 예측 시스템을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서의 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집하며 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 기존의 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게 하여 예측의 정확도를 높일 수 있다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다. 그 결과 기존의 협력적 필터링 기술의 문제점을 해결하여 예측의 정확도를 높이는데 효과적임을 확인하였다.

Eigenvoice 기반 화자가중치 거리측정 방식을 이용한 화자 분할 시스템 (Speaker Segmentation System Using Eigenvoice-based Speaker Weight Distance Method)

  • 최무열;김형순
    • 한국음향학회지
    • /
    • 제31권4호
    • /
    • pp.266-272
    • /
    • 2012
  • 화자 분할 기술은 오디오 데이터로부터 자동적으로 화자 경계 구간을 검출하는 것이다. 화자 분할 방식은 화자에 대한 선행 지식 사용 여부에 따라 거리기반 방식과 모델기반 방식으로 나누어진다. 본 논문에서는 eigenvoice 기반의 화자가중치 거리를 이용한 화자 분할 방식을 도입하고, 이 방식을 대표적인 거리 기반 방식들과 비교한다. 또한, 화자가중치의 거리 측정 함수로 유클리드 거리와 cosine 유사도를 사용하여 화자 분할 성능을 비교하고, eigenvoice 방식에 의해 화자 적응된 모델들 사이의 직접적인 거리를 이용한 화자 분할 방식과의 비교를 통해 화자가중치 거리를 이용한 방식이 계산량면에서 효율적인 점을 검증한다.

효율적인 kNN 알고리즘 (An Efficient kNN Algorithm)

  • 이재문
    • 정보처리학회논문지B
    • /
    • 제11B권7호
    • /
    • pp.849-854
    • /
    • 2004
  • 본 논문은 문서분류 방법인 kNN의 실행속도를 개선하는 알고리즘을 제안한다. 제안된 알고리즘은 기존의 kNN이 사용하는 <용어, 가중치>쌍의 목록 대신, <문서, 가중치>쌍의 목록을 사용하여 유사성 계산을 빠르게 함으로써 실행속도를 개선하는 것이다. <문서, 가중치>의 목록은 문서분류의 학습단계에서 <용어, 가중치>의 목록을 행렬 전치함으로써 구한다. 본 논문에서는 제안된 알고리즘을 시간복잡도 측면에서 분석하고 기존의 kNN과 비교 하였으며, 로이터-21578 데이터를 사용하여 실험적으로 성능을 비교 하였다. 실험결과, 본 논문에서 제안한 알고리즘이 기존의 kNN보다 실행속도측면에서 약 $90{\%}$정도의 우수함을 알 수 있었다.

동해안 울릉도 해역의 해조군집 (Benthic algal community of Ulleungdo, East coast of Korea)

  • 김성태;황강석;박규진;최창근
    • 수산해양교육연구
    • /
    • 제28권1호
    • /
    • pp.83-90
    • /
    • 2016
  • A subtidal marine benthic algal vegetation at Ulleungdo Island, the eastern coast of Korea was investigated to clarify the community structure and vertical distribution by quadrat method at seven stations in May and August 2014. The total number of marine algal species was 148 species composed of the green algae of 12 species, the brown algae of 40 species and the red algae of 96 species. Mean biomass in dry weight was $94.8g\;dry\;weight\;m^{-2}$ in study sites, $98.1g\;dry\;weight\;m^{-2}$ in upper tidal level, and $86.6g\;dry\;weight\;m^{-2}$ in middle level. The R/P and (R+C)/P value reflecting flora characteristic were 1.9 and 2.3, respectively. Three groups produced by cluster analysis, one including sites Neunggeol, Daepung, Jukdo, second including sites Gongam, Ssangjeongcho and the other including sites Gwaneum, Hangnam, showed meaningful difference in similarity (about 40%), each other. The number of marine algal species and biomass in Ulleungdo Island area were markedly reduced comparing that in the previous studies. This result may suggest probably change of algal vegetation in future, considering the physical and chemical pollutions loaded in the coastal marine environment of this area.

얼굴 분석과 유사도 비교를 이용한 사용자 인증 시스템 (A User Authentication System Using Face Analysis and Similarity Comparison)

  • 류동엽;임영환;윤선희;서정민;이창훈;이근수;이상문
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1439-1448
    • /
    • 2005
  • 본 논문에서는 입력된 영상에서 색상 정보와 얼굴에서 주요한 특징정보의 기하 위치 분석과 추출 객체의 유사도 비교를 이용해서 얼굴 영역을 검출한 후 비율정보와 유사도를 이용해 사용자 인증을 하는 방법에 대해서 기술한다. 색상 정보를 이용한 얼굴 추출 알고리즘은 얼굴의 기울어진 정도나 크기 등에 영향을 받지 않는 장점을 가지고 있으므로 형태정보를 이용한 얼굴 추출 알고리즘에 비해 비교우위를 가진다. 하지만 색상 정보를 기반으로 하기 때문에 조명의 변화나, 피부색과 유사한 배경 등 색상에 대해 민감해서 정확한 성능을 유지하기 어렵다. 따라서 색상 정보 이외에 얼굴의 주요 특징 요소인 눈과 입술 등의 특징 정보를 검출하고 각 객체에 대한 유사도 비교를 수행함으로서 색상 정보를 이용한 방법에 비해 더 효율적으로 사용될 수 있다. 본 논문에서는 얼굴을 각각의 개체단위로 분할한 후 각 개체의 비율적인 특징을 계산하고 특정 계산식에 가중치를 부여하며 분할된 눈과 입의 유사도 검색을 통해 유사성을 확인함으로써 사용자를 인식하는 시스템을 제안한다. 제안한 방법을 실험하고 그 결과의 분석을 통해 인식률이 높아짐을 알 수 있었다.

  • PDF