• 제목/요약/키워드: Similarity matrix

검색결과 315건 처리시간 0.022초

비부정 행렬 인수분해 차원 감소를 이용한 최근 인접 협력적 여과 (Nearest-Neighbor Collaborative Filtering Using Dimensionality Reduction by Non-negative Matrix Factorization)

  • 고수정
    • 정보처리학회논문지B
    • /
    • 제13B권6호
    • /
    • pp.625-632
    • /
    • 2006
  • 협력적 여과는 사용자 선호도를 예측하기 위해 그 사용자의 유형을 학습하는 데 목적을 둔 기술이다. 협력적 여과 시스템이 전자상거래에서 성공적인 기술일지라도 그들은 데이터의 고차원성과 희박성이라는 문제점을 갖는다. 본 논문에서는 이와 같은 문제점을 해결하기 위하여 비부정 행렬 인수분해(NNMF, Non-negative Matrix Factorization) 방법을 이용한 최근 인접 협력적 여과 방법을 제안한다. 행렬을 분해하기 위한 전처리로서 사용자 변동 계수를 이용하여 사용자-아이템 행렬의 결측치를 채우고, 이를 대상으로 비부정 분해 방식을 적용하여 행렬을 인수분해 한다. 비부정 분해 방식을 적용한 긍정 분해는 사용자들을 의미를 갖는 벡터로써 표현함으로써 사용자들을 의미 관계를 갖는 그룹으로 표현한다. 이와 같이 벡터로 표현된 사용자들은 벡터 유사도에 의해 그들간의 유사도를 계산한다. 계산된 유사도의 정도에 의해 이웃을 결정하고, 이웃들이 평가한 아이템에 대한 흥미도를 기반으로 새로운 사용자가 평가하지 않은 아이템에 대한 결측치를 예측한다.

PAM 행렬 모델을 이용한 음소 간 유사도 자동 계산 기법 (Automatic Inter-Phoneme Similarity Calculation Method Using PAM Matrix Model)

  • 김성환;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권3호
    • /
    • pp.34-43
    • /
    • 2012
  • 두 문자열 간의 유사도를 계산하는 문제는 정보 검색, 오타 교정, 스팸 필터링 등 다양한 분야에 응용될 수 있다. 동적 계획법 기반의 유사도 계산 방법을 통하여 한글 문자열의 유사도 계산을 위해서는 우선 음소간의 유사도에 대한 정의가 필요하다. 그러나 기존의 방법들은 수동적 설정에 의한 유사도 점수를 사용하고 있다는 한계점이 있다. 본 논문에서는 PAM(Point Accepted Mutation) 행렬과 유사한 확률 모델을 이용하여 변형 단어 집합으로부터 음소 간의 유사도를 자동적으로 계산하는 기법을 제안한다. 제안 기법은 주어진 변형 단어의 집합 내 유사한 단어 쌍을 찾아 문자열 정렬(Text Alignment)을 수행함으로써 음소 변형 규칙을 도출하고, 이로부터 각 음소 쌍의 상호 변형 빈도에 따른 유사도 점수를 계산한다. 실험 결과 특이도(Specificity) 77.2~80.4% 수준에서 불일치 여부에 따른 단순 점수 부여 방식에 비해서는 10.4~14.1%, 수동으로 음소 간 유사도를 직접 설정하는 방식에 비해서는 8.1~11.8%의 민감도(Sensitivity) 향상이 있음을 확인하였다.

Genetic Diversity of Barley Cultivars as Revealed by SSR Masker

  • Kim, Hong-Sik;Park, Kwang-Geun;Baek, Seong-Bum;Suh, Sae-Jung;Nam, Jung-Hyun
    • 한국작물학회지
    • /
    • 제47권5호
    • /
    • pp.379-383
    • /
    • 2002
  • Allelic diversity of 44 microsatellite marker loci originated from the coding regions of specific genes or the non-coding regions of barley genome was analyzed for 19 barley genotypes. Multi-allelic variation was observed at the most of marker loci except for HVM13, HVM15, HVM22, and HVM64. The number of different alleles ranged from 2 to 12 with a mean of 4.0 alleles per micro-satellite. Twenty-one alleles derived from 10 marker loci are specific for certain genotypes. The level of polymorphism (Polymorphic Information Content, PIC) based on the band pattern frequencies among genotypes was relatively high at the several loci such as HVM3, HVM5, HVM14, HVM36, HVM62 and HVM67. In the cluster analysis using genetic similarity matrix calculated from microsatellite-derived DNA profiles, two major groups were classified and the spike-row type was a major factor for clustering. Correlation between genetic similarity matrices based on microsatellite markers and pedigree data was highly significant ($r=0.57^{**}$), but these two parameters were moderately associated each other. On the other hand, RAPD-based genetic similarity matrix was more highly associated with microsatellite-based genetic similarity ($r=0.63^{**}$) than coefficient of parentage.

전송선로행열에 대한 유사변환을 이용한 PCB기판 임피던스 해석 (PCB Board Impedance Analysis Using Similarity Transform for Transmission Matrix)

  • 서영석
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2052-2058
    • /
    • 2009
  • 디지털 시스템의 동작주파수가 증가하고 전압스윙폭이 감소함에 따라 PCB보드의 정확하고 빠른 해석이 중요하게 되었다. 단위 기둥 행열의 다중곱을 이용하는 전송선로 행열을 이용한 방법은 PCB보드 해석에 있어서 가장 빠른 방법이다. 본 논문에서 PCB보드 임피던스를 계산하는 새로운 방법이 제안되었다. 우선, 이 방법에서 PCB의 단위기둥에 대한 전송선로행열의 고유치와 고유벡터가 계산되고, 단위기둥에 대한 전송선로 행열은 행열요소의 곱셈횟수를 줄이기 위해 행열유사변환을 통해 변환된다. 이러한 유사변환을 방법은 기존방법에 비해 계산시간을 대폭 줄여 줄 수 있다. 제안된 방법은 가로 1.3인치 세로 1.9인치의 PCB기판에 적용되었고, 10배 정도의 계산시간저감 효과를 보였다. 제안된 방법은 보드임피던스의 반복적인 계산을 필요로 하는 PCB설계에 응용될 수 있다.

비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약 (Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means)

  • 박선;이주홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.255-264
    • /
    • 2008
  • 본 논문은 K-means과 비음수 행렬 분해(NMF)를 이용하여 주제기반의 다중문서를 요약하는 새로운 방법을 제안하였다. 제안방법은 비음수 행렬 분해를 이용하여 가중치가 부여된 용어-문장 행렬을 희소(Sparse)한 비음수 의미특징 행렬과 비음수 변수 행렬로 분해함으로써 직관적으로 이해할 수 있는 형태의 의미적 특징을 추출할 수 있고, 주제와 의미특징간의 유사도에 가중치를 부여하여 유사도는 높으나 실제 의미 없는 문장이 추출되는 것을 막는다. 또한 K-means 군집을 이용하여 문장에 포함된 노이즈를 제거함으로써 문서의 의미가 요약에 편향되게 반영하는 것을 피할 수 있고, 추출된 문장에 부여된 순위순서대로 정렬하여 보여 줌으로써 응집성을 높인다. 실험 결과 제안방법이 다른 방법에 비하여 좋은 성능을 보인다.

제한된 프로그램 소스 집합에서 표절 탐색을 위한 적응적 알고리즘 (An Adaptive Algorithm for Plagiarism Detection in a Controlled Program Source Set)

  • 지정훈;우균;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1090-1102
    • /
    • 2006
  • 본 논문에서는 대학생들의 프로그래밍 과제물이나 프로그래밍 경진대회에 제출된 프로그램과 같이 동일한 기능을 요구받는 프로그램 소스 집합들에서 표절행위가 있었는지를 탐색하는 새로운 알고리즘을 제시하고 있다. 지금까지 보편적으로 사용되어 온 대표적인 알고리즘은 부분 스트링간의 완전 일치를 통한 Greedy-String-Tiling이나 두 스트링간의 지역정렬(local alignment)을 이용한 유사도 분석이 주된 방법론이었다. 본 논문에서는 해당 프로그램 소스의 집합에서 추출된 키워드들의 빈도수에 기반한 로그 확률값을 가중치로 하는 적응적(adaptive) 유사도 행렬을 만들어 이를 기반으로 주어진 프로그램의 유사구간을 탐색하는 새로운 방법을 소개한다. 우리는 10여개 이상의 프로그래밍 대회에서 제출된 실제 프로그램으로 본 방법론을 실험해 보았다. 실험결과 이 방법은 이전의 고정적 유사도 행렬(match이면 +1, mismatch이면 -1, gap이면 -2)에 의한 유사구간 탐색에 비하여 여러 장점이 있음을 알 수 있었으며, 제시한 적응적 유사도 행렬을 보다 다양한 표절탐색 목적으로 사용할 수 있음을 알 수 있었다.

무 결합계수-회전변환의, 최적화된 유리함수 Fitting에 의한 효율적인 RF대역 여파기 설계기법 (An Efficient Design Method of RF Filters via Optimized Rational-Function Fitting, without Coupling-Coefficient Similarity Transformation)

  • 주정호;강승택;김형석
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2006년도 하계학술대회
    • /
    • pp.202-204
    • /
    • 2006
  • A new method is presented to design RF filters without the Similarity Transform of their coupling coefficient matrix as circuit parameters which is very tedious due to pivoting and deciding rotation angles needed during the iterations. The transfer function of a filter is directly used for the design and its desired form is derived by the optimized rational-function fitting technique. A 3rd order Coaxial Lowpass filter and an 8th order dual-mode elliptic integral function response filter are taken as an example to validate the proposed method.

  • PDF

초고주파용 필터설계를 위한 결합행렬 합성법 (Coupling Matrix Synthesis Methods for RF/Microwave Filter Design)

  • 최동묵;김채영
    • 한국통신학회논문지
    • /
    • 제32권12A호
    • /
    • pp.1346-1353
    • /
    • 2007
  • 본 논문에서는 필터함수의 감쇄극점(poles)과 반사손실(Return Loss)로부터 전송계수($S_{21}$)와 반사계수($S_{11}$)를 도출하고, 이 값들로부터 대역통과필터 설계를 위한 결합계수행렬 계산법을 제시하였다. 계산된 결합계수행렬에 유사변환을 적용하여서 결합계수행렬을 접힌 표준형 필터 구조의 커플링계수 행렬로 변환하였다. 그 결과를 이용하여 접힌 표준형 필터를 설계하였다.

이중모드 비대칭 Canonical 구조 필터의 합성에 대한 연구 (A Study on the Synthesis of a Dual-Mode Asymmetric Canonical Filter)

  • 엄만석;이주섭;염인복;이성팔
    • 한국전자파학회논문지
    • /
    • 제14권6호
    • /
    • pp.599-605
    • /
    • 2003
  • 이중모드 비대칭 canonical 구조 필터는 일반적으로 위성 중계기의 입력 멀티플렉서에 주로 사용된다. 본 논문에서는 비대칭형 canonical 필터의 용이한 합성 방법에 대하여 언급하였다. 비대칭형 canonical 필터의 결합행렬은 대칭형 canonical 필터의 결합 행렬로부터 평면 회전(plane rotation)과 같은 similarity transformation을 이용하여 구하였다. 비대칭형 canonical 필터의 결합 행렬을 구하기 위한 similarity transformation 과정에 있어서 회전 순서, 피벗(pivot), 회전각을 제시하였다. 본 논문에서 제시한 방법을 이용하여 8차 및 10차 비대칭 canonical filter의 결합 행렬을 추출하였으며, 비대칭형 canonical 필터의 주파수 응답 특성은 대칭형 canonical 필터의 주파수 응답 특성과 동일한 특성을 나타내었다.

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.