• 제목/요약/키워드: 유사도 가중치

검색결과 576건 처리시간 0.043초

질의확장 검색에서의 추가용어 가중치 최적화 (Optimizing the Weight of Added Terms in Query Expansion)

  • 정영미;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.241-246
    • /
    • 2002
  • 전역적 질의확장 검색에서 단어간 공기기반 유사도를 사용할 경우에는 질의에 추가되는 용어에 부여하는 탐색가중치로 질의와의 유사도를 사용하는 것이 일반적이다. 그러나 과연 유사도가 탐색가중치로 최적인가는 의문의 여지가 있다. 추가용어와 질의 사이의 유사도가 가지는 특성을 살펴보고 고정가중치를 부여한 경우와 비교해보았다. 또한 실험집단이나 확장범위의 영향을 덜 받는 최적화된 추가용어 가중치를 찾기 위해 여러 가지 탐색가중치 공식을 실험하였다.

  • PDF

정보 검색에서 질의문 길이에 대한 가중치와 질의어 출현 빈도 가중치 적용 (Applying the Weight for Query Length and the Frequency of Query Term to Information Retrieval)

  • 강승식;전영진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.763-766
    • /
    • 2005
  • 정보검색 시스템에서 긴 문장으로 질의가 들어올 경우 질의문의 길이와 시스템이 정답이라고 판단한 문서에서 질의문을 분석하여 추출한 질의어들이 출현한 빈도수를 가중치로 준다면 좀더 정확한 결과를 보일 수 있을 것이라 가정하였다. 즉 벡터 모델을 이용하여 문서와 질의와의 유사도를 계산하고 여기에 질의문의 길이에 대한 가중치와 유사도를 이용하여 얻은 결과 문서에서 질의문을 분석하여 얻은 질의 용어들의 출현 빈도에 대한 가중치를 적용하는 방법을 제안하였다.

  • PDF

실질적 유사성 판단을 위한 가중치 활용과 질적 분석의 관계 (A Study on the Relationship between Weighted Value and Qualitative Standard in Substantial Similarity)

  • 김시열
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권1호
    • /
    • pp.25-35
    • /
    • 2019
  • 우리나라에서 컴퓨터프로그램의 실질적 유사성 여부 판단은 정량적인 유사도를 산출하여 그 결과를 활용하는 방식이 일반적으로 이용된다. 실질적 유사성은 유사한 부분의 양과 질을 고려하여 판단되어야 하는데, 실무에서는 정량적인 유사도 계산 과정에서 가중치를 곱함으로써 유사한 부분의 질을 고려하는 모습을 보인다. 그런데 실질적 유사성 판단과 관련하여 유사한 부분의 양적, 질적인 고려는 동일한 지위에서 순차적으로 이루어져야 한다는 본질적 특징을 고려할 때, 현재와 같은 실무 방식은 적절하다고 할 수 없다. 이에 이와 같은 가중치 활용의 문제를 지적하고, 실질적 유사성 판단을 위한 유사 부분의 질적 평가는 정량적 유사도 판단에 후행하여 그와 동일한 지위에서 이루어져야 함을 제시 및 이를 위한 적절한 실무적 방안을 제언하였다.

용어 발생 유사도와 퍼지 추론을 이용한 질의 용어 확장 및 가중치 재산정 (Query Term Expansion and Reweighting using Term Co-Occurrence Similarity and Fuzzy Inference)

  • 김주연;김병만
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권9호
    • /
    • pp.961-972
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 적합 문서들에서 발생하는 용어들과 초기 질의어간의 발생 빈도 유사도 및 퍼지 추론을 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의어로 확장될 수 있는 후보 용어들로 선택하고, 발생 빈도 유사성을 이용한 초기 질의어-후보 용어의 관련 정도, 용어의 IDF, DF 정보를 퍼지 추론에 적용하여 후보 용어의 초기 질의어에 대한 최종적인 관련 정도를 산정 하였으며, 피드백 문서들에서의 가중치와 관련 정도를 결합하여 후보 용어들의 가중치를 산정 하였다. 본 논문에서는 성능을 평가하기 위하여 KT-set 1.0과 KT-set 2.0을 사용하였으며, 성능의 상대적인 평가를 위하여 Dec-Hi 방법, 용어 분포 유사도를 이용한 방법, 퍼지 추론을 이용한 방법들을 정확률-재현률을 사용하여 평가하였다.

  • PDF

유사 정보 추출에 기반한 조정 에이전트 모델 (A coordination Agent Model based on Extracting Similar Information)

  • 양소진
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.398-413
    • /
    • 2000
  • 본 논문의 목적은 유사도와 강화 학습을 사용하여, 정보를 제공하는 에이전트와 정보를 요청하는 에이전트간의 연결을 매개하는 조정 에이전트(Coordination Agent, Middle Agent) 구현 방식을 제안하는데 있다.본 논문에서는 질의 에이전트의 질의와 가장 밀접한 정보를 제공하는 것으로 판단되는 정보 에이전트를 찾는 방안을 제안하고자 한다. 정보 에이저트와 질의 에이전트는 조정에이전트에 정보를 등록·요청할 때, 조정 에이전트에 이미 존재하는 기본 오톨로지(Base Ontology)에 자신이 제공·질의하는 정보의 상대적 가중치를 함께 등록한다. 조정 에이전트는 질의 에이전트와 정보 에이전트의 가중치를 고려하여 유사도를 구하고, 구해진 유사도를 이용하여 가장 근접한 정보를 제공하는 정보 에이전트를 찾아 연결한다. 가중치를 제공하지 않는 질의 에이전트의 경우에는 강화 학습으로 얻어진 특성 자료를 이용하여 조정 에이전튼가 임의로 가중치를 구하고, 얻어진 결과에 대하여 타당성을 검증한다.

  • PDF

퍼지 추론을 이용한 질의 용어 확장 및 가중치 재산정 (Query Term Expansion and Reweighting by Fuzzy Infernce)

  • 김주연;김병만;신윤식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.336-338
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 적합 문서들에서 발생하는 용어들과 초기 질의어간의 발생 빈도 유사도 및 퍼지 추론을 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의로 확장될 수 있는 후보 용어들로 선택하고, 발생 빈도 유사성을 이용한 초기 질의어-후보 용어의 관련 정도, 용어의 IDF, DF 정보를 퍼지 추론에 적용하여 후보 용어의 초기 질의에 대한 최종적인 관련 정도를 산정 하였으며, 피드백 문서들에서의 가중치와 관련 정보를 결합하여 후보 용어들의 가중치를 산정 하였다.

  • PDF

감정 대상 규격서의 수정 및 추가에 대한 분석 방법 (Analysis Method for Revision and Addition of the Specification to Appraisal)

  • 전병태
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제16권2호
    • /
    • pp.37-44
    • /
    • 2020
  • 정보화 사회가 발전함으로써 다양한 저작권 침해 사례가 발생하고 있다. 기업간의 여러 분쟁은 소프트웨어 유사도 감정이 대부분을 차지하고 있다. 본 논문은 감정 대상 규격서의 유사도 산정 방법에 관한 연구이다. 즉, 감정 대상 규격서의 수정 및 추가 분량이 어느 정도 인지 산정하는 연구이다. 감정 분석 방법은 양측의 규격서 목차 비교하고 동일 또는 유사 부분을 찾아낸다. 유사 정도에 따라 유사도 가중치를 결정한다. 가중치는 전문가의 전문적 지식과 규격서의 유사 정도를 파악하고 부여한다. 완전히 새로 추가된 경우 유사도 가중치는 1, 일부 수정한 경우 유사도 가중치는 0.4, 기존과 거의 동일한 경우 가중치 0.05를 주어 산정한다. 본 논문을 통하여 규격서에 대한 동일 유사성 산출 결과 21.2 페이지임을 알 수 있었다.

커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도 (A relevance-based pairwise chromagram similarity for improving cover song retrieval accuracy)

  • 서진수
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.200-206
    • /
    • 2024
  • 음악 유사도 계산은 음악 검색 서비스 구현에서 중요한 구성 요소 중 하나이다. 본 논문은 커버곡 검색 성능을 제고하기 위해서, 크로마그램 벡터 별로 커버곡 검색 적합도를 구하여 음악 유사도 계산 시 가중치로 활용한다. 커버곡 검색 적합도는 확률 적합도 모델을 이용하여 구한다. 커버곡 검색에 도움이 될 수 있는 분별도가 높은 벡터에 높은 가중치를 부여하고, 흔하게 존재하여 분별도가 떨어지는 벡터에 낮은 가중치를 부여하는 방식으로 음악 유사도 함수를 유도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선시킬 수 있음을 보였다.

협업 필터링 추천에서 대응평균 알고리즘의 예측 성능에 관한 연구 (A study on the Prediction Performance of the Correspondence Mean Algorithm in Collaborative Filtering Recommendation)

  • 이석준;이희춘
    • 경영정보학연구
    • /
    • 제9권1호
    • /
    • pp.85-103
    • /
    • 2007
  • 본 연구의 목적은 좀 더 정확한 고객 선호도 예측을 위한 협업 필터링 알고리즘의 예측 성능을 평가하기 위한 것이다. 고객 선호도 예측의 정확도를 비교하기 위하여 이웃 기반의 협업 필터링 알고리즘과 대응평균 알고리즘에 의한 고객 선호도 예측의 MAE를 비교하였다. 예측 알고리즘의 정확성을 분석하기 위하여 MovieLens 1 Million dataset을 이용하여 실험을 하였다. 각 예측 알고리즘에 사용된 유사도 가중치는 일반적으로 이용되는 피어슨 상관계수와 벡터 유사도를 이용하였으며 분석결과 대응평균 알고리즘의 예측 정확도가 이웃 기반의 협업 필터링 알고리즘의 예측 정확도 보다 우수한 것으로 나타났다. 두 알고리즘에 사용된 유사도 가중치인 피어슨 상관계수와 벡터 유사도는 두 고객이 특정 상품에 대하여 공통으로 평가한 선호도 평가치를 이용하여 계산된다. 이때 공통으로 평가한 선호도 평가치의 개수가 적으면 계산된 유사도 가중치가 과대 평가된다. 과대 평가된 유사도 가중치를 보정하여 고객 선호도 예측의 정확도를 높이기 위하여 기존의 연구에서 고려한 공통 평가 영화의 개수 보다 확대된 범위를 적용하였으며 각 예측 방법에 따라 서로 다른 개선 경향을 파악할 수 있었다.

복원된 뇌신호원의 국지화 정확도 평가를 위한 거리 가중치 유사도 비교법 (a new distance weighted correlation method to evaluate reconstructed brain sources)

  • 최종호;박선애;정현교
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.2027-2028
    • /
    • 2011
  • 이 논문에서는 복원된 뇌신호원을 평가하는 방법 중의 하나로 거리 가중치 유사도 비교법을 제안한다. 의료영상처리 분야에서 시공간적인 뇌신경신호원의 변화를 비교 및 분석하기 위해서 여러 방법이 적용되고 있는데 가장 널리 사용되고 있는 것이 유사도 비교법이다. 본 논문에서는 1차원 기준으로 구성된 기존의 유사도 비교법을 3차원 뇌신호원 평가에 적합하도록 거리 가중치를 고려한 새로운 유사도 비교법을 제시한다. 또한 3차원 뇌신경신호원의 시뮬레이션을 통해 새로운 기법의 타당성을 검증한다.

  • PDF