• 제목/요약/키워드: 유사도 측정 기법

검색결과 618건 처리시간 0.027초

단일 문서 기반의 인지적 지식구조 자동 생성 기법 제안 및 검증 (Proposing and Validating an Automated Method of Cognitive Knowledge Structure Creation from Single Documents)

  • 김형우;이문용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.247-250
    • /
    • 2011
  • 본 연구는 단일 문서로부터 문서가 내포하고 있는 지식정보를 지식구조 혹은 인지스키마로 불리는 형태로 자동 생성하는 기법을 제안한다. 제안된 기법을 이용하여 자동 생성된 지식구조는 실제 문서 학습자의 학습 전, 후의 지식구조, 문서의 해당 지식을 명확히 알고 있는 도메인 전문가의 지식구조와의 유사도 측정을 통해 검증하였다. 자동 생성된 지식구조는 학습자의 학습 후 지식구조, 전문가 지식구조와 상당한 유사성을 보이며, 문서의 지식 정보를 인지적인 관점에서 정교하게 표현 하고 있음을 확인하였다. 이는 기존의 단어 기반의 정보 기술들에서 더욱 고차원적인 지식 정보를 활용한 지식구조 기반 정보 기술의 연구 가능성을 제시한다.

지형도상에서의 경사측정기법 (Measuring technique of the slope on a topographic map)

  • 김석중;강필종
    • 지질공학
    • /
    • 제3권1호
    • /
    • pp.75-81
    • /
    • 1993
  • 본 논문에서 다룬 경사의 측정기법은 4종류이다. 면적과 둘레를 이용하는 기법은 매우 편리하나 상당한 오차를 가져올 수 있어 방안지를 사용하는 기법이 널리 사용된다. 특히 이와 유사하게 compter를 통하여 각 교점마다 경사를 표시할 수 있어 다른 자료와 비교가 가능하게 되었다. vector product를 사용하는 기법은 곡면을 직접 삼각형으로 나누어 측정할 수 있으므로 여러가지 용도를 갖고 있으나 지형의 굴곡이 심한 곳에서는 상당한 오차를 나타낸다.

  • PDF

Self-Attention 기반의 문장 임베딩을 이용한 효과적인 문장 유사도 기법 기반의 FAQ 시스템 (An Effective Sentence Similarity Measure Method Based FAQ System Using Self-Attentive Sentence Embedding)

  • 김보성;김주애;이정엄;김선아;고영중;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.361-363
    • /
    • 2018
  • FAQ 시스템은 주어진 질문과 가장 유사한 질의를 찾아 이에 대한 답을 제공하는 시스템이다. 질의 간의 유사도를 측정하기 위해 문장을 벡터로 표현하며 일반적으로 TFIDF, Okapi BM25와 같은 방법으로 계산한 단어 가중치 벡터를 이용하여 문장을 표현한다. 하지만 단어 가중치 벡터는 어휘적 정보를 표현하는데 유용한 반면 단어의 의미적인(semantic) 정보는 표현하기 어렵다. 본 논문에서는 이를 보완하고자 딥러닝을 이용한 문장 임베딩을 구축하고 단어 가중치 벡터와 문장 임베딩을 조합한 문장 유사도 계산 모델을 제안한다. 또한 문장 임베딩 구현 시 self-attention 기법을 적용하여 문장 내 중요한 부분에 가중치를 주었다. 실험 결과 제안하는 유사도 계산 모델은 비교 모델에 비해 모두 높은 성능을 보였고 self-attention을 적용한 실험에서는 추가적인 성능 향상이 있었다.

  • PDF

A New Similarity Measure based on Separation of Common Ratings for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.149-156
    • /
    • 2021
  • 추천 시스템의 여러 구현 기법들 중 협력 필터링은 과거 평가 이력을 토대로 유사성이 높은 인접 이웃들을 선정하여, 그들이 선호했던 상품들을 추천하는데, 많은 상업 사이트에서 성공적으로 활용되고 있다. 유사도의 정확한 측정은 시스템의 성능을 좌우하는 매우 중요한 요소이다. 기존에 다양한 방식의 유사도 척도들이 개발되었는데, 대개 전통적인 유사도 척도와 기개발된 여러 계수들과의 통합 방식이었다. 본 연구에서는 새로운 방식의 유사도 척도를 제안한다. 두 사용자 간의 공통 평가 영역을 평가치 크기에 따라 분할하여 각 부분 영역별로 유사도를 측정하고 이들을 가중 통합함으로써, 유사한 영역이 구체적으로 파악되어 최종 유사도값에 반영된다. 두 종류의 개방형 데이터셋을 활용한 성능을 측정하였고, 그 결과 특히 밀집 데이터셋에서 제안 방법의 예측 정확도, 순위 정확도, 평균 정밀도 성능이 기존보다 우수하였다. 제안 척도는 다양한 상업 시스템에서 사용자들의 선호에 보다 적합한 상품을 추천하는데 유용하게 활용될 것으로 기대한다.

RAM 흡수능 측정기법 연구 (A Study on Measurement Techniques of Absorbing Ability for a RAM)

  • 최창묵;임봉택;고광섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.527-530
    • /
    • 2010
  • 본 논문에서는 RCS 감소용 RAM의 흡수능 측정기법에 대하여 연구하였다. 먼저 측정기법 중 자유공간법과 전송선로법을 분석하고 실제 RAM 샘플을 제작하여 측정기법에 따라 측정 후 비교 분석하였다. 비교 분석결과 흡수능은 자유공간법에서 다소 우수한 특성이 보였으나 전체적인 패턴이 유사한 것을 확인하였다. 따라서 RAM 개발시 초기단계부터 최종단계까지 단계별/주파수별 제시하는 측정기법을 차등 적용한다면 보다 효과적으로 RAM을 개발 할 수 있을 것이다.

  • PDF

수환경 유출 유해화학물질 감지 및 식별에 관한 머신러닝 기법 적용 연구 (A study on the application of machine learning for the detection of hazardous chemicals in the water environment)

  • 남수한;권시윤;권재현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.163-163
    • /
    • 2021
  • 하천에서의 화학사고는 자연적 및 인위적인 원인으로 인해 발생할 수 있으며, 이러한 화학사고가 발생하게 되면 수환경 변화를 야기해 생태계나 인간에게 악영향을 발생시킬 수 있어 신속한 초기대응이 필요하다. 하천으로 유입된 화학물질의 평가에 대한 연구는 활발하게 진행되고 있지만, 화학사고 초기대응을 위한 연구는 미비한 실정이다. 초기대응을 위해서는 현장에서 측정이 용이한 지표를 활용해야하며, 이 지표를 이용해 유출된 화학물질에 대한 정보를 취득 할 수 있어야 한다. 하천의 주요 지점에는 pH 및 EC 등을 실시간으로 측정하는 자동측정망을 운영하고 있는데, 이러한 측정항목들을 지표로 활용한다면 하천 화학사고 대응을 위한 중요한 기초자료로 활용될 수 있을 것이다. 또한 측정된 데이터를 머신러닝 기법을 적용한다면 화학사고 발생 시 초기대응을 위한 기초자료로 활용될 수 있을 것이다. 본 연구에서는 분석한 유해화학물질은 총 26종이며, pH 및 EC를 화학물질들의 특성을 파악하기 위한 대체지표로 선정하였다. 화학물질의 농도변화에 따른 대체지표 변화를 측정하였으며, 실험결과를 바탕으로 성질이 유사한 화학물질들을 Group별로 분류하여 데이터베이스를 구축하였다. 구축된 데이터베이스를 바탕으로 머신러닝 기법인 Decision Tree, Random Forest, Gradient Boosting, XG Boosting에 적용해 각 알고리즘에 대한 성능 평가를 진행하여 가장 우수한 성능의 머신러닝 기법을 선정한다. 본 연구 결과를 바탕으로 선정된 머신러닝 기법을 활용한다면 향수 수환경 화학사고 발생 시 유출된 유해화학물질에 대한 정보를 제공할 수 있으며 그에 따른 신속한 대응의 기초자료로 활용될 수 있을 것으로 판단된다.

  • PDF

코사인 유사도 기법을 이용한 top-k 관련쌍 검색 방법 조사 (Survey on Top-k Related Pair Search Method Using Cosine Similarity)

  • 김성철;김정환;김나영;김태훈;유환조
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.808-809
    • /
    • 2017
  • 유사도 검색은 전통적으로 데이터베이스 그리고 웹검색 분야의 핵심이었으나, 대용량 데이터의 등장으로 검색의 정확도뿐만이 아니라 효율성 측면에서의 요구가 증가하며 여전히 다양한 분야에서 활발히 연구되고 있다. 아이템간의 유사도를 측정하기 위한 방법론 중 코사인 유사도 방법론은 고차원공간에서의 활용이 유리하다는 이점 때문에 가장 널리 활용되고 있는 방법론으로, 정보검색, 장바구니 분석, 생물정보학 등 다양한 분야에서 활용되고 있다. 본 논문에서는 코사인 유사도를 소개하고, 연관성 분석 측면에서 코사인 유사도를 사용한 기존의 연구들을 소개한다.

대수적 특성을 고려한 벡터 유사도 측정 함수의 고찰 (Survey on Vector Similarity Measures : Focusing on Algebraic Characteristics)

  • 이동주;심준호
    • 한국전자거래학회지
    • /
    • 제17권4호
    • /
    • pp.209-219
    • /
    • 2012
  • 전자 상거래 시스템 환경에서 상품, 상품평, 사용자 특성 등은 주요한 정보 객체이다. 벡터는 객체의 표현기법으로 널리 사용되고 있다. 전자 상거래 데이터 객체들은 벡터로서 모델되어 각 특질에 해당하는 차원의 숫자 값으로 표현될 수 있다. 전자 상거래의 특성상 이러한 객체들은 방대한 분량이 되고 있고, 이중 여러 객체들은 실제로 같거나 유사한 객체일 수 있다. 따라서 객체간 유사도 측정은 전자상거래 시스템에서 중요한 역할을 한다. 본 논문에서는 벡터 객체에서 사용되는 대표적인 유사도 측정 함수들을 고찰한다. 유사 함수들은 각각의 대수적 특성을 가지고 있고 서로 연결된 특성을 보인다. 이러한 특성을 분석하고 또한 유사 함수들을 분류해 본다. 이러한 과정은 표준 벡터 유사도 함수가 가져야 할 대수적 특성을 제시해준다.

그래프 기반 바이너리 구조 비교 기법의 강인성 개선 (Improving Resilience in Graph-based Structure Comparison for Binary Objects)

  • 장준혁;조유근;홍지만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.104-106
    • /
    • 2012
  • 소프트웨어 버스마크 (Software Birthmark)는 프로그램 실행 파일로부터 프로그램의 고유한 정보를 추출하는 기법이다. 프로그램의 도용을 판별하기 위해 바이너리로부터 버스마크를 추출하여 원본 프로그램과의 유사도를 측정하거나 악성 코드 탐지에 사용된다. 본 논문에서는 그래프 기반 바이너리 구조 매칭기법을 기반으로 한 버스마크를 제안한다. 제안 기법은 원본 프로그램과 대상 프로그램 사이에서 함수와 함수, 기본 블록과 기본 블록의 매칭 방법을 개선함으로써, 기존 기법에 비해 강인성(Resilience)이 향상된 버스마크를 추출한다.

비디오 데이터에서 움직임 객체의 모델링을 위한 시공간 표현 기법 (A Spatio-temporal Representation Scheme for Modeling Moving Objects in Video Data)

  • 심춘보;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.585-595
    • /
    • 2000
  • 비디오 데이터에서 움직임 객체에 대한 움직임 경로는 내용-기반 검색을 위해 비디오 데이터를 색인하는 데 있어 매우 중요한 역할을 한다. 따라서, 본 논문에서는 비디오 데이터에서 움직임 객체의 움직임 경로를 모델링하기 위한 새로운 시공간 표현 기법을 제안한다. 비디오 데이터를 위한 보다 효율적인 내용-기반 검색을 위해, 제안하는 기법은 시간, 공간 관계성과 더불어 일정 시간 간격 동안 움직인 객체의 이동 거리(moving distance)를 고려한다. 아울러, 제안하는 표현 기법에 기반하여 단일 움직임 객체의 움직임 경로와 다수 움직임 객체들의 움직임 경로를 위한 새로운 유사성 측정 알고리즘을 제시하며, 이들 알고리즘은 검색 결과에 대해서 유사성에 준하여 순위(Ranking)를 부여할 수 있다. 마지막으로, 성능 평가를 통하여 제안된 시공간 표현 기법은 기조의 Li 방법과 Shan의 방법에 비해 동등한 재현율을 유지하며, 정확율 측면에서 약 20%의 성능 향상을 보인다.

  • PDF