• 제목/요약/키워드: 유사도 판별

검색결과 380건 처리시간 0.031초

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

유사도 증가를 통한 강인한 패턴 워터마킹 방법 (A Robust Pattern Watermarking Method by Similarity Improvement)

  • 이경훈;김용훈;이태홍
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.330-333
    • /
    • 2003
  • 본 논문에서는 웨이브릿 변환 영역에 제안한 알고리듬으로 여러 공격에 강인한 워터마크를 삽입하였다. 추출된 워터마크는 정칙화 영상복원에 활용하는 Tikhonov-Miller 처리를 함으로써 워터마크의 유사성 판별을 쉽게 하였다. 제안한 방법의 강인성과 유사성 향상을 실험하기 위해 명암, 크기 변화, 필터링, 잘라내기, 히스토그램 평활화, 손실압축(JPEG, gif)과 같은 영상처리를 하였다. 실험 결과 제안한 방법은 비가시성을 고려한 강인한 워터마크를 삽입할 수 있고 여러 공격에 대해서 더욱 높은 상관 계수로 추출할 수가 있었다.

  • PDF

OpenCV를 활용한 이미지 유사성 비교 시스템 (The Similarity of the Image Comparison System utilizing OpenCV)

  • 반태학;방진숙;육정수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.834-835
    • /
    • 2016
  • 최근 들어 IT기술의 발전은 급속도로 성장하고 있다. 이에 따라 실시간 이미지 프로세싱 및 여러 플랫폼의 호환성을 제공하는 OpenCV를 활용한 이미지 처리 기술들에 대한 연구도 활발히 진행 중에 있다. 현재, 서로 다른 이미지를 비교, 유사성을 판별하는 시스템은 일치율이 낮거나, 사람이 아날로그적인 수치를 이용하여 판별하는 시스템이 대부분이다. 본 논문에서는 OpenCV의 Template Matching과 Feature Matching을 활용하여 서로 다른 이미지 간 유사성을 디지털 값으로 판별하는 시스템에 대해 연구한다. 이미지 스크린 중 비교점을 특정하여 피처를 추출, 서로 상이한 크기에서도 동일한 피처로 인식하여 비교대상 이미지의 피처셋과 비교하여 유서성을 비교, 검증하게 된다. 이는 음성 및 영상 인식 및 분석, 처리기술에서 보다 정확인 일치율 판독이 가능하다. 향후 법의학 및 OpenCV외의 이미지 처리기술에 대한 연구가 필요할 것으로 사료된다.

  • PDF

최소 자승법에 의한 1차 유사도 및 2차 유사도의 개발 (Development of the 1st-Order Similarity Measure and the 2nd-Order Similarity Measure Based on the Least-Squares Method)

  • 강환일;석민수
    • 대한전자공학회논문지
    • /
    • 제20권6호
    • /
    • pp.23-28
    • /
    • 1983
  • 콘투어 맷칭을 위한 1차 유사도와 2차 유사도가 제안되었다. 그것들은 최소자승법에 의한 것이다. 특히 2차 유사도는 콘투어의 불완전함 혹은 어파인 변환 혹은 이들 특성의 결합같은 왜곡된 변화에 양호한 신뢰도를 가지고 있다는 사실을 비행기 기종의 판별과 인식하는 실험을 통하여 증명하였다. 또한 맷칭 성능에 있어서 2차 유사도가 1차 유사도뿐만 아니라 기존의 맷칭기법들보다 우수함을 보였다.

  • PDF

도장영상 인식 시스템의 개발 (Development of a System for Recognizing Stamp Images)

  • 송민정;한경숙
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.125-137
    • /
    • 2003
  • 동양 문화권에서는 각종 계약과 서류 결재 등을 위하여 서명대신에 도장이 오랫동안 사용되어 왔으며 아직까지도 보편적인 인증 수단으로 사용되고 있다. 지문과 달리, 도장 영상은 유사한 패턴을 갖지 않고 도장이 찍히는 압력등 입력 상태에 따라서 선명도가 크게 달라진다. 본 연구에서는 입력 장치로부터 얻은 한글 또는 한자 도장 영상을 스트레칭, 이진화 및 잡음처리를 거쳐 판별하는 시스템을 개발하였다. 이 시스템을 가장 보편적으로 사용되는 원형모양의 50개의 도장 영상 (20개 한글 도장, 20개 한자 도장, 10개 유사 도장)에 대하여 실험한 결과, 46개의 도장 영상을 성공적으로 인식하여 비교적 높은 판별도 (92%)를 보였다. 한글과 한자 도장 사이의 차이는 거의 없었으며, 도장을 찍을 때의 각도 차이나 압력 차이가 판별도를 결정하는 중요한 요인으로 작용함을 알 수 있다. 인식할 수 있는 도장 영상의 모양을 원형뿐 아니라 타원과 사각형으로 확장하고 판별도를 좀더 향상하면, 현재 육안으로 확인하는 도장 영상 인식을 자동화하는데 실제로 유용하게 사용될 수 있을 것이다.

  • PDF

문서의 공기관계를 이용하여 국가 R&D 보고서간 유사도 계산 (Similarity calculation between national R&D reports using co-occurrence)

  • 김남훈;주종민;박혁로;양형정;최광남
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.201-204
    • /
    • 2016
  • 본 논문에서는 문서의 공기관계를 통해 추출된 문서의 특징을 이용하여 유사 보고서를 판별하는 시스템을 제안한다. 국가 R&D 보고서의 XML형식 파일에서 텍스트를 추출 후, 문장 단위로 나누어 각 문장의 공기관계를 추출한다. 그 후 공기관계의 노드와 엣지를 문서에 추가하고, 노드로 사용된 단어만 남기고 나머지 단어는 제외한다. 그리고 이것을 문서의 특징으로 삼고 유사도 계산을 한다. 이 때, 유사도 계산은 코사인 유사도를 사용한다. 실험결과, 국가 R&D문서 유사도 계산에서 제안된 방법이 기존의 방법보다 높은 분류율을 보여주었다.

  • PDF

문서의 공기관계를 이용하여 국가 R&D 보고서간 유사도 계산 (Similarity calculation between national R&D reports using co-occurrence)

  • 김남훈;주종민;박혁로;양형정;최광남
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-204
    • /
    • 2016
  • 본 논문에서는 문서의 공기관계를 통해 추출된 문서의 특징을 이용하여 유사 보고서를 판별하는 시스템을 제안한다. 국가 R&D 보고서의 XML형식 파일에서 텍스트를 추출 후, 문장 단위로 나누어 각 문장의 공기 관계를 추출한다. 그 후 공기관계의 노드와 엣지를 문서에 추가하고, 노드로 사용된 단어만 남기고 나머지 단어는 제외한다. 그리고 이것을 문서의 특징으로 삼고 유사도 계산을 한다. 이 때, 유사도 계산은 코사인 유사도를 사용한다. 실험결과, 국가 R&D문서 유사도 계산에서 제안된 방법이 기존의 방법보다 높은 분류율을 보여주었다.

  • PDF

얼굴 컬러 분석에 의한 지능형 여권 얼굴 인증 시스템 (Intelligent Passport′s Face Verification System Using Face Color Analysis)

  • 김도현;차의영;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.279-286
    • /
    • 2004
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 위조 여권을 판별할 수 있는 지능형 여권 얼굴 인증 시스템을 제안한다. 제안하는 지능형 여권 얼굴 인증 시스템은 여권 이미지에서 여권 코드 문자열을 인식하여 여권 사용자의 사진 및 관련 정보를 여권 데이터베이스에서 추출한다. 추출된 출입국자의 사진 및 얼굴과 여권에 부착된 사진 및 얼굴과의 유사도 측정을 통하여 여권 사진의 위조 여부을 판단한다. 이때, 이미지의 유사도 측정을 위해서 다양한 실험을 통한 결과를 종합 분석해 본 결과 사진 영역의 인증에는 Luminance, Edge, RGB 특징이, 얼굴 영역의 인증을 위해서는 Hue, YIQ-I, YCbCr-Cb 특징이 효과적인 것으로 나타났으며 사진 영역의 유사도와 얼굴영역의 유사도가 모두 0.8이상인 경우 정상적인 여권으로 판정하고 그렇지 않은 경우 위조가 되었을 가능성이 있는 여권으로 판정하는 방법을 사용하여 FAR 3.1%, FRR 2.7%의 우수한 결과를 나타내었다.

  • PDF

SIFT 및 HSV 특징 추출 기반 폐기물 객체 유사도 측정 모델 (The SIFT and HSV feature extraction-based waste Object similarity measurement model)

  • 고준혁 ;최혁순 ;김진아 ;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1220-1223
    • /
    • 2023
  • 폐기물을 처리하는데 있어 배출과 수거에 대한 프로세스 자동화를 위해 폐기물 객체 유사도 판별이 요구된다. 이를 위해 본 연구에서는 폐기물 데이터셋에서 SIFT(Scale-Invariant Feature Transform)와 HSV(Hue, Saturation, Value)기반으로 두 이미지의 공통된 특징을 추출해 융합하고, 기계학습을 통해 이미지 객체 간의 유사도를 측정하는 모델을 제안한다. 실험을 위해 수집된 폐기물 데이터셋 81,072 장을 활용하여 이미지를 학습시키고, 전통적인 임계치 기반 유사도 측정과 본 논문에서 제시하는 유사도 측정을 비교하여 성능을 확인하였다. 임계치 기반 측정에서 SIFT 와 HSV 는 각각 0.82, 0.89(Acc)가 측정되었고, 본 논문에서 제시한 특징 추출 방법을 사용한 기계학습의 성능은 DT(Decision Tree)와 SVM(Support Vector Machine) 모두 0.93 (Acc)로 4%의 정확도가 향상되었다.

주위온도를 보상한 정밀 영상 자동 측정 시스템 개발 ((System Development of Precision Vision Measurement Compensated for the Ambient Temperature))

  • 김석현;황병곤
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.323-332
    • /
    • 2000
  • 정밀을 요하는 자동차 부품의 측정 시스템은 온도에 따른 보상이 필수적이다. 부품의 측정값의 신뢰도를 유지하기 위해서 단순히 제품의 합격 영역을 상온에서 51.786~51.819mm로 했을 때, 온도가 상온에서 떨어져 있는 경우 그 부품의 측정영역을 신뢰하기가 어려워진다. 본 논문에서는 이 문제를 해결하기 위해서 2개의 카메라를 사용하여 한쪽은 표준 제품을 두고, 다른 쪽은 실제 제품을 두므로서 온도에 따라 달라지는 표준 제품의 측정값의 Offset를 실제 제품에 반영하므로 측정값을 보상하려고 하였다. 자동차의 부품은 여러 가지가 있으나, 이 중에서 현재 공장에서 측정에 어려움을 겪고 있는 에어콘 스윗치인 마그네트 코일 하우징을 대상으로 하였다. 특히 측정 대상이 크고, 카메라의 화소수가 40만 이하일 경우, 측정의 중요한 포인트는 화소수이기 때문에 이를 정확히 알아 내는데, FCM(Fuzzy C-means) 알고리듬이 좋은 결과를 주지만 속성 공간에서 유사성만을 고려하고, 공간영역에서 유사성을 고려되지 않기 때문에 FCM은 \"equal evidence\"와 \"ignorance\"를 구분하지 못한다. 이를 개선하기 위해서 FCM를 수정하여 먼저 FCM로 처리하고 하고 이를 바탕으로 PCM(Possibilistic C-means)를 사용하였다. 결과를 모니터에 보여주고, RSC-232 포트를 통하여 신호를 마이크로프로세서에 전달하여 제품의 양호(good), 불량(bad)을 판별하는 신호를 발생하게 하였다.을 판별하는 신호를 발생하게 하였다.

  • PDF