• 제목/요약/키워드: 유사성

검색결과 14,833건 처리시간 0.041초

동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안 (Association rule thresholds of similarity measures considering negative co-occurrence frequencies)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1113-1121
    • /
    • 2011
  • 최근 여러 분야에서 다양한 데이터 마이닝 방법들을 현업에 적용하고 있는 추세이다. 가장 많이 활용되고 있는 데이터 마이닝 기법 중의 하나인 연관성 규칙은 대용량 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화하여 그들 간의 연관 정도를 나타내는 기법이다. 의미 있는 연관성 규칙을 생성하기 위해 지지도, 신뢰도, 향상도 등의 측도가 가장 기본적으로 활용되고 있다. 본 논문에서는 군집 분석이나 다차원 분석법에서 많이 활용되고 있는 유사성 측도들 중에서 동시 비 발생 빈도를 고려한 유사성 측도를 연관성 평가 기준으로 제안한 후, 예제를 통하여 기존의 신뢰도 및 지지도와 비교함으로써 그 유용성을 알아보았다. 모의실험 결과를 종합해볼 때, 동시 발생 빈도 또는 동시 비 발생 빈도가 증가하면 본 논문에서 고려한 모든 유사성 측도들은 지지도 및 신뢰도와 마찬가지로 증가하며, 불일치 계수의 값이 증가하면 이 측도들은 감소하게 된다는 사실을 알 수 있었다. 또한 이들 유사성 측도들은 지지도 및 신뢰도와 매우 유의한 상관관계가 있는 것으로 나타났으며, 전항과 후항이 바뀌더라도 값의 변화가 없기 때문에 신뢰도 보다 더 바람직한 연관성 규칙 평가 기준이라고 할 수 있다.

Digital Library를 위한 텍스타일 프린트 디자인의 이미지 유사성 평가 (Similarity Evaluation on Images of Textile Print Design for Digital Library)

  • 이채정;김주용
    • 감성과학
    • /
    • 제10권4호
    • /
    • pp.631-637
    • /
    • 2007
  • 이미지의 유사성을 결정하는 요인을 톤(tone), 즉 명도와 채도로 결정하여 정보 엔트로피를 계산하여 상관 계수를 계산하였다. 이미지의 톤을 알아보기 위해 영상정보의 색 공간을 RGB color space에서 HSI color space로 전환하였다. 이후 유사성을 판단하기 위해 이미지의 전체 픽셀수가 아닌 엔트로피 값의 범위에 따라 전체 70%의 픽셀 또는 이미지를 가장 많이 구성하는 세 가지 톤의 픽셀 수에 의해 결정되었다. 'Romantic'이라는 인간의 감성으로 판단된 18개의 영상정보를 선정하여 위의 모델을 적용, 이미지 유사성을 판단하였다.

  • PDF

개선된 유사성 검증 방법과 동적인 경계 변수를 이용한 ART1 알고리즘에 관한 연구 (A Study on ART1 Algorithm by Using Enhanced Similarity Test and Dynamical Vigilance Threshold)

  • 민지희;홍제형;김재용;김광백
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.193-197
    • /
    • 2003
  • 기존의 ART1 알고리즘은 입력 패턴과 저장 패턴간의 유사성 검증 방법의 문제점과 경계 변수에 따라 클러스터의 수와 인식률이 좌우되는 문제점이 있다. 본 논문에서는 기존의 ART1 알고리즘을 개선하기 위하여 입력 패턴과 저장 패턴간의 Exclusive NOR의 놈(norm) 비율을 사용하는 유사성 측정 방법과 퍼지 접속 연산자를 이용하여 유사성에 따라 경계변수를 동적으로 조정하는 방법을 적용한 개선된 ART1을 제안한다. 제안된 방법에서는 1의 개수 비율이 아니라 같은 값을 가진 노드의 비율을 사용하여 유사성을 측정하고 경계 변수는 Yager의 합 접속 연산자를 사용하여 동적으로 조정한다. 제안된 방법의 성능을 확인하기 위하여 26개의 영문 패턴 분류 문제와 잡음이 있는 패턴 인식 문제를 대상으로 실험한 결과, 제안된 방법이 기존의 ART1 알고리즘 보다 경계 변수의 설정에 따라 민감하게 반응하지 않았고 인식률에서도 개선된 것을 확인하였다.

  • PDF

시맨틱 프레임을 이용한 한국어 패러프레이즈 자동 평가 방법 (An Automatic Evaluation Metric for Korean Paraphrase via Semantic Frame)

  • 박한철;권가진;최호진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.761-764
    • /
    • 2014
  • 본 연구는 지능형 QA시스템과 관련한 연구에서, 자동 패러프레이즈 생성 시스템을 평가하는 새로운 방법을 제시한다. 기존의 패러프레이즈 생성 시스템의 자동 평가 방법은 참조할 수 있는 패러프레이즈 정보의 양이 크게 제한되어 있었으며, 원 문장의 콘텍스트(context)와 이에 의존하는 통사적 구조(syntactic structure) 및 의미적 구조의 유사성을 고려하지 않고, 단순 구/단어 수준의 의미 유사성을 기반으로 생성된 패러프레이즈를 평가하였다. 이러한 문제를 해결하기 위해 본 연구는 시맨틱 프레임(semantic frame)을 이용한 패러프레이즈 문장 평가 방법을 제시한다. 본 연구에서 제시하는 방법론은 문장의 콘텍스트를 표현하는 프레임과 이러한 프레임이 발생시키는 통사적, 의미적 구조의 유사성을 바탕으로 원 문장과 패러프레이즈 문장의 '의미 유사성', '어휘 형태 비 유사성'을 평가하는 방식이다.

키워드 유사성 검색에 관한 연구 (A Study on Keyword Proximity Search)

  • 이윤기;윤지현;정형수;염헌영;양영규;황순욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.209-210
    • /
    • 2007
  • 키워드 유사성 검색은 입력받은 키워드에 관련된 의미 있는 데이터를 검색하는 것을 말한다. 데이터들은 매우 다양한 형태로 표현 될 수 있고, 각각의 형태에 대한 키워드 유사성 검색에 대한 많은 연구가 이루어졌다. 이 논문에서는 다양한 키워드 유사성 검색에 대한 연구들의 개관을 살펴보고 그것들을 비교해 볼 것이다. 이 연구들을 비교 분석하는 것은 키워드 유사성 검색을 일반화 하는데 도움이 될 것으로 기대한다.

  • PDF

점유센서를 위한 유사성 메트릭 기반 입출입 사람 매칭 (Incoming and Outgoing Human Matching Using Similarity Metrics for Occupancy Sensor)

  • 정재준;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.33-35
    • /
    • 2018
  • 기존의 사람간의 유사성 측정 시스템은 적외선 빔이나 열 감지 영상 장치를 통해 측정하였다. 하지만 이와 같은 방법으로 측정하면 2명 이상의 객체를 분류해내는 기술은 제공하지 않는다. 이에 본 논문은 고정된 카메라를 이용하여 각 사람의 피부색과 옷차림 등의 RGB 정보를 이용한 사람 유사성 측정 기법을 제안한다. RGB카메라 영상을 통하여 객체의 RGB 히스토그램을 얻은 후 각 객체에 대해 Bhattacharyya metric, Cosine similarity, Jensen difference, Euclidean distance로 histogram similarity를 계산하여 객체 추적 및 유사성 측정을 통해 객체를 분류한다. 제안된 시스템은 C/C++를 기반으로 구현하여, 유사성 측정 성능을 평가하였다.

  • PDF

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

컬러 보정을 위한 컬러 간의 유사성 측정 기법 (Method of Measuring Color Similarity for Color Correction)

  • 황영배;김제우;최병호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.420-423
    • /
    • 2011
  • 두 카메라 혹은 다수의 카메라에서의 컬러 보정은 알고리즘의 성능 향상 및 양안식 3D 카메라에서 매우 중요한 기술이다. 최근 컬러 보정 방법들이 다수 제안되었지만 이 방법들의 결과에 대한 정확한 측정 방법이 많지 않으며 기존의 측정 방법은 두 영상이 카메라의 위치에 따른 서로 다른 장면을 가지고 있을 경우에 적합하지 않을 수 있다. 본 논문에서는 컬러 보정을 위한 컬러 간의 유사성 측정 기법을 제안한다. 이 기법은 대상이 되는 두 영상의 장면이 일치하지 않는 경우를 고려하여 대응점 검색을 통해 두 장면 간의 같은 컬러를 가져야 하는 대응점을 찾고 이 대응점 주위의 영역으로부터 통계치를 계산하여 컬러의 유사성을 비교한다. 이 경우 두 영상의 위치 변화에 따른 장면 변화와 대응점의 약간의 어긋남에 대해서 고려할 수 있다. 또한 대응점들이 영상의 모든 영역을 포함하지 않을 수 있기 때문에 전체 영상의 통계치를 계산하여 컬러의 유사성을 비교도 동시에 수행하여 결과적인 컬러의 유사성은 대응점 기반과 전체 영상 기반의 유사성의 가중치의 합으로 결정되며 이 가중치는 대응점 기반의 컬러 비교가 영상 내의 얼마만큼의 영역을 포함하는지에 따라서 결정된다.

  • PDF

워드넷의 의미 관계 집합을 이용한 온톨로지 매핑 (Ontology Mapping using Semantic Relationship Set of the WordNet)

  • 곽정애;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.466-475
    • /
    • 2009
  • 다양한 온톨로지 개발로 온톨로지간에 정보공유와 재사용이 필요하게 되면서 온톨로지 매핑에 관련된 연구가 활발이 이루어지고 있다. 온톨로지 매핑 기법으로는 어휘 유사성, 구조 유사성, 인스턴스 유사성, 추론 유사성 검사 기법으로 나누어진다. 이 중 어휘 유사성 검사 기법은 대부분의 온톨로지 매핑 연구에서 사용하는 기법으로써 주로 워드넷에 정의되어 있는 동의어 집합만을 사용한다. 이에 본 연구에서는 워드넷에 정의되어 있는 동의어 집합 외에 상위어, 하위어, 전체어, 부분어 집합의 모든 단어들을 포함한 수퍼워드셋을 정의하고, 이것을 이용한 온톨로지 매핑 기법을 제안한다. 실험 결과에 의하면, 제안된 기법은 기존 온톨로지 매핑 기법보다 평균 12%까지 온톨로지 매칭율을 높인 것을 보여준다.

정적 주요 경로 API 시퀀스를 이용한 소프트웨어 유사성 검사 (Detecting Software Similarity Using API Sequences on Static Major Paths)

  • 박성수;한환수
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1007-1012
    • /
    • 2014
  • 소스코드가 없이 실행코드만으로 소프트웨어 간의 유사성을 비교하기위해 소프트웨어 버스마크를 이용한다. 소프트웨어 버스마크란 그 소프트웨어만의 고유한 특징으로 소프트웨어 식별에 사용된다. 본 논문에서는 정적 주요경로 상의 API 함수 시퀀스를 이용하여 소프트웨어 간의 유사성을 산정하는 방법을 제시한다. 바이너리코드에서 소프트웨어의 특성이 뚜렷하게 나타나는 API 함수만을 사용하여 소프트웨어 유사성 검사의 신뢰성을 높이고, 정적 분석 기법에 동적 분석 기법의 특징을 적용하여 강인성을 높이는 방법을 모색하였다. 정적 분석으로 바이너리코드의 주요경로를 추출하고, API 함수 시퀀스 간의 효과적인 유사성 측정을 위해 서열정렬 알고리즘인 Smith-Waterman 알고리즘을 이용한 유사성 척도를 제안한다. 버스마크의 신뢰성을 평가하기 위하여 같은 프로그램의 여러 버전을 대상으로 실험하였고, 강인성을 평가하기 위해 오픈소스 소프트웨어의 소스코드를 다양한 컴파일환경으로 바꾸어 실험하였다.