• 제목/요약/키워드: 유사도 비

검색결과 8,122건 처리시간 0.04초

구조 및 의미 검색을 지원하는 비디오 데이타의 모델링 (Video Data Modeling for Supporting Structural and Semantic Retrieval)

  • 복경수;유재수;조기형
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.237-251
    • /
    • 2003
  • 이 논문에서는 비디오 데이타의 논리적 구조와 의미적 내용을 효과적으로 검색하기 위한 비디오 검색 시스템을 제안한다. 제안하는 검색 시스템은 비정형화된 비디오 데이타를 원시 데이타 계층, 내용 계층 그리고 키프레임 계층의 세 계층으로 구성하는 계층화된 모델링을 사용한다. 계층화된 모델링에 존재하는 내용 계층은 비디오 데이타에 대한 논리적인 계층 구조와 의미적 내용을 표현한다. 제안하는 검색 시스템은 모델링에 따라 텍스트 기반의 검색은 물론 시각적인 특징 기반의 유사도 검색을 지원한다. 또한 시공간 관계에 기반한 의미적 내용 검색과 유사도 검색을 지원한다.

웹 트랜잭션 클러스터링의 정확성을 높이기 위한 흥미도 가중치 적용 유사도 비교방법 (Similarity Measurement with Interestingness Weight for Improving the Accuracy of Web Transaction Clustering)

  • 강태호;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1765-1768
    • /
    • 2002
  • 최근 들어 웹사이트 개인화(Web Personalization)에 관한 연구가 활발히 진행되고 있다. 웹 개인화는 클러스터링과 같은 데이터 마이닝 기법을 이용하여 개개의 사용자에게 가장 흥미를 갖을만한 URLs의 집합을 예측하는 것이라 할 수 있다. 기존에는 웹 트랜잭션을 클러스터링 하기 위해서 사용자의 방문여부에 따라 트랜잭션을 비트벡터(bit vector)로 표현하였다. 하지만 이것은 웹 트랜잭션의 클러스터링에 있어서 사용자의 흥미를 배제하고 단순히 방문여부만을 반영하게 된다. 이에 본 논문에서는 사용자의 흥미도(Interestingness)를 반영할 수 있도록 보완된 웹 트랜잭션 모델을 제시하고 제안된 트랜잭션 모델을 적용한 유사도 비교방법을 제안한다. 그리고 성능평가를 통하여 제안한 방법이 기존 방법에 비해 클러스터링의 정확성을 높임을 보인다.

  • PDF

LC/MS 데이터에서 동위 원소 패턴을 찾는 새로운 방법 (A New Method for Detecting Isotope Patterns in Liquid Chromatography/Mass Spectrometry Data)

  • Kim, Youn-Dong;Han, Joon-Hee;Hwang, Ji-Woon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.167-177
    • /
    • 2004
  • 본 논문에서는 LC/MS 데이터로부터 동위 원소 패턴(isotope pattern)을 찾는 새로운 방법을 제시하고자 한다. 기존의 분석 방법에서는 LC/MS 데이터를 1차원적으로 분석하고 있기 때문에 2차원에서 적용할 수 있는 알고리즘을 적용하기가 어렵다. LC/MS 데이터를 2차원 영상으로 가시화해 본 결과, 하나의 동위 원소 패턴에 속하는 단일 동위 원소 피크(single isotope peak)는 모양, 크기와 같은 2차원 형태적 특징들도 유사함을 알 수 있다. 따라서, 기존의 방법들이 질량 스펙트럼과 같은 1차원 신호를 분석하는 것에 중점을 둔 것에 비해, 본 논문에서는 LC/MS 데이터를 2차원 신호 즉, 영상(image)으로 간주하고 영상 처리 방법과 객체 인식 방법을 적용하였다. 실험 결과 같은 동위 원소 패턴에 속하는 각각의 단일 동위원소 피크들 사이에 peak maxima position 뿐만 아니라 skewness, variance등도 유사였으며 이러한 유사도를 기반으로 동위 원소 패턴을 찾을 수 있었다.

  • PDF

FMS에 있어서 공정할당 및 대체 가공경로를 고려한 셀 형성모델 (Cell Formation Models Considering Loading, Alternative Routes, and Operations in a FMS)

  • Chung, Byung Hee;Yoon, Chang Won
    • 산업경영시스템학회지
    • /
    • 제22권51호
    • /
    • pp.73-87
    • /
    • 1999
  • 본 연구에서는 다양한 종류의 공정을 수행할 수 있는 가공장비와 자동화된 물류 운반시스템으로 구성된 FMS의 효율적 운영을 위해 셀 제조방식의 개념을 도입한 다수의 유연셀 형성 방법을 제시하고 있다. 서로 독립적인 유연셀의 형성을 위해 FMS의 장점인 공정유연성을 최대한 활용할 수 있도록 기계-공정 행렬과 부품-공정 행렬에 기초한 2 종류의 새로운 유사도 계수와 예외적 요소의 수를 최소화하기 위한 셀 형성 알고리즘을 개발하였다. 두 행렬들은 다공정 수행가능기계간 유사도와 기계셀과 부품간 비처리 능력지수 산출의 기초자료로 사용된다. 알고리즘은 예외적 요소의 수를 최소로 하면서 셀의 수를 최대로 하는 정리에 기초하여 공정을 기계에 할당하며, 다수의 대체경로가 유연셀내에서 형성될 수 있도록 크게 2 단계로 구성되어 있다. 마지막으로 수치예제와 함께 예외적 요소의 발생수를 척도로 하여 기존의 방법들과 비교, 평가하고 있다.

  • PDF

퍼지패턴매칭에 의한 음성인식에 관한 연구 (A Study on Speech Recognition Using Fuzzy Pattern Matching)

  • 이기영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1991년도 학술발표회 논문집
    • /
    • pp.3-6
    • /
    • 1991
  • 본 연구에서는 음성의 패턴작성법을 개선하고 음성인식율을 향상시키기 위하여 퍼지패턴매칭을 개선한 뉴럴퍼지패턴매칭에(a neural-fuzzy pattern matching)의해 특정화자 고립단어인식을 수행하였다. 이 방법에서는 신경회로망의 연상기억에 의한 사상에 의해 패턴을 작성하여 주파수변동을 흡수하고 표준패턴고 선형매칭에 의해 유사도를 측정하여 인식하므로써 시간변동의 문제를 보완하였다. 또한, 이 방법에서 사용하는 특징피라미터는 2진화 스펙트럽이며, 유사도는 논리연산에 의해 측정되기 때문에 종래의 왜곡척도를 이용한 DTW 방법에 비해 기억용량과 계산량이 매우 작다. 이 방법의 인식성능을 평가하기 위하여 남녀가 발성한 28개의 도시명을 대상으로 인식실험을 수행한 결과, 신경회로망을 이용하지 않은 퍼지패턴매칭보다 오인식을 감소시켰으며, 뉴럴-퍼지 패턴매칭에 의한 특정화자 고립단어인식의 우수성을 확인하였다.

  • PDF

정보 검색에서 용어 가중치 재부여를 이용한 성능 증진에 관한 연구 (A Study on Improving the Effectiveness Using Term Reweighting for Information Retreival)

  • 김영천;이재훈;문유미;이성주;박병권
    • 한국지능시스템학회논문지
    • /
    • 제11권9호
    • /
    • pp.811-816
    • /
    • 2001
  • 정보 검색 시스템의 중요한 목적중의 하나는 단순히 사용자 질의를 만족하는 문서들의 집합을 검색하는 것이 아니라, 질의를 만족하는 정도에 따라 검색된 문서들에 순위를 부여함으로써 사용자들이 필요한 정보를 얻는데 소모되는 시간을 최소화시키는 것이다. 순수한 부울 검색 시스템은 검색 전략이 이진값에 근거하여 순위 구분 없이 연관/비연관 중의 하나로 결정된다. 딸서 문서와 질의 사이의 유사도를 나타내는 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정보에 따라 정렬할 수 없다. 부울 검색 시스템의 이러한 단점을 보완하는 방법으로 MMM 모델, Paice 모델, P-norm 모델이 개발되었다. 본 논문에서는 높은 검색 효과를 제공하는 백터모델에서 용어 가중치 재부여를 이용한 정보검색 모델을 제안한다. 벡터모델에서 용어 가중치 재부여를 이용한 질의 확장 모델의 연산 특성이 MMM, Paice, P-norm 모델보다 우수함을 설명하고, 또한 성능 비교를 통하여 이를 입증한다.

  • PDF

기능동사 구문과 개념 유사도를 이용한 한국어 부사격의 의미역 결정 (Semantic Role Assignment for Korean Adverbial Case Using Support Verb Phrase and Concept Similarity)

  • 신명철;이용훈;김미영;정유진;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.451-453
    • /
    • 2005
  • 본 논문에서는 한국어에 있어 '에, 로'를 격표지로 하는 부사격에 대한 의미역 결정 모델에 대해 다루고 있다. 의미역 결정은 의미 분석의 핵심 과정 중 하나이고 자연언어처리에서 해결해야 할 중요한 문제이다. 본 논문은 기존 연구와 언어학 논저를 참고해서 의미역 결정에 유용한 자질들을 정리하였고 SVM을 이용하여 의미역 결정 모델을 구축하였다. 또한 기존 연구와 차별적으로 기능동사 구문의 처리와 지배소 개념의 유사도 보정 방법을 사용하여 보다 견고한 모델을 만들 수 있었다. 성능 평가 결과 개념(Concept)만을 사용한 기본 모델에 비해서 평균 $9\%$의 정확률 향상을 보였다.

  • PDF

Aspect model 기반의 차원 축소를 이용한 유전자 발현데이터 분석 (Gene Expression Pattern Analysis Using Aspect Model-based Dimensionality Reduction)

  • 장정호;엄재홍;김유섭;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.247-249
    • /
    • 2004
  • 본 논문에서는 aspect model을 이용한 차원 축소 기반의 유전자 발현 데이터 분석을 제시한다. Aspect model은 은닉변수모델의 하나로서, 이를 이용하여 유전자 발현 데이터에 대한 확률적 학습 과정을 통해 특징적 발현 패턴을 추출할 수 있다. 또한 모델로부터 커널함수를 유도함으로써 발현패턴에 기반한 유전자간의 유사도를 자연스럽게 측정할 수 있다. 모델에 의해 정의되는 은닉공간 차원 수는 데이터 permutation 기반의 검증을 통해 결정한다. 효모 (yeast)의 세포 주기(cell cycle) 관련 발현데이터네 대한 실험에서, 주기별 특징 발현 패턴을 추출할 수 있었다. 또한 aspect model로부터 유도된 커널 기반의 유사도 척도를 이용함으로써, 동일 기능 또는 동일 complex 범주에 속하는 유전자 쌍 예측에서 기본적인 상관계수에 의한 방법에 비해 보다 향상된 성능을 얻을 수 있었다.

  • PDF

일반화된 벡터 공간 모델을 적용한 주관식 문제 채점 보조 시스템 (Subjective Tests Sub-System Applied with Generalized Vector Space Model)

  • 오정석;추승우;김유섭;이재영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.965-968
    • /
    • 2004
  • 기존의 주관식 문제 채점 보조 시스템은 자연어 처리의 어려움으로 인해 채점의 자동화가 어려워 전자우편 등을 통하여 채점자에게 채점 의뢰를 하는 수준이었다. 본 논문에서는 이러한 문제점을 해결하기 위하여 문제 공간을 벡터 공간으로 정의하고 벡터를 구성하는 각 자질간의 상관관계를 고려한 방법을 적용하였다. 먼저 학습자가 답안을 작성할 때 동의어 사용을 한다는 가정하에 출제자가 여러 개의 모범 답안을 작성하고 이들 답안을 말뭉치에 첨가하여 구성한 다음 형태소 분석기를 통하여 색인을 추출한다. 그리고 학습자가 작성한 답안 역시 색인을 추출한 다음, 이들 색인들을 각 자질로 정의한 벡터를 구성한다. 이렇게 구성된 벡터들을 이용하여 답안들간 유사도 측정을 하고, 유사도 범위에 따라 답안을 자동으로 정답과 오답으로 분류하려는 시스템을 제안한다. 170 문항의 주관식 문제을 제안된 방법으로 실험하여, 기존 모델에 비해 성능과 신뢰성 향상을 이룰 수 있었다.

  • PDF

문자열 비교 기법을 이용한 악성코드 탐지 및 분류 연구 (A Study of Malware Detection and Classification by Comparing Extracted Strings)

  • 이진경;임채태;정현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1245-1248
    • /
    • 2010
  • 최근 급격하게 증가하고 있는 악성코드에 비해 이들을 분석하기 위한 전문 인력은 매우 부족하다. 다행히 양산되는 악성코드의 대부분은 기존의 것을 수정한 변종이기 때문에 이들에 대해서는 자동분석시스템을 활용해서 분석하는 것이 효율적이다. 악성코드 자동분석에는 동적 분석과 정적 분석 모두가 사용되지만 정적 분석은 여러 가지 한계점 때문에 아직까지도 개선된 연구를 필요로 한다. 본 논문은 문자열 비교를 통해 두 실행파일에 대한 유사도를 측정함으로써 악성코드 판별 및 분류를 도와주는 정적 분석기법을 제안한다. 제안된 방법은 비교 문자열의 수와 종류에 따라 그 성능이 결정되기 때문에 문자열들을 정제하는 과정이 선행된다. 또한 유사도 측정에 있어서 악성코드가 가지는 문자열들의 특성을 고려한 개선된 비교방법을 보인다.