• 제목/요약/키워드: 유사도 질의

검색결과 1,856건 처리시간 0.033초

MDD 기법을 이용하여 생성된 코드 간의 기능적 유사도 및 코드 생성률 측정 기법 (Measuring Methods of Functional Similarity and Code Generation Rate for the Code Generated by MDD)

  • 류성태;박철현;이은석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.287-290
    • /
    • 2010
  • 오늘날 모바일 시장을 중심으로 다양한 플랫폼이 등장하면서 모바일 어플리케이션 개발 시 여러 플랫폼을 고려해야 하는 부담이 증대되고 있다. 이러한 상황에서 Model-Driven Development(MDD) 는 멀티플랫폼에 대응하는 어플리케이션 개발의 효율성을 높여줄 수 있다. 하지만 이 기법을 이용하는 대다수의 연구 결과들은 해당 방법론을 통해 생성된 결과물의 질을 객관적으로 평가할 수 없고, 이 때문에 해당 방법론의 성능 평가가 힘들다. 본 연구에서는 대상 플랫폼들이 제공하는 API 를 분석한 결과에 근거하여 공통 요소를 추출하고 이를 이용하여 MDD 기반으로 개발을 진행할 수 있는 개발 프로세스를 소개하고, 이를 통해 생성된 소스 코드의 기능적 유사도 및 코드 생성률과 기능적 유사도를 평가할 수 있는 방법을 제안한다. 이 방법은 코드를 AST 로 바꾸고 API 맵핑 테이블에 근거하여 동일한 키워드로 변환하고 유사도를 측정하여 설계 시 의도한 기능이 얼마나 잘 코드로 생성되었는 지 평가할 수 있는 방법이다. 본 연구에서는 이 방법을 이용하여 생성된 코드의 기능적 유사도와 코드 생성률을 측정하였다.

기억-탐험 방법을 이용한 단일-질의 확률 로드맵 계획 알고리즘 (Single-Query Probabilistic Roadmap Planning Algorithm using Remembering Exploration Method)

  • 김정태;김대진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.487-491
    • /
    • 2010
  • 고차원의 구성 공간 상에서 빠르게 동작하는 경로 계획을 위하여, 본 논문에서는 단일-질의 알고리즘의 일종인 새로운 경로 계획 알고리즘을 제안한다. 단일-질의 알고리즘의 동작과 탐험 알고리즘의 유사성에 주목하여 탐험 알고리즘의 하나인 기억-탐험(Remembering Exploration) 방법을 응용하여, 로드맵의 한 노드를 선택하여 그 주위의 자유 공간상에 있는 노드들을 새로 로드맵에 추가하는 방법으로 로드맵을 키워나가는 것이 본 논문이 제안하는 알고리즘이다. 성능 평가를 위하여 2차원 공간상에서의 경로 계획 문제와 3차원 공간상의 움직임 계획 문제를 제안하는 알고리즘과 다른 잘 알려진 알고리즘을 이용하여 성능 비교 실험을 하였으며, 경로의 발견 유무와 발견하기까지의 시간 비교를 한 결과 제안하는 알고리즘의 성능 우위를 확인할 수 있었다.

가상 윈도우 기반 인스턴스 레벨 서브시퀀스 매칭 방안 (Instance-Level Subsequence Matching Method based on a Virtual Window)

  • 임선영;박영호
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권2호
    • /
    • pp.43-46
    • /
    • 2014
  • 시계열 데이터는 시간에 따라 변화되는 실수 값을 저장한 것이다. 시계열 데이터에서 사용자 질의 시퀀스가 주어졌을 때, 유사한 서브시퀀스를 가지는 데이터 시퀀스를 검색하는 서브시퀀스 매칭은 매우 중요한 문제이다. 본 논문에서는 인스턴스 레벨의 새로운 서브시퀀스 매칭 방법인 I-Match (Instance-Match)를 제안한다. I-Match는 인스턴스 레벨에서 가상 윈도우를 생성하여 질의 시퀀스와 데이터 시퀀스를 비교하여 착오 해답을 줄이는 방법으로 기존 방법인 Dual Match에 비해 후보의 개수를 줄임으로써 성능을 향상시켰다. 실험을 통해 I-Match의 질의 처리 시간이 Dual Match와 비교하여 최대 2.95배 빠르며, 후보의 개수를 줄임을 보인다.

시계열 데이터베이스에서 순위를 지원하는 서브시퀀스 매칭 방법을 위한 시각화 툴 (A Visualization Tool for Ranked Subsequence Matching in Time-Series Databases)

  • 이성진;이진수;조훈;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.787-788
    • /
    • 2009
  • 시계열 데이터(time-series data)는 연속적인 데이터를 고정된 시간 간격으로 샘플링한 실수 값들의 연속을 의미한다. 시계열 데이터의 예로는, 음악 및 동영상 데이터, 심전도 데이터, 주식 그래프 등의 데이터가 있다. 시계열 데이터는 다시 데이터베이스에 저장 되어있는 데이터 시퀀스(data sequence)와, 사용자에 의해 주어지는 질의 시퀀스(query sequence)로 분류된다. 시계열 데이터베이스(time-series database)에서 순위를 지원하는 서브시퀀스 매칭 방법(ranked subsequence matching)은 데이터 시퀀스와 질의 시퀀스가 주어졌을 때, 질의 시퀀스의 길이와 같은 데이터 시퀀스의 서브시퀀스(subsequence)들 중에서 질의 시퀀스와 가장 유사한 상위 k개의 서브시퀀스들을 찾는 것이다. 본 논문의 목적은 사용자가 매칭 방법에 대한 인식과 이해가 부족하더라도 기존의 콘솔 기반의 매칭 프로그램을 보다 쉽게 사용할 수 있도록 이용성을 향상시키기 위하여 시각화 툴을 개발하는 것이다. 구체적으로, 5가지 시각화(visualization) 기능을 제공하는 사용자 인터페이스를 구현하였다. 구현된 사용자 인터페이스를 통해 사용자가 기존의 매칭 프로그램을 보다 쉽고 간편하게 사용할 수 있도록 기여한다.

제품 영상을 이용한 제품 설계 정보 검색 시스템 (Product Design Information Retrieval System using Product Ad-hoc image)

  • 이형재;김용일;양형정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.307-310
    • /
    • 2006
  • 본 논문은 분산된 협동적 개발 환경에서 제품 설계 정보 재사용을 위한 제품 영상 기반의 제품 설계 정보 검색 시스템을 제안한다. 본 논문에서 제안한 시스템은 에지기반 라벨링(EBL) 방법으로 제품 영상을 분할하고 각 분할 영역의 속성과 영역간의 관계를 표현하는 속성 관계 그래프(ARG)을 생성하여 질의 영상과의 부합을 수행한다. 검색된 유사 영상과 연결된 제품 설계 정보를 접근함으로써 영상 검색을 통한 제품 설계 정보의 재사용이 가능하다. 본 시스템의 주요 이점은 다음과 같다. (1) 비율을 이용한 특징 벡터에 의해 다양한 크기의 유사 부품을 포함한 영상의 검색이 가능하다. (2) 분할된 각 부품의 영역, R,G,B 채널의 표준편차등의 다양한 속성(특징)과 그들의 관계를 적용하기 때문에 검색 능력이 뛰어나다. (3) 주변 장치로부터 쉽게 획득할 수 있는 래스터 영상을 이용하므로 활용성이 높다.

  • PDF

신약 발견을 위한 top-K 검색 엔진의 개발 (Development of a top-K search engine for drug discovery)

  • 서인;이승민;무하메드 이자즈 아메드;채송이
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.810-811
    • /
    • 2017
  • 신약 개발은 고부가가치를 창출하는 차세대 전략 산업으로 주목받고 있지만, 동물 실험과 임상 시험에 막대한 비용이 필요한 고위험-초고소득(high risk-super high return) 산업이다. 따라서 신약 후보군의 선정이 매우 중요하며 약물 유사도를 랭킹함수를 사용하는 top-k 질의 처리를 통해 후보군을 효과적으로 선정할 수 있다. 본 논문에서는 ChEMBL 데이터베이스[4]에 존재하는 화합물들 중 사용자가 원하는 특성을 갖는 k개의 화합물들을 후보군으로 추천해주는 검색 엔진을 개발하였다.

도메인 지식을 이용한 의미 기반 검색을 위한 유사성 측정 (Similarity Measure for Semantic-based Retrieval using Domain Knowledge)

  • 조미영;최창;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.347-350
    • /
    • 2007
  • 멀티미디어 데이터 처리 요구가 증가함에 따라 이의 의미적 표현 및 검색에 관한 연구가 활발히 이루어지고 있다. 최근에는 특히 지식 기반의 온톨로지를 이용한 의미적 검색에 초점을 두고 있으며, 구축된 온톨로지를 기반으로 동의어 관계, 반의어 관계 등을 이용하여 질의 확장으로 활용되고 있다. 하지만 이들은 대부분 속성 관계 등을 고려하지 않을 뿐만 아니라 각 관계별 가중치를 고려하지 않고 있다. 이에 본 논문에서는 비디오의 의미적 특징들을 추출하여 온톨로지를 구축한 후 의미 기반 검색을 위하여 관계별 가중치를 고려한 유사성 측정을 제안하고자 한다.

  • PDF

소파변환을 사용한 오디오 데이터 베이스 검색 기반에서의 오디오 색인에 관한 연구 (A Study on Audio Indexing Using Wavelet Transform for Content-based Retrieval in Audio Database)

  • 최귀열;곽칠성
    • 한국정보통신학회논문지
    • /
    • 제4권2호
    • /
    • pp.461-468
    • /
    • 2000
  • 디지털 기술 발전에 따른 오디오 데이터의 증가는 여러 컴퓨터 응용에 사용되면서 데이터를 관리하고 사용하기 위해, 내용기반 질의와 유사성 검색과 같은 새로운 기능을 갖는 데이터베이스 시스템의 개발이 불가피하게 됐다. 내용 기반 질의를 위한 빠르고 정확한 검색은 이러한 응용 시스템들에 필요하다. 효율적인 내용기반 색인과 유사성 검색의 설계는 관련성 있는 데이터의 빠른 검색을 제공하기 위한 주된 요소이다. 본 논문에서는 소파(Wavelet) 변환을 이용한 한국 전통 음악 데이터베이스의 오디오 색인을 위한 방법을 제안한다. 또한 소파 변환을 이용해 오디오 데이터에 대한 색인의 가능성을 보인다.

  • PDF

XML 문서의 효율적인 경로 통합 기법 (An Efficient Path Combining Strategy of XML Document)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2005
  • XML은 비즈니스 메시징, 웹사이트 정보 통합, 그리고 카탈로그 통합 등의 분야에서 다양한 데이터를 표현하기 위한 포맷으로 급격하게 성장했다. 그러나 XML 데이터의 형태가 고정되어 있지 않기 때문에 전통적인 질의 방법이 항상 정확한 결과를 보여주지는 않는다. 또한 객체 지향 DBMS가 이 영역에 적합한지의 여부는 아직 명확하지 않다. 따라서 XML 데이터를 효율적으로 검색하기 위해 기존의 관계형 DBMS와 연계하여 구조 유사성을 기반으로 하는 검색 기법이 연구되고 있다. 그 중 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스를 이용한 검색 시스템은 다른 XML 문서 검색 시스템보다 훨씬 빠른 수행 속도를 보여주지만, 3차원의 메모리 구조를 사용하여 많은 저장공간을 필요로 하는 단점이 있다. 본 논문에서는 XML 문서를 저장할 때 경로들 사이의 유사성을 이용하여 XML 데이터의 경로를 통합하는 기법에 대해 소개한다. 이렇게 통합된 경로를 이용하여 생성하는 3차원 비트맵 인덱스는 그 크기가 상당히 줄어들게 되고, 기존의 연구에서 보여주었던 문제점들을 해결하게 되었다.

  • PDF

상호정보량의 정규화에 대한 연구 (A Study on Relative Mutual Information Coefficients)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제37권4호
    • /
    • pp.178-198
    • /
    • 2003
  • 상호정보량은 용어간 유사도 산출을 비롯한 다양한 분야에서 연관성 척도로 사용되어왔다. 그러나 값의 범위가 일정하지 않으며 지나치게 저빈도인 경우를 선호하는 경향이 제한점으로 지적되고 있다. 이런 점을 보완하기 위해서 상호정보량을 정규화하는 상대적 상호정보량 계수를 제안하였다. 제안된 계수의 특성을 알아본 다음, 세 실험집단을 대상으로 전역적(global) 질의확장 검색을 수행한 결과 검색 성능을 향상시킬 수 있었다.