• 제목/요약/키워드: 인덱싱

검색결과 448건 처리시간 0.029초

도로 네트워크 데이터베이스를 위한 근사 인덱싱 (Approximate Indexing in Road Network Databases)

  • 이상철;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.61-62
    • /
    • 2007
  • 본 논문에서는 도로 네트워크 데이터베이스에서 k-최근접 이웃 질의를 효율적으로 처리하기 위한 방안에 대하여 논의한다. 네트워크 거리는 삼각형 부등식 성질(triangular inequality property)을 만족하지 못하므로 기존의 기법들은 네트워크 거리를 기반으로 하는 인덱스를 사용하지 않았다. 이러한 기법들은 질의 처리 시 심각한 성능 저하의 문제를 가진다. 사전 계산된 네트워크 거리를 이용하는 또 다른 기법은 저장 공간의 오버헤드가 크다는 문제를 갖는다. 본 논문에서는 이러한 두 가지 문제점들을 동시에 해결하기 위하여 객체들 간의 네트워크 거리를 근사하여 객체들에 대한 인덱스를 구축하고, 이를 이용하여 k-최근접 이웃 질의를 처리하는 새로운 기법을 제안한다. 실제 도로 네트워크를 이용한 정확도 검증 실험을 통하여 제안된 기법의 우수성을 규명한다.

  • PDF

키워드 기반 전문 검색을 이용한 Access Grid에서의 효과적인 데이터 공유 방안 (Effective Method for Data Sharing on Access Grid Using Keyword-Based Fulltext Retrieval)

  • 오헌;김진승;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.799-801
    • /
    • 2007
  • 앞으로 다가올 유비쿼터스 컴퓨팅 환경에서는 일상생활 어디에서든지 컴퓨팅이 가능해질 것으로 예상되며, 원격지의 상대방과의 상호작용이 다양한 형태로 발전할 것으로 예상된다. 이를 지원하기 위하여 유비쿼터스 환경에서의 다자간 인터랙티브 협업 시스템들이 연구되고 있다. 그런데, 현재 개발된 다자간 협업 환경 시스템에서는 자료를 공유하는데 있어서, 데이터에 대한 인덱싱과 검색에 비중을 두지 않고 있다. 공유 데이터는 늘어나는 반면, 그것을 효과적으로 검색할 수 있는 방법이 마련되지 않아 데이터를 공유하고 활용하는 효율성이 떨어질 것이 예상됨에 따라서 키워드 검색 기반으로 데이터를 검색할 수 있는 방법을 마련하고자 한다.

  • PDF

CopyCheck: 한국어 표절 검사 시스템 (CopyCheck: Korean Plagiarism Detection System)

  • 장은서;권도형;김낙원;박소영;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.117-118
    • /
    • 2012
  • 기존의 표절 검사 소프트웨어의 경우에는 수행 시간이 지나치게 오래 걸리거나 표절의 의미가 희박한 구간들을 찾는 등의 문제가 있었다. 본 논문은 대학에서 과제물 표절 검사에 활용할 수 있는 소프트웨어인 CopyCheck을 설계 및 개발하였다. CopyCheck은 각각의 대상 문서로부터 문서 고유의 시그니처 세트를 추출 비교하여 표절이 의심되는 문서들 간의 중복 인텍스 세트를 만들어 의심 구간들을 추려낸 다음 지역 정렬 방법을 이용하여 일치 구간을 찾아내는 방법으로 많은 문서들을 대상으로도 표절 구간들을 빠르게 찾아낸다.

  • PDF

관계형 데이터베이스 상품 정보 질의 처리를 위한 인덱싱 (Towards a Indexing Structure for Querying Product Information in Relational Databases)

  • 이현자;심준호
    • 한국전자거래학회지
    • /
    • 제13권4호
    • /
    • pp.209-222
    • /
    • 2008
  • 관계형 데이터베이스를 사용하여 상품 온톨로지의 저장과 관리가 현실적 방안이라고 할때, 의미적 관계에 대한 온톨로지 질의를 효과적으로 처리하기 위해서는 인덱스의 도움을 받는 것이 필요하다. 상품 온톨로지에서 의미적 관계는 상품 정보 간의 포함관계 및 분류계층 구조상의 위치관계 등 전이적 특성을 지닌 관계를 포함한다. 이 논문에서는 상품 정보 간의 포함관계 및 전이적 특성을 갖는 의미적 관계에 대한 질의를 효율적으로 처리할 수 있고, 정보의 갱신에 유리한 넘버링 기법을 사용한 인덱스 방법을 제안한다.

  • PDF

보로노이 다이어그램을 이용한 지문정합 알고리즘 (A Fingerprint Matching Algorithm Based on the Voronoi Diagram)

  • 김승훈;최태영
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.247-252
    • /
    • 2004
  • 본 논문에서는 검출된 특징점에 대해 보로노이 다이어그램을 사용하여 이동과 회전에 불변인 정합 알고리즘을 제안한다. 보로노이 다이어그램에 의해서 검출되는 각각의 특징점과 그에 인접한 특징점들 사이의 거리와 각도를 데이터베이스에 저장하고 인증을 요청한 지문의 정보를 같은 방법으로 변환 후 데이터베이스 내의 정보들과의 비교를 통해서 결과를 출력한다. 이는 기존의 인덱싱 기반 알고리즘에 비해 더욱 정확한 알고리즘이다.

내용기반 검색을 위한 뉴스 비디오 인덱싱의 자동화 (Automation of News Video Indexing for Content-Based Retrieval)

  • 이동섭;이지연;신성윤;전근환;배석찬;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.507-510
    • /
    • 1998
  • 다양한 분야에서 중요하게 사용될 수 있는 뉴스 비디오 데이터베이스를 구축하기 위해서는 비디오 색인의 자동화에 관한 연구가 필연적이다. 본 논문에서는 뉴스 비디오 색인을 자동화하는 방법으로, 이전에 제안한 컷 추출 방법을 이용하였다. 컷에 의해 추출된 키 프레임에서 앵커 인식 알고리즘으로 앵커 프레임을 자동으로 추출하여 색인을 부여하는 방법으로 비디오 스트림에 대한 색인을 자동화하였다. 구성되는 색인 구조의 형태는 앵커 프레임들이 시간에 따른 사건의 연결이 되고, 앵커 프레임 내에서는 종속되는 키 프레임들을 중심으로 원형을 형성한다. 이들 각각을 논리적으로 통합하면 사용자의 관점에 따라 여러 가지 방법으로 브라우징되며, 사용자가 원하는 뉴스 비디오 씬들을 쉽게 선택하여 볼 수 있는 특징을 제공하는 장점을 부여한다. 또한, 색인화 된 비디오 스트림을 이용하면 자동적으로 비디오 편집을 수행 할 수 있는 비디오 저작도구의 기반을 제공할 수 있다.

  • PDF

대화형 인덱싱을 위한 로봇 에이전트의 설계 및 구현

  • 박민우;김성수
    • 전자공학회지
    • /
    • 제25권8호
    • /
    • pp.40-51
    • /
    • 1998
  • 에이전트는 분산 환경에서 작업을 수행하는 지적인 특성을 갖는 응용 프로그램으로 정의되며, 연구 분야에 따라 다양한 의미로 해석이 가능하다. 그 중에서 로봇 에이전트는 전세계에 산재된 방대한 양의 정보를 스스로 추적하며 새로운 정보를 찾는다. 로봇 에이전트에 대한 기존의 연구는 대부분 통계적인 목적이나 검색엔진을 위한 데이터의 수집을 목적으로 사용되었다. 많은 정보를 수집하기 위해 더 높은 성능의 로봇 에이전트들이 제작되었고, 이러한 프로그램들이 팽창하면서 네트워크를 과부하시키는 현상을 초래하게 되었다. 재귀적인 방법으로 수행되는 로봇 에이전트의 사용을 억제하기 위한 연구들이 많이 발표되었으나, 수동적인 방법에 의존하는 연구가 대부분이며 대표적인 것이 로봇 배제를 위한 표준안 정도이다. 본 연구에서는 이러한 로봇 에이전트의 문제점을 개선하여, 서버와 클라이언트간에 대화형으로 수행되는 인덱스 로봇 에이전트를 제안하며, 사용자의 요구에 따라 수행되는 로봇 에이전트에 의한 정보획득의 방법을 시도하여 네트워크의 과부하를 억제하면서도 정보의 신뢰성과 정확성을 보장한다. 아울러, 차세대 지능형 검색 기술인 TEMA 시스템에 대해 소개한다.

  • PDF

Hyperion 센서 데이터를 이용한 지형지물 추출 (Man-made Feature Extraction from the Hyperion Sensor Data)

  • 서병준;강명호;이용웅;김용일
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.182-186
    • /
    • 2003
  • 일반적으로 영상은 공간, 분광 및 시간 해상력을 바탕으로 고해상과 저해상 영상으로 구분된다. 최근 IKONOS 와 QuickBird 등 공간해상력이 1m 이하인 위성 영상들이 국내에 공급되어 바야흐로 고해상 위성영상을 이용한 다양한 활용분야들이 연구되고 있다. 이에 반하여 고분광해상력을 갖는 하이퍼스펙트럴 영상에 대한 연구는 미흡한 실정이다. 국제적으로는 항공기탑재 센서들을 이용한 다양하고 광범위한 조사분석 연구가 이루어지고 있으나, 국내에서는 장비와 관심의 부재로 인하여 초기적인 연구 단계에 있는 실정이다 하이퍼스펙트럴 센서는 환경, 지질, 목표물 인식 분야에 있어 많은 관심을 받고 있으며 위성탑재 초다중분광센서가 운용되기 시작하면서 연구의 활성화가 더욱 기대되고 있다. 본 연구에서는 EO-1 위성의 Hyperion 센서 데이터를 이용하여 노이즈 제거를 위한 영상 전처리 과정을 실시하고 분광특성에 따른 무감독 분류를 통한 인덱싱 기법과 널리 알려진 분광 라이브러리를 활용한 대상물, 특히 인공지물 추출 기법을 실험하였다. 이를 위하여 MNF(Maximum/Minimum Noise Filtering) 변환 및 분광 매칭(Spectral Matching) 기법, 분광 라이브러리 처리 등을 수행하였다. 결과의 비교를 위하여 동일 지역의 Landsat ETM+ 데이터를 이용하여 상호비교를 통한 검증작업으로서 그 성과를 판단하였다.

  • PDF

시맨틱 연관성 검색을 위한 ${\rho}$-intersect 연산의 처리 (Processing of ${\rho}$-intersect Operation for Semantic Association Discovery)

  • 김성완
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.285-288
    • /
    • 2011
  • 시맨틱 웹상에서 메타 데이터를 표현하는 RDF 데이터에 대한 질의 처리를 위해 여러 가지 RDF 질의어가 제안되었으나 리소스간의 복잡한 관계성들의 발견(discovery)을 위한 충분한 지원을 하지 못하고 있다. 본 논문에서는 시맨틱 연관성 검색 유형의 하나인 ${\rho}$-intersect 연산의 처리 방법을 소개한다. 이를 위해 접미사 배열을 이용한 인덱싱과 ${\rho}$-intersect 연산의 특징을 고려한 최적화 방법을 활용한다. 제안된 처리 기법을 통해 전형적인 RDF 질의 유형뿐만 아니라 시맨틱 연관성 질의 유형도 지원할 수 있도록 한다.

  • PDF

한국어 음성인식 결과의 선언적 형태소 분석 (Declaritive Morphological Analysis of Spoken Korean Recognition Results)

  • 이원일;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.322-325
    • /
    • 1994
  • 한국어 음성인식 결과의 형태소 분석은 한국어 문서의 분석보다 더 많은 문제점을 가지고 있다. 음성 인식의 낮은 인식률, 여러 개의 후보를 제시하는 경우의 지수적 가능성, 말하는 단위와 띄어쓰기 단위의 불일치, 형태소 안에서 그리고 형태소와 형태소 사이에서 일어나는 음운 변동등이 음성 인식 결과를 분석할 때 추가되는 문제점이다. 본 논문에서는 한 음소에 대해 여러 개의 후보를 제시하는 음성 인식 결과에 대하여, TRIE 인덱싱, 어절 간의 접속을 위한 확장된 접속 검사, 음운 변동을 고려한 사전구성, 음운 접속 정보를 사용하는 형태소 분석 방법을 제안한다.

  • PDF