• 제목/요약/키워드: intelligent information retrieval

검색결과 227건 처리시간 0.028초

역방향 레이블 경로를 이용한 XML 문서의 선형 경로 질의 처리 (Linear Path Query Processing using Backward Label Path on XML Documents)

  • 박충희;구흥서;이상준
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.766-772
    • /
    • 2007
  • XML의 광범위한 사용으로 XML 저장과 질의 처리에 관한 많은 연구가 이루어지고 있다. 하지만 기존의 경로 질의 처리에 대한 연구들은 한 개의 대규모 XML 문서나 동일한 구조를 가진 문서들에 대한 저장, 검색에 초점이 맞춰져 있어서 상이한 구조를 가진 대규모 문서들에 대해서 부분 매치 질의(partial match query)를 효과적으로 지원하지 못하는 단점이 있었다. 본 논문에서는 상이한 구조를 가지는 대규모 문서들에 대해서도 부분 매치 질의를 효과적으로 지원할 수 있는 관계형 테이블을 이용한 새로운 인덱스 구조를 제안하였다. 본 방법은 경로 정보를 저장할 때 기존의 연구에서 사용된 순방향 레이블 경로 대신 역방향 레이블 경로를 사용하여 $B^+$-트리 인덱스를 구축함으로써 부분 매치 질의 처리시 구축된 인덱스를 이용하여 질의에 해당되는 레이블 경로들을 효율적으로 찾을 수 있도록 하였다.

LDA 모델을 이용한 잠재 키워드 추출 (Latent Keyphrase Extraction Using LDA Model)

  • 조태민;이지형
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.180-185
    • /
    • 2015
  • 인터넷 미디어의 발달과 함께 온라인 문서의 양이 급격하게 증가함에 따라, 문서 요약과 정보 검색 등 다양한 분야에 활용가능한 키워드를 자동으로 찾고자하는 연구가 활발히 진행되고 있다. 하지만 기존의 키워드 추출 연구들은 문서에서 나타나는 키워드만을 대상으로 하고 있어, 문서에서 등장하지 않는 잠재 키워드를 추출하지 못하는 한계를 갖고 있다. 잠재 키워드는 실데이터 키워드의 1/4 이상을 차지하고 있으며, 문서에서 나타나지는 않지만 문서의 중요한 개념이나 내용을 함축하고 있어 문서 요약 및 정보 검색에 중요한 역할을 차지할 수 있다. 특히 SNS와 같이 내용이 적어 키워드가 명시적으로 나타나기 어려운 문서에서 유용하게 활용될 수 있다. 본 논문에서는 잠재 키워드를 추출하기 위해 주어진 문서와 유사한 문서의 키워드를 후보 키워드로 선택하고 후보 키워드를 구성하는 개별 단어들을 이용해 후보 키워드의 중요도를 평가하는 방법을 제안한다. 실험을 통해, 제안 기법이 잠재 키워드를 합리적인 수준으로 추출할 수 있음을 보였다.

XMDR을 이용한 지능형 검색 온톨로지 서버 구축 (A Construction of an Ontology Server based Intelligent Retrieval using XMDR)

  • 황치곤;정계동
    • 한국통신학회논문지
    • /
    • 제30권8B호
    • /
    • pp.549-561
    • /
    • 2005
  • 인터넷 기술과 통신망 기술이 발전됨에 따라 전자상거래는 복잡하고 다양해지고 있다. 본 논문에서는 이기종 데이터베이스 시스템들 간의 메타데이터 및 데이터 교환을 위해 W3C에서 제안한 XML Schema를 사용하고, XML Schema는 관계형 데이터베이스 시스템의 메타데이터 및 데이터를 계층적 구조인 XML 문서형식으로 나타낼 수 있고, 다양한 원시 데이터 형식을 지원하여 관계형 데이터베이스 시스템이 제공하는 데이터형식을 충분히 반영할 수 있는 구조를 사용한다. 그리고 기존 전자상거래에서는 이질적인 플랫폼을 사용함으로 인해 발생하는 시스템간의 상호 호환 및 운영의 어려움이 있다. 이러한 문제를 해결하기 위해 상품 분류와 속성표현의 표준과 관계성을 정의한 표준 온톨로지와 상품들에 대한 전자상거래 사이트의 정보를 제공하는 로케이션 온톨로지를 구축한다. 이 온톨로지 정보를 검색시스템에 적용하여 고객의 선택에 필요한 정보를 제공함으로서 효율적인 검색을 수행한다. 이러한 온톨로지와 상품 분류 카테고리 정보를 결합하여 XMDR이라 하고, 이 XMDR을 상품 검색 시스템에 도입하여 효율적인 검색을 수행하기 위한 은톨로지 서버 구축에 관한 방법을 제안한다.

영상표현을 위한 비전 중심점 이동에 따른 영역기반 형태 기술자 (Region-based Shape Descriptor with Moving a Vision Center for Image Representation)

  • 김선종;김영인
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.95-105
    • /
    • 2006
  • 본 논문에서는 영상을 비전 중심점 이동에 따라 정밀하게 표현할 수 있는 형태 기술자를 제안하고, 이를 이용하여 영상이 표현되는 방법을 조사하였다. 제안된 기술자는 영역의 중심점에 모든 영역의 크기가 집중되어 있도록 표현하는 방법이며, 이 비전의 중심점을 다른 관심영역으로 이동시킴으로써 좀 더 정밀한 영상표현도 가능하게 되었다. 이는 또한 영역의 크기 정보를 포함하고 있어서 더욱 효과적이다. 영상의 윤곽선이 제안된 기술자에 의해 정밀하게 표현될수록 영상 내용 검색 등에는 더욱 효과적으로 이용될 수 있다. 제안된 형태 기술자는 정규화가 가능하여 크기, 위치, 회전에 무관하게 표현될 수 있으며, 일정한 영상 패턴으로 구성된 데이터베이스 시스템을 만들 수 있다. 제안된 형태 기술자를 이용하여 실루엣 영상 검색에 적용하여 실험하였으며, 실험 결과, 영상 표현에 효과적으로 사용될 수 있음을 보였다.

  • PDF

비겹침 다중 IP 카메라 기반 영상감시시스템의 객체추적 프레임워크 (Object Tracking Framework of Video Surveillance System based on Non-overlapping Multi-camera)

  • 한민호;박수완;한종욱
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.141-152
    • /
    • 2011
  • 다양한 감시 환경에서의 보안의 중요성이 대두됨에 따라 여러 대의 카메라로 움직이는 물체를 연속적으로 추적하는 시스템에 대한 연구가 활발히 진행되고 있다. 본 논문은 물체를 연속적으로 추적하기 위해 비겹침 다중 카메라 기반의 영삼감시시스템을 제안한다. 제안된 다중 IP 카메라 기반 객체추적 기술은 장치 간 hand-off 기술 및 프로토콜을 바탕으로 객체추적 모듈과 추적관리 모듈로 구성된다. 객체추적 모듈은 IP 카메라에서 실행되며 객체추적 정보 생성, 객체추적 정보 공유, 객체추적 정보를 이용한 객체 검색 및 모듈 내 설정 기능을 제공하고, 추적관리 모듈은 영상관제 서버에서 실행되며 객체추적 정보 실시간 수신, 객체추적 정보 검색, IP 카메라 컨트롤 기능을 제공한다. 본 논문에서 제안한 객체추적 기술은 다양한 감시 환경과 기술 방법에 의존하지 않는 범용적 프레임워크를 제안한다.

시맨틱 웹 데이터의 경로 기반 질의 처리 기법 (The Scheme for Path-based Query Processing on the Semantic Data)

  • 김연희;김지현
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.31-41
    • /
    • 2009
  • 시맨틱 웹에서는 메타데이터와 온톨로지를 이용해 정보 리소스의 개념을 정의하고 의미적 연관성을 표현함으로써 지능적인 정보 검색과 자동화된 웹 서비스의 제공이 가능하다. 이러한 시맨틱 웹의 핵심적인 기능을 구현하기 위해서는 온톨로지와 메타데이터와 같은 시맨틱 웹 데이터를 효율적으로 관리하는 것이 무엇보다 중요하다. 따라서 본 논문에서는 시맨틱 웹 데이터의 의미와 구조적인 특성을 고려하여 보다 정확한 질의 결과의 검색과 효율적인 질의 처리를 지원할 수 있는 인덱스 구조를 제안한다. 특히 시맨틱 웹 데이터의 의미와 구조적인 특성을 그대로 표현하기 위해 그래프 데이터 모델을 이용하고 다양한 질의 형태를 그래프 모델 기반의 경로식으로 처리한다. 본 논문에서 제안한 인덱스는 1차적으로 추출 가능한 구조적 경로 정보는 물론 온톨로지를 이용한 추론을 통해 2차적으로 추출 가능한 구조적 경로 정보에 대한 질의를 처리 대상으로 하여 기존연구들과 차별화하며 시맨틱 웹의 개념을 온전히 반영하는 것을 목표로 한다. 또한 실험적 평가를 통해 본 논문에서 제안한 인덱스 구조가 정확성과 효율성 측면에서 우수하며 시맨틱 웹의 다양한 애플리케이션 개발에 적용 가능함을 보인다.

e-비즈니스 컴포넌트 시스템 설계 및 구현 (The Design and Implementation of e-BCOS for e-Business Component System)

  • 최하정;김행곤
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.85-100
    • /
    • 2003
  • 오늘날의 컴퓨팅 시스템은 인터넷을 사용하여 비즈니스 거래와 분산 업무 처리로 확대되어가고 있으며 정보 기술은 점차적으로 재사용성과 독립성 그리고 이식성을 가진 컴포넌트를 기반으로 한 응용 개발이 확산되고 있다. 컴포넌트 개발 형태는 코드의 재사용이나 클래스 라이브러리보다 좀 더 발전된 형태의 부품개발 형태로서, CBD(Component Based Development)를 기초로 한다. 그러나, CBD를 이용하여 새로운 컴포넌트를 구축하는 비용의 증가와 함께 비즈니스 요구사항에 맞는 컴포넌트 개발을 위한 노력이 필요하며, 빠르게 정확한 컴포넌트 정보를 웹 상에서 지원할 수 있도록 시스템 측면에서 정규화 형태의 컴포넌트 모델이 요구되고 있다. 본 논문에서는 사용자의 요구사항에 접근하고 웹 상에서 빠르고 신속하게 애플리케이션이 개발되는데 목적을 두고 있으며, 네트워크 상에서 비즈니스 도메인을 기반한 가장 소규모 단위의 분산 컴포넌트를 대상으로 인터페이스 명세를 제공하고자 한다. 분산 컴포넌트 내부와 외부 관계를 담고 있는 명세는 사용자 중심의 컴포넌트를 제공하기 위해서 웹 상에서 요구사항을 작성하고 결국 이들은 조합되어 e-비즈니스 컴포넌트 명세 제공이 요구된다. 따라서 본 논문에서는 사용자가 분산 컴포넌트를 등록하고, 이에 대한 컴포넌트 정보를 검색말 수 있는 e-BCOS(e-Busines Component System)을 설계 구현한다. e-BCOS는 컴포넌트 등록. 검색을 위한 에이전트 시스템으로, 비즈니스 도메인에서의 분산 컴포넌트의 e-비즈니스 컴포넌트 개발을 통해 재사용성을 증대시키고, 웹 상에서 애플리케이션 구축을 빠르고 신속하게 처리될 수 있도록 하며, 사용자가 쉽게 컴포넌트에 관한 정보를 얻고 이해할 수 있도록 해준다. 또한 명세의 공유와 유통을 원활히 하기 위해서 XML(extensible Markup Language)로 명세를 표현하여 사용자의 다양한 욕구를 충족시키도록 한다. 따라서, e-BCOS는 에이전트에 의해서 효율성 증대와 시간 절약 및 신뢰성과 유지보수성을 증대할 수 있는 잇점을 가진다.

전자상거래에서의 벡터 공간 모델링을 통한 Configuration 시스템 (Configuration System through Vector Space Modeling In I-Commerce)

  • 김세형;조근식
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.149-159
    • /
    • 2001
  • 최근 전자상거래에는 일대일 마케팅이나 협력적 정보여과기법등을 이용한 다양한 추천서비스가 도입되고 있다. 이러한 추천 서비스의 형태는 다양한 제약 조건을 갖고 계산 복잡도가 높은 제품의 경우에는 고객을 만족시킬 만큼 적절한 추천서비스가 이루어지기 어려울 것으로 본다. 본 논문에서는 Clancey의 Classification Problem Solving 방법과 제약조건 기반 Configuration기술을 통합하여, 이러한 문제를 해결할 수 있는 방법을 제시하였다. 이 방법은 Clancey의 이론에 따라 구성 복잡도가 높은 제품의 해집합 도메인을 분할하여 문제의 복잡도를 줄일 수 있도록 하였으며, 여기에서 선택된 도메인을 제약조건 기반 Configuration기술에 적용시킴으로써, 구매자와 제품 컴포넌트 사이에 존재하는 제약조건을 처리할 수 있도록 하였다. 제약조건기반 Configuration기술은 구매자에게 적합한 제품을 구성하기 위해서 제막 조건 판촉 문제(Constraint Satisfaction Problem; CSP)해결 기법을 이용한다. 또한 Clancey이론은 구매자의 만족도를 고려하기 위해서 정보검색 분야의 벡터공간 모델링 방법을 변형하여 적용하였다. 마지막으로 본 모델의 평가를 위해 전체 시스템의 수행시간 및 구매자 만족도를 비교 분석하였다

  • PDF

기울기 히스토그램 및 폐색 탐지를 통한 다중 보행자 추적 (Multiple Pedestrians Tracking using Histogram of Oriented Gradient and Occlusion Detection)

  • 정준용;정병만;이규원
    • 한국정보통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.812-820
    • /
    • 2012
  • 본 논문에서는 지능형 감시 시스템에 부합하는 기울기 히스토그램 및 폐색 추적을 통한 다중보행자 추적 시스템을 제안한다. 먼저, 연속 영상에서 보행자의 특징을 이용하여 보행자를 검출한다. 보행자의 특징을 획득하기 위해 HOG(Histogram of Oriented Gradient)를 기반으로 기울기의 방향성을 이용한 블록별 히스토그램을 생성하고, Linear-SVM(Support Vector Machine)의 학습을 통해 보행자만을 분류한다. 다음으로 보행자의 위치정보를 이용하여 추적을 행한다. 마지막으로 추적이 끝날 경우 내용기반 검색이 가능한 움직임 궤적 디스크립터를 생성한다. 실험을 통해 제안한 방법이 기존 방법보다 빠르고 정확한 움직임 추적에 효과적임을 증명하였다.

적응형 사용자 프로파일기법과 검색 결과에 대한 실시간 필터링을 이용한 개인화 정보검색 시스템 (PIRS : Personalized Information Retrieval System using Adaptive User Profiling and Real-time Filtering for Search Results)

  • 전호철;최중민
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.21-41
    • /
    • 2010
  • 본 논문은 다양한 사용자의 개인적 검색요구를 충족시키지 못하는 기존 검색시스템의 문제점을 해결하기 위해 사용자의 묵시적 피드백을 이용한 적응형 사용자 기호정보 기반의 개인화 검색을 실현하고, 검색결과에 대한 실시간 필터링을 통해 사용자에게 적합한 검색 결과를 제공하는 시스템을 제안한다. 기존의 검색 시스템들은 검색의도의 불확실성 때문에 사용자의 검색실패율이 높다. 검색 의도의 불확실성은 동일한 사용자가 "java"와 같은 다의어에 대해 동일한 질의어를 사용하더라도 다른 검색 결과를 원할 수 있다는 것이며, 단어의 수가 적을수록 불확실성은 가중될 것이다. 실시간 필터링은 사용자의 도메인 지정여부에 따라 주어진 도메인에 해당하는 웹문서들만 추출하거나, 적절한 도메인을 추론하고 해당하는 웹문서들만 검색 결과로 보여주는 것으로, 일반적인 디렉토리 검색과 유사하지만 모든 웹문서에 대해 이루어진다는 것과 실시간으로 분류된다는 것이 다르다. 실시간 필터링을 개인화에 활용함으로써 검색 결과의 수를 줄이고 검색만족도를 개선했다. 본 논문에서 생성한 기호정보파일은 계층적 구조로 이루어지며, 상황정보의 반영이 가능하기 때문에 의도의 불확실성을 해결 할 수 있다. 또한 사용자의 도메인별 웹문서 검색 동작을 효과적으로 추적(track) 할 수 있으며, 사용자의 기호 변화를 적절하게 알아낼 수 있다. 각 사용자 식별을 위해 IP address를 사용했으며, 기호정보파일은 사용자의 검색 행동에 대한 관찰을 기반으로 지속적으로 갱신된다. 또한 사용자의 검색결과에 대한 행동 관찰을 통해, 사용자 기호를 인지하고, 기호정보를 동적으로 반영했으며, 검색결과에 대한 만족도를 측정했다. 기호정보파일과 반영비율은 사용자가 검색을 수행할 때 시스템에 의해 생성되거나 갱신된다. 실험결과 적응형 사용자 기호정보파일과 실시간 필터링을 함께 사용함으로써, 상위 10개의 검색결과 중 평균 4.7개의 결과들에 대해 만족하는 것으로 나타났으며, 이는 구글의 결과에 비해 약 23.2% 향상된 만족도를 나타내었다.