• 제목/요약/키워드: 텍스트 검색

검색결과 684건 처리시간 0.029초

내용기반 질의 처리하기 위한 XML Mediator (Design XML Meidator for Content-based Query Processing)

  • 유광열;김흥식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.47-50
    • /
    • 2001
  • 최근 인터넷의 발전으로 방대한 정보가 존재함에 따라 이들 정보들을 통합 관리할 필요성이 증대하고, 웹 검색 시스템의 서비스가 텍스트 뿐만 아니라 이미지나 사운드 데이터와 같은 멀티미디어 정보까지 보편화되어 검색의 결과로 서비스를 제공하고 있다. 기존의 검색결과를 보면 멀티미디어 데이터에 대한 검색결과는 부가적 정보로서 서비스를 제공하기 때문에 검색 결과에 대해서도 정확한 결과에 대한 서비스를 제공하지 못하고 있다. 본 논문에서는 XML기반에서 멀티미디어 데이터 소스에 대한 메타데이터를 DTD로 설계하여 내용기반 질의를 효과적으로 분산처리 할 수 있도록 Mediator를 설계한다.

  • PDF

동영상 자료의 효과적인 관리를 위한 검색시스템에 관한 연구 (A Study on the Video Information Retrieval System for Effective Management of Video data)

  • 민인식;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.213-216
    • /
    • 2001
  • 국방부문에 있어 항공에서 촬영되는 동영상들은 정보분석 측면에서 수많은 자료를 제공하고 있다. 그러나 이러한 자료는 Off-Line 상태에서 또는 국한된 네트웍에서 다루어지고 있으며, 비직관적인 텍스트 위주의 데이터로 가공되어 전파됨으로써 정보를 필요로 하는 여러 부대에 효과적으로 제공되지 못하고 있다. 본 연구에서는 항공에서 촬영된 동영상 정보를 디지털화하여 관리하기 위하여 동영상을 정보 분석 자료와 유기적으로 결합시킨 데이터베이스로 관리하고 이러한 정보를 국방망등의 인트라넷에서 이용하기 위해 자료요구 부대에서 효율적으로 동영상을 검색할 수 있는 동영상 정보 시스템을 설계하였다. 동영상 정보시스템은 검색의 다양성과 정확성을 위해 주석기반의 검색과 내용기반의 검색을 지원하는 시스템으로 설계하였다.

  • PDF

온톨로지 기반 지식 검색 시스템 개발: KT 콜센터 사례 (Development of an ontology-based knowledge search system: The case of KT call center)

  • 안세열;최현식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.576-579
    • /
    • 2010
  • 콜센터의 고객문의는 복잡하여 기존 검색 시스템으로는 고객의 문제점을 신속하게 찾아 상담에 적용하는데 문제가 많았다. 온톨로지를 구축하고 시맨틱 검색을 제공할 경우 보다 보다 좋은 검색 기능을 제공할 것으로 기대되나 콜센터의 상담지식은 내용이 매우 복잡하여 그 텍스트의 내용을 완벽하게 온톨로지로 표현하는 것은 쉽지 않았다. 본 논문에서는 온톨로지 기반으로 구축된 지식베이스의 데이터 검색과 함께 그와 가장 관련성이 높은 문서를 출력하기 위해 문서를 온톨로지와 링크하여 어노테이션하는 방법을 제안한다. 본 시스템을 적용한 상담에서 상담원들의 생산성이 향상되고 고객 만족도를 높이는 결과를 확인했다.

WWW상에서 음란물 검색기법 (Obscene Material Searching Method in WWW)

  • 노경택;김경우;이기영;김규호
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.1-7
    • /
    • 1999
  • WWW은 기존의 인터넷이 단순 문자 자료 중심의 데이타 교환을 멀티미디어화 하기 위한 프로토콜이며, 자료들을 하이퍼텍스트 형태로 저장함으로써 초보자들도 쉽게 원하는 자료를 찾고, 접근할 수 있도록 되어있다. 이러한 WWW의 멀티미디어 데이타의 검색 및 접근의 용이성은 음란물 데이타가 보편화, 멀티미디어화 되는데 결정적인 역활을 하였으며, 음란물의 상업화를 가능케 하는 사회적 문제를 야기하였다. 한편, 이러한 문제를 해결하기 위해 음란물을 제공하는 사이트를 효율적으로 차단하기 연구가 활발하게 진행되고 있다. 본 논문에서는 이러한 음란물을 제공하는 사이트를 효율적으로 검색하여, 미성년자의 음란성 사이트접근을 차단하기 위한 기법을 제시하고 이를 구현하였다. 제안된 기법은 링크를 기반으로 정보 검색 기능을 수행하며, 가장 정확한 결과를 보여 주는 것으로 알려진 확률 모델과 비교한 결과 제안된 모델(Link-Based Model)이 확률 모델보다 평균 재현율과 정확율에서 12%와 8% 성능이 우수하였다. 특히 텍스트 이외의 데이타와 적은 링크를 가진 문서들을 검색하는데 크게 효율성이 향상되었다.

  • PDF

CORBA기능을 이용한 정보검색시스템 통합에 관한 연구 (A Study on Information Retrieval Systems Integration Using Common Object Request Broker Architecture)

  • 최한석;김상미;남태우;손덕주
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.223-242
    • /
    • 1996
  • 본 논문에서는 정보검색을 원하는 이용자들에게 시스템 및 DBMS의 이형성, 서로 다른 검색시스템 사용에 관계없이 단일 사용자 인터페이스를 통해 일관성 있는 질의 및 검색결과를 제공할 수 있는 CORBA기반의 정보검색시스템(DDIR/ORB) 통합모델을 제안한다. 본 논문에서 제안한 DDIR/ORB는 질의를 요구한느 클라이언트와 검색을 실행하는 응용서버 사이에 미들웨어베이스와 CD-ROM 텍스트 데이터베이스에 대한 접근 투명성을 보장하고 정보검색 결과에 대한 자유로운 데이터 교환 및 변환을 제공하며, 기존의 정보검색시스템의 재사용을 보장한다. DDIR/ORB 시스템 설계 및 구현에서 OMG IDL을 사용함으로써 인터페이스 복잡도가 감소되었고 구성요소들의 구현 비용을 최소화하였다.

  • PDF

텍스타일 영상의 내용과 메타데이터의 결합을 통한 검색 (Image retrieval integrated image contents and metadata)

  • 권혜영;김근하;김하얀;이경미;박우창;이은옥
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.465-469
    • /
    • 2007
  • 본 논문에서는 텍스타일 영상의 내용 데이터와 메타데이터를 결합시킨 영상 검색 시스템을 제안한다. 섬유 패션의 정보를 가지고 있는 메타데이터와의 결합은 그 동안의 섬유 패션 산업과 관련된 영상 검색 시스템에서 진보된 것이다. 우선 메타데이터의 정보를 통해서 영상을 검색하게 된다. 검색된 영상 안에서 색상히스토그램과 색상스케치를 통하여 주어진 영상과 비슷한 영상들을 검색하게 된다. 이러한 방법은 영상내용만을 통해 검색했던 것 뿐만아니라 텍스트가 가지고 있는 의미를 보안하여 보다 효과적인 검색을 할 수 있었다. 본 논문에서 제안된 시스템에서 부가적인 기능인 돋보기 기능, 색상 히스토그램 기능, 색상 스케치 기능, 반복 패턴 보기 기능을 통해 검색된 영상들의 정보를 효과적으로 제공함으로써 사용자의 편의를 강화하였다.

  • PDF

자동차 전조등 영상검색을 위한 향상된 유효 특징 추출 방법 (The Advanced Effective Feature Extraction for Image Retrieval of an Automobile Head Lamp)

  • 손병환;이병일;손성건;최흥국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.261-264
    • /
    • 2002
  • 자동차 전조등에서 나오는 데이터는 다양한 패턴을 가지는 영상자료와 부분적으로 보이는 문자자료이다. 내용기반 영상검색을 통해 자동차 전조등에서 검사자가 판독하는 텍스트와 부분적인 전조등의 영상정보로 차량의 정보를 추출하기 위한 검색 방법을 국립과학수사연구소의 자료를 기반으로 설계하였으며, 영상검색에 사용된 영상특징값의 구성과 영상 검색방법을 연구하였다. 본 논문에서는 영상데이터의 검색을 위해 효과적인 영상특징이 추출 되도록 향상된 방법론을 제시하였다. 특징함수에 대한 유효성 검증을 위해 샘플 영상에서 각 후보 특징함수들에 대한 결과값들을 비교하였으며, 이를 기반으로 유효한 특징함수를 찾아서 검색에 사용되어지도록 구성하였다. 사용되어진 영상의 특징값은 전조등 영상이 가지는 다수의 텍스쳐함수와 가로, 세로 성분값을 사용하였다. 영상 검색을 위해 추출된 영상 특징값을 데이터베이스화하고 용의차량의 전조등 영상을 질의 영상으로 하여 후보 차량에 대한 정보를 검색하도록 하였다.

  • PDF

정보검색관리시스템 KRISTAL-2001 (Information Retrieval Management System KRISTAL-2001)

  • 진두석;서정현;최윤수;최성필;김광영
    • 지식정보인프라
    • /
    • 통권7호
    • /
    • pp.32-43
    • /
    • 2001
  • 정보화사회에 있어서 인간의 지적 활동에 필수적인 요소는 과학기술에 의존한 정보의 수집과 축적 및 검색과 이용이라고 할 수 있다. 이러한 요구에 따른 다양한 형태의 정보나 데이터를 효율적으로 구축, 유지, 운영할 수 있는 정보 검색시스템 개발의 중요성이 점차 증가하고있다. 특히, 웹과 컴퓨터의 보급이 확산됨에 따라 수많은 전자문서들이 생산되면서 기존의 검색시스템의 기능, 즉 정형적인 텍스트문서에 대한 단순한 불리언질의만으로는 사용자의 요구를 충족시킬 수 없게되었다. 따라서, 본 논문에서는 이러한 사용자 요구를 빠르고 정확하게 처리하기 위해 기존의 정보 검색시스템인 "KRISTAL-2001"의 특징은 저장엔진, 시스템제어기, 검색기, 색인기, 분산엔진 모듈이 각각 서버 역활을하며 통신을 통하여 상호간의 정보를 전달한다. 따라서 분산검색을 통한 빠른 질의처리가 가능하다는 장점을 가지고 있다. 그리고 문서 또는 문서그룹단위의 트랜잭션처리를 지원하기 때문에 데이터의 안정적인 저장 및 수정을 보장한다. 또한 구조문서, 멀티미디어 데이터등 다양한 형태의 데이터를 관리할 수 있기 특징을 가지고 있다. KRISTAL-2001은 순수 국내기술로 개발된 대용량 데이터를 위한 차세대 정보검색시스템으로서 국제 경쟁력 향상에 중요한 역할을 수행할 것으로 기대된다.

  • PDF

미디어 창작을 위한 비디오 아카이브 키워드기반 내용 검색 서비스 요구사항 분석 (Analysis of Keyword-based Content Search Service Requirements in Video Archive for Media Creation)

  • 정병희;박완;이윤성;이하주;김산성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1265-1267
    • /
    • 2022
  • 방대한 분량의 콘텐츠 홍수 속에서 원하는 소재를 찾기 위해 콘텐츠 내용을 검색할 수 있는 효과적인 방법이 지원되는 것은 창작을 자유롭게 하고, 콘텐츠 활용도를 높이기 위해 매우 중요하다. KBS 바다 서비스의 경우 분류체계 방법을 사용하고 있으나. 최근 딥러닝을 이용한 인공지능 기술의 발전으로 콘텐츠의 내용을 인공지능 기술로 태깅하고, 태깅된 텍스트 정보를 이용하여 검색할 수 있는 기술 개발이 활발히 수행되고, 국가적으로도 해당 기술을 지원하고 있다. 본 논문에서는 이러한 기술 개발의 선행 요소인 방송사의 제작과정에서 요구되는 동영상 소재 콘텐츠 검색의 요구사항을 KBS 비디오 아카이브 검색 키워드 실제 사용 데이터를 이용하여 분석하였다. 약 1,000여건의 검색 키워드 분석과 이용자와 운영자의 응답 내용을 고찰한 결과, 특정 키워드에 집중하여 검색할 수 있도록 보완하여 주는 것이 필요함을 알아내었다. 또한, 검색 범위를 효과적으로 축소하여 검색을 손쉽고 빠르게 할 수 있는 방법을 고찰하였다. 본 논문에서는 미디어 창작에서 필요한 소재 콘텐츠를 찾기 위해 연구 개발해야 할 미디어 속성 추출 기술의 방향성을 제시하였다.

  • PDF

웹 컨텐츠의 분류를 위한 텍스트마이닝과 데이터마이닝의 통합 방법 연구 (Interplay of Text Mining and Data Mining for Classifying Web Contents)

  • 최윤정;박승수
    • 인지과학
    • /
    • 제13권3호
    • /
    • pp.33-46
    • /
    • 2002
  • 최근 인터넷에는 기존의 데이터베이스 형태가 아닌 일정한 구조를 가지지 않았지만 상당한 잠재적 가치를 지니고 있는 텍스트 데이터들이 많이 생성되고 있다. 고객창구로서 활용되는 게시판이나 이메일, 검색엔진이 초기 수집한 데이터 둥은 이러한 비구조적 데이터의 좋은 예이다. 이러한 텍스트 문서의 분류를 위하여 각종 텍스트마이닝 도구가 개발되고 있으나, 이들은 대개 단순한 통계적 방법에 기반하고 있기 때문에 정확성이 떨어지고 좀 더 다양한 데이터마이닝 기법을 활용할 수 있는 방법이 요구되고 있다. 그러나, 정형화된 입력 데이터를 요구하는 데이터마이닝 기법을 텍스트에 직접 적용하기에는 많은 어려움이 있다. 본 연구에서는 이러한 문제를 해결하기 위하여 전처리 과정에서 텍스트마이닝을 수행하고 정제된 중간결과를 데이터마이닝으로 처리하여 텍스트마이닝에 피드백 시켜 정확성을 높이는 방법을 제안하고 구현하여 보았다. 그리고, 그 타당성을 검증하기 위하여 유해사이트의 웹 컨텐츠를 분류해내는 작업에 적용하여 보고 그 결과를 분석하여 보았다. 분석 결과, 제안방법은 기존의 텍스트마이닝만을 적용할 때에 비하여 오류율을 현저하게 줄일 수 있었다.

  • PDF