• 제목/요약/키워드: 시간정보추출

검색결과 2,165건 처리시간 0.045초

퍼지관계곱을 이용한 정보검색시스템의 성능 개선 (Performance Improvement of Information Retrieval System by means of Fuzzy Relational Product)

  • 김창민;김용기
    • 한국지능시스템학회논문지
    • /
    • 제10권3호
    • /
    • pp.242-251
    • /
    • 2000
  • 퍼지관계 개념을 응용한 BK-퍼지정보검색기법은 형태론에 입각하는 기존의 정보검색기법과는 달리 문서와 용어의 상대적 의미에 근거한 정보검색 기법이다. 그러나 BK-퍼지정보검색기법은 높은 시간복잡도(time complexity)의 검색 연산을 내재하고 있어 실제 대용량의 정보 검색은 사실상 불가능하다. 본 논문에서는 BK-퍼지검색정보모델의 시간복잡도를 낮추기 위해, 축소용어집합(reduced term set)을 이용한 개선된 BK-퍼지정보검색모델(A-FIRM)을 제안한다. 개선된 BK-FIRM은 시스템 처리시간과 신뢰도 간 상층점(trade-off)을 제공한다. 축소용어집합은 용어집합의 부분집합으로서 검색결과의 신뢰도와 밀접한 관계를 가진다. 동일한 크기의 축소용어집합이 주어질 때, 보다 적절한 용어들로 구성된 축소용어집합이 보다 나은 검색 신뢰도를 이끈다. 따라서 보다 적절한 축소용어집합 구성을 위한 축소용어집합 추출방법이 요구된다. 본 논문에서는 축소용어집합 추출방법을 크게 무작위 추출, 규칙에 의한 추출, 인간에 의한 직관적 추출 방법으로 구분하고 검색결과의 신뢰도 변화 형태를 분석한다.

  • PDF

시간을 고려한 모바일 사용자의 유용한 행동패턴 추출 (Efficient Mining of User Behavior Patterns by Temporal Access)

  • 이승철;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.60-65
    • /
    • 2007
  • 유비쿼터스 컴퓨팅은 일상생활 속에 편재해 있는 PDA 또는 모바일 폰 등의 무선 단말기를 이용하여 사용자가 언제, 어디서나 유용한 서비스를 받을 수 있는 환경을 제공한다. 이는 대용량 데이터베이스에 저장된 지능형 멀티 모바일 에이전트의 통신 데이터를 분석하여 모바일 유저의 위치에 따른 요청된 유용한 서비스정보를 추출할 수 있게 되었으며, 이를 통한 효율적인 사용자 서비스는 물론 광고 등의 새로운 이익 창출로 이어져왔다. 그러나 기존 위치 정보만을 이용한 서비스정보의 추론은 단순히 통계적인 빈발 행동패턴만을 추출하여 시간에 따른 사용자의 서비스 요청에 능동적으로 대처할 수 없을 뿐만 아니라 원치 않는 서비스정보를 제공하는 문제점을 야기 시켰다. 이 논문에서는 시간을 고려한 모바일 사용자의 유용한 행동패턴 추출을 위한 효율적인 마이닝 기법인 시간대별 모바일 사용자 행동패턴 및 메모리 적재에 용이한 새로운 콤팩트한 데이터 구조를 제안한다. 이는 사용자의 동적인 움직임에 따른 실시간적 서비스를 가능하게 하며, 더 나아가 유비쿼터스 컴퓨팅 환경에서 중요한 이슈인 데이터의 메모리 적재가 용이 할 뿐만 아니라 접근속도의 향상 및 메모리 사용이 적다는 이점이 있다.

  • PDF

시간지원 데에터베이스에서의 시간 연관규칙 탐사 시스템의 설계 (Design of a Temporal Association Rule Mining System in Temporal Databases)

  • 이강태;정동원;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.229-231
    • /
    • 1998
  • 시간지원 데이터베이스내에는 다양한 유형의 시간 정보가 내포되어 있다. 이 논문은 다양한 시간 정보를 기반으로 하는 시간 연관규칙 탐사에 관한연구이다. 기존의 연관규칙 탐사에 관한 연구는 현실세계에 존재하는 사건을 탐사 대상으로 하면서도 시간 개념을 지니지 않은 형태의 데이터 집합을 대상으로 하고 있다. 그리고 단순히 단일 시점의 트랜잭션 시간마을 고려하여 순차패턴을 추출해내는 연구가 진행되었다. 이러한 연구는 시간 데이터의 시간 간격 특성과 시간 위상 특성을 간과하게 된다. 또한 시간 종속적인 데이터에 관한 정보의 탐사 시에는 한계점을 지니게 된다. 따라서 이 논문에서는 시간 간격과 시간 위상을 지니는 시간지원 데이터베이스로부터 추출될 수 있는 시간 정보 유형을 제시하고 이에 기반한 다양한 유형의 연관규칙을 제시한다. 또한 시간 연관규칙을 정의하고 이를 탐사하는 과정을 설명하며 궁극적으로 시간지원 데이터베이스에서의 시간 연관규칙 탐사 시스템을 소개한다.

역사객체 기반의 기계학습 기법을 활용한 웹 문서의 시간정보 추출 방안 제안 (A Proposal of Methods for Extracting Temporal Information of History-related Web Document based on Historical Objects Using Machine Learning Techniques)

  • 이준;권용진
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.39-50
    • /
    • 2015
  • 최근 검색엔진을 통한 정보검색 과정에서 특정 시구간 상황에 대응하는 문서를 검색하고자 하는 경우가 있다. 예를 들면, 임진왜란 이전의 시대적 상황과 관련된 문서를 검색하기 위해, 키워드 '임진왜란'으로 검색하면 시간에 관계없이 임진왜란 당시나 전후의 모든 문서가 검색되어 추가적인 작업이 요구된다. 또한, 역사관련 문서의 경우는 문서내용에 대응하는 시간 정보가 문서 생성시간과 일치하지 않는 경우가 대부분이다. 만약 웹 문서의 내용에 대응하는 시간 정보를 추출 할 수 있다면 효과적인 정보검색은 물론 다양한 응용에 적용 가능할 것이다. 따라서 본 논문은 문서 내용에 대응하는 시간정보 추출을 목적으로, 조선시대를 대상으로 한 역사문헌을 활용하여 조선시대 역사관련 문서의 시간추출에 대한 연구를 진행한다. 역사 문헌과 웹으로부터 수집된 역사관련 문서를 바탕으로 역사객체를 정의하고, 이를 기반으로 다양한 기계학습 기법을 활용하여 웹 문서의 시간정보 추출에 대한 가능성을 확인한다. 또한 기계학습 과정에 있어서 객체의 유사도에 기반 한 여과과정을 제안하고 이를 적용한 효율적인 시간정보 추출 및 정확도 향상에 대한 결과를 비교 분석한다.

DCT 계수를 이용한 MPEG-7 컬러 기술자의 고속 추출 (Fast MPEG-7 Color Descriptor Extraction using DCT Coefficient)

  • 배빛나라;이재욱;노용만
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.254-258
    • /
    • 2002
  • 멀티미디어의 내용 기반 검색을 위한 표준인 MPEG-7은 컨텐츠의 비주얼 내용 정보를 표현하기 위해 Part3에서 비주얼 기술자를 정의하고 있다. MPEG-7 비주얼 컬러 기술자에 의해 정의된 컨텐츠의 컬러 정보를 추출하기 위해서는 주파수 영역 정보를 공간 영역 정보로 변환해야 한다. 이때 변환 과정에서 수행되는 IDCT(Inverse DCT)의 연산 속도는 특징 추출 시간을 증가시키는 원인이 된다. 본 논문에서는 IDCT의 연산 시간을 최소화하는 방법으로 DCT 계수 영역에서 컬러 특징 정보를 빠르게 추출하는 방법에 대해 제안하였다. 제안한 방법에 대해 MPEG-7 실험 모듈과 공인 데이터 베이스를 이용하여 실험을 수행하였고 실험 결과, 검색 율이 평균 5% 감소한 반면 추출 시간은 평균 80% 향상되었다.

  • PDF

직접 융선 추출을 이용한 자동 지문 인식 시스템 (Automatic Fingerpring Identification System using Direct Ridge Extraction)

  • 배인구;조병호;김증섭;배재형;유기영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.553-555
    • /
    • 2000
  • 기존의 특징점 추출 알고리즘들은 입력 지문의 전처리, 이미지의 이진화, 세선화, 특징점 추출 등의 여러 처리 단계를 거쳐 이루어지므로 잡음등과 같은 외부적 요인과 여러 처리단계엣 발생하는 내부적 요인 등으로 왜곡 현상을 피하기 어렵고 전체 인증 시간이 길어 지는 등 성능 저해 요인이 많다. 본 논문에서는 복잡한 처리 과정을 거치지 않고 입려영상에서 집적 융선의 흐름을 추적하여 특징점들을 추출하고 매칭을 수행함으로써 이미지의 왜곡에서 오는 오류를 줄이고 처리 시간을 단축하여 기존의 시스템보다 빠른 시간에 지문을 인식하는 시스템을 설계 및 구현한다.

  • PDF

규칙 기반 한국어 시간 정보 추출 (Rule-Based Temporal Information Extraction for Korean)

  • 정영섭;도효진;임준호;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.242-246
    • /
    • 2014
  • 웹을 비롯한 다양한 곳에서 기하급수적으로 증가하고 있는 문서들로 인해, 자연어 텍스트로부터의 지식추출의 중요성이 점차 커지고 있다. 이 연구에서는 한국어로 작성된 자연어 텍스트로부터의 시간 정보 추출을 위해 개발된 시스템을 소개하고, 직접 구축한 한국어 데이터셋에 대한 성능 분석을 제공한다. 이 시스템은 사람이 직접 작성한 규칙들에 기반하여 작동하지만, 질의응답시스템 등에 적용될 수 있는 수준의 성능으로 향상시키기 위해 기계학습 기반의 시스템으로 업그레이드하는 등의 작업을 계속할 것이다.

  • PDF

시간 정보와 공간 정보를 이용한 객체 추출 (Object Segmentation using Temporal and Spatial Information)

  • 김창근;유재명;이귀상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.766-768
    • /
    • 2004
  • 동영상에서 객체의 추출은 객체 단위로 압축하는 MPEG-4와 객체의 특성을 기술하고 유사한 영상을 검색하는 기능을 가진 MPEG-7에 기반 기술로, 동영상의 효과적인 압축 및 색인, 검색에 유용하게 사용되는 방법이다. 본 논문에서는 시간적 정보와 공간적 정보를 이용한 영상 분할 방법을 제시한다. 동영상은 배경 화면과 전방 객체로 이루어져 있는데, 여기서 프레임간 모션벡터로 글로벌영상(배경영상)의 움직임을 분리할 수 있다. 이 Motion-based Segmentation을 통해 배경과 전방객체를 분리하여 rough한 전방객체를 추출하게 된다. 그리고 시간적 분할을 통해 얻은 rough한 전방객체에 모폴로지 변환과 Watershed 알고리즘을 적용하여 배경과 전방객체의 모호한 부분을 제거함으로써 효과적으로 전방객체를 추출한다.

  • PDF

카이제곱 통계량을 이용한 이슈 단어 추출 (Issue Word Extraction Using Chi-square Statistics)

  • 신준수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-227
    • /
    • 2014
  • 최근 온라인 뉴스는 대중의 관심사 및 트렌드에 따라서 다양한 종류의 기사들이 작성된다. 이러한 관심사 및 트렌드는 시간의 흐름에 따라 계속 변한다. 본 논문에서는 온라인 뉴스의 기사 제목을 이용하여 시간에 따라 변하는 관심사 및 트렌드와 관련된 단어를 추출하는 방법을 제안한다. 특정 기간 별 출현하는 뉴스들을 하나의 카테고리로 가정하고 자질 선택 방법에서 널리 사용되는 카이제곱 통계량을 이용하여 각 카테고리의 주요 단어를 추출한다. 실험 결과 특정 기간 별 관심사 및 트렌드와 관련된 단어들이 출현하는 것을 확인하였다.

  • PDF

사전 정보를 이용한 자동차 번호판의 문자 위치 추출과 세그멘테이션에 관한 연구 (A Study of plate Number Extraction and Segmentation using domain Knowledge)

  • 김병훈;고미애;김영모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2003
  • 차량 번호판 인식 시스템의 번호판 인식과정은 영상획득 및 번호판 영역 추출, 개별문자 추출, 문자 인식의 3가지 핵심부분으로 구성된다. 이 중에서도 번호판 추출의 정확성은 시스템 전체의 결과에 영향을 줄 수 있는 부분이며 다양한 주변 환경에도 정확한 추출과 빠른 수행 시간을 요구한다. 본 논문에서는 검출 시간의 단축을 위하여 명암값의 차이와 사전정보를 이용하여 먼저 인식대상의 주목표인 등록번호의 위치를 추출 및 검증하고 등록번호에 대한 지역명의 상대적인 위치 정보를 이용하여 문자의 대략적인 위치를 선정, 각 요소들의 외곽 근접 선들의 투영(protection)과 이동을 통하여 번호판의 모든 문자 요소의 위치를 추출한다.

  • PDF