• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.037초

비정상 문자 조합으로 구성된 스팸 메일의 탐지 방법 (An Approach to Detect Spam E-mail with Abnormal Character Composition)

  • 이호섭;조재익;정만현;문종섭
    • 정보보호학회논문지
    • /
    • 제18권6A호
    • /
    • pp.129-137
    • /
    • 2008
  • 인터넷의 활용도가 높아짐에 따라, 스팸메일이 전체 메일에서 차지하는 비중이 점점 커지게 되었다. 전체 인터넷 자원에서 필요에 의해 사용되는 메일의 기능보다, 주로 광고나 악성코드 등의 전파를 위한 목적으로 사용되는 메일의 비중이 점점 커지고 있으며, 이를 방지하기 위한 컴퓨터 및 네트워크, 인적자원의 소모가 매우 심각해지고 있다. 이를 해결하기 위해 스팸 메일 필터링에 대한 연구가 활발히 진행되어 왔으며, 현재는 문맥상의 의미는 없지만 가독상에서 의미를 해석할 수 있는 문장에 대한 연구가 활발히 이루어지고 있다. 이러한 방식의 메일은 기존의 어휘를 분석하거나 문서 분류 기법 등을 이용한 스팸 메일을 필터링 방법을 통해 분류하기 어렵다. 본 연구는 이와 같은 어려움을 해결하기 위해 메일의 제목에 대한 N-GRAM 색인화를 통해 베이지안 및 SVM 을 이용하여 스팸 메일을 필터링 하는 방법을 제안한다.

동영상 데이터에서 조명 보정을 사용한 관심 영역의 획득 (Acquisition of Region of Interest through Illumination Correction in Dynamic Image Data)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.439-445
    • /
    • 2021
  • 영상 센서 및 소형 디스플레이의 발달로 가능해진 저가의 고속 카메라는 영상처리 및 패턴인식 분야에서 유용하게 활용될 수 있다. 본 논문에서는 약간의 시차를 두고 연속적으로 입력되는 고속의 영상으로부터 불규칙적인 조명을 보정한 다음, 조명이 보정된 영상으로부터 사람의 관심 영역인 노출된 피부 색상 영역을 획득하는 알고리즘을 소개한다. 본 연구에서는 먼저 받아들인 고속의 영상으로부터 비 균일하게 발생된 조명적인 효과를 프레임 블렌딩 기법을 사용하여 보정한다. 그런 다음, 사전에 반복적인 학습으로 생성된 타원형의 피부 색상 분포 모델을 적용하여 입력된 고속의 컬러 영상으로부터 관심 영역을 강인하게 획득한다. 실험 결과에서는 본 논문에서 제시된 접근 방법이 입력되는 컬러 영상으로부터 조명을 보정한 다음 관심 영역을 정확하게 획득한다는 것을 보여준다. 본 연구에서 제안된 알고리즘은 얼굴 인식 및 추적, 조명 보정 및 제거, 동영상 색인 및 검색 등과 같은 영상 인식과 연관된 다양한 종류의 실제적인 응용 프로그램에서 매우 유용하게 이용될 것으로 추측된다.

Identification and Analysis of Author's Institution in Korean Journal Papers for the Decision Support in Disaster Situations

  • Kim, Byungkyu;You, Beom-Jong;Shim, Hyoung-Seop
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.85-97
    • /
    • 2021
  • 본 논문에서는 재난 상황에서의 신속하고 효과적인 의사결정 및 대응을 지원하기 위하여 학술 연구 논문의 저자소속 기관을 식별하고 이를 바탕으로 협업관계 분석연구를 수행하였다. 이를 위해 국내 학술지 69종에 수록된 재난안전유형 논문 2,308건을 대상으로 KISTI의 한국과학기술인용색인데이터베이스와 기관식별데이터를 기반으로 실험데이터를 구축하였다. 협업관계 분석은 기관, 기관유형, 기관지역, 대학기관의 단위별로 출현빈도 등의 통계 현황을 비교 분석하고, 사회네트워크분석 기법을 사용하여 각각의 동시출현 네트워크의 기본 속성과 주요 중심성 지수를 산출하고 분석하였다. 또한 단위별 네트워크 협업관계를 전체적으로 조망할 수 있도록 시각화 맵을 생성 및 제시하였다. 본 연구의 결과는 효과적인 재난 대응을 지원하는 기관 및 협업 그룹의 탐색 활동과 관련 정보서비스체계 기반 마련에 기여할 수 있을 것으로 기대된다.

특수 영상에서 비디오 요약을 위한 장면 전환 검출 알고리즘 (Scene Change Detection Algorithm for Video Abstract on Specific Movie)

  • 정명범;김재경;고일주;장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.65-74
    • /
    • 2009
  • 장면 전환 검출은 영상 정보의 색인 및 검색을 위한 전처리로서 비디오 검색 시스템의 전체 성능을 좌우하는 중요한 기술이다. 기존의 장면 전환 검출은 인접한 프레임간에 픽셀 값, 히스토그램 차이 등의 단일 특징을 이용하거나, 단일 특징들을 혼합하여 상호 보완 관계를 갖는 다수의 특징을 이용하여 장면 전환점을 검출하였다. 그러나 기존 방식은 적외선 촬영이나, 야간 촬영과 같이 특수한 영상에서 현저히 낮은 정확성을 갖는다. 따라서 본 논문에서는 Color 히스토그램 특징과 KLT 알고리즘을 혼합하여 특수 영상에서 보다 효과적인 장면 전환 검출 방법을 제안한다. 제안방법의 성능을 확인하기 위해 특수 영상에 대하여 Color 히스토그램을 이용한 검출과 KLT를 혼합한 검출을 실험하였으며, 그 결과 제안한 기법이 기존 방법보다 성능평가지수에서 평균 11.4%의 성능이 향상됨을 알 수 있었다.

텍스트마이닝을 활용한 국내외 기록서비스 연구동향 분석 (Analysis of Research Trends on Archival Information Services Using Text Mining)

  • 박서희;이혜은
    • 한국기록관리학회지
    • /
    • 제24권1호
    • /
    • pp.89-109
    • /
    • 2024
  • 본 연구는 국내외 기록정보서비스의 연구 동향을 분석한 것으로 2003년부터 2022년까지 한국학술지인용색인(KCI)에 수록된 학술논문 136편과 LISTA(Library, Information Science & Technology Abstracts)에 수록된 학술논문 74편을 대상으로 연도별, 연구 유형별, 연구자 유형별, 연구 대상별, 연구목적별 현황을 살펴보았다. 또한 텍스트마이닝 기법을 적용하여 빈도분석, 동시출현 빈도분석, 중심성분석, 토픽모델링을 진행하였다. 연구의 결과 국내 논문은 특정 기관이나 기록물에 집중되었고 이용자 중심의 만족도조사 연구, 콘텐츠 중심의 연구 등이 진행되었다. 국외논문은 아키비스트와 이용자 간의 관계를 연구하는 흐름과 함께 평가 중심의 연구, 자료·자원·컬렉션 등의 정보제공 연구가 다수 진행되었음을 확인하였다. 정보자원의 관리는 국내외 논문 공통의 토픽으로 확인되었으나 국내는 정보자원의 품질 유지를, 국외는 정보의 저장과 검색에 집중된 연구 흐름을 파악할 수 있었다.

OPAC에 있어서 키워드/불연산자 탐색에 대한 이용자 지식수준 연구 (Knowledge Level of Users of Keyword/Boolean Searching on an Online Public Access Catalog : SELIS)

  • 구본영
    • 한국문헌정보학회지
    • /
    • 제32권4호
    • /
    • pp.249-274
    • /
    • 1998
  • SELIS(SEoul Women's University Library and Information System) OPAC에 대한 이용자의 키워드/불연산자 탐색의 지식수준을 알아보기 위하여 4가지 사항에 따라 질문지의 결과를 분석하였다. 분석한 결과를 보면 SELIS OPAC 이용시 키워드 탐색에서 불연산자의 사용이 쉽다고 생각하고 불연산자의 사용으로 검색결과를 만족하는 이용자는 그렇지 않다고 응답한 이용자 보다 키워드/불연산 탐색의 지식수준이 높은 것으로 요약할 수 있다. 설문문항에서 제시한 지식은 키워드 탐색의 특성(단일 키워드 사용, 2개 이상의 키워드 사용), 키워드 탐색 시 불연산자의 사용, 색인에 대한 지식, 불용어 리스트에 대한 지식(비통제 용어) 키워드 탐색기법(전방일치, 우측절단). 불연산자의 올바른 사용, 키워드의 브라우징으로 주제어 선정에 관한 것이다. 앞에서 제시한 이러한 지식들은 OPAC의 키워드/불연산자 탐색에서 중요한 요소로 볼 수 있다. 성공적인 탐색을 위해서는 정보검색과정에 대한 개념적인 지식 즉, 정보요구를 탐색 가능한 질의어로 바꾸는 것과 주어진 시스템에서 질문의 결과를 얻는 방법에 대한 어의적인 지식(시스템의 특징을 어떻게 언제 이용할 것인가 하는 지식) 그리고 이용자의 질문에 대한 과학적인 기술 즉, 기본적인 컴퓨터 기술과 상세한 탐색문을 작성하는 구문론적인 지식이 요구된다. 그러나 지금까지 이용자에 대한 온라인목록 탐색의 중요한 지식으로 간주해온 것은 과학적인 기술방법에 관한 지식에만 치중하고 어의적인 지식, 개념적인 지식을 강조하는 것은 부족하였다. 따라서 온라인목록 이용에 관한 교육을 너무 과학적인 기법에만 치중할 것이 아니라 어의적 지식, 구문에 관한 기술과 개념적인 지식 교육에 초점을 맞추어야 할 것이다.

  • PDF

특징의 효과적 병합에 의한 광고영상정보의 분류 기법 (A Grouping Method of Photographic Advertisement Information Based on the Efficient Combination of Features)

  • 정재경;전병우
    • 전자공학회논문지CI
    • /
    • 제48권2호
    • /
    • pp.66-77
    • /
    • 2011
  • 본 논문은 특징을 효과적으로 병합하여 계층적 색인구조를 적용하는 광고영상의 분류기법에 대한 체계적 방법을 제안한다. 본 방법은 온라인 및 오프라인 상의 광고 영상 정보 관리를 위한 효과적인 응용으로써, 특별히 광고 영상정보의 추적을 위한 전처리 과정을 제공한다. 이를 위하여 전체 영상에 대한 일반적 정보를 포함하는 전역특징과 영상의 지역적 특성에 기반하는 지역특징을 고려한다. 고안된 지역특징은 영상 회전, 스케일링, 잡음추가, 빛의 변화에 불변하여 아핀(Affine) 변환에 의한 화면 차 영상에 대하여도 신뢰성 높은 매칭 도를 얻을 수 있고 동질의 영상 쌍을 검색하는데 있어서도 높은 정확도를 보여준다. 제안 방법은 우선 전역특징으로 전체영상자료에서 다수의 영상 쌍들로 개략적인 영상 군을 구성한 후에, 영상군안에서 지역특징에 의한 동질 영상 쌍들 즉 정밀한 영상 군들로 분리하는 정밀 매칭을 실행한다. 실행시간을 단축하기 위해 전형적인 클러스터링으로 전역특성이 유사한 영상들끼리 그룹화 함으로서 지역특징에 의한 동질 영상 쌍 간 과도한 매칭 시간의 문제점을 극복한다.

새로운 비디오 자막 영역 검출 기법 (A new approach for overlay text detection from complex video scene)

  • 김원준;김창익
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.544-553
    • /
    • 2008
  • 최근 영상 편집 기술의 발달과 더불어 시청자의 이해를 돕기 위해 인위적으로 자막을 삽입하는 경우가 늘고 있다. 인위적으로 삽입된 자막은 해당 장면의 내용이나 편집자의 의도를 잘 표현하고 있기 때문에 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에 유용하다. 기존의 자막 영역 추출 방법은 에지(edge), 색상(color), 텍스처(texture) 정보와 같은 하위 계층(low-level) 특징을 기반으로 하기 때문에 다양한 필체나 밝기 대비를 가진 자막이 동시에 나타나거나 복잡한 배경에 포함된 자막 영역의 경우 잘 검출하지 못한다. 이에 본 논문은 기존의 방법과는 전혀 다른 천이 영역 기반의 새로운 영상 내 자막 영역 검출 기법을 제안하고자 한다. 먼저, 영상 내 삽입된 글자 주변은 시청자에게 영상으로부터의 높이 감을 주기 위해 해당 글자와 다른 색으로 표현된다는 관찰 결과를 바탕으로 천이 지도를 생성한다. 생성된 천이 지도를 이용하여 후보 영역을 추출하고 상태 밀도 개념을 바탕으로 후보 영역 중에서 삽입된 자막 영역을 추출한다. 제안하는 알고리즘은 글자 색, 크기, 위치, 필체, 밝기 대비에 관계없이 적용이 가능하며, 다양한 언어에 관계없이 뛰어난 성능을 보인다. 또한, 프레임 간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

영상의 에지 특징정보를 이용한 주석기반 및 내용기반 영상 검색 시스템의 구현 (Implementation of Annotation-Based and Content-Based Image Retrieval System using)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.510-521
    • /
    • 2001
  • 영상은 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 영상을 검색하기 위해 영상의 정확한 특징정보를 추출하여 검색 시스템을 구축하여야 한다. 영상 검색 시스템은 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 영상 검색 시스템에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 영상 데이타베이스 생성기법과 효율적인 검색 기법이 필요하다. 본 논문에서는 입력 영상으로부터 검색에 상용되는 에지 특징정보 추출을 위해 라플라시 안마스크와 입력 영상을 컨벌루션하여 에지의 외곽선 데이타를 추출하였으며, 그리고 추출한 에지 특징정보와 메타데이타로 영상 데이타베이스를 생성하여 신속하고 효율적으로 영상을 검색할 수 있도록 주석기반 및 내용기반 영상 검색 시스템을 구현하였다. 주석기반 및 내용기반 영상 검색 시스템은 영상의 하위 레벨에 표현된 내용기반 에지 특징정보와 특징정보 추출이 어려운 상위레벨에 표현된 주석기반 에지 특징 정보를 영상의 색인으로 구성하여 사용하기 때문에 영상 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 영상 검색 시스템은 메타데이타에 의해 영상 데이타베이스를 구축하므로 정확한 영상 컨텐츠 정보의 축적관리와 영상의 정보공유 및 재이용이 가능하다.

  • PDF

유비쿼터스 센서 네트워크를 위한 이벤트 처리 기법에 관한 연구 (A study on the event processing methods for ubiquitous sensor network)

  • 조양현;박용민;김현규
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.137-147
    • /
    • 2013
  • RFID(Radio Frequency Identification)와 WSN(Wireless Sensor Network)은 기술적 유사성과 상호 영향에도 불구하고 별개의 연구로 인식되었으며 RFID와 WSN의 기술적인 융합에 대한 연구는 미비한 수준이다. 이러한 문제점을 인식한 EPCglobal에서는 국제 표준인 EPCglobal Network를 기반으로 RFID와 WSN 기술을 효율적으로 통합/연동할 수 있는 EPC(Electronic Produce Code) 센서 네트워크를 제안하였다. 제안된 EPC 센서 네트워크는 미들웨어에서 복합 이벤트 처리(Complex Event Processing) 기법을 이용하여 RFID와 WSN을 통해 발생되는 데이터를 단일 환경에서 통합하고, 발생된 이벤트를 EPC global Network를 기반으로 연동하는 기술이다. 하지만 이러한 EPC 센서 네트워크는 미들웨어에서 복합 이벤트를 검출하기 위해 복합 이벤트를 구성하는 모든 기본 이벤트가 발생하지 못하는 경우에도 계속적인 검사를 수행하기 때문에 연산 비용이 증가되는 문제점이 있다. 이러한 EPC 센서 네트워크의 문제점들을 해결하기 위하여 본 논문에서는 미들웨어에서 복합 이벤트의 최소 조건을 정의하고 조건을 만족하는 경우에만 복합 이벤트를 검출하는 알고리즘을 제안하였다. 복합 이벤트의 최소 조건을 검사하기 위하여 인덱스 기반의 질의 색인을 사용하여 복합 이벤트를 추출한다. 제안하는 인덱스 기반의 복합 이벤트 검출 알고리즘은 기존의 검출 알고리즘과 NS2 시뮬레이션을 이용하여 성능 평가를 수행하여 복합 이벤트를 검출하는 시간에서는 기존 알고리즘과 비교하여 평균 6.8msec 적게 나타났으며, 검출에 필요한 연산수는 기존 알고리즘과 비교하여 평균 226개로 적은 연산 수를 나타내었다. 결과적으로 기존 알고리즘에 비해 복합 이벤트 검출을 위해 제안하는 알고리즘이 우수한 성능을 나타내었다.