• 제목/요약/키워드: 내용 기반 필터링

검색결과 140건 처리시간 0.027초

사용자와 상품의 특성을 이용한 개인화 추천 시스템 (Personalized Recommendation System Using User and Item Properties)

  • 김윤혜;오제환;이은석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.782-784
    • /
    • 2008
  • 급속하게 확산된 비즈니스 웹 사이트로 인해 웹상에 상품의 정보가 기하급수적으로 증가하여 정보 과부하 문제가 발생하였다. 이를 극복하기 위해 내용 기반 추천 시스템, 협업 필터링 추천 시스템 등의 개인화 추천 시스템이 발전했으나 사용자의 성향과 아이템의 성향을 반영하지 못하고 있다. 본 연구에서는 웹상에서 사용자의 행동을 관찰하여 상품의 구매경로와 판매의 상관관계에 따라 각 사용자의 성향과 그룹의 성향, 아이템의 성향을 측정한 뒤 벡터의 내적을 이용하여 사용자의 성향에 가장 적합한 상품의 유사도를 계산하고 추천하는 시스템을 제안한다.

동영상 내용 분석을 위한 관심 객체 추출 (Segmentation of Objects of Interest for Video Content Analysis)

  • 박소정;김민환
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.967-980
    • /
    • 2007
  • 동영상에서의 관심 객체를 추출하는 것은 비디오 내용 분석과 비디오 검색 및 압축의 성능을 개선시키는데 큰 역할을 한다. 관심 객체는 단순히 사람 눈의 시선을 끄는 대상물이 아니라 내용전개의 중심이 되거나 제작자가 표현하려고 하는 핵심 객체를 의미한다. 이러한 관심 객체는 움직이는 객체뿐만 아니라 정지해 있는 객체도 될 수 있으나, 사람의 관심을 절차적으로 표현하는 것이 어렵기 때문에 관심 객체를 명확하게 정의하기가 곤란하다. 이에, 본 논문에서는 동영상 샷에서의 움직이는 객체의 위치, 크기, 움직임 패턴의 변화에 대한 조건을 정의하여 필터링에 의해 사람의 관심을 끄는 움직임 관심 객체를 추출하는 방법을 제시하고, 아울러 동영상 샷에서 정지되어 있는 객체에 대해서도 컬러/텍스처 특이성, 위치, 크기, 출현 빈도 등에 대한 조건을 정의하여 정지 관심 객체도 추출할 수 있는 방법을 제안한다. 제안한 방법을 50개의 동영상 샷에 대하여 실험한 결과, 사람이 선정한 움직임 및 정지 관심 객체를 84% 정도 추출할 수 있음을 확인할 수 있었다.

  • PDF

가사의 감정 분석과 구조 분석을 이용한 노래 간 유사도 측정 (Similarity Evaluation of Popular Music based on Emotion and Structure of Lyrics)

  • 이재환;임혜원;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권10호
    • /
    • pp.479-487
    • /
    • 2016
  • 음악 스트리밍 서비스의 대중화로 음악의 소유 없이 언제든 원하는 듣고 싶은 노래를 들을 수 있게 되었다. 넓어진 선택권은 역설적으로 노래를 선택하기 어렵게 만들었다. 이러한 선택의 어려움을 극복하기 위해 음악 추천에 대한 관심이 높아졌고 판도라와 Last.fm과 같은 상용 서비스뿐 아니라 음악 정보 검색 분야의 연구자들도 다양한 추천 시스템을 제안하였다. 내용 기반 필터링과 협업 필터링 방식이 주류인 기존의 추천 시스템은 음악 감상의 주요 요인인 맥락을 고려하지 않았다는 한계점을 지니고 있다. 본 논문에서는 음악을 선택하는 맥락 중 주요한 요인인 감정을 이용한 노래간 유사도 측정 방법을 제안하여 새로운 추천 시스템에 대한 가능성을 탐색한다. 노래의 감정 추출에 가사를 이용하였고 가사에서 노래의 구조도 추출해 노래의 의미적 분석을 시도하였다. 실험을 통해 제안한 모델이 기존의 추천 시스템에 비해 작은 계산 복잡성으로 기존 모델과 유사한 성능을 보일 수 있음을 보였다.

인터넷 게시물의 댓글 분석 및 시각화 (Analysis and Visualization for Comment Messages of Internet Posts)

  • 이윤정;지정훈;우균;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.45-56
    • /
    • 2009
  • 오늘날 인터넷 사용자들은 블로그나 뉴스, 인터넷 게시판 등의 매체에서 댓글을 통해 다른 사람의 의견을 살피고 자신의 의견을 나타내고 있다. 그러나 현재 대부분의 블로그나 인터넷 포털 사이트의 경우 기사나 댓글들을 순차적인 목록 형태로 제공하므로 사용자가 원하는 내용의 댓글을 검색하거나 살펴보는 것은 힘든 일이다. 또한 댓글 사용자가 증가함에 따라 스팸 댓글이나 악플 등이 사회 문제가 되기도 한다. 본 논문에서는 다음 아고라(Daum AGORA) 웹 블로그의 게시글과 댓글을 통계적으로 분석하고 유사도를 기반으로 클러스터링하는 시스템을 제안한다. 본 시스템은 클러스터링 결과를 시각화하여 간단한 스크린 뷰(screen view)로 보여준다. 또한, 본 시스템은 생물정보학에서 잘 알려진 정렬 기법인 Needleman-Wunsch 알고리즘을 이용해 스팸 댓글을 필터링한다.

PC기반의 천해저 다중채널 탄성파 자료의 전산처리 (PC-based Processing of Shallow Marine Multi-channel Seismic Data)

  • 공영세;김국주
    • 한국해양학회지
    • /
    • 제30권2호
    • /
    • pp.116-124
    • /
    • 1995
  • PC기반의 디지털 탄성과 시스템에 다중채널 수진기(6채널)를 연결하여 천해져 탄 성과 반사법 자료를 취득하고 이를 P에서 전산처리하였다. 자료처리 내용은 전처리, 너울효과보정, 주파수필터링, 이득회수, 디콘볼루션, 종합, 구조보정, 단면도작성 등 이다. 이러한 다중채널 디지털 자료취득 및 처리를 거친 최종 단면을 종래의 아날로그 기록계의 단면과 비교해 본 결과 다중반사를 포함하는 잡음이 제거 혹은 억제되고 신 호는 강화되었으며 해상도 또한 향상되었다. 종래의 아날로그 탄성과 장비에 결합하여 사용하는 천해저 다중채널 디지털 탄성과 시스템 및 자료처리 소프트웨어는 경제성이 높고, 아날로그 시스템에 비해 현장작업이 용이하면서도 양질의 지질정보를 효율적으 로 획득하게 해준다.

  • PDF

빅데이터 분석 기반의 정보 검색을 위한 웹 크롤러 서비스 구현 (Web Crawler Service Implementation for Information Retrieval based on Big Data Analysis)

  • 김희숙;한나;임숙자
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.933-942
    • /
    • 2017
  • 본 논문에서는 대학생 및 취업준비생의 대외활동, 공모전, 장학금에 대한 효율적인 정보 수집을 위한 웹 크롤러 서비스 방식을 제안한다. 제안된 웹 크롤러 서비스는 빠른 속도로 크롤링하면서 중복해서 크롤링되는 문제를 회피하기 위하여 Jsoup 트리 분석과 Json 형식의 데이터 전송 방식을 이용하였다. 24시간 동안 관련 정보를 수집한 결과 100%의 정확도로 웹 크롤러 서비스가 실행되고 있음을 확인할 수 있었다. 향후 제안된 웹 크롤러 서비스를 적용할 수 있는 웹 페이지 범위를 확대하여 다양한 웹 사이트에 동시에 적용할 수 있도록 개선하면 웹 크롤러 서비스의 양적 내용을 보충할 수 있을 것으로 기대한다.

인터넷 상점에서의 내용기반 추천을 위한 상품 및 고객의 자질 추출 성능 비교 (Comparison of Product and Customer Feature Selection Methods for Content-based Recommendation in Internet Storefronts)

  • 안형준;김종우
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.279-286
    • /
    • 2006
  • 인터넷 쇼핑몰에서의 상품 추천을 위해 널리 사용되는 방식 중 한 가지는 상품의 특성과 고객의 특성을 비교하여 고객에 맞는 상품을 추천하는 방식이다. 이 방식은 상품이나 고객의 특성을 표현하는 자질(Feature)의 개수가 많을수록 그 중에 어떤 자질을 선택해야 더 좋은 추천 성과를 가져올 수 있는지 파악해 내는 것이 추천의 효과 및 효율성 측면에서 중요하지만 아직까지 충분히 연구되지 않은 실정이다. 본 연구에서는 인터넷 서점에서의 가상 구매실험을 바탕으로 사용자가 구매한 책 들에서 사용자를 잘 나타낼 수 있는 자질을 선택하는 방식에 대해서 벡터 스페이스 모형, TFIDF(Term Frequency-Inverse Document Frequency), Mutual Information, SVD(Singular Value Decomposition) 방식 등을 활용하여 실험하고 그 결과를 비교해본다. 실험 결과 SVD를 응용한 자질 추출 기법이 가장 좋은 성능을 나타내었다.

물체 분할 기법을 이용한 내용기반 영상 검색 (A Content-Based Image Retrieval using Object Segmentation Method)

  • 송석진;차봉현;김명호;남기곤;이상욱;주재흠
    • 융합신호처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.1-8
    • /
    • 2003
  • 현재 사회전반에 걸쳐 급격히 증가하고 있는 멀티미디어 정보를 효율적으로 관리, 활용할 수 있는 방법이 다양하게 연구되고 있다. 본 논문에서는 정지영상 검색을 위해 사용자가 질의(query)를 요구하면 질의 물체를 배경으로부터 분할한 후 유사물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상이 들어오면 우선 메디안 필터링 처리를 하여 잡음 제거한 후 캐니 에지 탐지법으로 물체의 에지를 구한다. 그리고 볼록 다각형 기법을 이용하여 배경으로부터 질의물체를 분할한다. 분할된 영상으로부터 컬러 히스토그램을 구한 후 데이터 베이스내의 영상과 히스토그램 인터섹션을 하여 유사치를 구한다 또한 공간적 그레이 분포와 질감특성을 추출하기 위해 분할된 영상을 그레이 영상으로도 변환시켜 웨블릿 변환한 후 밴디드 오토코릴로그램과 에너지를 구해 유사치를 구한다. 이렇게 구한 유사치을 더해 최종 유사영상을 검색하는데 물체 분할기법을 사용함으로써 배경에 강인할 뿐 아니라 보다 정확한 물체 검색이 가능하였다.

  • PDF

수평 분할 방식을 이용한 병렬 셀-기반 필터링 기법의 설계 및 성능 평가 (Design and Performance Analysis of a Parallel Cell-Based Filtering Scheme using Horizontally-Partitioned Technique)

  • 장재우;김영창
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.459-470
    • /
    • 2003
  • 데이터웨어하우징의 애트리뷰트 벡터나 멀티미디어 데이터베이스의 특징 벡터는 모두 고차원 데이터를 이루고 있기 때문에, 이러한 고차원 데이터를 효율적으로 검색하기 위해서는 고차원 색인 기법이 요구된다. 이를 위하여 다수의 고차원 색인 기법들이 제안되었는데, 제안된 대부분의 색인 기법들이 차원의 수가 증가할수록 검색 성능이 급격히 저하되는 ‘차원 저주(dimensional curse)’ 문제를 지니고 있다. 셀-기반 필터링(Cell-Based Filtering : CBF) 기법은 이러한 차원 저주 문제를 해결하기 위해 제안되었다. 그러나 CBF 기법은 데이터의 양이 증가할수록 선형적으로 검색 성능이 감소하며, 이를 극복하기 위해 병렬 처리 기법을 사용하는 것이 필요하다. 본 논문에서는 데이터 디클러스터링(declustering) 방법으로 수평 분할 방식을 사용한 병렬 CBF 기법을 제안한다. 아울러 제안한 병렬 CBF 기법의 성능을 최대화하기 위하여, 병렬 CBF 기법을 다수의 서버로 구성된 Shared Nothing(SN) 구조의 클러스터 아키텍쳐 하에서 구축한다. 또한 SN 구조의 클러스터 아키텍쳐에 적합한 데이타 삽입 알고리즘, 범위질의 처리 알고리즘, k-최근접 질의 처리 알고리즘을 제시한다. 마지막으로 제안하는 병렬 CBF 기법이 기존 CBF 기법과 비교하여 서버 개수에 비례하여 우수한 검색 성능을 달성함을 보인다.

필터링에 기반한 고차원 색인구조의 동시성 제어기법의 설계 및 구현 (Design and Implementation of High-dimensional Index Structure for the support of Concurrency Control)

  • 이용주;장재우;김학영;김명준
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.1-12
    • /
    • 2003
  • 최근 이미지, 비디오와 같은 멀티미디어 데이터에 대한 효율적인 검색을 위해 많은 다차원 및 고차원 색인 구조들에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 색인 구조의 연구 방향은 검색의 효율을 극대화 하는데 초점을 맞추어 왔으며 최근의 멀티미디어 데이터베이스나 데이터 마이닝 분야와 같은 다수 사용자 환경을 요구하는 환경에서는 부적합한 실정이다. 이에 본 논문에서는 기존의 제시된 차원이 증가하면서 급속하게 성능이 저하되는 문제를 특징 벡터의 시그니쳐를 구성하여 완화시킨 필터링에 기반한 고차원 색인 구조에 동시성 제어기법을 설계 및 구현하여 위스콘신 대학에서 개발한 지속성 객체 저장 시스템인 SHORE 하부저장 시스템과 밀결합 방식으로 통합하였다. 확장된 SHORE 하부저장 시스템은 고차원 데이터에 대한 효율적인 검색 뿐만 아니라 레코드 레벨의 색인 데이터에 대한 동시성 제어를 지원하며 시그니쳐 파일을 모두 메모리에 로딩하는 구조를 개선하여 페이지 레벨의 관리가 가능하다. 아울러 본 논문에서 제시한 확장된 SHOE 하부저장 시스템을 실제 응용 시스템에 적용하기 위해 플랫폼 독립적인 환경을 지원하는 자바 언어를 사용하여 미들웨어 구축 방안을 제시한다. 또한 구축된 미들웨어를 통해 쓰레드 별로 대표적인 내용기반 질의 형태인 포인트질의, 범위질의, k-최근접 질의에 대한 다수 사용자 환경에서의 성능 평가를 수행하였다.