• 제목/요약/키워드: Real-time Search Terms

검색결과 60건 처리시간 0.028초

키워드의 유사도와 가중치를 적용한 연관 문서 추천 방법 (Method of Related Document Recommendation with Similarity and Weight of Keyword)

  • 임명진;김재현;신주현
    • 한국멀티미디어학회논문지
    • /
    • 제22권11호
    • /
    • pp.1313-1323
    • /
    • 2019
  • With the development of the Internet and the increase of smart phones, various services considering user convenience are increasing, so that users can check news in real time anytime and anywhere. However, online news is categorized by media and category, and it provides only a few related search terms, making it difficult to find related news related to keywords. In order to solve this problem, we propose a method to recommend related documents more accurately by applying Doc2Vec similarity to the specific keywords of news articles and weighting the title and contents of news articles. We collect news articles from Naver politics category by web crawling in Java environment, preprocess them, extract topics using LDA modeling, and find similarities using Doc2Vec. To supplement Doc2Vec, we apply TF-IDF to obtain TC(Title Contents) weights for the title and contents of news articles. Then we combine Doc2Vec similarity and TC weight to generate TC weight-similarity and evaluate the similarity between words using PMI technique to confirm the keyword association.

Hop 제약조건이 고려된 최적화 웹정보검색 (Optimized Structures with Hop Constraints for Web Information Retrieval)

  • 이우기;김기백;이화기
    • 한국경영과학회지
    • /
    • 제33권4호
    • /
    • pp.63-82
    • /
    • 2008
  • The explosively growing attractiveness of the Web is commencing significant demands for a structuring analysis on various web objects. The larger the substantial number of web objects are available, the more difficult for the clients(i.e. common web users and web robots) and the servers(i.e. Web search engine) to retrieve what they really want. We have in mind focusing on the structure of web objects by introducing optimization models for more convenient and effective information retrieval. For this purpose, we represent web objects and hyperlinks as a directed graph from which the optimal structures are derived in terms of rooted directed spanning trees and Top-k trees. Computational experiments are executed for synthetic data as well as for real web sites' domains so that the Lagrangian Relaxation approaches have exploited the Top-k trees and Hop constraint resolutions. In the experiments, our methods outperformed the conventional approaches so that the complex web graph can successfully be converted into optimal-structured ones within a reasonable amount of computation time.

모바일 디바이스상에서 공간-칼라와 가버 질감을 이용한 내용-기반 영상 검색 (Content-based Image Retrieval using Spatial-Color and Gabor Texture on A Mobile Device)

  • 이용환;이준환;조한진;권오진;김영섭
    • 반도체디스플레이기술학회지
    • /
    • 제13권4호
    • /
    • pp.91-96
    • /
    • 2014
  • Mobile image retrieval is one of the most exciting and fastest growing research fields in the area of multimedia technology. As the amount of digital contents continues to grow users are experiencing increasing difficulty in finding specific images in their image libraries. This paper proposes a new efficient and effective mobile image retrieval method that applies a weighted combination of color and texture utilizing spatial-color and second order statistics. The system for mobile image searches runs in real-time on an iPhone and can easily be used to find a specific image. To evaluate the performance of the new method, we assessed the iPhone simulations performance in terms of average precision and recall using several image databases and compare the results with those obtained using existing methods. Experimental trials revealed that the proposed descriptor exhibited a significant improvement of over 13% in retrieval effectiveness, compared to the best of the other descriptors.

범위 질의 인덱싱을 이용한 스트림 데이터의 다중 질의처리 기법 (A Multi-dimensional Query Processing Scheme for Stream Data using Range Query Indexing)

  • 이동언;이윤석
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.69-77
    • /
    • 2009
  • 스트림 서비스 환경에서는 지속적으로 입력되는 막대한 양의 데이터에 대해 원하는 조건을 탐색하는 실시간 질의처리가 요구된다. 기존의 R-tee기반 질의처리 기술은 각 이벤트에 대해 트리 전체에 대해 동일한 탐색과정을 반복해야 하므로 이를 효율적으로 감당할 수 없었다. 한편 센서 측정값을 비롯한 대부분의 스트림 데이터는 매우 높은 지역성을 가지며 이를 활용하여 탐색 공간을 크게 줄일 수 있다. 따라서 본 연구에서는 스트림 데이터의 지역성을 활용하여 스트림 환경에 적합한 질의처리 기법을 제안하였다. 또한 이 프레임웍을 활용하여 스트림 환경에서 어플리케이션이 요구하는 다양한 질의처리 서비스를 개발할 수 있을 것으로 기대된다. 본 연구에서 구현한 프로토타입 시스템을 스트림 환경에 적용해 얻은 실험 결과를 통해, 스트림 환경에서 기존질의처리 기법보다 더 적합하고 효율이 크게 개선됨을 확인할 수 있었다.

빅데이터에 기반한 지역 상점 관련 정보제공 서비스 (Big data-based Local Store Information Providing Service)

  • 문창배;박현석
    • 한국콘텐츠학회논문지
    • /
    • 제20권2호
    • /
    • pp.561-571
    • /
    • 2020
  • 빅데이터를 활용한 위치정보 서비스가 지속적으로 발전하고 있다. 네비게이션의 측면에서는 지도 API서비스부터 선박 항해정보에 이르기까지 서비스의 범위가 확대되었고, 시스템 응용정보로서는 각 위치에 대한 SNS와 블로그 검색 기록에까지 확장되고 있다. 특히 최근에는 위치기반 검색 및 광고, 무인 자동차, IoT(Internet of Things) 및 O2O (Online to Offline) 서비스 등 신규 산업으로 활용되고 있다. 본 연구에서는 사용자가 특정 경로를 이동할 때, 빅데이터를 활용하여 근처 상점에 대한 정보를 보다 효과적으로 수신할 수 있도록 하는 인터넷 서비스를 제안하였다. 또한 지역 상점은 이 시스템을 사용하여 저렴한 비용으로 효과적으로 홍보할 수 있도록 시스템을 설계하였다. 특히 실시간으로 웹 기반 정보를 분석하여 사용자에게 제공하는 상점 정보의 정확도를 높이고자 하였다. 이 시스템을 통해 시스템 이용자인 일반 사용자와 상점 업주는 보다 효과적으로 정보를 활용할 수 있게 될 것이다. 또한 시스템 관점에서, 다양한 웹서비스와 통합하여 신규 서비스를 창출하는 것에 활용할 수 있을 것이다.

시퀀스 유틸리티 리스트를 사용하여 높은 유틸리티 순차 패턴 탐사 기법 (Mining High Utility Sequential Patterns Using Sequence Utility Lists)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.51-62
    • /
    • 2018
  • 높은 유틸리티 순차 패턴 탐사는 데이터 마이닝에서 중요한 연구 주제로 간주되고 있다. 이 주제에 대해 몇 개의 알고리즘들이 제안되었지만, 그것들은 높은 유틸리티 순차 패턴 탐사의 탐색 공간이 커지는 문제에 부딪히게 된다. 한 시퀀스의 더 엄격한 유틸리티 상한 값은 탐색 공간에서 초기에 유망하지 않은 패턴들을 더 가지치기할 수 있다. 본 논문에서 새로운 유틸리티 상한 값을 제안하는데, 그것은 한 시퀀스와 그 자손 시퀀스들의 최대 예상 유틸리티인 sequence expected utility (SEU)이다. 높은 유틸리티 순차 패턴들을 탐사하는데 필수적인 정보를 유지하기 위해 각 패턴에 대한 시퀀스 유틸리티 리스트를 새로운 자료구조로 사용한다. SEU를 활용하여 높은 유틸리티 순차 패턴들을 찾아내는 알고리즘인 High Sequence Utility List-Span (HSUL-Span)을 제안한다. 서로 다른 영역의 합성 데이터세트와 실제 데이터세트에 대한 실험 결과는 HSUL-Span이 상당히 적은 수의 후보 패턴들을 생성하고 실행 시간 면에서 다른 알고리즘들보다 우수한 것을 보여준다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.

An Improved Particle Swarm Optimization Algorithm for Care Worker Scheduling

  • Akjiratikarl, Chananes;Yenradee, Pisal;Drake, Paul R.
    • Industrial Engineering and Management Systems
    • /
    • 제7권2호
    • /
    • pp.171-181
    • /
    • 2008
  • Home care, known also as domiciliary care, is part of the community care service that is a responsibility of the local government authorities in the UK as well as many other countries around the world. The aim is to provide the care and support needed to assist people, particularly older people, people with physical or learning disabilities and people who need assistance due to illness to live as independently as possible in their own homes. It is performed primarily by care workers visiting clients' homes where they provide help with daily activities. This paper is concerned with the dispatching of care workers to clients in an efficient manner. The optimized routine for each care worker determines a schedule to achieve the minimum total cost (in terms of distance traveled) without violating the capacity and time window constraints. A collaborative population-based meta-heuristic called Particle Swarm Optimization (PSO) is applied to solve the problem. A particle is defined as a multi-dimensional point in space which represents the corresponding schedule for care workers and their clients. Each dimension of a particle represents a care activity and the corresponding, allocated care worker. The continuous position value of each dimension determines the care worker to be assigned and also the assignment priority. A heuristic assignment scheme is specially designed to transform the continuous position value to the discrete job schedule. This job schedule represents the potential feasible solution to the problem. The Earliest Start Time Priority with Minimum Distance Assignment (ESTPMDA) technique is developed for generating an initial solution which guides the search direction of the particle. Local improvement procedures (LIP), insertion and swap, are embedded in the PSO algorithm in order to further improve the quality of the solution. The proposed methodology is implemented, tested, and compared with existing solutions for some 'real' problem instances.

복잡한 배경에서 신경망을 이용한 얼굴인식 (Face Recognition on complex backgrounds using Neural Network)

  • 한준희;남기환;박호식;이영식;정연길;나상동;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1149-1152
    • /
    • 2005
  • 복잡한 배경을 지닌 이미지에서 얼굴을 검출하기란 매우 어려운 일이다. 본 논문에서는 신경망 모델을 기반으로 한 제한생성모델(CGM: Constrained Generative Model)을 제안한다. 학습 과정의 목표라 할 수 있는 생성은 신경망 모델이 입력 데이터를 발생시킬 확률을 계산하도록 하는 것이고, 계산하는데 걸리는 시간을 줄이기 위해서 고속 탐지 알고리즘을 제안한다. 얼굴 측면 검출과 오 인식의 수를 줄이기 위해서 조건을 혼합한 신경망을 사용하였고 반증으로 인한 제한을 둠으로써 모델의 측정 품질을 증가시켰다. 본 논문에서 제안한 검출 알고리즘이 0$_{\circ}$ ${\sim}$60$_{\circ}$ 사이에서는 90%정도의 검출율을 나타냄을 알 수 있었다.

  • PDF

계층적 탐색기법을 이용한 이동물체 추적 (Tracking Moving Object using Hierarchical Search Method)

  • 방만식;김태식;김영일
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.568-576
    • /
    • 2003
  • 본 논문에서는 계층적 탐색기법을 이용한 동적 배경에서의 이동물체 추적 알고리즘을 제안하였다. 제안한 알고리즘은 초기모델 생성단계와 이동물체 추적 단계로 구성되었으며, 이전프레임에 비해 이동 거리가 큰 경우에도 안정적으로 추적할 수 있었다. 그리고, 카메라의 흔들림과 추적물체의 3차원 운동으로 인한 형태 변화에도 전체 프레임에서 효과적으로 추적을 할 수 있었고, 이동물체의 정확한 위치를 검출하여 추적시간을 단축할 수 있었다. 정합모델과 윤곽선 영상에 사이에 이동물체의 유사도 판정은 Partial Hausdorff 거리를 이용하여 평가하였다. 제안한 알고리즘의 타당성 검토를 위해 도로에서 주행하는 차량을 대상으로 이동물체 검출 및 추적 실험을 한 결과 정합횟수는 평균 28.21회이고, 프레임 당 정합시간은 평균 53.21 ms로 제안한 알고리즘의 우수성을 입증하였다. 추적위치와 실체위치를 비교하여 그 평균 자승오차를 계산한 결과 E=1.148임을 알 수 있었다. 차량의 크기, 색상 및 형태가 다른 경우 도로의 색과 차이가 있는 차량들은 98.66%의 추적 성능을 나타냈으며, 검정색 또는 적색 등과 같은 차량은 흑백 영상에서 도로의 색과 유사하여 배경의 영향을 많이 받으므로 95.33%이었고, 전체 평균은 97%로 우수한 추적 성능을 나타내었다.