• 제목/요약/키워드: Intelligent Information Retrieval Algorithm

검색결과 36건 처리시간 0.038초

보로노이 다이어그램의 경계지점 최소거리 행렬 기반 k-최근접점 탐색 알고리즘 (k-NN Query Processing Algorithm based on the Matrix of Shortest Distances between Border-point of Voronoi Diagram)

  • 엄정호;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.105-114
    • /
    • 2009
  • 최근 사용자에게 자신과 가장 가까운 k 개의 주유소, 레스토랑, 은행 등의 POI(Point Of Interest) 정보를 추천해주는 위치 기반 서비스가 텔레매틱스, ITS(Intelligent Transport Systems), 키오스크(kiosk)등의 어플리케이션에서 필요로 하고 있다. 이를 위해, 보로노이 다이어그램 k-최근접점 탐색 알고리즘이 제안되었다. 이는 보로노이 다이어그램에서 각 POI의 네트워크의 거리를 미리 계산한 파일을 이용하여 k-최근접점 탐색을 수행한다. 그러나 이 알고리즘은 보로노이 다이어그램 확장에 따른 비용 문제를 야기한다. 따라서 본 논문에서는 보로노이 다이어그램의 경계지점마다 각각에 대하여 최소거리 행렬을 생성하는 알고리즘을 제안한다. 또한 k 개의 POI를 탐색하기 위해, 최소거리 행렬을 이용한 k-최근접점 탐색 알고리즘을 제안한다. 제안하는 알고리즘은 미리 계산된 경계 지점 간 최소거리 행렬을 통해 탐색하므로, k-최근 접점 탐색 시 보로노이 다이어그램의 확장비용을 최소화한다. 아울러 기존 연구와의 성능비교를 통해 제안하는 알고리즘이 기존 알고리즘에 비해 검색시간 측면에서 성능이 우수함을 보인다.

  • PDF

Text filtering by Boosting Linear Perceptrons

  • O, Jang-Min;Zhang, Byoung-Tak
    • 한국지능시스템학회논문지
    • /
    • 제10권4호
    • /
    • pp.374-378
    • /
    • 2000
  • in information retrieval, lack of positive examples is a main cause of poor performance. In this case most learning algorithms may not characteristics in the data to low recall. To solve the problem of unbalanced data, we propose a boosting method that uses linear perceptrons as weak learnrs. The perceptrons are trained on local data sets. The proposed algorithm is applied to text filtering problem for which only a small portion of positive examples is available. In the experiment on category crude of the Reuters-21578 document set, the boosting method achieved the recall of 80.8%, which is 37.2% improvement over multilayer with comparable precision.

  • PDF

유전자 알고리즘을 이용한 WWW 정보검색 (WWW Information Retrieval Using a Genetic Algorithm)

  • 서영우;장병탁
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 춘계학술대회 학술발표 논문집
    • /
    • pp.89-92
    • /
    • 1998
  • 최근 웹 상에서 여러 가지 정보에 대한 접근이 용이하여 많은 사람들이 다양한 검색 시스템을 이용하여 원하는 정보를 얻고 있다. 그러나 웹의 크기가 점점 커지고 그에 따른 사용량 또한 증가함에 딸 원하는 시간 안에 원하는 수준의 정보를 얻기가 매우 어렵다. 본 논문에서는 유전자 알고리즘을 이용하여 사용자의 요구수준에 보다 가까운 저오를 검색하는 학습방법에 대해 고찰한다. 검색 엔진의 초기 검색 결과로부터 만들어진 색인어들이 하나의 염색체로 구성한다. 염색체를 구성하고 있는 각 유전자는 사용자의 기호에 맞는 URL을 추천하기 위해 검색된 문서들과 연관성 값을 비교하여 유전 연산자에 의해 변형된다. 제시된 저오 검색 방식은 기존의 검색 엔진으로부터 반환되는 검색 결과로부터 사용자가 원하는 장보에 연관된 하나 이상의 색인어를 생성한 다음 재검색하여 연관성이 높은 소수의 정보만을 사용자에게 제공한다. 제안된 학습 방식과 기존 검색 엔진으로 검색된 결과를 초기의 사용자 정보 요구와의 연관성에 있어서 비교 분석하였다.

  • PDF

Using GAs to Support Feature Weighting and Instance Selection in CBR for CRM

  • 안현철;김경재;한인구
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.516-525
    • /
    • 2005
  • Case-based reasoning (CBR) has been widely used in various areas due to its convenience and strength in complex problem solving. Generally, in order to obtain successful results from CBR, effective retrieval of useful prior cases for the given problem is essential. However, designing a good matching and retrieval mechanism for CBR systems is still a controversial research issue. Most prior studies have tried to optimize the weights of the features or selection process of appropriate instances. But, these approaches have been performed independently until now. Simultaneous optimization of these components may lead to better performance than in naive models. In particular, there have been few attempts to simultaneously optimize the weight of the features and selection of the instances for CBR. Here we suggest a simultaneous optimization model of these components using a genetic algorithm (GA). We apply it to a customer classification model which utilizes demographic characteristics of customers as inputs to predict their buying behavior for a specific product. Experimental results show that simultaneously optimized CBR may improve the classification accuracy and outperform various optimized models of CBR as well as other classification models including logistic regression, multiple discriminant analysis, artificial neural networks and support vector machines.

  • PDF

PCA-SIFT의 차원 중복점을 이용한 이미지 기반 이미지 검색 시스템 (Image-based Image Retrieval System Using Duplicated Point of PCA-SIFT)

  • 최기룡;정혜욱;이지형
    • 한국지능시스템학회논문지
    • /
    • 제23권3호
    • /
    • pp.275-279
    • /
    • 2013
  • 최근 멀티미디어 정보가 보편화됨에 따라 인터넷에서 이미지를 기반으로 정보를 검색하려는 다양한 시도가 진행되고 있다. 그러나 이미지에는 다양한 패턴이 포함되어 있기 때문에 정확하게 원하는 이미지를 찾는 것은 아직 어려움이 많다. 본 논문에서는 인터넷 쇼핑몰의 상품검색을 효율적으로 할 수 있는 이미지 기반 검색 시스템을 제안한다. 제안된 검색 방법은 SIFT(Scale Invariant Feature Transform) 알고리즘을 이용하여 이미지 검색을 위한 특징을 추출하고, PCA-SIFT를 이용하여 여러 차원에서 키포인트의 매칭을 반복하여 누적 후 사용자가 원하는 상품을 찾아준다. 제안된 방법의 효율성을 검증하기 위해, 다양한 패턴의 상품 이미지를 이용하여 기존 SIFT, PCA-SIFT 방법과 제안된 방법을 비교한 결과, 상표가 포함되지 않은 이미지의 경우 제안방법이 가장 높은 변별력을 보였으며, 효과적인 이미지 검색의 가능성을 보였다.

WWW상의 지능형 정보검색을 위한 기계학습 알고리즘 구현에 관한 연구 (A Study on Machine Learning Algorithm for Intelligent Information Retrieval in World Wide Web)

  • 김성희
    • 정보관리학회지
    • /
    • 제17권2호
    • /
    • pp.189-205
    • /
    • 2000
  • 본 연구에서는 현재 웹정보검색의 문제점을 해결하기 위하여 기계학습알고리즘을 이용한 지능형정보검색 시스템을 구현하고 있다. 구체적으로. 수학분야 질의어 및 적합한 문서를 선정해서 이 자료를 토대로 어떻게 귀납학습알고리즘과 신경망을 적용할 수 있는지를 검토하고 있다. 또한, 본 논문에서는 신경망시스템 설계시 성능에 영향을 미치는 입.출력노드수, 은닉층, 학습매개변수등 다양한 요소를 경험적방법을 통해 검토하고 있다.

  • PDF

A Deep Learning Algorithm for Fusing Action Recognition and Psychological Characteristics of Wrestlers

  • Yuan Yuan;Yuan Yuan;Jun Liu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권3호
    • /
    • pp.754-774
    • /
    • 2023
  • Wrestling is one of the popular events for modern sports. It is difficult to quantitatively describe a wrestling game between athletes. And deep learning can help wrestling training by human recognition techniques. Based on the characteristics of latest wrestling competition rules and human recognition technologies, a set of wrestling competition video analysis and retrieval system is proposed. This system uses a combination of literature method, observation method, interview method and mathematical statistics to conduct statistics, analysis, research and discussion on the application of technology. Combined the system application in targeted movement technology. A deep learning-based facial recognition psychological feature analysis method for the training and competition of classical wrestling after the implementation of the new rules is proposed. The experimental results of this paper showed that the proportion of natural emotions of male and female wrestlers was about 50%, indicating that the wrestler's mentality was relatively stable before the intense physical confrontation, and the test of the system also proved the stability of the system.

내용 기반 이미지 검색을 위한 개선된 SIM 방법 (Improved SIM Algorithm for Contents-based Image Retrieval)

  • 김광백
    • 지능정보연구
    • /
    • 제15권2호
    • /
    • pp.49-59
    • /
    • 2009
  • 내용기반 이미지 검색은 색상, 질감 등의 이미지 자체의 자질들을 이용하여 검색하므로 텍스트 기반 이미지 검색의 객관성 부족과 모든 이미지에 사람이 주석을 달아야 하는 단점을 보완할 수 있는 이미지 검색 방법이다. 이러한 내용 기반 이미지 검색에서 사용되는 방식 중 SIM(Self-organizing Image browsing Map) 방식은 SOM 알고리즘을 이용하여 이미지들을 브라우징 가능한 그룹으로 맵핑하고 그 결과를 바탕으로 이미지를 검색하게 된다. 하지만 비슷한 이미지라 할지라도 이미지의 밝기, 피사체의 움직임 등에 의하여 색상 정보가 다르게 나타나게 되면 SOM 알고리즘의 학습 과정에서 유사한 이미지들을 그룹화한 노드를 BMU로 선택하지 못하고 떨어져 있는 다른 노드를 선택하게 된다. 이 경우 학습이 진행되면서 유사한 이미지들이 군집하는 과정을 거치지만 학습이 완료될 때까지 다른 유사 이미지들을 그룹화한 노드에 맵핑이 되지 못하는 경우가 발생한다. 그 결과, 검색 결과에 나타나지 못하여 적합 이미지 검색률이 낮아 질 수 있다. 따라서 본 논문에서는 HSV 색상모델을 이용하여 양자화하고 이미지의 색상 특징 벡터를 추출한 뒤 SOM 알고리즘을 이용하여 이미지들을 브라우징 가능한 그룹으로 맵핑한다. 이때 SIM 방식의 문제점인 유사 이미지가 따로 맵핑되어 적합 이미지 검색률이 낮아지는 것을 줄이기 위하여 SOM을 두 개의 층으로 구성한다. 첫 번째 층에서 이미지의 색상 자질을 이용하여 학습을 완료한 후, 학습이 완료된 첫 번째 층 맵의 각 노드들의 연결 가중치를 이용하여 두 번째 층에서 다시 한번 학습을 수행한다. 두 개의 층으로 학습이 완료된 두 번째 층의 SOM에 질의 이미지의 특징 벡터를 입력하여 BMU를 선택하고 BMU와 연결된 첫 번째 층의 노드를 최종 선택하여 이미지를 검색한다. 실험결과, 제안된 이미지 검색 방법이 기존의 이미지 검색 방법 보다 적합 이미지의 검색 성공률이 높은 것을 확인 할 수 있었다.

  • PDF

교량정보모델 기반의 설계정보와 XML 기반의 문서정보 통합 (Integration between XML-based Document Information and Bridge Information Model-based Structural Design Information)

  • 정연석;김봉근;정원석;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2006년도 정기 학술대회 논문집
    • /
    • pp.208-215
    • /
    • 2006
  • This study provides a new operation strategy which can guarantee the data consistency of engineering information among the various intelligent information systems. We present the strategies for the operation of bridges engineering information and the construction methodology of integrated database. The two core standard techniques are adopted to construct the integrated database. One of these standards is the Standard for the Exchange of Product Model Data (STEP) for CAD/CAE information and the other is the Extensible Markup Language (XML) for engineering document information. This study can transform a document me into a data type for web-based application modules which assist end-users in searching and retrieval of engineering document data. In addition, relaying algorithm is developed to integrate the two different information, e.g. CAD/CAE information and engineering document information. The pilot application modules for management and maintenance of existing bridge are also developed to show application of the strategy.

  • PDF

다차원 신호공간 분할을 이용한 데이터 복원 (Data Retrieval by Multi-Dimensional Signal Space Partitioning)

  • 전태현
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.674-677
    • /
    • 2004
  • 본 논문에서는 심볼간의 간섭이 존재하는 채널에서 고정 지연 값을 가지는 트리검색 신호검출기의 효율적인 구성방법을 다룬다. 이 접근방법은 효율적인 다차원 신호공간 분할에 기반을 두고 있다 다차원 공간에서의 Voronoi 다이어그램 (VoD)과 Delaunay 분할 (DT)이 신호검출 알고리즘의 구현에 적용된다 제안된 방식에서는 VOD/DT에 포함되어 있는 기하학적인 정보를 활용하여 관찰된 순차적인 신호의 상대적인 위치가 결정되며 이러한 방식이 구현치 복잡도를 감소시키는 장점이 있음을 보인다. 구체적인 구성 절차가 심볼간의 간섭이 존재하는 통신채널에서의 예를 가지고 논의되며 시뮬레이션 결과가 논의된다.