• 제목/요약/키워드: Feature Collection

검색결과 197건 처리시간 0.028초

The Kernel Trick for Content-Based Media Retrieval in Online Social Networks

  • Cha, Guang-Ho
    • Journal of Information Processing Systems
    • /
    • 제17권5호
    • /
    • pp.1020-1033
    • /
    • 2021
  • Nowadays, online or mobile social network services (SNS) are very popular and widely spread in our society and daily lives to instantly share, disseminate, and search information. In particular, SNS such as YouTube, Flickr, Facebook, and Amazon allow users to upload billions of images or videos and also provide a number of multimedia information to users. Information retrieval in multimedia-rich SNS is very useful but challenging task. Content-based media retrieval (CBMR) is the process of obtaining the relevant image or video objects for a given query from a collection of information sources. However, CBMR suffers from the dimensionality curse due to inherent high dimensionality features of media data. This paper investigates the effectiveness of the kernel trick in CBMR, specifically, the kernel principal component analysis (KPCA) for dimensionality reduction. KPCA is a nonlinear extension of linear principal component analysis (LPCA) to discovering nonlinear embeddings using the kernel trick. The fundamental idea of KPCA is mapping the input data into a highdimensional feature space through a nonlinear kernel function and then computing the principal components on that mapped space. This paper investigates the potential of KPCA in CBMR for feature extraction or dimensionality reduction. Using the Gaussian kernel in our experiments, we compute the principal components of an image dataset in the transformed space and then we use them as new feature dimensions for the image dataset. Moreover, KPCA can be applied to other many domains including CBMR, where LPCA has been used to extract features and where the nonlinear extension would be effective. Our results from extensive experiments demonstrate that the potential of KPCA is very encouraging compared with LPCA in CBMR.

머신러닝 알고리즘 분석 및 비교를 통한 Big-5 기반 성격 분석 연구 (A Study on Big-5 based Personality Analysis through Analysis and Comparison of Machine Learning Algorithm)

  • 김용준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.169-174
    • /
    • 2019
  • 본 연구에서는 설문지를 이용한 데이터 수집과 데이터 마이닝에서 클러스터링 기법으로 군집하여 지도학습을 이용하여 유사성을 판단하고, 성격들의 상관 관계의 적합성을 분석하기 위해 특징 추출 알고리즘들과 지도학습을 이용하는 것을 목표로 진행한다. 연구 수행은 설문조사를 진행 후 그 설문조사를 토대로 모인 데이터들을 정제하고, 오픈 소스 기반의 데이터 마이닝 도구인 WEKA의 클러스터링 기법들을 통해 데이터 세트를 분류하고 지도학습을 이용하여 유사성을 판단한다. 그리고 특징 추출 알고리즘들과 지도학습을 이용하여 성격에 대해 적합한 결과가 나오는지에 대한 적합성을 판단한다. 그 결과 유사성 판단에 가장 정확도 높게 도움을 주는 것은 EM 클러스터링으로 3개의 분류하고 Naïve Bayes 지도학습을 시킨 것이 가장 높은 유사성 분류 결과를 도출하였고, 적합성을 판단하는데 도움이 되도록 특징추출과 지도학습을 수행하였을 때, Big-5 각 성격마다 문항에 추가되고 삭제되는 것에 따라 정확도가 변하는 모습을 찾게 되었고, 각 성격 마다 차이에 대한 분석을 완료하였다.

기술용어 분산표현을 활용한 특허문헌 분류에 관한 연구 (A Study on Patent Literature Classification Using Distributed Representation of Technical Terms)

  • 최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.179-199
    • /
    • 2019
  • 본 연구의 목적은 특허 문헌 분류에 가장 적합한 방법론을 발견하기 위하여 다양한 자질 추출 방법과 기계학습 및 딥러닝 모델을 살펴보고 실험을 통해 최적의 성능을 제공하는 방법론을 분석하는데 있다. 자질 추출 방법으로는 전통적인 BoW 방법과 분산표현 방식인 워드 임베딩 벡터를 비교 실험하고, 문헌 집합 구축 방식으로는 형태소 분석과 멀티그램을 이용하는 방식을 비교 검토하였다. 또한 전통적인 기계학습 모델과 딥러닝 모델을 이용하여 분류 성능을 검증하였다. 실험 결과, 분산표현 방법과 형태소 분석을 이용한 자질추출 방법을 기반으로 딥러닝 모델을 적용하였을 경우에 분류 성능이 가장 우수한 것으로 판명되었으며 섹션, 클래스, 서브클래스 분류 실험에서 전통적인 기계학습 방법에 비해 각각 5.71%, 18.84%, 21.53% 우수한 분류 성능을 보여주었다.

A Research on Cylindrical Pill Bottle Recognition with YOLOv8 and ORB

  • Dae-Hyun Kim;Hyo Hyun Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.13-20
    • /
    • 2024
  • 본 논문은 영상에서 특정 원통형 약통을 식별할 수 있는 모델 이미지 생성 방식을 제시하고 데이터 수집에 대한 기술을 연구한다. 기존 연구들은 객체 인식과 특정 객체 식별이 분리되어 있어 이미지 스티칭(image stitching) 자동화에 적용하기 어려웠으며, 좌표 기반 이미지 추출 방식이 이미지 스티칭 과정에서 객체 영역 외의 정보도 모델 이미지에 포함시키는 문제를 갖고 있었다. 이를 해결하기 위해 본 논문은 최근에 출시된 YOLOv8(You Only Look Once)의 세그멘테이션(segmentation)기법을 수직축 회전하는 약통 영상에 적용하고 특징점 매칭 알고리즘인 ORB(Oriented FAST and Rotated BRIEF)를 활용하여 모델 이미지 생성을 자동화하였다. 연구 결과, 세그멘테이션 기법을 적용할 경우 특정 약통 식별시 인식률이 향상되었으며 특징점 매칭 알고리즘으로 생성된 모델 이미지는 특정 악통을 정확하게 식별해 낼 수 있었다.

문헌각과 문헌각서목의 분석 -숙종조의 문화적 배경을통한 한국본 서고의 연구- (A Study of the Munheongak and Munheongaksomog)

  • 남권희
    • 한국문헌정보학회지
    • /
    • 제11권
    • /
    • pp.147-183
    • /
    • 1984
  • This is an analytical study on Munheongak (文獻閣) and it's catalogue. The major objective of the study is to get a recognition of Munheongak under the culture of Sukjong (肅宗) period in Korean library history. Most of early studies made on such a category have been concentrated on Jiphyunjeon (集賢殿), Hongmungwan (弘文館), Kyujanggak(奎章閣) and their backgrounds. In this study, the author has invest gated Kungwolji (宮闕志), Munheongakseomg (文獻閣書目) and other materials related to this subject. The findings of the study can be summarized as follows: 1. Munheongak was established by king Sukjong in the 26th year of his reign. According to some records of Kungkwolji, the reason of establishment of the library was to arrange the collection in the Sango (相庫) consisted of various kinds of materials. In case of books, most of them turned out to be Korean books. 2. Munheongak was sited to the estern side of Kyunghyundang (景賢堂), which was located on the Kyungdeokgung (慶德宮). After Youngjo (英祖) the place was called Kyungheuigung (慶熙宮) so as to avoid the name of the precedent king. But these days, both the buildings are not to be found. 3. After its establishment, the library could not play the role as a library because of the then political situation and sectionalism. During the period of the revival of the learning from Youngjo till Jeongjo(正祖) the function of the library was in a stagnant state. Kyujanggak played the part in its place. 4. Referring to the collection management, the Munheongakseomog is equipped with 101 titles, 2,525 volumes, which are arranged by means of the traditional Chinese classification system. 5. The classification scheme is based on the traditional Chinese classification system which might divide all subjects into four categories such as: Confucian classics division, Historical documents division, Master's division, and Collection of literature division. Some illustrations reveal that the classification system was directly influenced by Seogoseomg (書庫書目) : the influence reflected in the classes for the translated literature and writings, poems, genealogy about kings, etc. But some subdivisions such as a class of Annals, Historical Epcerpts were omitted in the classification scheme, which did not strike the balance in the system in terms of the present theory of classification. Most of bibliographical descriptions were also influenced by Seogoseomog but some elements were partly omitted. 6. The special feature of the collection building is the absence of books in Collection of literature division except only three kinds of books in examining the Munheongakseomog. Since this is rather a comprehensive study for such aspects as historical backround, catalogue, and cultural environment of Munheongak and its related record, it is advised that further and additional research should be made.

  • PDF

19세기 초반, 가곡 향유의 한 단면 - 『영언』과『청륙』의 ‘이삭대엽 우ㆍ계면 배분방식’을 대상으로 - (An aspect of Gagok enjoyment in the early 19th century)

  • 성무경
    • 한국시조학회지:시조학논총
    • /
    • 제19권1호
    • /
    • pp.235-260
    • /
    • 2003
  • 최근, 필자는 가곡 가집 $\boxDr$영언$\boxUl$을 학계에 처음 소개한 바 있다. 이 $\boxDr$영언$\boxUl$은 그 동안 19세기초반을 대표해온 (육당본)$\boxDr$청구영언$\boxUl$과 높은 친연성을 지니며, $\boxDr$청육$\boxUl$과 동 시기 또는 그보다 조금 앞선 시기의 문화적 도상을 나타낸다. 이 글은 $\boxDr$영언$\boxUl$$\boxDr$청육$\boxUl$이 ‘이삭대엽 우ㆍ계면’ 배분방식이 상당히 큰 차이를 보인다는 점에 주목하고, $\boxDr$청육$\boxUl$의 ‘이삭대엽’이 18세기 가집의 특징인 이삭대엽 내의 ‘유명씨+무명씨’ 수록방식을 19세기 가집들이 취하는 ‘우ㆍ계면’의 양조배분에 그대로 덧씌운 것임을 밝혀, $\boxDr$청육$\boxUl$의 ‘이삭대엽’수록 방식이 우ㆍ계면 양조가 정착되는 19세기 초반의 가창실상에 위배된다는 사실을 논증해보았다. 반면 $\boxDr$영언$\boxUl$에는 작가표기가 전혀 없으나 역추적 해보면 ‘이삭대엽 우ㆍ계면’ 양조에 유ㆍ무명씨 작품이 골고루 배분되어 있다는 사실이 드러나는데, 이로써 $\boxDr$영언$\boxUl$이 당대 가창의 실질에 충실한 가집이라는 사실을 밝힐 수 있었다. 아울러 가집들 사이에는 악조나 악곡 배분에 갈등을 일으키는 작품들이 적지 않은데, 이들 작품들에 대한 곡해석 문제가 2세기에 걸쳐 지속적으로 가집이 편찬되었던 구체적 동인이었을 것임을 진단해 보았다. 특정시기 가곡향유의 실질은 곧 가곡의 곡 해석방식에 직결될 것이기 때문이다.

  • PDF

워드넷 기반 특징 추상화를 통한 웹문서 자동분류시스템의 성능향상 (Improving Hypertext Classification Systems through WordNet-based Feature Abstraction)

  • 노준호;김한준;장재영
    • 한국전자거래학회지
    • /
    • 제18권2호
    • /
    • pp.95-110
    • /
    • 2013
  • 본 논문은 기계학습 기법에 기반한 웹문서 자동분류 시스템의 성능을 높이기 위한 새로운 형태의 특징가공 기법을 제안한다. 제안 기법은 하이퍼텍스트 웹문서에 대한 자동분류를 효과적으로 수행하기 위해 하이퍼링크 관계를 활용하여 특징 집합을 확장시킨다. 웹문서는 하이퍼링크 관계를 통해 서로 연결된 구조를 가지며, 그 관계는 많은 경우 연관도가 높은 문서들 간에 존재한다. 이러한 링크 정보가 분류모델의 주요 인자가 되는 특징 집합의 질을 높이는 중요한 역할을 수행할 수 있다. 제안 기법의 기본 아이디어는 워드넷 온톨로지를 기반으로 분류 대상 문서와 인접 문서들에 포함된 단어(특징)들 간의 의미적 유사도를 평가함으로써 다수의 특징들로 구성된 추상화된 개념적 특징을 생성하는 것이다. 여기서 유사도 함수는 워드넷 안에서 특징들 간의 상/하위어 관계 정보를 정량적으로 계산하게 된다. 분류모델의 구축시 추상화된 개념 특징은 일반 특징과 동일하게 간주하여 보다 정확한 분류 모델을 구축하는데 기여한다. Web-KB 문서집합을 이용한 실험을 통해 제안 기법이 기존 기법 보다 우수함을 보였다.

The Solution of Vehicle Scheduling Problems with Multiple Objectives in a Probabilistic Environment

  • Park, Yang-Byung
    • 대한산업공학회지
    • /
    • 제14권1호
    • /
    • pp.119-131
    • /
    • 1988
  • Vehicle Scheduling Problem (VSP) is a generic name given to a whole class of problems involving the visiting of "stations" by "vehicles," where a time is associated with each activity. The studies performed to date have the common feature of a single objective while satisfying a set of restrictions and known customer supplies or demands. However, VSPs may involve relevant multiple objectives and probabilistic supplies or demands at stations, creating multicriteria stochastic VSPs. This paper proposes a heuristic algorithm based on goal programming approach to schedule the most satisfactory vehicle routes of a bicriteria VSP with probabilistic supplies at stations. The two relevant objectives are the minimization of the expected travel distance of vehicles and the minimization of the due time violation for collection service at stations by vehicles. The algorithm developed consists of three major stages. In the first stage, an artificial capacity of vehicle is determined, on the basis of decision maker's subjective estimates. The second one clusters a set of stations into subsets by applying an efficient cluster method developed. In the third one, the stations in each subset are scheduled by applying an iterative goal programming heuristic procedure to each cluster.

  • PDF

Support Vector Machines를 이용한 효율적인 차량 인식 알고리즘 (The Efficient Vehicle Recognition Algorithm using Support Vector Machines)

  • 황원준;송명철;고한석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.327-330
    • /
    • 2000
  • In this paper, we describe an intelligent method to detect types of vehicles using Support Vector Machines focused to the Intelligent Transportation System (ITS) applications such as in the CCD based Electronic Toll Collection System (ETCS). This algorithm can be used the various fields of ITS applications. Support Vector Machines employed in this paper has been recently proposed as a very effective method for 3D image recognition. And our proposed feature extraction method using the singluar values that directly come from pixels at input images. Consequently, The low calculation load and the high recognition rate in spite of image rotation and various noises are one of merits of proposed method.

  • PDF

A PRACTICAL LOOK AT MONTE CARLO VARIANCE REDUCTION METHODS IN RADIATION SHIELDING

  • Olsher Richard H.
    • Nuclear Engineering and Technology
    • /
    • 제38권3호
    • /
    • pp.225-230
    • /
    • 2006
  • With the advent of inexpensive computing power over the past two decades, applications of Monte Carlo radiation transport techniques have proliferated dramatically. At Los Alamos, the Monte Carlo codes MCNP5 and MCNPX are used routinely on personal computer platforms for radiation shielding analysis and dosimetry calculations. These codes feature a rich palette of variance reduction (VR) techniques. The motivation of VR is to exchange user efficiency for computational efficiency. It has been said that a few hours of user time often reduces computational time by several orders of magnitude. Unfortunately, user time can stretch into the many hours as most VR techniques require significant user experience and intervention for proper optimization. It is the purpose of this paper to outline VR strategies, tested in practice, optimized for several common radiation shielding tasks, with the hope of reducing user setup time for similar problems. A strategy is defined in this context to mean a collection of MCNP radiation transport physics options and VR techniques that work synergistically to optimize a particular shielding task. Examples are offered in the areas of source definition, skyshine, streaming, and transmission.