• 제목/요약/키워드: Majority voting

검색결과 71건 처리시간 0.031초

Fuzzy-Membership Based Writer Identification from Handwritten Devnagari Script

  • Kumar, Rajiv;Ravulakollu, Kiran Kumar;Bhat, Rajesh
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.893-913
    • /
    • 2017
  • The handwriting based person identification systems use their designer's perceived structural properties of handwriting as features. In this paper, we present a system that uses those structural properties as features that graphologists and expert handwriting analyzers use for determining the writer's personality traits and for making other assessments. The advantage of these features is that their definition is based on sound historical knowledge (i.e., the knowledge discovered by graphologists, psychiatrists, forensic experts, and experts of other domains in analyzing the relationships between handwritten stroke characteristics and the phenomena that imbeds individuality in stroke). Hence, each stroke characteristic reflects a personality trait. We have measured the effectiveness of these features on a subset of handwritten Devnagari and Latin script datasets from the Center for Pattern Analysis and Recognition (CPAR-2012), which were written by 100 people where each person wrote three samples of the Devnagari and Latin text that we have designed for our experiments. The experiment yielded 100% correct identification on the training set. However, we observed an 88% and 89% correct identification rate when we experimented with 200 training samples and 100 test samples on handwritten Devnagari and Latin text. By introducing the majority voting based rejection criteria, the identification accuracy increased to 97% on both script sets.

Patch based Semi-supervised Linear Regression for Face Recognition

  • Ding, Yuhua;Liu, Fan;Rui, Ting;Tang, Zhenmin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권8호
    • /
    • pp.3962-3980
    • /
    • 2019
  • To deal with single sample face recognition, this paper presents a patch based semi-supervised linear regression (PSLR) algorithm, which draws facial variation information from unlabeled samples. Each facial image is divided into overlapped patches, and a regression model with mapping matrix will be constructed on each patch. Then, we adjust these matrices by mapping unlabeled patches to $[1,1,{\cdots},1]^T$. The solutions of all the mapping matrices are integrated into an overall objective function, which uses ${\ell}_{2,1}$-norm minimization constraints to improve discrimination ability of mapping matrices and reduce the impact of noise. After mapping matrices are computed, we adopt majority-voting strategy to classify the probe samples. To further learn the discrimination information between probe samples and obtain more robust mapping matrices, we also propose a multistage PSLR (MPSLR) algorithm, which iteratively updates the training dataset by adding those reliably labeled probe samples into it. The effectiveness of our approaches is evaluated using three public facial databases. Experimental results prove that our approaches are robust to illumination, expression and occlusion.

딥러닝을 활용한 고객 경험 기반 상품 평가 변화 예측 방법론 (A Methodology for Predicting Changes in Product Evaluation Based on Customer Experience Using Deep Learning)

  • 안지예;김남규
    • 한국IT서비스학회지
    • /
    • 제21권4호
    • /
    • pp.75-90
    • /
    • 2022
  • From the past to the present, reviews have had much influence on consumers' purchasing decisions. Companies are making various efforts, such as introducing a review incentive system to increase the number of reviews. Recently, as various types of reviews can be left, reviews have begun to be recognized as interesting new content. This way, reviews have become essential in creating loyal customers. Therefore, research and utilization of reviews are being actively conducted. Some studies analyze reviews to discover customers' needs, studies that upgrade recommendation systems using reviews, and studies that analyze consumers' emotions and attitudes through reviews. However, research that predicts the future using reviews is insufficient. This study used a dataset consisting of two reviews written in pairs with differences in usage periods. In this study, the direction of consumer product evaluation is predicted using KoBERT, which shows excellent performance in Text Deep Learning. We used 7,233 reviews collected to demonstrate the excellence of the proposed model. As a result, the proposed model using the review text and the star rating showed excellent performance compared to the baseline that follows the majority voting.

Credit Risk Evaluations of Online Retail Enterprises Using Support Vector Machines Ensemble: An Empirical Study from China

  • LI, Xin;XIA, Han
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권8호
    • /
    • pp.89-97
    • /
    • 2022
  • The e-commerce market faces significant credit risks due to the complexity of the industry and information asymmetries. Therefore, credit risk has started to stymie the growth of e-commerce. However, there is no reliable system for evaluating the creditworthiness of e-commerce companies. Therefore, this paper constructs a credit risk evaluation index system that comprehensively considers the online and offline behavior of online retail enterprises, including 15 indicators that reflect online credit risk and 15 indicators that reflect offline credit risk. This paper establishes an integration method based on a fuzzy integral support vector machine, which takes the factor analysis results of the credit risk evaluation index system of online retail enterprises as the input and the credit risk evaluation results of online retail enterprises as the output. The classification results of each sub-classifier and the importance of each sub-classifier decision to the final decision have been taken into account in this method. Select the sample data of 1500 online retail loan customers from a bank to test the model. The empirical results demonstrate that the proposed method outperforms a single SVM and traditional SVMs aggregation technique via majority voting in terms of classification accuracy, which provides a basis for banks to establish a reliable evaluation system.

영상처리기법을 이용한 CNN 기반 리눅스 악성코드 분류 연구 (A Study on Classification of CNN-based Linux Malware using Image Processing Techniques)

  • 김세진;김도연;이후기;이태진
    • 한국산학기술학회논문지
    • /
    • 제21권9호
    • /
    • pp.634-642
    • /
    • 2020
  • 사물인터넷(IoT) 기기의 확산으로 인해 다양한 아키텍처가 존재하는 Linux 운영체제의 활용이 증가하였다. 이에 따라 Linux 기반의 IoT 기기에 대한 보안 위협이 증가하고 있으며 기존 악성코드를 기반으로 한 변종 악성코드도 꾸준히 등장하고 있다. 본 논문에서는 시각화한 ELF(Executable and Linkable Format) 파일의 바이너리 데이터를 영상처리 기법 중 LBP(Local Binary Pattern)와 Median Filter를 적용하여 CNN(Convolutional Neural Network)모델로 악성코드를 분류하는 시스템을 제안한다. 실험 결과 원본 이미지의 경우 98.77%의 점수로 가장 높은 정확도와 F1-score를 보였으며 재현율도 98.55%의 가장 높은 점수를 보였다. Median Filter의 경우 99.19%로 가장 높은 정밀도와 0.008%의 가장 낮은 위양성률을 확인하였으며 LBP의 경우 전반적으로 원본과 Median Filter보다 낮은 결과를 보였음을 확인하였다. 원본과 영상처리기법별 분류 결과를 다수결로 분류했을 경우 원본과 Median Filter의 결과보다 정확도, 정밀도, F1-score, 위양성률이 전반적으로 좋아졌음을 확인하였다. 향후 악성코드 패밀리 분류에 활용하거나 다른 영상처리기법을 추가하여 다수결 분류의 정확도를 높이는 연구를 진행할 예정이다.

집단지성을 이용한 한글 감성어 사전 구축 (Building a Korean Sentiment Lexicon Using Collective Intelligence)

  • 안정국;김희웅
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.49-67
    • /
    • 2015
  • 최근 다양한 분야에서 빅데이터의 활용과 분석에 대한 중요성이 대두됨에 따라, 뉴스기사와 댓글과 같은 비정형 데이터의 자연어 처리 기술에 기반한 감성 분석에 대한 관심이 높아지고 있다. 하지만, 한국어는 영어와는 달리 자연어 처리가 어려운 교착어로써 정보화나 정보시스템에의 활용이 미흡한 실정이다. 이에 본 연구는 감성 분석에 활용이 가능한 감성어 사전을 집단지성으로 구축하였고, 누구나 연구와 실무에 사용하도록 API서비스 플랫폼을 개방하였다(www.openhangul.com). 집단지성의 활용을 위해 국내 최대 대학생 소셜네트워크 사이트에서 대학생들을 대상으로 단어마다 긍정, 중립, 부정에 대한 투표를 진행하였다. 그리고 집단지성의 효율성을 높이기 위해 감성을 '정의'가 아닌 '분류'하는 방식인 폭소노미의 '사람들에 의한 분류법'이라는 개념을 적용하였다. 총 517,178(+)의 국어사전 단어 중 불용어 형태를 제외한 후 감성 표현이 가능한 명사, 형용사, 동사, 부사를 우선 순위로 하여, 현재까지 총 35,000(+)번의 단어에 대한 투표를 진행하였다. 본 연구의 감성어 사전은 집단지성의 참여자가 누적됨에 따라 신뢰도가 높아지도록 설계하여, 시간을 축으로 사람들이 단어에 대해 인지하는 감성의 변화도 섬세하게 반영하는 장점이 있다. 따라서 본 연구는 앞으로도 감성어 사전 구축을 위한 투표를 계속 진행할 예정이며, 현재 제공하고 있는 감성어 사전, 기본형 추출, 카테고리 추출 외에도 다양한 자연어 처리에 응용이 가능한 API들도 제공할 계획이다. 기존의 연구들이 감성 분석이나 감성어 사전의 구축과 활용에 대한 방안을 제안하는 것에만 한정되어 있는 것과는 달리, 본 연구는 집단지성을 실제로 활용하여 연구와 실무에 활용이 가능한 자원을 구축하여 개방하여 공유한다는 차별성을 가지고 있다. 더 나아가, 집단지성과 폭소노미의 특성을 결합하여 한글 감성어 사전을 구축한 새로운 시도가 향후 한글 자연어 처리의 발전에 있어 다양한 분야들의 융합적인 연구와 실무적인 참여를 이끌어 개방적 협업의 새로운 방향과 시사점을 제시 할 수 있을 것이라 기대한다.

오프라인 필기체 슷자 인식을 위한 다양한 특징들의 성능 비교 및 인식률 개선 방안 (Performance Comparison of Various Features for Off-line Handwritten Numerals Recognition and Suggestions for Improving Recognition Rate)

  • 박창순;김두영
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.915-925
    • /
    • 1996
  • 본 논문에서는 오프라인 필기체 숫자의 변형을 흡수할 수 있는 효과적인 특징을 찾기 위해서 여러 가지 특징의 성능을 비교하였다. 실험적인 성능 비교 결과는 윤곽 선을 이용한 4방향성 특징 그리고 교차 거리+교차+망+투영 특징이 오프라인 필기체 숫자 인식에서 인식률과 인식 시간측면에서 효과적인 것으로 나타났다. 그리고 단일 신경회로망에서 인식률의 한계점을 극복하기 위하여 효과적인 특징을 조합한 복합특징 으로 다수결투표와 신뢰도 지수를 이용한 모듈화된 신경회로망을 제안한다. 제안된 방식의 성능을 검증하기 위해서 캐나다의 Concordia 대학교와 한국의 Dong-A 대학교 오프라인 필기체 숫자 데이터베이스에 대하여 실험을 하였다. Concordia 대학교의 데이터 베이스는 97.1%의 정인식률, 1.5%의 기각률, 1.4%의 오인식률 그리고 98.5%의 신뢰도가 나타났으며, Dong-A 대학 교의 데이터 베이스는 98%의 정인식률, 1.2%의 기각률, 0.8%의 오인식률 그리고 99.1%의 신뢰도가 나타났다.

  • PDF

단순화된 메타데이타를 이용한 고스트 기반 정족수 동의 기법의 개선 (Quorum Consensus Method based on Ghost using Simplified Metadata)

  • 조성연;김태윤
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권1호
    • /
    • pp.34-43
    • /
    • 2000
  • 중복 데이타는 분산 시스템에서 결함을 포용하는 방법 중 하나로 여러 복사본들의 일관성을 유지하기 위하여 복제 제어 프로토콜(replica control protocol)을 필요로 한다. 복제 제어 프로토콜 중 정 족수 동의 기법(quorum consensus method)은 정족수 이상의 동의를 얻어서 데이타에 접근하는 방법이다. 그런데 사이트나 통신 링크의 실패로 인하여 정족수 이상의 동의를 얻을 수 없으면 데이타 접근이 불가능하게 되므로 부족한 정족수를 고스트(ghost)로 대치하는 방법이 필요하다. 고스트는 메타 데이타(meta data)에 상태 정보만을 저장한 프로세스이기 때문에 생성과 관리의 비용을 줄이려면 메타 데이타를 간략화 시키는 것이 중요하다. 따라서 본 논문에서는 동료 집합을 이용하여 메타 데이타를 구성하는 방법을 제안한다. 제안된 방법은 2N+logN 비트만으로 메타 데이타를 구성할 수 있게 하고 동료 집합만을 이용하는 프로토콜이나 동적 선형 보우팅 프로토콜보다 향상된 가용성을 나타낸다. 제안된 방법의 가용성은 마코브 모델(Markov model)을 이용하여 측정하고 그 결과를 다른 프로토콜들과 비교 분석한다.

  • PDF

판소리 자동채보를 위한 구조분석 알고리즘 (Structural Analysis Algorithm for Automatic Transcription 'Pansori')

  • 주영호;김준철;서경숙;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제14권2호
    • /
    • pp.28-38
    • /
    • 2014
  • 서양 음악의 경우 자동채보와 내용기반 음악검색을 위한 음악 정보 분석연구가 활발하게 진행되고 있다. 그러나 한국 전통음악에서는 유사한 연구사례를 찾아보기 어렵다. 본 논문에서는 한국의 전통음악인 판소리 구조를 자동으로 분석하기 위한 알고리즘들을 제안한다. 제안된 알고리즘은 음성과 비음성의 시간 간격비율을 이용하여 '소리' 부분과 '아니리' 부분을 자동으로 구분한다. 뿐만 아니라 알고리즘은 '장단'이라 칭하는 리듬을 템플릿 이용한 다수결 결정 방법으로 강건하게 구분한다. 또한 알고리즘은 칼만 필터를 이용하여 '소리' 부분의 마디 지점을 검지해낸다. 본 논문에서 제안된 알고리즘들은 판소리 샘플들에서 양호하게 동작하였으며 자동채보의 전단계의 구조분석에 유용할 수 있다.

Ubiquitous 환경 하에서 고장 극복 암호 및 데이터 압축 (Fault Tolerant Encryption and Data Compression under Ubiquitous Environment)

  • 유영갑;김한벼리;박경창;이상진;김승열;홍윤기
    • 한국콘텐츠학회논문지
    • /
    • 제9권8호
    • /
    • pp.91-98
    • /
    • 2009
  • 본 논문은 암호화된 영상 데이터가 유비쿼터스 환경 하에서 무선 간섭에 의한 랜덤 오류를 가질 때 복호화 과정의 오류 산사태에 대한 해결책을 제시하였다. 영상 획득 장치는 영상 압축과 암호화 기능을 가지고서 데이터 트래픽 양을 줄이고 개인 정보를 보호하도록 구성한다. 블록 암호 알고리즘은 암호문의 단일 비트 오류가 여러 개의 픽셀 결함을 유발하는 산사태 효과를 겪을 수 있다. 새로운 고장 극복 방식은 오류의 산사태 효과를 다루는데 3 차원 데이터 셔플을 활용하여 에러 비트를 여러 프레임으로 분산시켜서 고립된 영상 결함으로 나타나도록 한다. 인접 화소 값에 대한 평균화 또는 다수결 회로는 에러정정을 위한 데이터 증가 없이 두드러져 보이는 화소 결함을 극복하도록 한다. 이 방식은 기존 Hamming code 방식보다 33% 적은 데이터 트래픽 부하를 가진다.