• 제목/요약/키워드: Weighted F-measure

검색결과 21건 처리시간 0.026초

가중치가 부여된 베이지안 분류자를 이용한 스팸 메일 필터링 시스템 (Spam-Mail Filtering System Using Weighted Bayesian Classifier)

  • 김현준;정재은;조근식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1092-1100
    • /
    • 2004
  • 최근 인터넷의 급속한 성장과 더불어 전자메일(E-Mail)은 통신 및 정보, 의사교환의 필수적인 매체로 사용되어지고 있다. 그러나 편리하고 비용이 들지 않는 장점을 이용해 엄청난 양의 스팸 메일이 매일같이 쏟아져 오고, 그 문제의 심각성에 정보통신부는 ‘정보통신망 이용촉진 및 정보보호등에 관한 개정안’이라는 새로운 법률까지 만들었다. 본 논문에서는 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(naive Bayesian classifier)보다 개선된 가중치가 부여된 베이지안 분류자 (weighted Bayesian classifier)와 정보통신부의 개정안을 준수하는 매일을 분류하기 위한 전처리 단계, 그리고 사용자의 행동을 학습하여 보다 정확한 분류를 가능하게 지능형 에이젼트(intelligent agent)가 결합된 형태의 스팸 메일 필터링 시스템(spam mail filtering system)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 넣을 필요 없이 학습한 데이타를 가지고 자동적으로 스팸 메일을 분류할 수가 있는데, 특히 이메일의 특징 추출(feature extraction)을 이용하여 상대적으로 스팸/논스팸 판별에 비중이 큰 단어들에 대해 가중치를 부여함으로서 필터링의 성능향상을 도모하였다. 실험에서는 제안된 시스템의 최적의 성능 평가를 위해서 일반 나이브 베이지안 필터링시의 성능과 이메일 헤더정보, 특정 Tag들 그리고 하이퍼링크 부분에 가중치를 준 베이지안 필터링, 마지막으로 4가지를 결합한 상태의 필터링 성능을 각각 비교 분석하였다. 그 결과 제안하는 시스템이 나이브 베이지안 분류자를 이용한 시스템보다 정확도에서는 5.7% 저조한 성능을 보였으나, 재현율에서 33.3%, F-measure에서 31.2% 우수한 성능향상을 보였다.

흉부 볼륨 CT영상에서 Weighted Integration Loss을 이용한 폐암 분할 알고리즘 연구 (A Study on Lung Cancer Segmentation Algorithm using Weighted Integration Loss on Volumetric Chest CT Image)

  • 정진교;김영재;김광기
    • 한국멀티미디어학회논문지
    • /
    • 제23권5호
    • /
    • pp.625-632
    • /
    • 2020
  • In the diagnosis of lung cancer, the tumor size is measured by the longest diameter of the tumor in the entire slice of the CT. In order to accurately estimate the size of the tumor, it is better to measure the volume, but there are some limitations in calculating the volume in the clinic. In this study, we propose an algorithm to segment lung cancer by applying a custom loss function that combines focal loss and dice loss to a U-Net model that shows high performance in segmentation problems in chest CT images. The combination of values of the various parameters in custom loss function was compared to the results of the model learned. The purposed loss function showed F1 score of 88.77%, precision of 87.31%, recall of 90.30% and average precision of 0.827 at α=0.25, γ=4, β=0.7. The performance of the proposed custom loss function showed good performance in lung cancer segmentation.

Topic Extraction and Classification Method Based on Comment Sets

  • Tan, Xiaodong
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.329-342
    • /
    • 2020
  • In recent years, emotional text classification is one of the essential research contents in the field of natural language processing. It has been widely used in the sentiment analysis of commodities like hotels, and other commentary corpus. This paper proposes an improved W-LDA (weighted latent Dirichlet allocation) topic model to improve the shortcomings of traditional LDA topic models. In the process of the topic of word sampling and its word distribution expectation calculation of the Gibbs of the W-LDA topic model. An average weighted value is adopted to avoid topic-related words from being submerged by high-frequency words, to improve the distinction of the topic. It further integrates the highest classification of the algorithm of support vector machine based on the extracted high-quality document-topic distribution and topic-word vectors. Finally, an efficient integration method is constructed for the analysis and extraction of emotional words, topic distribution calculations, and sentiment classification. Through tests on real teaching evaluation data and test set of public comment set, the results show that the method proposed in the paper has distinct advantages compared with other two typical algorithms in terms of subject differentiation, classification precision, and F1-measure.

Substitution Elasticity and Gains from Trade Variety in South Korea

  • Kichun Kang
    • Journal of Korea Trade
    • /
    • 제26권7호
    • /
    • pp.1-18
    • /
    • 2022
  • Purpose - Recent international studies have largely focused on measuring the welfare gains from increased trade varieties. To adequately capture the variety gains, it is of importance to estimate the elasticity of substitution between varieties of trade goods because it is one of the key parameters to determine the magnitude of the variety gains. Using the import data of South Korea, this paper shows that the elasticities vary substantially across the estimators, which affects the magnitude of the gains from trade. Design/methodology - Empirical studies working on the gains from trade variety have heavily depended on the estimation methods for the elasticity of substitution between trade varieties, developed by Feenstra (1994) and refined by Broda and Weinstein (2006). We estimate and compare the estimated elasticities for 8,945 HS 10 goods of South Korea, obtained from the three estimation methods: Feenstra's weighted least square (F-WLS), Feenstra's feasible generalized least square (F-FGLS), and Broda and Weinstein's feasible generalized least square (BW-FGLS). Findings - Using the estimated elasticities from the F-FGLS, considered as a suitable estimator, A typical Korean consumer saved 228 dollars per year by the greater access to new import varieties. This leads to gains from imported variety of 2.06% of GDP. In 2017, a typical Korean consumer would gain by 611 dollars, compared with 2000. China is the country with the largest contribution (28.4%), followed by Japan and USA. About 50% of all the welfare gains come from the imports from the three main trade partners. The Southern Asian countries are more important to the South Korean welfare gain than the Western European countries. Originality/value - Existing studies have chosen one of the methods without any criterion for the choice and then estimated the elasticities of substitution between varieties of trade goods. This paper focuses on the estimation specifications and methods as the cause of the disparity in estimated elasticities and welfare gains from trade variety. According to the Ramsey RESET and White tests, the F-FGLS estimates are relatively better compared to the F-WLS and BW-FGLS estimates. As another contribution, this paper provides the first measure of the welfare gains from trade variety for South Korea, using the estimated elasticities of substitution between trade varieties.

사용자 청취 습관과 태그 정보를 이용한 하이브리드 음악 추천 시스템 (A Hybrid Music Recommendation System Combining Listening Habits and Tag Information)

  • 김현희;김동건;조진남
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.107-116
    • /
    • 2013
  • 본 연구에서는 소셜 음악 사이트에서 사용자들이 음악 아이템을 청취한 횟수와 생성한 태그 정보를 혼합하여 음악을 추천하는 시스템을 제안한다. 현재, 상용화된 음악 추천 시스템들은 주로 사용자의 청취 습관과 외부적인 선호도 입력값을 기반으로 음악을 추천하고 있다. 그러나 이 방식은 아직 음악을 청취한 사용자가 많지 않은 새로운 음악이나 청취 정보가 없는 새로운 사용자의 경우 추천하는 데 어려움이 있다. 이 문제를 해결하기 위해서 본 논문에서는 사용자가 선정한 키워드를 아이템에 부여하는 협업 태깅으로 생성된 태그 정보를 활용하였다. 태그의 의미를 파악하여 감정 표현의 정도에 따라 가중치를 부여한 뒤, 태그 점수와 청취 횟수를 혼합하여 음악 아이템의 선호도를 산출하였다. 이를 기반으로 사용자 프로파일을 생성하고 협업 필터링 알고리즘을 수행하였다. 제안하는 추천 방법의 효율성을 평가하기 위해서, 청취 습관 기반 추천, 태그 점수 기반 추천, 하이브리드 추천 방법의 세 가지 추천 방법에 대해서 정확도, 재현율, 그리고 F-measure를 계산하였다. 실험 결과에 대해 통계적 검증을 시행한 결과, 하이브리드 추천 방법이 다른 두 가지 방식보다 통계적으로 유의한 차이를 보여 성능이 우수한 것으로 나타났다.

The Study on The Identification Model of Friend or Foe on Helicopter by using Binary Classification with CNN

  • Kim, Tae Wan;Kim, Jong Hwan;Moon, Ho Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.33-42
    • /
    • 2020
  • 각종 감시체계에서 육안에 의존하여 물체를 식별해내는 것은 어렵고 실수하기 쉬우므로 군 감시체계에서 자동식별능력의 필요성은 더욱 높아지고 있다. 사회에 발표되는 모형들은 군 무기체계에 대한 데이터가 반영되지 않아 군에 바로 적용하는 것은 제한된다. 본 연구는 군용 헬기의 이미지에 합성곱 신경망을 적용하여 피아식별 모형을 구축한 연구이다. 제안하는 모형은 우리나라에서 주로 사용하고 있는 헬기인 AH-64 기종과 공산권 국가에서 주로 사용하고 있는 헬기인 Mi-17 기종의 이미지를 통해 학습시켜 구축되었다. 제안하는 모형의 성능을 살펴보면, 평가척도를 이용하여 평가한 결과 97.8%의 정확도, 97.3%의 정밀도, 98.5% 재현율과 97.9%의 F-measure의 성능을 보임을 확인하였다. 이런 분류 결과에 대해서 Feature-map을 통해 아군 헬기의 바퀴와 무장, 그리고 흡기구 주변이, 적군 헬기의 바퀴, 흡기구, 그리고 창문 부위가 피아식별 모형의 분류 기준임을 확인할 수 있었다. 본 연구는 CNN을 이용하여 군 무기체계 중 헬기의 영상정보에 대한 피아식별에 대한 분류를 처음으로 시도한 연구이며, 본 연구에서 제안하는 모형은 기존의 다른 무기체계에 대한 분류 모형보다 높은 정확도를 보인다.

Multi-scale Diffusion-based Salient Object Detection with Background and Objectness Seeds

  • Yang, Sai;Liu, Fan;Chen, Juan;Xiao, Dibo;Zhu, Hairong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권10호
    • /
    • pp.4976-4994
    • /
    • 2018
  • The diffusion-based salient object detection methods have shown excellent detection results and more efficient computation in recent years. However, the current diffusion-based salient object detection methods still have disadvantage of detecting the object appearing at the image boundaries and different scales. To address the above mentioned issues, this paper proposes a multi-scale diffusion-based salient object detection algorithm with background and objectness seeds. In specific, the image is firstly over-segmented at several scales. Secondly, the background and objectness saliency of each superpixel is then calculated and fused in each scale. Thirdly, manifold ranking method is chosen to propagate the Bayessian fusion of background and objectness saliency to the whole image. Finally, the pixel-level saliency map is constructed by weighted summation of saliency values under different scales. We evaluate our salient object detection algorithm with other 24 state-of-the-art methods on four public benchmark datasets, i.e., ASD, SED1, SED2 and SOD. The results show that the proposed method performs favorably against 24 state-of-the-art salient object detection approaches in term of popular measures of PR curve and F-measure. And the visual comparison results also show that our method highlights the salient objects more effectively.

이종의 공간 데이터 셋의 면 객체 자동 매칭 방법 (Automated Areal Feature Matching in Different Spatial Data-sets)

  • 김지영;이재빈
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.89-98
    • /
    • 2016
  • 본 연구에서는 축척과 갱신 주기가 상이한 이종의 공간 데이터 셋을 융합하기 위하여 사용자의 개입을 최소화하면서 다대다 관계에도 적용이 가능한 기하학적 방법론 기반의 면 객체 자동 매칭 방법을 제안하였다. 이를 위하여 첫째, 포함함수가 0.4 이상인 객체(노드)는 인접행렬에서 에지로 연결되었고, 이들 인접행렬의 곱을 반복적으로 수행하여 다대다 관계를 포함하는 후보 매칭 쌍을 선정하였다. 다대다 관계인 면 객체들은 알고리즘으로 생성된 convex hull로 단일 면 객체로 변환하였다. 기하학적 매칭을 위하여, 매칭 기준을 설정하고, 이들을 유사도 함수를 이용하여 유사도를 계산하였다. 다음으로 변환된 유사도와 CRITIC 방법으로 도출된 가중치를 선형 조합하여 형상 유사도를 계산하였다. 마지막으로 훈련자료에서 모든 가중치에 대한 정확도와 재현율을 나타낸 PR 곡선의 교차점인 EER로 임계값을 선정하고, 이 임계값을 기준으로 매칭 유무를 판별하였다. 제안된 방법을 수치지도와 도로명 주소기본도에 적용한 결과, 일부 다대다 관계에서 잘못 매칭되는 경우를 시각적으로 확인할 수 있었으나, 통계적 평가에서 정확도, 재현율, F-measure가 각각 0.951, 0.906, 0.928로 높게 나타났다. 이는 제안된 방법으로 이종의 공간 데이터 셋을 자동으로 매칭하는데 그 정확도가 높음을 의미한다. 그러나 일부 오류가 발생한 다대다 관계인 후보 매칭 쌍을 정확하게 정량화하기 위해서 포함함수나 매칭 기준에 대한 연구가 진행되어야 할 것이다.

Development of a Group-specific Average Brain Atlas: A Comparison Study between Korean and Occidental Groups

  • Kim Hyun-Pil;Lee Jong-Min;Lee Dong Soo;Koo Bang-Bon;Kim Jae-Jin;Kim In Young;Kwon Jun Soo;Yoo Tae Woo;Chang Kee-Hyun;Kim Sun I.
    • 대한의용생체공학회:의공학회지
    • /
    • 제26권1호
    • /
    • pp.9-16
    • /
    • 2005
  • One of the most important roles of a brain atlas is providing a spatial reference system in which multiple images can be interpreted in a consistent way. The brain atlase based on Western populations such as the International Consortium for Brain Mapping's 452 T-1 Weighted Average Atlas was widely used; however, they may not be the optimal choice for use with brain images from other ethnic groups, because structural differences between occidental and oriental brains have been reported. Therefore, in this study, we created an average brain atlas from 100 healthy Koreans (100 cases (M/F=53/47), 39.0±17.0 years). The purpose of this study was to make a Korean average-brain atlas and to measure its differences from a widely accepted average brain atlas built on an occidental population. The average brain atlas for Koreans was developed using widely accepted tools and procedures. The comparison between the Korean and occidental averages was performed using tissue probability maps and a registration tool, and it was shown that the global pattern of differences between the two average brains found in this work agreed with previously reported differences: Korean brains are wider and shorter in size, and smaller in volume, yet no hemispheric volume asymmetry was found.

A Study on Multilayer Sub-contracting in Construction Industry of Hong Kong

  • Cheng, T.F.;Lam, H.C.;Leung, K.L.;Liu, W.T.;Zayed, Tarek;Sun, Yi
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.23-29
    • /
    • 2020
  • Multilayer sub-contracting is a significant practice among the world, including Hong Kong. When a principal contractor secured a project from a developer, the specific jobs will usually be breaking down and sub-contractors with the lowest bid [1]. The adoption of multilayer sub-contracting has been a controversy issue which is considered as a two-side blade. While certain studies have been carried out to examine both the contributions, damages and improvements for multi-layer subcontracting, the construction industry and researchers are still waiting for a solid measure to enhance the system. Hence, this research attempts to study the advantages, disadvantages, conducts a comparison between single and multilayer sub-contracting and measures of current Hong Kong construction industry based on literature review, questionnaire and in-depth interviews. To achieve the objectives, Analytic Hierarchy Process (AHP) and total weighted score methods are adopted to examine and rank the criterion. The findings of this study provide a good basis for understanding the major reasons and problems caused by the adoption of multilayer sub-contracting. Besides, the identified safety perspective explores a new perspective regarding to issues of multi-layer subcontracting, which will serve as a solid foundation for further research to enhance safety performance. Finally, the findings of measurements towards improvement of multilayer sub-contracting will also provide a solidsolution for construction industry.

  • PDF