• 제목/요약/키워드: Classification accuracy

검색결과 3,065건 처리시간 0.033초

데이터 이산화와 러프 근사화 기술에 기반한 중요 임상검사항목의 추출방법: 담낭 및 담석증 질환의 감별진단에의 응용 (Extraction Method of Significant Clinical Tests Based on Data Discretization and Rough Set Approximation Techniques: Application to Differential Diagnosis of Cholecystitis and Cholelithiasis Diseases)

  • 손창식;김민수;서석태;조윤경;김윤년
    • 대한의용생체공학회:의공학회지
    • /
    • 제32권2호
    • /
    • pp.134-143
    • /
    • 2011
  • The selection of meaningful clinical tests and its reference values from a high-dimensional clinical data with imbalanced class distribution, one class is represented by a large number of examples while the other is represented by only a few, is an important issue for differential diagnosis between similar diseases, but difficult. For this purpose, this study introduces methods based on the concepts of both discernibility matrix and function in rough set theory (RST) with two discretization approaches, equal width and frequency discretization. Here these discretization approaches are used to define the reference values for clinical tests, and the discernibility matrix and function are used to extract a subset of significant clinical tests from the translated nominal attribute values. To show its applicability in the differential diagnosis problem, we have applied it to extract the significant clinical tests and its reference values between normal (N = 351) and abnormal group (N = 101) with either cholecystitis or cholelithiasis disease. In addition, we investigated not only the selected significant clinical tests and the variations of its reference values, but also the average predictive accuracies on four evaluation criteria, i.e., accuracy, sensitivity, specificity, and geometric mean, during l0-fold cross validation. From the experimental results, we confirmed that two discretization approaches based rough set approximation methods with relative frequency give better results than those with absolute frequency, in the evaluation criteria (i.e., average geometric mean). Thus it shows that the prediction model using relative frequency can be used effectively in classification and prediction problems of the clinical data with imbalanced class distribution.

노이즈 기반의 새로운 피쳐(feature)와 SVM에 기반한 개선된 CG(Computer Graphics) 및 PI(Photographic Images) 판별 방법 (New feature and SVM based advanced classification of Computer Graphics and Photographic Images)

  • 정두원;정현지;홍일영;이상진
    • 정보보호학회논문지
    • /
    • 제24권2호
    • /
    • pp.311-318
    • /
    • 2014
  • 컴퓨터 그래픽 기술은 사람의 눈으로 컴퓨터 그래픽과 카메라로 촬영한 사진을 구분하기 힘들 정도로 발전하였다. 그래픽 기술의 진보는 인간에게 많은 편의를 주었으나 악의적인 조작 편집 및 사기 기법으로 사용되는 등 부작용도 수반하였다. 이에 대응하기 위해 이미지의 피쳐(feature)를 이용하여 컴퓨터 그래픽을 판별해내는 알고리즘에 대한 연구가 진행되고 있다. 본 논문에서는 기존에 제안된 알고리즘을 직접 검증해보고 컴퓨터 그래픽의 특성을 잘 나타내는 노이즈에 기반한 새로운 피쳐를 제안한다. 또한 선행 연구에서 제안한 피쳐와 함께 SVM(Support Vector Machine)을 활용하여 판별 정확도를 높이는 방법을 소개한다.

문자메시지의 특성을 고려한 한국어 모바일 스팸필터링 시스템 (Korean Mobile Spam Filtering System Considering Characteristics of Text Messages)

  • 손대능;이정태;이승욱;신중휘;임해창
    • 한국산학기술학회논문지
    • /
    • 제11권7호
    • /
    • pp.2595-2602
    • /
    • 2010
  • 본 논문에서는 휴대전화로 오는 짧은 문자메시지의 스타일을 반영하여 스팸 문자메시지를 검출해내는 한국어 모바일 스팸필터링 시스템을 소개한다. 제안하는 시스템은 내용어 어휘들의 출현에만 기반을 두는 기존 방법과 달리 제안하는 스타일 정보를 추가적으로 활용하여 스팸성 단어가 포함된 일반 문자메시지가 스팸으로 잘못 분류되는 치명적인 오류를 효과적으로 줄인다. 또한 띄어쓰기 및 철자 오류교정을 거쳐 문자메시지를 정규화 함으로써 스팸 분류성능을 향상시킨다. 실제 한국어 문자메시지를 이용한 실험 결과를 통해 제안하는 시스템이 한국어 스팸 문자메시지 검출에 효과적임을 보인다.

네트워크상에서의 징후를 기반으로 한 공격분류법 (A Symptom based Taxonomy for Network Security)

  • 김기윤;최형기;최동현;이병희;최윤성;방효찬;나중찬
    • 정보처리학회논문지C
    • /
    • 제13C권4호
    • /
    • pp.405-414
    • /
    • 2006
  • 공격 발생시에 네트워크에 나타나는 징후정보를 수집하여 공격을 분류하는 징후기반공격분류법을 제안한다. 이 공격분류법은 공격 발생시 징후를 이용하므로 필요한 정보의 수집이 빠르고 알려지지 않은 공격에 대한 분류가 가능한 장점이 있다. 제안하는 공격법은 두 단계로 공격을 분류한다. 단일 공격자로부터 단일 공격대상에게 나타나는 단일 공격들을 먼저 분류하고 단일 공격들이 서로 연관성 없는 다른 공격들인지 아니면 동일한 하나의 공격을 구성하는 연관된 공격인지 판단하게 된다. 따라서, 이미 제안된 공격분류법보다 정확하게 분산서비스거부공격이나 웜, Bot과 같은 공격을 분류할 수 있게 되었다. 제안하는 분류법을 이용하여 원과 분산서비스거부공격의 특정 및 근거리통신망에서 발생하는 공격의 특정을 도출하였고 이러한 특정들은 새로운 웜이나 분산서비스거부공격 또는 근거리통신망에서 발생하는 공격들도 공통적으로 가지는 특정임을 보였다.

기계가독형사전에서 상위어 판별을 위한 규칙 학습 (Learning Rules for Identifying Hypernyms in Machine Readable Dictionaries)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.171-178
    • /
    • 2006
  • 기계가독형사전(Machine Readable Dictionary)에서 단어의 정의문에 나타나는 항목 단어의 상위개념을 추출하는 대부분의 연구들은 전문가에 의해 작성된 어휘패턴을 사용하였다. 이 방법은 사람이 직접 패턴을 수집하므로 시간과 비용이 많이 소모될 뿐만 아니라, 자연언어에는 같은 의미를 가진 다앙한 표현들이 존재하므로 넓은 커버리지를 갖는 어휘패턴들을 수집하는 것이 매우 어렵다는 단점이 있다. 이런 문제점들을 해결하기 위하여, 본 논문에서는 구문적 특징만을 이용한 상위어 판별 규칙을 기계학습함으로써 기존에 사용되었던 어휘패턴의 지나친 어휘 의존성으로 인한 낮은 커버리지 및 패턴 수집의 문제를 해결하는 방법을 제안한다. 제안한 방법으로 기계학습된 규칙들을 상위어 자동추출과정에적용한 결과 정확도 92.37% 성능을 보였다. 이는 기존 연구들보다 향상된 성능으로 기계학습에 의해 수집된 판별규칙이 상위어 판별에 있어서 어휘패턴의 문제를 해결할 수 있다는 것을 입증하였다.

로지스틱 회귀모형을 이용한 산불발생확률모형 개발 (Development of Forest Fire Occurrence Probability Model Using Logistic Regression)

  • 이병두;유계선;김선영;김경하
    • 한국산림과학회지
    • /
    • 제101권1호
    • /
    • pp.1-6
    • /
    • 2012
  • 산불의 빠른 탐지와 진화를 위해서는 산불이 발생할 가능성이 높은 곳에 산불예방과 진화를 위한 자원을 집중적으로 배치하여야 한다. 이를 위해 임상, 지형 인자, 사회-공간 인자를 이용하여 산불발생확률을 추정할 수 있는 로지스틱 회귀모형을 개발하고, 이를 통해 전국 산불발생확률지도를 작성하였다. 모형 추정 결과 산림 및 묘지와의 거리, 과거의 산불빈도, 침엽수림, 낮은 고도, 급경사에서 산불발생확률이 높은 것으로 나타났으며, 분류정확도는 63% 이었다. 개발된 모형과 지도는 한정된 산불자원을 최적으로 배치하는데 참고자료로 활용될 수 있을 것이다.

기술력 평가항목을 이용한 고활동성 중소기업 판별 (Verification Test of High-activity SMEs Using Technology Appraisal Items)

  • 이준원
    • 기술혁신연구
    • /
    • 제28권1호
    • /
    • pp.31-52
    • /
    • 2020
  • 본 연구는 기술금융에 사용되는 '미래 진보성' 중심의 기술력 평가모형을 이용하여 기업의 고활동성 여부에 대한 사전적(Ex-ante) 판별력 검증을 목적으로 한다. 분석 대상기업을 업종(제조업군/비(非)제조업군)과 업력(창업기업군/비(非)창업기업군)으로 구분한 후 해당 군집의 평균 총자산회전율 2배 이상을 달성한 기업을 고활동성 중소기업으로 정의하였다. 의사결정나무 모형 중 하나인 C5.0 기법을 적용하여 판별모형을 작성한 결과 모든 업종과 업력에서 99% 이상의 분류정확도를 보였으며, 모형의 판별력이 안정적임을 확인하였다. 분석 결과 경영진 전문성, 자본참여도, 자금조달능력 항목은 업종·업력과 무관하게 고활동성 중소기업 여부를 결정하는 중요변수로 확인되었으며, 제조업군에서는 기술경영능력과 기술수명주기 또한 고활동성 중소기업 여부를 결정하는 평가항목임이 확인되었다. 이를 통해 기술력 평가항목을 이용하여 고활동성 중소기업 여부에 대한 사전적 판별 및 정책적 활용에 대한 가능성을 일정부분 확인할 수 있었다.

도산 예측을 위한 러프집합이론과 인공신경망 통합방법론 (The Integrated Methodology of Rough Set Theory and Artificial Neural Network for Business Failure Prediction)

  • 김창연;안병석;조성식;김성희
    • Asia pacific journal of information systems
    • /
    • 제9권4호
    • /
    • pp.23-40
    • /
    • 1999
  • This paper proposes a hybrid intelligent system that predicts the failure of firms based on the past financial performance data, combining neural network and rough set approach, We can get reduced information table, which implies that the number of evaluation criteria such as financial ratios and qualitative variables and objects (i.e., firms) is reduced with no information loss through rough set approach. And then, this reduced information is used to develop classification rules and train neural network to infer appropriate parameters. Through the reduction of information table, it is expected that the performance of the neural network improve. The rules developed by rough sets show the best prediction accuracy if a case does match any of the rules. The rationale of our hybrid system is using rules developed by rough sets for an object that matches any of the rules and neural network for one that does not match any of them. The effectiveness of our methodology was verified by experiments comparing traditional discriminant analysis and neural network approach with our hybrid approach. For the experiment, the financial data of 2,400 Korean firms during the period 1994-1996 were selected, and for the validation, k-fold validation was used.

  • PDF

시판 복분자주의 기호도 분석을 통한 탐색적 등급 분류 (Exploratory Study on the Quality Grade of Korea Black Raspberry Wines by Using Consumer Preference Data)

  • 이승주
    • 한국식품과학회지
    • /
    • 제46권3호
    • /
    • pp.352-357
    • /
    • 2014
  • 수도권 거주 소비자 100명을 대상으로 전국에서 시판되는 24종의 복분자주의 소비자 기호도 조사를 실시하였다. 24개 복분자주 시료의 전반적인 기호도 평가의 분산분석을 통해 기호도 평가에 연령 및 성별간의 차이보다는 개인 간의 차이가 더 크게 작용한 것으로 나타났다. 전체 소비자 기호도 평가 결과를 바탕으로 군집분석을 실시하여 시료 간 유사한 기호도 평가를 보인 세 개의 군집으로 분류하였다. 세 개의 군집은 기호척도의 빈도수 분포와 실제 기호도 평균 점수에서 군집 간의 차이가 확인되었다. 이러한 군집 분류를 바탕으로 판별분석을 활용하여 군집의 분류가 적절한지 또한 판별함수의 예측력은 적정한지 파악하였다. 판별분석결과 분류율이 100%로 적절한 예측력을 보였고, 세 군집간의 마할라노비스거리와 추출된 요인 내에서의 분포도도 적정한 것으로 나타났다. 향후 다양한 우리술의 품질평가시스템 개발에 소비자 기호도 조사를 활용한 평가방법이 활용 가능하리라 여겨진다.

"방제학"에 기재된 방제 효능과 본초 구성을 기반으로 도출된 효능의 비교 연구 (The Comparative Study between the Effect of Herbal Formula in Schoolbook and the Effect deduced from Compositional Herbal Effects)

  • 박병선;김은하;이선아;이병욱
    • 대한한의학원전학회지
    • /
    • 제21권1호
    • /
    • pp.79-92
    • /
    • 2008
  • Objective The analysis method based on the herbal formula's effects is a general tool, in traditional medicine. In effective applications of herbal formula, Korean herbal medicines traditionally used the classification methods based on the curative effects through the various compositions of herbal formulas. However' the effects of herbal formulas were not filed systemically in ancient literatures, and the standards to confirm their effects are not clear. Thus, it is not easy to classify herbal formulas according to the curative effects. Furthermore, there are no standards to estimate the effects of prescriptions frequently directed in clinic. In this study, we aimed to provide the methodology of classifying the curative effects of herbal formulas by calculating the combination of the effect of each compositional herb through the DB systems. Results : By comparing effects of herbal formula with those of compositional herbs, we found that about 25-50% of the herbal effects were included in herbal formula's effects. These results showed that the prospective estimation of herbal formula's effects may be possible through the DB systems filing herbal effects. To enhance the accuracy in explaining the herbal formula's effect, more studies are needed by giving prominence to major effects and by subtracting minor effects.

  • PDF