• 제목/요약/키워드: 판별모델

검색결과 624건 처리시간 0.027초

면 객체 매칭을 위한 판별모델의 성능 평가 (Evaluation of Classifiers Performance for Areal Features Matching)

  • 김지영;김정옥;유기윤;허용
    • 한국측량학회지
    • /
    • 제31권1호
    • /
    • pp.49-55
    • /
    • 2013
  • 데이터마이닝과 바이오인식 분야의 판별모델의 성능평가 방법을 이종의 공간 데이터 셋의 매칭에 적용함으로써 좋은 매칭결과를 보이는 판별모델을 도출하고자 한다. 이를 위하여 매칭 기준별 매칭 후보객체 쌍의 거리 값을 구하고, 이들 거리 값을 Min-Max 방법과 Tanh 방법으로 정규화하여 유사도를 산출한다. 산출된 유사도를 CRITIC 방법, Matcher Weighting 방법 그리고 Simple Sum 방법으로 결합하여 형상유사도를 도출하는 판별모델을 적용하였다. 각 판별모델을 PR곡선과 AUC-PR로 평가한 결과, Tanh 정규화와 Simple Sum 방법을 적용한 판별모델의 AUC-PR이 0.893으로 가장 높게 나타났다. 따라서 이종의 공간 데이터 셋의 매칭을 위해서는 Tanh 정규화를 이용하여 각 매칭기준별 유사도를 산출하고 Simple Sum 방법으로 형상유사도를 구하는 판별모델이 적합한 것으로 사료된다.

교통사고 발생원인 인식과 감소대책 인지 영향요인 판별.분류에 관한 연구 (A Study on Discriminant.Classification Model of Impact Factors about Understanding of Traffic Accident Causes and Acknowledgement to Decrease Traffic Accidents)

  • 고상선;배기목;이원규;정헌영
    • 대한교통학회지
    • /
    • 제20권7호
    • /
    • pp.143-153
    • /
    • 2002
  • 본 연구는 교통사고의 발생원인에 대한 인식유형과 감소대책에 대한 인지 유형별 영향요인의 정도를 분석하기 위하여 수량화이론 II류와 CHAID 분석법을 이용하여 분류모델과 판별모델을 구축하였다. 수량화이론 II류에 의한 교통사고 발생원인에 대한 인식 유형별 영향요인 판별모델은 전체 적중률이 78.4%로 매우 높게 나타났다. 편상관계수는 설명변수의 항목 중 학력, 성별, 운전경력 년 수, 소유 차종의 순으로 영향을 미치고 외적 변수인 교통사고 발생원인에 대한 유형에서는 기여 정도가 교통단속 부재 > 교통체계 미비 > 승용차 과다 사용 >잘못된 의식 때문의 순으로 나타났다. 교통사고 감소 대책에 대한 인지유형별 영향요인 판별모델은 전체 적중률이 59.9%로 높게 나타났으며, 편상관 계수는 학력, 성별, 운전경력 연수, 연령의 순으로 영향을 미치고 있고, 외적 변수인 교통사고 감소 대책에 대한 유형에서는 기여 정도가 교통단속 강화 > 대중교통수단 이용 유도 > 교통체계 개선 > 의식 개혁의 순으로 나타났다. 또한 CHAID 분석법에 의한 교통사고 발생원인에 대한 인식 유형별 영향요인 분류모델에 있어서는 예측변수로 학력, 연령, 성별, 통행수단의 네 가지 변수가, 교통사고의 감소 대책에 대한인지 유형별 영향요인 분류모델에 있어서는 학력, 운전경력 연수, 성별 그리고 통행수단의 네 가지 변수가 카이제곱 통계량 이 5%의 유의수준에서 유의한 것으로 판단되었다. 교통사고 발생원인 인식과 감소 대책의 인지 유형에 대한 빈도분석과 교차분석은 의식과 관련한 유형이 가장 높게 나타났으나 판별.분류모델에서는 교통단속과 관련한 유형이 기여 정도가 높고 의식 관련 유형이 상대적으로 낮게 나타나는 등 반대양상을 보이고 있어 심리적으로 내재되어 있고 표면에 잘 드러나지 않았던 의식 수준의 낮음이 분류모델을 통해서 명확하게 드러났다.

근적외선 분광법을 이용한 콩과 이물질의 판별 (Identification of Foreign Objects in Soybeans Using Near-infrared Spectroscopy)

  • 임종국;강석원;이강진;모창연;손재용
    • 산업식품공학
    • /
    • 제15권2호
    • /
    • pp.136-142
    • /
    • 2011
  • 본 연구에서는 정상 콩과 이에 혼입되는 이물질을 판별하기 위해 900 nm에서 1800 nm의 파장대역에서 단색화장치가 장착된 근적외선 분광장치를 이용하여 획득된 콩과 이물질의 반사 스펙트럼의 세기를 이용하여 각각의 판별예측모델을 개발하고 그 성능과 판별정확도를 검증해보았다. 정상콩 60 립과 이물질 60 점을 각각 2 회 반복하여 측정한 총 240 개의 반사스펙트럼에 대해서 모델 개발용인 calibration group으로 168 개를, 나머지 72 개는 개발된 모델을 예측하는 prediction group으로 나누어 사용하였다. 획득된 스펙트럼은 광원의 불안정함, 시료의 크기와 형태에서 기인되는 여러 변이들을 최소화하기 위해 다양한 수학적인 전처리를 적용하였으며 판별예측모델의 개발을 위해 PLS-DA와 SIMCA 방법을 사용하여 모델의 예측 성능과 판별율을 검토하였다. PLS-DA에서 모델 개발에 사용된 84 개의 정상 콩 스펙트럼 CLASS I은 적용된 모든 전처리에서 100%의 판별율을 보여주었으며 이물질 스펙트럼 CLASS II에서도 SNV 전처리를 제외하고는 모두 100% 이물질로 판별하여 분류하였다. 개발된 PLS-DA의 모델에 대한 prediction group의 검증에 있어서는 평균값 정규화 전처리 방법이 정상 콩과 이물질에서 100% 판별율을 보여주었다. SIMCA를 이용한 이물질 판별예측모델 개발은 PLS-DA와 비교할 때 상대적으로 저조한 판별율 결과를 나타냈으며 최대값 정규화와 일정 범위값 정규화의 전처리 방법을 적용한 모델이 평균 판별율 94.4%로 다소 양호한 결과를 보여주었다. 따라서 콩에 혼입되어 있는 이물질을 판별하는 시스템을 개발하는 데 있어서 근적외선 분광장치를 이용하여 획득한 반사도 스펙트럼은 PLS-DA로 판별예측모델을 개발하고 최적의 전처리 방법을 적용한다면 콩과 이물질의 선별시에 보다 나은 판별율을 얻을 수 있을 것이다.

데이터마이닝을 이용한 심혈관질환 판별 모델 방법론 연구 (A study of methodology for identification models of cardiovascular diseases based on data mining)

  • 이범주
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.339-345
    • /
    • 2022
  • 심혈관 질환은 전 세계적으로 주요 사망원인들 중 하나이다. 본 연구는 보다 우수한 심혈관질환 판별 모델을 생성하기 위한 방법에 대한 연구로써, 3가지 변수 선택법과 7가지 머신러닝 알고리즘을 바탕으로 사회인구학적 변수들을 이용하여 고혈압과 이상지질혈증 판별모델들을 생성하고, 생성된 모델들의 성능을 비교 평가한다. 본 연구의 결과에서는 두 가지 질병 모두에서, 전체변수 및 correlation-based feature subset selection 메소드 기반 모델들에서는 naive Bayes 모델이 다른 머신러닝을 이용한 모델들보다 다소 우수한 판별 성능이 있는 것으로 나타났고, wrapper 메소드 기반 변수 선택법에서는 logistic regression 모델이 다른 모든 모델보다 성능이 다소 우수한 것으로 나타났다. 본 연구의 결과는 원격의료 및 대중보건 분야에서 향후 한국인의 심혈관질환 판별 및 예측 모델 생성을 위한 참고자료로 활용될 수 있을 것으로 기대된다.

GC-MS 기반 대사체학 기법을 이용한 산수유의 산지판별모델 (Discrimination model of cultivation area of Corni Fructus using a GC-MS-Based metabolomics approach)

  • 임재윤
    • 분석과학
    • /
    • 제29권1호
    • /
    • pp.1-9
    • /
    • 2016
  • 생약의 원산지를 판별하는 논리적인 일련의 기준을 개발한다면, 현재 유통되는 한약을 좀 더 과학적으로 관리 할 수 있을 것이다. 이러한 노력은 전통적인 한약 산업 발전에 기여할 것이라고 사료된다. 산수유의 원산지 판별법을 개발하기 위해, 본 연구에서는 우선 국산 산수유와 중국산 산수유를 각각 수증기 증류하고 이 때 얻은 휘발성분을 GC/MS를 이용하여 분석하였다. NIST mass spectral library의 데이터베이스로부터 정성분석한 결과를 바탕으로 데이터를 범주화(binning)하여 변수를 얻고, 이에 대하여 PCA, OPLS-DA 등 다변량 통계 분석을 수행함으로써 신속, 정확하게 국산 산수유와 중국산 산수유의 산지를 판별할 수 있는 산지 판별모델을 확립하였다. 산지 판별모델 개발을 위해서 학습집합(n=53)을 분석하여 산지 판별모델을 수립한 후, 검증집합(n=12)을 산지 판별모델에 적용함으로써 그 타당성을 확인하였다. 더불어 1-ethylbutyl-hydroperoxide, nonadecane, butylated hydroxytoluene, 5β,7βH,10α-Eudesm-11-en-1α-ol, 7,9-bis (2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione, 그리고 2-decyldodecyl-benzene 등 6개의 마커성분을 선정할 수 있었다. 최근에 NMR을 활용한 산수유 원산지 판별에 대한 보고는 있었으나, GC/MS를 기반으로 한 대사체학 연구기법을 이용하여 산지판별 모델을 제시하는 것은 최초의 보고로서 그 의미가 크다. 본 연구결과를 활용하여 한약의 원산지 판별모델 확립과 산수유 원산지의 과학적인 관리에 적용할 수 있으리라 사료된다.

딥 러닝을 이용한 비디오 카메라 모델 판별 시스템 (Video Camera Model Identification System Using Deep Learning)

  • 김동현;이수현;이해연
    • 한국정보기술학회논문지
    • /
    • 제17권8호
    • /
    • pp.1-9
    • /
    • 2019
  • 현대 사회에서 영상 정보 통신 기술이 발전함에 따라서 영상 획득 및 대량 생산 기술도 급속히 발전하였지만 이를 이용한 범죄도 증가하여 범죄 예방을 위한 법의학 연구가 진행되고 있다. 영상 획득 장치에 대한 판별 기술은 많이 연구되었지만, 그 분야가 영상으로 한정되어 있다. 본 논문에서는 영상이 아닌 동영상에 대한 카메라 모델의 판별 기법을 제안한다. 기존의 영상을 학습한 모델을 사용하여 동영상의 프레임을 분석하였고, 동영상의 프레임 특성을 활용한 학습과 분석을 통하여 P 프레임을 활용한 모델의 우수성을 보였다. 이를 이용하여 다수결 기반 판별 알고리즘을 적용한 동영상에 대한 카메라 모델 판별 시스템을 제안하였다. 실험에서는 5개 비디오 카메라 모델을 이용하여 분석을 하였고, 각각의 프레임 판별에 대해 최대 96.18% 정확도를 얻었으며, 비디오 카메라 모델 판별 시스템은 각 카메라 모델에 대하여 100% 판별률을 달성하였다.

맥파의 특징점 추출 방법에 따른 만성위염 판별 모형 (Classification Model of Chronic Gastritis According to The Feature Extraction Method of Radial Artery Pulse Signal)

  • 최상호;신기영;김재욱;진승오;이태범
    • 전자공학회논문지
    • /
    • 제51권1호
    • /
    • pp.185-194
    • /
    • 2014
  • 한국에서 만성위염은 10명당 한 명 꼴로 발생하는 질병이다. 만성위염을 진단하기 위해서 일반적으로 내시경 검사를 하지만 이는 환자에게 고통을 주고 비용이 비싸다는 단점을 가지고 있다. 한편 비침습적이고 저비용인 전통한방의학의 맥진에 따르면, 오른쪽 손목의 '관' 위치에서 비위의 기능적 이상을 진단할 수 있다. 본 연구에서는, 전통한방의학의 견해에 따라 오른쪽 손목 '관' 부위의 맥파를 분석하여 만성위염 판별모델을 개발하였다. 모델의 판별률을 비교하기 위해, 피크-밸리 검출법과 가우시안 모델을 적용한 상이한 방법의 특징점 추출방법에 대해 선형판별분석 기법과 로지스틱 회귀분석법을 적용해 보았다. 그 결과, 판별모델과 특징점 추출 방법에 따라 77%~89%의 민감도와 72%~83%의 특이도를 보였고 각 모델의 평균 판별률은 약 80% 내외로 얻어졌다. 구체적으로, 가우시안 모델이 상대적으로 우수한 민감도(89.1%와 87.5%)를 보인 반면, 피크-밸리 검출법은 우수한 특이도(82.8%와 81.3%)를 보였고, 평균적인 판별률에 있어서는 가우시안 모델이 1.2% 정로 앞섰다(80.9% vs 79.7%). 결론적으로, 전통의학적 맥진원리에 기반한 요골동맥 맥파의 특성을 이용하여 유의미한 만성위염 판별모델을 얻을 수 있었고, 민감도에 있어서 가우시안 모델이 더 우수하였고, 특이도에 있어서 피크-밸리 검출법이 더 우수하였다.

판별모델 구축에 따른 도시고속도로의 교통사고 영향요인 분석에 관한 연구 - 부산지역 사례를 중심으로 - (A Study on the Analysis of Urban Highways Traffic Accident's Impact Factors Based on Building Discriminant Models - In Busan Metropolitan City -)

  • 정용화;최양원
    • 대한토목학회논문집
    • /
    • 제34권4호
    • /
    • pp.1269-1278
    • /
    • 2014
  • 교통문제 해결을 위해 건설된 자동차 전용도로인 도시고속도로는 신호에 의하여 단속되지 않는 연속 교통류가 주된 흐름인 관계로 주행차량들의 주행속도가 일반도로에 비해 높아 교통사고 발생 시 인명 피해의 정도가 매우 크다는 특징이 있으며, 특히 인명 피해의 정도가 큰 중상 교통사고는 전체 교통사고에 있어서 매우 중요한 위치를 점하고 있어 중상 교통사고 발생에 미치는 영향요인에 대한 분석은 중상 교통사고 감소대책 수립 시 가장 우선적으로 고려되어져야 할 것이다. 따라서 본 연구는 도시고속도로에서 발생한 중상 교통사고 발생에 있어 여러 인자들의 복합적 작용을 알아보기 위한 미시적 분석의 일환으로 영향요인의 영향정도를 판별할 수 있는 모델을 구축하였는바, 그 결과는 다음과 같이 나타났다. 첫째, 판별모델에서는 전체 적중률들이 비교적 높게 나타났고, 상관비들을 고려해 볼 때 본 모델들이 유효하다고 판단되었으며, 제반 영향요인들의 특성 역시 명확하게 구분되었다. 둘째, 판별모델을 통하여 도시고속도로에서의 중상 교통사고 발생 영향요인별 문제점을 명확하게 도출할 수 있었다. 셋째, 판별모델을 통하여 도출된 문제점에 대한 개선대책도 명확하게 제시할 수 있었다.

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별 (Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization)

  • 이창수;천주룡;김주근;김태일;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

전역 및 지역 특징 기반 딥러닝을 이용한 프린터 장치 판별 기술 (Printer Identification Methods Using Global and Local Feature-Based Deep Learning)

  • 이수현;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.37-44
    • /
    • 2019
  • 디지털 IT 기술의 발달로 인하여 프린터와 스캐너의 성능이 향상되고 가격이 저렴해지면서 일반인들도 쉽게 접할 수 있게 되었다. 그러나 이에 따른 부작용으로 공문서 및 사문서 위조 등의 범죄들이 쉽게 이루어질 수 있다. 따라서 해당 문서가 어떤 프린터를 사용하여 출력 되었는가를 특정할 수 있다면 수사 범위를 줄이고 용의자를 판별하는데 도움이 된다. 본 논문에서는 프린터 장치 판별을 위하여 딥러닝 모델을 제안한다. 먼저 최근 인식 등에서 범용적으로 활용되는 지역 특징 기반의 컨볼루셔널 뉴널 네트워크를 이용한 프린터 장치 판별 모델을 제안하고, 전역 특징 기반의 처리 과정을 네트워크 모델에 도입함으로 인하여 수렴 속도 및 정확도를 향상한 기법을 제안한다. 제안한 모델의 성능은 8개의 프린터 장치를 활용하여 기존 프린터 판별을 위한 특징 기반 기술과 비교를 수행하였다. 그 결과 제안하는 지역 특징 기반의 모델과 전역 특징 기반의 모델이 각각 97.23% 및 99.98%의 높은 판별 정확도를 달성하였고, 기존 기술들에 비하여 높은 정확도를 갖는 우수성을 보였다.