• 제목/요약/키워드: 규칙 생성과 평가

검색결과 196건 처리시간 0.025초

이질적 이미지의 딥러닝 분석을 위한 적대적 학습기반 이미지 보정 방법론 (Adversarial Learning-Based Image Correction Methodology for Deep Learning Analysis of Heterogeneous Images)

  • 김준우;김남규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.457-464
    • /
    • 2021
  • 빅데이터 시대의 도래는 데이터에서 스스로 규칙을 배우는 딥러닝의 비약적인 발전을 가능하게 하였으며, 특히 CNN 알고리즘이 거둔 성과는 모델의 구조를 넘어 소스 데이터 자체를 조정하는 수준에 이르렀다. 하지만 기존의 이미지 처리 방법은 이미지 데이터 자체를 다룰 뿐, 해당 이미지가 생성된 이질적 환경을 충분히 고려하지 않았다. 이질적 환경에서 촬영된 이미지는 동일한 정보임에도 촬영 환경에 따라 각 이미지의 특징(Feature)이 상이하게 표현될 수 있다. 이는 각 이미지가 갖는 상이한 환경 정보뿐 아니라 이미지 고유의 정보조차 서로 상이한 특징으로 표현되며, 이로 인해 이들 이미지 정보는 서로 잡음(Noise)으로 작용해 모델의 분석 성능을 저해할 수 있음을 의미한다. 따라서 본 논문은 이질적 환경에서 생성된 이미지 데이터들을 동시에 사용하는 앤드-투-앤드(End-To-End) 구조의 적대적 학습(Adversarial Learning) 기반의 이미지 색 항상성 모델 성능 향상 방안을 제안한다. 구체적으로 제안 방법론은 이미지가 촬영된 환경인 도메인을 예측하는 '도메인 분류기'와 조명 값을 예측하는 '조명 예측기'의 상호 작용으로 동작하며, 도메인 분류의 성능을 떨어뜨리는 방향의 학습을 통해 도메인 특성을 제거한다. 제안 방법론의 성능을 평가하기 위해 이질적 환경에서 촬영된 이미지 데이터 셋 7,022장에 대한 색 항상성 실험을 수행한 결과, 제안 방법론이 기존 방법론에 비해 Angular Error 측면에서 우수한 성능을 나타냄을 확인하였다.

불균형 데이터 집합의 분류를 위한 하이브리드 SVM 모델 (A Hybrid SVM Classifier for Imbalanced Data Sets)

  • 이재식;권종구
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.125-140
    • /
    • 2013
  • 어떤 클래스에 속한 레코드의 개수가 다른 클래스들에 속한 레코드의 개수보다 매우 많은 경우에, 이 데이터 집합을 '불균형 데이터 집합'이라고 한다. 데이터 분류에 사용되는 많은 기법들은 이러한 불균형 데이터에 대해서 저조한 성능을 보인다. 어떤 기법의 성능을 평가할 때에 적중률뿐만 아니라, 민감도와 특이도도 함께 측정하여야 한다. 고객의 이탈을 예측하는 문제에서 '유지' 레코드가 다수 클래스를 차지하고, '이탈' 레코드는 소수 클래스를 차지한다. 민감도는 실제로 '유지'인 레코드를 '유지'로 예측하는 비율이고, 특이도는 실제로 '이탈'인 레코드를 '이탈'로 예측하는 비율이다. 많은 데이터 마이닝 기법들이 불균형 데이터에 대해서 저조한 성능을 보이는 것은 바로 소수 클래스의 적중률인 특이도가 낮기 때문이다. 불균형 데이터 집합에 대처하는 과거 연구 중에는 소수 클래스를 Oversampling하여 균형 데이터 집합을 생성한 후에 데이터 마이닝 기법을 적용한 연구들이 있다. 이렇게 균형 데이터 집합을 생성하여 예측을 수행하면, 특이도는 다소 향상시킬 수 있으나 그 대신 민감도가 하락하게 된다. 본 연구에서는 민감도는 유지하면서 특이도를 향상시키는 모델을 개발하였다. 개발된 모델은 Support Vector Machine (SVM), 인공신경망(ANN) 그리고 의사결정나무 기법 등으로 구성된 하이브리드 모델로서, Hybrid SVM Model이라고 명명하였다. 구축과정 및 예측과정은 다음과 같다. 원래의 불균형 데이터 집합으로 SVM_I Model과 ANN_I Model을 구축한다. 불균형 데이터 집합으로부터 Oversampling을 하여 균형 데이터 집합을 생성하고, 이것으로 SVM_B Model을 구축한다. SVM_I Model은 민감도에서 우수하고, SVM_B Model은 특이도에서 우수하다. 입력 레코드에 대해서 SVM_I와 SVM_B가 동일한 예측치를 도출하면 그것을 최종 해로 결정한다. SVM_I와 SVM_B가 상이한 예측치를 도출한 레코드에 대해서는 ANN과 의사결정나무의 도움으로 판별 과정을 거쳐서 최종 해를 결정한다. 상이한 예측치를 도출한 레코드에 대해서는, ANN_I의 출력값을 입력속성으로, 실제 이탈 여부를 목표 속성으로 설정하여 의사결정나무 모델을 구축한다. 그 결과 다음과 같은 2개의 판별규칙을 얻었다. 'IF ANN_I output value < 0.285, THEN Final Solution = Retention' 그리고 'IF ANN_I output value ${\geq}0.285$, THEN Final Solution = Churn'이다. 제시되어 있는 규칙의 Threshold 값인 0.285는 본 연구에서 사용한 데이터에 최적화되어 도출된 값이다. 본 연구에서 제시하는 것은 Hybrid SVM Model의 구조이지 특정한 Threshold 값이 아니기 때문에 이 Threshold 값은 대상 데이터에 따라서 얼마든지 변할 수 있다. Hybrid SVM Model의 성능을 UCI Machine Learning Repository에서 제공하는 Churn 데이터 집합을 사용하여 평가하였다. Hybrid SVM Model의 적중률은 91.08%로서 SVM_I Model이나 SVM_B Model의 적중률보다 높았다. Hybrid SVM Model의 민감도는 95.02%이었고, 특이도는 69.24%이었다. SVM_I Model의 민감도는 94.65%이었고, SVM_B Model의 특이도는 67.00%이었다. 그러므로 본 연구에서 개발한 Hybrid SVM Model이 SVM_I Model의 민감도 수준은 유지하면서 SVM_B Model의 특이도보다는 향상된 성능을 보였다.

설계자를 위한 GUI 환경기반 알루미늄 압출재 철도차량 차체구조물의 자동화 설계 및 구조해석 지원 프로그램 개발 (A Development of Automated Design and Structural Analysis Aided-Program based on GUI environment for Aluminum Extrusion Carbody Structures of Railway Vehicle for Design Engineers)

  • 김준환;강승구;신광복;이용주
    • 한국철도학회논문집
    • /
    • 제15권4호
    • /
    • pp.323-328
    • /
    • 2012
  • 본 연구의 목적은 설계자 전용 알루미늄 압출재 철도차량 차체 구조물의 자동화 구조해석 지원프로그램을 개발하는 것이다. 본 연구에서 개발된 프로그램 명칭은 "AUTO-RAP"이며, 알루미늄 압출재 철도차량 설계 및 구조해석에 대해 전문적인 지식과 경험이 없는 엔지니어도 설계와 검증이 동시에 가능하도록 하였다. 설계자는 기존의 알루미늄 압출재의 데이터베이스를 활용하거나 사용자 정의에 의한 지식기반설계가 가능하도록 하였으며, 설계검증은 철도안전법과 도시철도차량 안전기준에 관한 규칙에 의거하여 철도차량 차체 구조 안전성을 자동으로 평가하도록 프로그래밍 하였다. 또한, 본 프로그램은 MFC(Microsoft Foundation Classes)를 사용하여 GUI 환경을 구축하였으며, ANSYS와 ABAQUS 같은 다양한 상용 유한요소해석 프로그램 및 CAD 프로그램과의 호환성을 위해 .stp, .iges 등의 파일 생성을 지원한다. 결론적으로, 본 프로그램을 통하여 알루미늄 압출재 철도차량 차체 구조물의 제품 설계 비용과 시간 단축에 기여할 것으로 판단된다.

결정트리 데이터마이닝을 이용한 족부 임상 진단 (Podiatric Clinical Diagnosis using Decision Tree Data Mining)

  • 김진호;박인식;김봉옥;양윤석;원용관;김정자
    • 전자공학회논문지CI
    • /
    • 제48권2호
    • /
    • pp.28-37
    • /
    • 2011
  • 최근 건강에 대한 관심이 고조 되면서 발과 다리에 대한 진단, 치료, 예방의 전반적인 진료를 맡고 있는 족부의학(Podiatry)이 주목받고 있지만 국내 연구는 미비한 실정이다. 또한 임상 데이터 분석에 있어 대부분의 기존 연구들은 기초 통계적인 방법에 근거한 정량분석만을 수행함으로서, 획득된 정보를 임상에 적용 하는데 있어서는 충분한 신뢰성을 보장할 수 없다. 임상데이터 마이닝은 데이터마이닝의 다양한 분석 방법론을 이용하여 의료 현장에서 발생한 임상 데이터를 분석함으로서 전문가의 진단과 치료 과정의 결정에 도움을 주고 있다. 결정트리(Decision Tree) 알고리즘은 분석과정의 설명과 표현성이 좋고, 결과에 대한 해석이 편리하여 임상에서 적용하기가 용이하다. 본 연구에서는 신뢰성 있는 족부 임상 진단 평가를 위해 충남대학교병원 재활의학과 신발클리닉에 내원한 환자 1310명(남자:633명, 여자:677명)의 2620족(foot)을 대상으로 수집된 진료 데이터에 결정트리를 적용하여 22개의 족부 질환 인자에 따르는 15개의 족부 질환을 분류하고 그에 대한 64개의 진단 규칙을 탐사 하였다. 또한 5개의 클래스(영유아, 소아, 청소년, 노인, 전체)로 분류된 각 그룹들로부터 생성된 결정 트리를 통해 각 클래스의 질환 특징과 질환 주요 인자, 클래스 간 상관관계를 비교, 분석하였다. 탐사된 결과는 족부 임상 전문가의 의사결정에 더욱 정성적이고 유용한 선험적 지식을 제공할 것이고, 효과적이고 정확한 진단과 예측을 위한 임상 도구로써 사용될 수 있다.

무선 센서 네트워크에서 지역 결정을 통한 유연한 분리형 다중경로 라우팅 프로토콜 (Flexible Disjoint Multipath Routing Protocol Using Local Decision in Wireless Sensor Networks)

  • 정관수;염희균;박호성;이정철;김상하
    • 한국통신학회논문지
    • /
    • 제38B권11호
    • /
    • pp.911-923
    • /
    • 2013
  • 무선 센서 네트워크에서 다중경로 라우팅 방안은 종단 간 데이터 전달의 신뢰성을 향상시키기 위한 연구주제 중 하나이다. 최근에는 다중경로의 강건함과 효율성을 위해서 경로의 분리와 관리를 위한 연구가 다수 진행 되었다. 그러나 이전의 연구들은 무선 통신 환경을 고려하지 않은 다중경로의 분리 방법을 이용하고 있다. 게다가, 그들은 불규칙 네트워크 환경에서 노드나 통신 실패로 인해 발생하는 경로 실패를 관리하는 방법이 없거나 추가경로를 생성하는 간단한 방법을 통해 다중경로를 유지한다. 이를 보완하기 위해서, 네트워크 오류지역을 우회 전송하고 경로를 재구성하는 다중경로 유지 방안이 제안되었지만, 중앙 집중적이고 정적인 경로 관리 방법을 이용하기 때문에, 경로 재구성 과정에서 데이터 전달의 중단이나 링크의 단절, 그리고 많은 경로 재구성 비용 등이 요구되는 문제가 있다. 이런 제약과 문제들은 데이터 전달의 신뢰성 저하와 긴급 데이터의 보고 실패로 이뤄질 수 있다. 따라서 본 논문에서는 불규칙적이고 제한적인 무선 센서 네트워크 환경을 고려하여 유연한 분리형 다중경로를 구축하는 방법과 효율적으로 다중경로를 유지할 수 있도록 경로의 우선순위 규칙을 적용한 지역 결정 기반의 다중경로 관리 방법을 제안한다. 그리고 제안 방법의 성능을 평가하기 위해서 시뮬레이션을 수행한다.

이산화 알고리즘을 이용한 계층적 클러스터링의 실험적 성능 평가 (Performance Comparison of Clustering using Discritization Algorithm)

  • 원재강;이정찬;정용규;이영호
    • 서비스연구
    • /
    • 제3권2호
    • /
    • pp.53-60
    • /
    • 2013
  • 데이터로부터 의미있는 형태의 정보를 얻기 위한 여러 가지 기법들이 개발되어 왔지만, 최근 들어 가장 각광받는 분야 중 하나는 패턴인식과 기계학습 방법이다. 기존의 학습 알고리즘은 대부분 범주 형 속성에 기반 한 규칙 또는 의사 결정 모델을 생성한다. 그런데, 실세계의 데이터는 보통 범주 형 속성 외에도 수치 값을 갖는 속성을 포함하고, 또 많은 경우에 있어 수치 형 속성으로만 구성되기도 한다. 따라서 이러한 경우, 데이터를 학습에 사용하기 위해서는 수치형 속성에 대한 적절한 처리 과정이 필요하다. 본 논문에서는, 수치형 속성의 도메인을 여러 개의 분절된 부분으로 나누어 학습 알고리즘에 사용하는 방법인 이산화 기법을 설명하고 또한 데이터마이닝의 기법으로 사용되는 클러스터링(Clustering)을 사용한다. 클러스터란 대량의 데이터베이스로부터 유사한 레코드 특성을 지닌 작은 그룹으로 여러 개를 분할하는 것으로 패턴 공간에 주어진 유한 개의 패턴들이 서로 가깝게 모여서 무리를 이루고 있는 패턴 집합이다. 그 집합들 중에서 특정한 카테고리를 지정하지 않고 주어진 데이터들에서 어떤 패턴을 추출하여, 비슷한 데이터들을 묶어서 데이터를 분류하는 기법인 클러스터링에 대해 실험한다.

  • PDF