• 제목/요약/키워드: 복잡도 가중치

검색결과 265건 처리시간 0.022초

멀티모달 딥 러닝 기반 이상 상황 탐지 방법론 (Anomaly Detection Methodology Based on Multimodal Deep Learning)

  • 이동훈;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.101-125
    • /
    • 2022
  • 최근 컴퓨팅 기술의 발전과 클라우드 환경의 개선에 따라 딥 러닝 기술이 발전하게 되었으며, 다양한 분야에 딥 러닝을 적용하려는 시도가 많아지고 있다. 대표적인 예로 정상적인 데이터에서 벗어나는 값이나 패턴을 식별하는 기법인 이상 탐지가 있으며, 이상 탐지의 대표적 유형인 점 이상, 집단적 이상, 맥락적 이중 특히 전반적인 상황을 파악해야 하는 맥락적 이상을 탐지하는 것은 매우 어려운 것으로 알려져 있다. 일반적으로 이미지 데이터의 이상 상황 탐지는 대용량 데이터로 학습된 사전학습 모델을 사용하여 이루어진다. 하지만 이러한 사전학습 모델은 이미지의 객체 클래스 분류에 초점을 두어 생성되었기 때문에, 다양한 객체들이 만들어내는 복잡한 상황을 탐지해야 하는 이상 상황 탐지에 그대로 적용되기에는 한계가 있다. 이에 본 연구에서는 객체 클래스 분류를 학습한 사전학습 모델을 기반으로 이미지 캡셔닝 학습을 추가적으로 수행하여, 객체 파악뿐만 아니라 객체들이 만들어내는 상황까지 이해해야 하는 이상 상황 탐지에 적절한 2 단계 사전학습 모델 구축 방법론을 제안한다. 구체적으로 제안 방법론은 ImageNet 데이터로 클래스 분류를 학습한 사전학습 모델을 이미지 캡셔닝 모델에 전이하고, 이미지가 나타내는 상황을 설명한 캡션을 입력 데이터로 사용하여 학습을 진행한다. 이후 이미지와 캡션을 통해 상황 특질을 학습한 가중치를 추출하고 이에 대한 미세 조정을 수행하여 이상 상황 탐지 모델을 생성한다. 제안 방법론의 성능을 평가하기 위해 직접 구축한 데이터 셋인 상황 이미지 400장에 대해 이상 탐지 실험을 수행하였으며, 실험 결과 제안 방법론이 기존의 단순 사전학습 모델에 비해 이상 상황 탐지 정확도와 F1-score 측면에서 우수한 성능을 나타냄을 확인하였다.

셀룰러 오토마타 기반 WCA2D 모형을 이용한 부산 온천천 유역 고해상도 도시 침수 해석 (High-resolution Urban Flood Modeling using Cellular Automata-based WCA2D in the Oncheon-cheon Catchment in Busan, South Korea)

  • 최현진;이송희;우현아;노성진
    • 대한토목학회논문집
    • /
    • 제43권5호
    • /
    • pp.587-599
    • /
    • 2023
  • 기후변화로 인해 전 세계 주요 도시에서 홍수의 빈도와 위험성이 증가함에 따라, 도시 침수에 대비한 선제적 대응을 위해 넓은 공간 영역에서 고해상도 2차원 침수 정보를 신속하고 정확하게 해석할 수 있는 모의 기술의 중요성이 대두되고 있다. 기존의 천수 방정식(shallow water equations)에 기반한 물리적 해석 방법은 고해상도 침수 예측을 위해 많은 컴퓨터 자원과 계산 시간이 소요되는 한계가 있다. 본 연구는 전환 규칙과 가중치 기반 시스템을 사용하여 침수의 시공간 변화를 모의하는 셀룰러 오토마타(cellular automata) 기반 2차원 침수 해석 모형 Weighted Cellular Automata 2D (WCA2D)의 이론적 배경을 고찰하고, 부산 온천천 유역의 침수 사상 모의를 통해 재현하여 국내 도시 유역에 대한 적용성을 검토하였다. 또한, Open Computing Language (OpenCL)와 Open Multi-Processing (OpenMP)과 같은 병렬계산(parallel computing)기술을 적용한 버전을 순차계산(sequential computing)결과와 비교하여 연산성능을 평가 하였다. 연구결과, WCA2D 모형에 의한 최대 침수심 분포는 과거침수 피해지도와 유사하게 모의되어, 복잡한 지형특성을 가지는 도시유역 침수의 시공간적 변화를 해석하기에 적절함을 확인하였다. 또한,병렬 계산 적용시 순차 계산 버전에 비해 OpenCL과 OpenMP는 약8배~14배, 5배~6배 연산 효율이 향상되어 효율적인 도시 침수 모의가 가능하였다.

초등학생의 에너지 과잉섭취 위험 진단을 위한 식습관평가표 개발 (Development of an Eating Habit Checklist for Screening Elementary School Children at High Risk of Energy Overintake)

  • 연미영;현태선
    • Journal of Nutrition and Health
    • /
    • 제41권5호
    • /
    • pp.414-427
    • /
    • 2008
  • 초등학교 $4{\sim}6$학년 어린이 142명 (남 80명, 여 62명)을 대상으로 식습관과 식이섭취조사를 실시하여 에너지를 과잉으로 섭취할 위험이 있는 어린이를 선별할 수 있는 간단한 식습관평가표를 개발한 결과는 다음과 같다. 에너지 과잉섭취 위험이 있는 어린이를 선별하기 위해서는 과잉섭취의 위험을 나타낼 수 있는 지표가 필요하므로 에너지 섭취량, 지방 섭취량, 에너지필요추정량에 대한 에너지 섭취량 비율 (%EER)의 세가지 지표를 임의로 선정하였고, 식습관 각 문항의 응답 보기에서 가장 좋은 식습관에 대하여 0점, 가장 좋지 않은 식습관에 대하여 2점을 부여하고, 이 두가지 식습관 사이에 중간 정도의 보기가 있는 경우 1점을 부여하였다. 부여된 점수로 계산한 각 문항의 식습관 점수와 에너지 과잉섭취 위험 평가지표와의 Pearson상관계수를 계산한 결과 유의적인 양의 상관관계를 나타낸 식습관 문항은 식사 중 TV 시청 여부, 식사속도, 식사량, 과식횟수, 외식횟수, 간식횟수, 라면과 패스트푸드 섭취 횟수에 관한 7개 문항으로 나타나 이들을 평가표에 포함시킬 문항으로 선정하였다. 선정된 문항 중에서 에너지 과잉섭취 위험을 더 잘 가려낼 수 있는 문항에 대한 가중치를 부여하기 위하여 선정된 문항과 에너지 과잉섭취 위험 평가지표와의 단계적 회귀분석을 실시하였고, 단계적 회귀분석 결과에 따라 세가지 지표 모두와 유의수준이 0.1 미만인 식사량에 관한 문항의 배점을 1점으로 낮추었다. 진단기준 점수를 결정하기 위해서 %EER$\geq$125%를 에너지 과잉섭취군, %EER < 125%를 비과잉섭취군으로 분류하고, 두 집단의 식습관평가표 점수 분포를 살펴본 후, 임의의 진단기준 점수에 대한 민감도, 특이도, 양성예측도를 구한 결과 5점을 진단기준 점수로 결정하였다. 본 조사대상자를 식습관평가표로 진단하여 5점 이상을 위험군으로 분류하였을 때, 13.4%가 위험군으로 분류되었고, 이들의 영양소 섭취량을 비위험군과 비교한 결과 위험군의 에너지 섭취량 평균은 2,156 kcal, 비위험군은 1,708 kcal로 유의적 차이가 있었으며, 대부분의 영양소 섭취량에도 유의적 차이를 볼 수 있었다. 그러나 에너지 섭취량으로 보정해 주어 INQ로 계산한 결과 모든 영양소에서 차이를 볼 수 없었다. 따라서 본 연구에서 개발된 에너지 과잉섭취 위험 진단을 위한 식습관평가표는 에너지 과잉을 잘 나타내 준다고할 수 있겠다. 본 연구에서 개발된 7문항의 식습관평가표는 복잡한 식이섭취조사를 실시하지 않고도 에너지 과잉섭취의 위험이 있는 어린이를 선별할 수 있으리라고 생각되며, 초등학생이 쉽고 간편하게 사용할 수 있으므로 이들을 대상으로 영양판정이나 영양교육을 실시할 때 활용할 수 있을 것이다. 다만 본 연구에서는 중소도시, 군 지역 어린이를 대상으로 조사한 결과를 이용하여 에너지 과잉섭취 위험을 평가할 수 있는 식습관평가표를 개발하였으므로 대도시를 포함한 다양한 지역의 어린이에게 활용하여 타당성을 검토하는 것이 필요하겠다. 개인의 식습관을 평가하여 진단하는 것은 영양교육이나 영양사업을 계획하고 실시하기 위하여 가장 먼저 해야 하는 단계로 이를 위한 간단하고 효율적인 평가도구가 절실히 필요하다. 따라서 앞으로 다양한 인구집단을 대상으로 다양한 영양적 위험을 평가하고 진단할 수 있는 식습관평가표가 지속적으로 개발되어야 할 것이다.

초등학생의 미량영양소 섭취부족 위험 진단을 위한 간이 식습관평가표 개발 (Development of an Eating Habit Checklist for Screening Elementary School Children at Risk of Inadequate Micronutrient Intake)

  • 연미영;현태선
    • Journal of Nutrition and Health
    • /
    • 제42권1호
    • /
    • pp.38-47
    • /
    • 2009
  • 초등학교 $4{\sim}6$학년 어린이 142명 (남 80명, 여 62명)을 대상으로 식습관과 식이섭취조사를 실시하여 미량영양소 섭취부족의 위험이 있는 어린이를 선별할 수 있는 간단한 식습관평가표를 개발한 결과는 다음과 같다. 미량영양소 섭취부족 위험지표는 비타민 A, 리보플라빈, 비타민 C, 칼슘, 철분, 아연의 여섯가지 영양소에 대하여 권장섭취량에 대한 섭취 백분율과 평균 적정섭취비율 (MAR), 이들 여섯가지 영양소 중 평균필요량 미만으로 섭취한 영양소의 개수를 임의로 선정하였다. 식습관의 각 문항에 대한 점수를 구하기 위하여 응답 보기에서 가장 좋은 식습관에 대하여 0점, 가장 좋지 않은 식습관에 대하여 2점을 부여하고, 이 두가지 식습관 사이에 중간 정도의 보기가 있는 경우 1점을 부여하였다. 부여된 점수로 계산한 각 문항의 식습관 점수와 미량영양소 섭취부족 위험지표와의 Pearson 상관계수를 계산한 결과 유의적인 상관관계를 나타낸 식습관 문항은 세끼 식사 여부, 아침식사 시간의 여유, 저녁식사의 규칙성, 식욕, 그리고 김치, 우유, 과일, 콩의 섭취 빈도에 관한 8개 문항으로 나타나 이들을 평가표에 포함 시킬 문항으로 선정하였다. 또한 이 8개 문항에 가중치를 부여하기 위해 MAR과 단계적 회귀분석을 실시하였고 그 결과 유의수준이 0.05 미만인 4개 문항의 배점을 1점으로 낮추었다. 식습관평가표의 영양부족위험 진단기준을 설정하기 위해 MAR < 0.75를 미량영양소 섭취부족군, MAR ${\geq}$ 0.75를 적정군으로 하여 총점 분포를 살펴본 후 각 총점의 민감도, 특이도, 양성예측도를 평가하였고 이 결과에 따라 식습관평가표의 총점이 3점 이하 일 때 저위험군, $4{\sim}5$점일때 중간위험군, 6점 이상일 때 고위험군으로 결정하였다. 식습관평가표의 진단기준에 따라 본 조사대상자를 세 집단으로 분류하고 영양소섭취를 비교한 결과 에너지와 단백질은 세 집단간 대상자 분포의 유의적 차이가 없었으나, 11개의 미량영양소 중에서는 비타민 A, 티아민, 리보플라빈, 니아신, 엽산, 칼슘, 인, 철, 아연 등 9개 영양소에서 평균 필요량 미만으로 섭취한 대상자의 비율이 고위험군이 가장 높았으며, 중간위험군, 저위험군의 순으로 유의적인 차이를 나타냈다. 그러나 비타민 C의 경우 중간위험군과 고위험군 간에는 차이가 없었으며, 저위험군은 유의적으로 낮았고, 비타민 $B_6$의 경우 세 군 간에 유의적인 차이가 없었다. 본 연구에서 개발된 8문항의 식습관평가표는 복잡한 식이섭취조사를 실시하지 않고도 초등학생의 미량영양소 섭취부족 위험을 간편하게 선별할 수 있을 것으로 생각되며, 초등학생이 쉽고 간편하게 사용할 수 있으므로 이들을 대상으로 영양판정이나 영양교육을 실시할 때 활용할 수 있을 것이다. 또한 다양한 지역의 학생을 대상으로 활용하여 타당성 검토를 거치면 영양사업과 영양교육의 도구로서 유용하게 활용될 수 있을 것으로 보인다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.