• 제목/요약/키워드: 가중치방법

검색결과 2,844건 처리시간 0.024초

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.

네트워크 분석을 활용한 딥러닝 기반 전공과목 추천 시스템 (Major Class Recommendation System based on Deep learning using Network Analysis)

  • 이재규;박희성;김우주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.95-112
    • /
    • 2021
  • 대학 교육에 있어서 전공과목의 선택은 학생들의 진로에 중요한 역할을 한다. 하지만, 산업의 변화에 발맞춰 대학 교육도 학과별 전공과목의 분야가 다양해지고 그 수가 많아지고 있다. 이에 학생들은 본인의 진로에 맞게 수업을 선택하여 수강하는 것에 어려움을 겪고 있다. 본 연구는 대학 전공과목 추천 모델을 제시함으로써 개인 맞춤형 교육을 실현하고 학생들의 교육만족도를 제고하고자 한다. 모델 연구에는 대학교 학부생들의 2015년~2017년 수강 이력 데이터를 활용하였으며, 메타데이터로는 학생과 수업의 전공 명을 사용했다. 수강 이력 데이터는 컨텐츠 소비 여부만을 나타낸 암시적 피드백 데이터로, 수업에 대한 선호도를 반영한 것이 아니다. 따라서 학생과 수업의 특성을 나타내는 임베딩 벡터를 도출했을 시, 표현력이 낮다. 본 연구는 이러한 문제점에 착안하여, 네트워크 분석을 통해 학생, 수업의 벡터를 생성하고 이를 모델의 입력 값으로 활용하는 Net-NeuMF 모델을 제시한다. 모델은 암시적 피드백을 가진 데이터를 이용한 대표적인 모델인 원핫 벡터를 이용하는 NeuMF의 구조를 기반으로 하였다. 모델의 입력 벡터는 네트워크 분석을 통해 학생과 수업의 특성을 나타낼 수 있도록 생성하였다. 학생을 표현하는 벡터를 생성하기 위해, 각 학생을 노드로 설정하고 엣지는 두 학생이 같은 수업을 수강한 경우 가중치를 가지고 연결되도록 설계했다. 마찬가지로 수업을 표현하는 벡터를 생성하기 위해 각 수업을 노드로 설정하고 엣지는 공통으로 수강한 학생이 있는 경우 연결시켰다. 이에 각 노드의 특성을 수치화 하는 표현 학습방법론인 Node2Vec을 이용하였다. 모델의 평가를 위해 추천 시스템에서 주로 활용하는 지표 4가지를 사용하였고, 임베딩 차원이 모델에 미치는 영향을 분석하기 위해 3가지 다른 차원에 대한 실험을 진행하였다. 그 결과 기존 NeuMF 구조에서 원-핫 벡터를 이용하였을 때보다 차원과 관계없이 평가지표에서 좋은 성능을 보였다. 이에 본 연구는 학생(사용자)와 수업(아이템)의 네트워크를 이용해 기존 원-핫 임베딩 보다 표현력을 높였다는 점, 모델을 구성하는 각 구조의 특성에 맞도록 임베딩 벡터를 활용하였다는 점, 그리고 기존의 방법론에 비해 다양한 종류의 평가지표에서 좋은 성능을 보였다는 점을 기여점으로 가지고 있다.

50세 이상 한국인의 성·연령군별 우유류와 두류 섭취량과 골 건강과의 관련성 : 2008~2011 국민건강영양조사 자료를 이용하여 (Sex- and age group-specific associations between intakes of dairy foods and pulses and bone health in Koreans aged 50 years and older: Based on 2008~2011 Korea National Health and Nutrition Examination Survey)

  • 서현비;최영선
    • Journal of Nutrition and Health
    • /
    • 제49권3호
    • /
    • pp.165-178
    • /
    • 2016
  • 본 연구는 50세 이상 한국인을 성 연령군으로 나누어 골밀도에 근거한 골 건강상태와 우유류와 두류 섭취 간의 관련성을 조사하고자 수행되었다. 국민건강영양조사 (2008~2011년)에 참여한 만 50세 이상 남성 3,201명과 여성 3,581명을 대상으로 '50~64세 남성', '50~64세 여성', '65세 이상 남성', '65세 이상 여성' 성 연령군 집단으로 나누어 정상, 골감소증, 골다공증의 골 건강상태에 따른 영양소 및 식품 섭취량을 비교하고, 로지스틱 회귀분석에 의해 우유류와 두류 섭취빈도에 따른 골다공증 오즈비를 구하였다. 통계 분석은 SAS 9.3 version을 이용하였으며, 모든 통계처리는 층화, 집락, 가중치를 고려한 복합표본설계 자료 분석 방법을 적용하였다. 50~64세 남성 1,721명 중 3.8%, 65세 이상 남성 1,480명 중 13.1%가 골다공증이었으며, 50~64세 여성 1,950명 중 15.9%, 65세 이상 여성 1,631명 중 63.0%가 골다공증이었다. 여성이 남성에 비해 4~5배 정도 골다공증 비율이 높고, 남녀 모두 연령 증가와 함께 골다공증 발생이 증가 하였다. 모든 성 연령군 집단에서 대상자의 체중과 체질량지수는 정상, 골감소증, 골다공증 순이었다. 에너지, 단백질, 나트륨, 칼륨, 칼슘 및 비타민 C 섭취량은 남성의 경우 전반적으로 정상, 골감소증, 골다공증 순이었으며, 여성도 유사한 경향을 보였다. 칼슘 섭취량의 사분위 섭취량에 따른 골다공증 오즈비 (OR)가 연령, BMI, 에너지 섭취량에 의한 보정 후 50~64세 여성과 65세 이상 남성에서 4사분위 섭취량이 1사분위 섭취량에 비해 유의하였으며, 칼슘섭취량이 많을수록 골다공증이 감소하는 경향성 (p for trend = 0.01)을 나타내었다. 그러나 음주, 흡연, 신체활동도 포함하여 보정한 후 경향성은 각각 p값이 0.055, 0.051 수준으로 낮아졌다. 50~64세 남성에서 골 건강상태가 나쁠수록 우유류와 우유 섭취량은 감소하는 경향성을 보였으며, 50~64세 여성에서는 골다공증군의 우유류와 우유 섭취량이 골감소증군에 비해 유의하게 적었다. 두류와 두부 섭취량은 모든 성 연령군에서 골 건강상태에 따른 유의적인 차이 및 경향성을 보이지 않았다. 50~64세 남성에서 우유 섭취빈도는 골다공증 위험 감소와 유의적인 관련성을 보이지 않은 반면에 65세 이상 남성에서는 우유 섭취빈도가 월 1회 미만에 비해 주 2회 이상일 경우 골다공증 위험 (OR 0.45, 95% CI 0.24~0.85)이 감소하였고, 감소하는 경향성 (p for trend = 0.022)을 보였다. 50~64세 여성에서 우유를 월 1회 미만 섭취하는 것에 비해 월1회~주1회 (OR 0.63, 95% CI 0.41~0.98) 섭취할 경우 오즈비가 유의하게 낮았다. 요구르트의 경우 50~64세 여성에서 섭취빈도가 높을수록 골다공증 위험이 감소하는 경향성 (p for trend = 0.019)을 보였다. 모든 성 연령군에서 두부 섭취빈도와 골다공증 위험과의 연관성은 나타나지 않은 반면에 두유를 주 2회 이상 섭취한 65세 이상 여성군에서는 골다공증 위험이 높게 나타났다. 혈청 25-hydroxy vitamin D 농도는 50~64세 여성에서 골 건강상태가 나쁠수록 뚜렷하게 낮았다. 이상의 결과를 요약하면, 여성의 경우는 50~64세 연령 시기에 칼슘 섭취량, 우유 및 요구르트 섭취와 골다공증 위험 감소 사이에 연관성이 있으며, 남성의 경우 65세 이후 칼슘 섭취량과 우유 섭취와 골다공증 위험 감소 사이에 연관성이 있었다. 반면 두부, 두유 등 두류 섭취는 골다공증 위험 감소에 효과적이지 않았다. 따라서 50세 이상 한국인에서 성 연령군에 적절한 골 건강상태 향상을 위한 식생활 및 생활습관 관리가 필요한 것으로 판단된다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.