• 제목/요약/키워드: 결측치

검색결과 98건 처리시간 0.023초

적대적 생성 신경망을 활용한 비지도 학습 기반의 대기 자료 이상 탐지 알고리즘 연구 (A Study on Atmospheric Data Anomaly Detection Algorithm based on Unsupervised Learning Using Adversarial Generative Neural Network)

  • 양호준;이선우;이문형;김종구;최정무;신유미;이석채;권장우;박지훈;정동희;신혜정
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.260-269
    • /
    • 2022
  • 본 논문에서는 기존에 전문가에 의해서 이루어지던 국가 대기오염 측정망 데이터들의 이상 탐지 작업을 인공지능을 통해 자동화하고자 심층 신경망을 이용한 이상 탐지 모델을 제안하였다. 환경과학원에서 제공받은 기상자료 데이터의 결측치 및 이상치를 분석하여 학습데이터를 생성하였으며 비지도 학습 방식의 BeatGAN 모델에 기반하여 커널 구조 변경과 합성곱 필터층 및 전치 합성곱 필터층의 추가를 통해 새로운 모델을 제안하여 이상 탐지 성능을 높이고자 하였다. 또한 제안하는 모델의 생성적 특징을 활용하여 새로운 데이터를 생성하고 이를 학습에 사용하는 재학습 알고리즘을 구현 및 적용하여 기존 BeatGAN 모델뿐 아니라 다른 비지도 학습 모델인 Iforest, One Class SVM과 비교하였을 때 제안모델의 성능이 가장 높았음을 확인할 수 있었다. 본 연구를 통해 실제 산업현장에서 센서의 이상, 점검 등의 여러 요인으로 인해 학습 데이터가 부족한 상황에서 추가적인 비용없이 과적합을 피하며 제안하는 모델의 이상탐지 성능을 올릴 수 있는 방법을 제시할 수 있었다.

혼합형 데이터 보간을 위한 디노이징 셀프 어텐션 네트워크 (Denoising Self-Attention Network for Mixed-type Data Imputation)

  • 이도훈;김한준;전종훈
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.135-144
    • /
    • 2021
  • 최근 데이터 기반 의사결정 기술이 데이터 산업을 이끄는 핵심기술로 자리 잡고 있는바, 이를 위한 머신러닝 기술은 고품질의 학습데이터를 요구한다. 하지만 실세계 데이터는 다양한 이유에 의해 결측값이 포함되어 이로부터 생성된 학습된 모델의 성능을 떨어뜨린다. 이에 실세계에 존재하는 데이터로부터 고성능 학습 모델을 구축하기 위해서 학습데이터에 내재한 결측값을 자동 보간하는 기법이 활발히 연구되고 있다. 기존 머신러닝 기반 결측 데이터 보간 기법은 수치형 변수에만 적용되거나, 변수별로 개별적인 예측 모형을 만들기 때문에 매우 번거로운 작업을 수반하게 된다. 이에 본 논문은 수치형, 범주형 변수가 혼합된 데이터에 적용 가능한 데이터 보간 모델인 Denoising Self-Attention Network(DSAN)를 제안한다. DSAN은 셀프 어텐션과 디노이징 기법을 결합하여 견고한 특징 표현 벡터를 학습하고, 멀티태스크 러닝을 통해 다수개의 결측치 변수에 대한 보간 모델을 병렬적으로 생성할 수 있다. 제안 모델의 유효성을 검증하기 위해 다수개의 혼합형 학습 데이터에 대하여 임의로 결측 처리한 후 데이터 보간 실험을 수행한다. 원래 값과 보간 값 간의 오차와 보간된 데이터를 학습한 이진 분류 모델의 성능을 비교하여 제안 기법의 유효성을 입증한다.

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.

노인의 사중고(四重苦)가 우울을 매개로 자살생각에 미치는 영향: 경로당 이용자를 중심으로 (Effects of Korean Elder's Four Major Pains on Suicidal Thought Mediated by Depression: Focused on Gyungrodang Users)

  • 신학진
    • 한국노년학
    • /
    • 제31권3호
    • /
    • pp.653-672
    • /
    • 2011
  • 본 연구는 노인의 사중고(四重苦) 개념을 확인하고 이를 구성하는 빈곤, 질병, 역할상실, 고독이 우울을 매개로 자살생각에 미치는 영향을 검증했다. 연구를 위해서 전주시 경로당을 지역별로 안배한 후 선정된 경로당에서 응답자를 편의 추출했다. 회수된 응답은 309사례였으며 이중에서 결측치, 이상치, 정규분포, 다중공선성의 조건을 만족한 291사례가 분석대상이 되었다. 분석은 빈도분석, 요인분석, 내적일관성신뢰도분석, 구조방정식을 이용한 확인요인분석과 구조모형분석을 실시했다. 구조모형분석을 통해서 각각의 가설에 해당하는 경로계수를 확인하였으며 이들의 유의성에 따라서 가설의 지지여부를 판정했다. 또한 요인들의 매개효과를 확인하기 위해서 모수추정치를 직접효과와 간접효과로 분해하고, 매개효과의 크기와 유의성을 확인했다. 주요 연구결과는 다음과 같다. 첫째, 사중고의 구성요인들인 빈곤, 질병, 역할상실, 고독은 우울을 매개로 자살생각에 영향을 미쳤다. 둘째, 사중고의 구성요인 중에서 가장 비중이 큰 빈곤은 다른 구성요인에 영향을 미치며, 역할상실은 고독에 영향을 미치는 것으로 확인되었다. 셋째, 노인의 빈곤, 질병, 역할상실, 고독으로 구성된 사중고의 모든 구성요인이 우울의 선행요인으로 확인되었다. 다만 빈곤이 우울에 미치는 영향은 직접적인 것보다는 간접적인 것으로 확인되었다. 본 연구는 노인의 사중고 개념을 확인했고 사중고를 통해서 급증하는 노인자살의 원인을 검증했다. 따라서 노인의 자살예방계획을 수립할 때 자살의 선행변수인 우울이나 사중고의 구성요인에 대한 포괄적인 중재계획이 필요하다.

한국중년의 노인차별에 미치는 영향요인과 집단간불안의 매개효과 (Middle-aged Korean's Ageism Affecting Factors Mediated by Intergroup Anxiety)

  • 신학진
    • 한국노년학
    • /
    • 제32권2호
    • /
    • pp.359-376
    • /
    • 2012
  • 본 연구는 한국중년의 노인차별에 미치는 영향요인으로 노화지식수준과 노인접촉의 질을 확인하고, 영향요인이 노인차별에 미치는 영향에 대한 집단간불안의 매개효과를 검증했다. 검증을 위해 전주시에서 20개 동을 무작위로 선정했고, 선정된 행정구역별로 35세에서 50세 사이의 중년남녀 20명씩 전체 400명을 표본 추출하였다. 회수된 설문응답 중에서 결측치, 이상치, 정규분포, 다중공선성의 조건을 만족한 393사례가 분석대상이 되었다. 분석은 빈도분석, 요인분석, 신뢰도분석, 그리고 구조방정식을 이용한 확인요인분석과 구조모형분석을 실시했다. 연구결과는 다음과 같다. 첫째, 중년의 노화지식수준은 노인에 대한 집단간불안에 부적 영향을 미치며, 노인차별에 직접적인 영향을 미치지는 않았다. 둘째, 노화지식수준은 집단간불안을 매개로 노인차별에 부적 영향을 미치는 것으로 확인되었다. 셋째, 중년의 노인접촉의 질은 노인에 대한 집단간불안에 부적 영향을 미치며, 노인차별에 직접적인 영향을 미치지 않았다. 넷째, 중년의 노인접촉의 질은 집단간불안을 매개로 노인 차별에 부적 영향을 미치는 것으로 확인되었다. 다섯째, 중년의 노인과의 집단간불안은 노인차별에 높은 정적 영향을 미치는 것으로 확인되었다. 연구결과는 노인차별을 중재하기 위한 전략적 방향으로 노화에 대한 교육과 노인과의 긍정적 접촉 기회의 제공을 시사하고 있다. 또한 교육과 접촉을 통한 중년의 노년집단에 대한 불안의 해소가 노인차별을 경감하는 방향임을 제시하고 있다.

LSTM Networks 딥러닝 기법과 SWAT을 이용한 유량지속곡선 도출 및 평가 (A study on the derivation and evaluation of flow duration curve (FDC) using deep learning with a long short-term memory (LSTM) networks and soil water assessment tool (SWAT))

  • 최정렬;안성욱;최진영;김병식
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1107-1118
    • /
    • 2021
  • 지구온난화로 인해 발생한 기후변화는 한반도의 홍수, 가뭄 등의 발생빈도를 증가시켰으며, 이로 인해 인적, 물적 피해가 증가한 것으로 나타났다. 수재해 대비 및 대응을 위해서는 국가 차원의 수자원 관리 계획 수립이 필요하며, 유역 단위 수자원 관리를 위해서는 장기간 관측된 유량 자료를 이용하여 도출된 유량지속곡선이 필요하다. 전통적으로 수자원 분야에서 유량지속곡선을 도출하기 위하여 물리적 기반의 강우-유출 모형이 많이 사용되고 있으며, 최근에는 데이터 기반의 딥러닝 기법을 이용한 유출량 예측 기법에 관한 연구가 진행된 바 있다. 물리적 기반의 모형은 수문학적으로 신뢰도 높은 결과를 도출할 수 있으나, 사용자의 높은 이해도가 요구되며, 모형 구동 시간이 오래 걸릴 수 있는 단점이 있다. 데이터 기반의 딥러닝 기법의 경우 입력 자료가 간단하며, 모형 구동 시간이 비교적 짧으나 입력 및 출력자료 간의 관계가 블랙박스로 처리되어 수리·수문학적 특성을 반영할 수 없는 단점이 있다. 본 연구에서는 물리적 기반 모형으로 국내외에서 적용성이 검증된 Soil Water Assessment Tool (SWAT)의 매개변수 보정(Calibration)을 통해 장기간의 결측치 없는 데이터를 산출하고, 이를 데이터 기반 딥러닝 기법인 Long Short-term Memory (LSTM)의 훈련(Training) 데이터로 활용하였다. 시계열 데이터 분석 결과 검·보정 전체 기간('07-'18) 동안 Nash-Sutcliffe Efficiency (NSE)와 적합도 비교를 위한 결정계수는 각각 0.04, 0.03 높게 도출되어 모형에서 도출된 SWAT의 결과가 LSTM보다 전반적으로 우수한 것으로 나타났다. 또한, 모형에서 도출된 연도별 시계열 자료를 내림차순하여 산정된 유량지속곡선과 관측유량 기반의 유량지속곡선과 비교한 결과 NSE는 SWAT과 LSTM 각각 0.95, 0.91로 나타났으며, 결정계수는 0.96, 0.92로 두 모형 모두 우수한 성능을 보였다. LSTM 모형의 경우 저유량 부분 모의의 정확도 개선이 필요하나, 방대한 입력 자료로 인해 모형 구축 및 구동 시간이 오래 걸리는 대유역과 입력 자료가 부족한 미계측 유역의 유량지속곡선 산정 등에 활용성이 높을 것으로 판단된다.

중장년 직장인의 창업 개인역량 및 창업기회인식이 창업의도에 미치는 영향: 창업기회평가의 매개효과를 중심으로 (The Effect of Entrepreneurial Competence and Perception of Entrepreneurship Opportunities on Entrepreneurial Intention: Focusing on the Mediating Effect of Entrepreneurship Opportunity Assessment)

  • 진주영
    • 벤처창업연구
    • /
    • 제18권3호
    • /
    • pp.45-60
    • /
    • 2023
  • 본 연구에서는 창업기회평가를 매개하여 중장년 직장인의 창업 개인역량과 창업기회인식이 창업의도에 미치는 영향을 분석하였다. 창업 개인역량의 하위변수로는 사전지식, 긍정적 태도, 사회적 네트워크로 구분하였다. 본 연구의 실증분석을 위하여 창업에 관심이 있는 전국의 직장인을 대상으로 약 15일간(2023.02.06.~2023.02.20.) 네이버 오피스를 이용한 온라인 설문조사를 실시하였으며, 총 262부를 수집하여 결측치 12부를 제외한 250부를 대상으로 SPSS Ver.24.0과 PROCESS MACRO Model 4.0을 실증분석에 사용하였다. 분석결과는 첫째, 창업자 개인역량의 사전지식과 사회적 네트워크 및 창업기회인식은 높을수록 창업기회평가와 창업의도가 증가하는 유의한 정(+)의 영향력을 미치는 것으로 나타났다. 반면 창업자 개인역량 중 긍정적 태도는 창업기회평가 및 창업의도에 영향을 미치지 않는 것으로 나타났다. 또한 창업기회평가 및 창업의도에 미치는 영향력의 크기는 창업기회인식, 사전지식, 사회적 네트워크 순으로 나타났다. 이는 중장년 직장인의 창업에 대한 긍정적태도는 COVID-19로 인한 창업환경 위축, 창업준비 부족으로 인한 실패의 두려움, 과잉자신감에 따른 인지편향의 오류로 인한 창업실패 사례 속출 등으로 창업이 부정적인 이미지를 가지고 있다는 것을 시사하고 있다. 둘째, 창업자 개인역량과 창업기회인식이 통제된 상황에서 창업기회평가는 창업의도에 유의한 정(+)의 영향을 미치는 것으로 나타났다. 셋째, 창업기회평가는 창업자 개인역량의 사전지식, 사회적 네트워크 및 창업기회인식과 창업의도 간을 매개하는 것으로 나타났지만, 긍정적 태도와 창업의도 간은 매개하지 않는 것으로 나타났다. 넷째, 창업기회평가 및 창업의도에 미치는 영향요인 중 창업자 개인역량보다 창업기회인식이 더 크게 나타나 창업기회인식의 중요함이 확인하였다. 다섯째, 창업자 개인역량인 사전지식과 네트워크가 창업기회평가 및 창업의도에 영향을 미치는 것으로 나타나 창업사전지식 함양 및 경험의 중요성을 인식하도록 창업교육을 강화하면 중장년 직장인들의 창업을 활성화할 수 있다는 점을 확인하였다.

  • PDF

인공폐경이 여성의 다빈도암 진단에 미치는 영향: 갑상선암, 유방암, 자궁경부암을 중심으로 (Effect of Artificial Menopause on Diagnosis of Common Cancers in Women: Focusing on Thyroid Cancer, Breast Cancer, and Cervical Cancer)

  • 정현정;박지경
    • 한국학교ㆍ지역보건교육학회지
    • /
    • 제25권2호
    • /
    • pp.45-57
    • /
    • 2024
  • 목적: 본 연구의 목적은 인공폐경이 갑상선암, 유방암, 자궁경부암 진단에 미치는 영향을 규명하여, 여성의 암 예방과 조기진단을 위한 기초자료를 제공하는 것이다. 방법: 2011년-2020년 국민건강영양조사 원시자료를 이용하여 분석하였다. 2011년-2020년 국민건강영양조사 조사대상자 79,262명 중 남성, 18세 이하, 80세 이상, 건강설문 미참여자, 결측치, 폐경 상태가 아닌 자를 제외하고 10,207명을 최종 연구대상자로 선정하였다. 이 중 갑상선암 진단자 248명(2.7%), 유방암 진단자 225명(2.2%), 자궁경부암 진단자 143명(1.5%)으로 나타났다. 결과: 첫째, 갑상선암 진단군과 비진단군 간에 교육수준, 출산경험, 폐경유형에 따라 차이가 있는 것으로 나타났다. 둘째, 유방암 진단군과 비진단군 간에 교육수준, 폐경 연령, 임신경험, 출산경험, 주관적 건강상태, 폐경유형에 따라 차이가 있는 것으로 나타났다. 셋째, 자궁경부암 진단군과 비진단군 간에 폐경 연령, 주관적 건강상태, 폐경유형에 따라 차이가 있는 것으로 나타났다. 넷째, 자연폐경에 비해서 인공폐경의 경우 여성의 진단 확률은 갑상선암이 2.010배, 유방암이 3.872배, 자궁경부암이 14.902배 증가하는 것으로 나타났다. 결론: 갑상선암, 유방암, 자궁경부암 모두에서 자연폐경에 비해서 인공폐경의 경우에 암 진단 확률이 증가하므로 암의 예방을 위하여 인공폐경을 경험하지 않도록 하는 것이 중요할 것으로 생각된다.