• Title/Summary/Keyword: Classification Variables

검색결과 939건 처리시간 0.025초

주부의 연령대별 농식품 소비 특성 비교 (Comparison of Housewives' Agricultural Food Consumption Characteristics by Age)

  • 홍준호;김진실;유연주;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.83-89
    • /
    • 2021
  • 라이프스타일이 빠르게 변화하고 있고, 식생활과 식품가공 기술의 발전에 따라 가구별로 식품 소비패턴이 매우 다양하다. 본 논문은 가구 단위의 농식품 구매 정보를 담고 있는 농촌진흥청이 구축하고 있는 소비자 패널 데이터의 식품군을 재분류하고 농식품 소비행위 주체인 패널 대표자의 연령대별로 그룹화하여 농식품 소비 특성 비교를 하였다. 연령대 구분의 기준은 대사질환 유병률로 20% 이상인 60대 이상 그룹과 10% 미만인 30~40대 그룹으로 나누었다. LightGBM 알고리즘을 사용하여 30~40대와 60대 이상의 식품 소비패턴의 차이를 분류 분석한 결과 정밀도는 0.85, 재현율은 0.71, F1_score는 0.77로 나타났다. 변수중요도의 결과는 과자류, 엽경채나물류, 조미채류, 과채류, 수산물류 순이었으며, SHAP 지표의 상위 5개 값은 과자류, 수산물류, 조미채류, 과채류, 엽경채나물류 순이었다. 이상치에 민감한 평균을 대신한 중앙값으로 소비패턴을 이진 분류한 결과 과자류의 경우 30~40대가 60대보다 두 배 이상 높은 것을 알 수 있었다. 이외의 변수에서도 30~40대와 60대 이상 사이에서 유의미한 차이를 보였다. 연구 결과 30~40대는 60대보다 과자류를 두 배 이상 소비하는 패턴을 보였으며, 60대의 경우 30~40대보다 수산물, 조미채류, 과채류, 엽경채나물류를 두 배 이상 섭취하였다. 상위 5개 품목 외에도 밀가공식품인 과자, 빵류, 면류에서 30~40대의 소비가 높았으며, 이는 60대의 식품 소비패턴과 차이를 보였다.

한국 성인의 사랑유형 잠재집단 및 영향요인 분석 (Analysis of Latent Classes and Influencing Factors According to the Love Types of Korean Adults)

  • 하문선;송연주
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제27권4호
    • /
    • pp.561-584
    • /
    • 2021
  • 본 연구는 한국 성인 601명을 대상으로 이들의 사랑유형에 따른 잠재집단을 분류하고, 각 집단별 우울 수준의 차이 및 잠재집단 구분에 영향을 주는 변인(성차, 연령, 결혼여부, 신경증, 불안애착, 정서조절)을 파악하고자 수행되었다. 잠재집단분석(LCA)을 실시한 결과, 한국성인의 사랑유형의 잠재집단은 친밀감, 열정, 책임감의 세 요인 모두에 대해 가장 높은 수준을 보이는 L-H(7.7%)집단, 세 요인 모두 평균보다 높은 수준을 나타내는 L-MH(33.6%)집단, 세 요인 모두 평균 수준을 나타내는 L-M(39.8%)집단, 세 요인 모두 평균보다 낮은 수준을 보이는 L-ML(14.6%)집단, 세 요인 모두가 가장 낮은 수준을 보이는 L-L(4.3%)집단으로 분류됨을 확인하였다. 또한, 한국 성인의 사랑유형 각 잠재집단에 따라 우울 수준에 차이가 있는지 ANOVA 검증 결과, L-MH집단이 L-ML집단에 비해 심리적으로 보다 건강하고 적응적인 집단으로 나타났다. 다항로지스틱 분석 결과, 여성은 남성에 비해 L-M, L-ML 및 L-L집단에 속할 가능성이 높았고, 미혼은 기혼에 비해 L-M, L-ML집단에 속할 가능성이 높았다. 또한, 불안애착 수준이 높을수록 L-H, L-MH집단보다 L-M, L-ML, L-L집단에, L-M집단보다 L-ML와 L-L집단에, L-ML집단보다 L-L집단에 속할 가능성이 높았으나, 연령과 신경증, 정서조절은 잠재집단 구분에 영향을 미치지 않았다. 본 연구는 한국 성인의 사랑유형에 대한 다양한 하위 잠재집단을 보다 입체적으로 파악하여 집단별 특성에 따른 차별적 개입의 가능성을 제시했다는 점에서 의미가 있다.

강우량 및 호우피해 자료를 이용한 호우피해 등급기준 Matrix작성 기법 개발 (Development of a method to create a matrix of heavy rain damage rating standards using rainfall and heavy rain damage data)

  • 정세진;유재은;허다솜;정승권
    • 한국수자원학회논문집
    • /
    • 제56권2호
    • /
    • pp.115-124
    • /
    • 2023
  • 현재 극한기상의 발생빈도가 많아지면서 극한기상현상이 발생하였을 때 피해규모는 증가하고 있다. 이게 과거부터 강우량의 예측을 위해 많은 시간과 제원을 투자하여 예측정보를 제공하고 있다. 하지만 이러한 정보는 전문가가 아닌 일반인이 이해하기 어려우며 특히 극한기상현상이 발생하였을 때 어느정도의 규모의 피해가 발생하는지에 대한 정보는 포함되어 있지 않다. 이에 본 연구에서는 영국에서 최초로 제시한 Risk Matrix 작성을 통해 영향예보 기준을 활용하여 호우피해 등급기준 Risk Matrix를 제시하였다. 먼저 강우량 자료와 피해자료와의 상관 분석을 통해 Risk Matrix 작성에 필요한 변수를 선정하고 선행연구에서 제시된 PERCENTILE (25%, 75%, 90%, 95%)과 JNBC(Jenks Natural Breaks Classification)기법을 이용하여 강우량과 피해에 따른 등급기준을 산정하여 두 개의 등급기준을 합성하여 하나의 기준을 제시하였다. 분석 결과에 이재민 세대수 결과의 경우 가장 많은 피해가 발생하였던 영산강, 섬진강유역에서 JNBC 보다 PERCENTILE이 가장 많은 분포를 보였으며, 충청도 지역에서는 유사한 결과를 나타내었다. 강우량의 등급화 결과를 살펴보면 PERCENTILE보다 JNBC의 등급이 높게 산정되었으며, 특히 전라도 지역과 충청도 지역에서 가장 큰 등급을 나타내었다. 또한 피해지역 호우특보 현황과 비교해 보면 JNBC가 유사한 것을 확인할 수 있다. Risk Matrix 결과에서 가장 피해가 심했던 세종, 대전, 충남, 충북, 광주, 전남, 전북지역을 살펴보면 PERCENTILE보다 JNBC가 잘 모사한 것을 확인하였다.

초지 바이오매스 부문 온실가스 인벤토리 구축을 위한 국제 동향과 국내 적용 가능성 평가 (Verification of International Trends and Applicability in the Republic of Korea for a Greenhouse Gas Inventory in the Grassland Biomass Sector)

  • 이슬기;이정관;김현준
    • 한국초지조사료학회지
    • /
    • 제43권4호
    • /
    • pp.257-267
    • /
    • 2023
  • 본 연구는 초지 바이오매스 부문에 대한 국제적 경향과 이를 통한 국내 적용 가능성을 검토하기 위해 수행되었다. 초지 분야는 LULUCF 내 타 분야에 비해 상대적으로 연구 수준이 낮은 편으로 UNFCCC에 보고된 각 국가별 NIR을 기준으로 Approach 2 수준의 Tier 1 방법이 가장 높은 빈도로 적용되고 있었다. IPCC 가이드라인의 Tier 1 방법에서 초지 바이오매스 부문은 연 변화량을 0으로 간주하기 때문에 LULUCF 타 분야에 비해 정형화된 기본 체계가 없이 국가 상황에 따른 다양한 산정 방법을 적용하는 특징이 나타났다. 국내 초지 바이오매스에 대한 Tier 2 이상의 방법에 적용 가능한 산정 방법을 항목별로 분류하면, 인간에 의한 초지 이용 유형을 구분하는지, 초지 내 목본 식생을 포함하는지, 재해로 인한 손실량을 산정하는지, 초지 관리 방법에 따른 차이를 적용하는지 여부였다. 각 항목에서 발생하는 유의미한 차이가 국내에 적용할 수 있는지를 확인하기 위하여 국내를 대상으로 현장 조사와 활동 자료 분석을 수행하였다. 현 시점에서 국내에서 확인 가능한 항목은 초지의 정의에 따른 공간 구성과 이용 유형에 따른 탄소량 차이로 나타났다. 연구 결과, 이용 유형에 따라서 방목지, 섭식이 수행된 방목지, 채초지에서 바이오매스 탄소량의 유의미한 차이가 나타났고, 기후대, 토양형에 따른 차이도 존재하고 있었다. 따라서 IPCC 가이드라인의 기후대와 토양형을 기준으로 한 세분류가 국내에서도 타당한 초지 분류 체계로 적용될 수 있는 것으로 분석되었다. 반면, 초지 바이오매스 부문에서 활용 가능한 국가 공간 자료와 현장 자료의 불일치성이 지나치게 높아 전국 단위의 적용은 신뢰도가 낮은 상황이다. 국제 동향에서 나타난 주요 함의를 국내의 상황과 비교하였을 때, 초지 분야에 대한 더 높은 수준의 온실가스 인벤토리 작성을 위해서는 기후대-토양형 유형에 대한 국가고유계수 개발과 더불어 활용 가능한 공간자료의 마련과 이를 뒷받침할 수 있는 정책 및 제도 체계가 시급히 마련되어야 할 것이다.

K-Means Clustering 기법과 원격탐사 자료를 활용한 탄소기반 글로벌 해양 생태구역 분류 (Classification of Carbon-Based Global Marine Eco-Provinces Using Remote Sensing Data and K-Means Clustering)

  • 김영준;배덕원;임정호;정시훈;추민기;한대현
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.1043-1060
    • /
    • 2023
  • 최근 기후변화의 가속화로 바다에 의한 탄소의 흡수 작용을 칭하는 '블루 카본(blue carbon)'에 대한 관심이 많아지고 있지만, 탄소 순환의 핵심이 되는 해양 생태계에 대한 우리의 이해는 아직 부족한 실정이다. 본 연구는 탄소 순환을 고려한 글로벌 해양 생태 권역(marine eco-province)을 k-means clustering 기법을 활용하여 분류·분석하였다. 지난 20년 간(2001-2020) 위성을 활용하여 생산된 Carbon-based Productivity Model (CbPM) 순 일차 생산량(Net primary production, NPP), particulate inorganic and organic carbon (PIC and POC), 위성 관측과 재분석모델을 결합하여 생산한 해수면 염분(sea surface salinity, SSS) 및 온도(sea surface temperature, SST) 총 다섯가지 자료를 활용하였다. 최적화 과정을 거쳐 총 9개의 생태권역을 도출하였으며, 각 권역의 공간분포와 특성을 분석하였다. 이 중 5개의 권역은 주로 대양의 특성을 반영하고, 4개의 권역은 연안 및 고위도 해역의 특성을 반영하는 것으로 나타났다. 또한, 기존에 알려진 해양 생태 권역과의 정성적 비교를 통하여 탄소순환을 고려한 해양 생태권역의 특징을 상세히 분석하였다. 마지막으로 과거 5년 단위(2001-2005, 2006-2010, 2011-2015, 2016-2020)로 생태 권역의 변화를 분석하였으며, 연안생태계의 빠른 변화와 특히 담수유입으로 인해 생산량이 높고 생태적으로 중요한 권역의 감소를 확인하였다. 이러한 연구 결과는 탄소 순환 및 기후변화를 고려한 해양 생태 권역 분류 및 연안 관리에 대한 중요한 참고자료로 활용 될 수 있으며, 기후 변화에 취약한 지역에 대한 체계적인 관리 지침 개발에 활용될 수 있다.

중소기업 기술 유출에 대한 조기경보시스템 개발에 대한 연구 (Development on Early Warning System about Technology Leakage of Small and Medium Enterprises)

  • 서봉군;박도형
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.143-159
    • /
    • 2017
  • 급속한 IT의 발전으로 인해 개인정보뿐만 아니라 기업이 보유하고 있는 핵심 기술 및 정보에 대한 유출 위협이 중요한 이슈로 인식되고 있다. 기업에게 있어서 보유하고 있는 핵심 기술은 기업의 생존 및 지속적으로 경쟁 우위를 차지하기 위해 매우 중요한 부분이다. 최근 기술 침해 사례가 많이 일어나고 있는데, 기술 유출은 기업에게 있어서 주가하락 등의 막대한 재무적인 손실을 가져올 뿐만 아니라, 기업의 신뢰에 손상을 입게 되고, 기업의 발전을 지연시키게 되는 악영향을 미치게 된다. 특히, 대기업에 비해 핵심기술이 기업 내 중요한 많은 부분을 차지하는 중소기업에 있어서 기술 유출에 대한 대비는 기업의 존립에 있어서 필수적인 요소로 볼 수 있다. 이처럼 정보 보안 관리의 필요성과 중요성이 대두되면서 기업 입장에서 조기에 기술 침해 위협에 대해 확인하고 대비할 필요가 있다. 본 연구에서는 기술 유출에 영향을 미치는 요인들을 탐색하는 실증 분석을 수행하고, 인공지능 알고리즘을 통해 기술유출 조기경보시스템을 개발하고자 한다. 구체적으로 본 연구에서는 중소기업이 보유한 기술 유출에 영향을 미치는 요인들을 로지스틱 회귀분석을 통해 확인해보고, 통계분석을 통해 검증된 요인들을 기반으로 인공지능 여러 기법들 중 하나인 Support Vector Machine을 활용하여 기술침해 가능성을 조기에 알려주는 모형을 개발하였다. 본 연구에서 제안하는 기술 유출 가능성에 대한 조기 경보 모형을 통해 기업 및 정부 관점에서 기술 유출을 미리 예방할 수 있는 기회를 제공할 수 있을 것으로 기대된다.

식물에 의한 호수생태계 건강성 평가법에 대한 고찰 (Review of a Plant-Based Health Assessment Methods for Lake Ecosystems)

  • 정연숙;이경은
    • 생태와환경
    • /
    • 제46권2호
    • /
    • pp.145-153
    • /
    • 2013
  • 물관리 정책이 수질평가 중심에서 수생태계 건강성 평가로 전환되고 있는 것은 세계적인 추세이다. 현재까지 수계의 평가기법은 수질이나 하상구조와 같은 물리화학적 요소 및 플랑크톤, 저서동물과 같은 일부 생물의 평가에 국한되어 개발되어 왔다. 식물은 호수의 물리, 화학 및 생물 변화를 민감하게 반영하는 지표인데 개발이 늦었다. 환경부에서는 전국의 호수와 저수지를 생태계로써 평가하고 관리할 목적으로 생태계의 평가 기법을 마련 중에 있다. 이 연구사업의 일환으로 식물을 이용하여 우리나라 호수생태계에 적합한 건강성 평가기법을 개발하기 위해서 기개발된 국외의 평가기법 중 주로 다변수법을 주로 고찰하였다. 다변수법의 적용은 시간과 비용이 많이 소요되고 변수 간의 상관성 등의 한계점이 있다. 그러나 현재 단일 변수로 쓸 만한 지표가 개발되어 있지 않으며 다변수법은 다면평가와 데이터 축적의 장점이 크다. 다변수법을 세 단계, 즉 평가지표의 선정, 점수화, 평가지수의 결정과 검증단계로 나누어 검토하였다. 평가지표 선정단계에서 가장 적용가능한 지표는 종조성과 수도 및 종 풍부도와 다양성 관련 지표들이다. 국외에서 대부분 포함하는 지표종은 아직 개발이 불완전해서 우리나라에서 적용하기에 한계가 있다. 다수 조사자가 참여할 경우 식물상에 대한 오동정이 결과에 영향을 미칠 수 있으므로 이 점의 사전 고려가 필요하다. 지표의 점수화 단계도 한계가 있다. 우리나라에 인위적 교란이 거의 없는 기준 호수가 없기 때문에 대안으로 다수의 호수를 조사하고, 조사된 호수의 지표값을 상대화하여 적용해야 한다. 같은 이유로 지수에 대한 검증과정도 어렵다. 종합할 때, 여러 가지 한계가 있지만 현장에서 조사 가능한 지표를 이용하여 식물을 이용한 호수 건강성의 다변수평가체계를 구축하는 것은 가능하다. 추후, 식물종의 질적 가치에 대한 지표를 추가하고 보다 많은 호수 조사의 결과가 누적되면 수준 높은 평가체계로 발전시킬 수 있을 것이다.

기업형 슈퍼마켓(SSM)의 시장진입이 소매업태간 시장점유율 변화에 미친 영향 (The Impact of SSM Market Entry on Changes in Market Shares among Retailing Types)

  • 최지호;윤민석;문연희;최성호
    • 한국유통학회지:유통연구
    • /
    • 제17권3호
    • /
    • pp.115-132
    • /
    • 2012
  • 본 연구의 목적은 최근 급격하게 확산되고 있는 기업형 슈퍼마켓(SSM)의 시장 진입이 국내 소매업 경쟁구조에 미친 영향을 실증하는데 있다. 자료의 분석기간은 2000년 1월부터 2010년 12월까지이며, 기업형 슈퍼마켓이 월별로 진입한 점포수, 누적 점포수, 신규 SSM 사업체 중 $165m^2$ 미만 점포비율이 분석모형에 고려되어 소매업태별 상대적 시장점유율에 미치는 효과가 분석되었다. 한국표준산업분류 코드에서 종합소매업에 속해 있는 백화점, 대형마트, 슈퍼마켓, 체인화 편의점, 기타 음식료품 위주 종합 소매업으로 구분된 소매업태간 시장점유율은 매월 각 소매업태별 판매액을 합산하여 월별 총 소매판매액을 계산한 후, 각 소매업태의 판매액이 총 소매판매액에서 차지하는 비율로 측정하였다. 통제변수로 소매업태별 종사자 수, 통화량(M2)이 모형에 추가되어 분석되었다. 분석결과, 신규 SSM 시장진입으로 인한 소매업태별 시장점유율 변화는 대형마트에서만 통계적으로 유의한 결과가 도출되었다. SSM의 누적 점포수는 모든 소매업태의 시장점유율 변화에 유의한 영향을 미쳤으나 그 영향력에 대한 방향성이 소매업태별로 다르게 나타났다. 먼저 SSM의 확산은 대형마트와 편의점의 시장점유율을 감소시킨 반면에 백화점, 슈퍼마켓, 기타 음식료품 위주 종합 소매점의 시장점유율에는 긍정적인 공헌을 한 것으로 나타났다. 이러한 결과에 대한 논의, 시사점, 그리고 향후 연구 방향이 제시되었다.

  • PDF

대화식 데이터 마이닝 기법을 활용한 자동차 보험사의 인입 콜량 예측 사례 (A Case Study on Forecasting Inbound Calls of Motor Insurance Company Using Interactive Data Mining Technique)

  • 백웅;김남규
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.99-120
    • /
    • 2010
  • 최근 고객들의 비대면 접점 서비스 이용도가 높아짐에 따라, 비대면 채널은 다양한 데이터의 분석을 통해 고객 만족도를 향상시킬 수 있는 유용한 창구로 인식되고 있다. 이러한 비대면 채널의 대표적 영역으로 콜센터를 들 수 있으며, 콜센터 운영에서 고객 만족도에 가장 큰 영향을 미치는 요소는 상담 인력의 규모인 것으로 알려져 있다. 즉, 일정수준 이상의 고객 만족도를 유지하기 위해서는 충분한 상담 인력을 확보하는 것이 관건이지만, 불필요하게 많은 인력을 확보하는 것은 인건비 측면에서 비용의 낭비를 초래할 수 있다. 따라서 부족하지도 않고 넘치지도 않을 정도의 적정 인력을 산출하는 능력은 콜센터 운영의 핵심 경쟁력으로 인식되고 있으며, 최근 콜센터에서는 적정 인력의 규모를 예측하기 위해 WFM(Work Force Management) 업무 전담 부서를 설치하고 콜량을 정확하게 예측하기 위한 노력을 기울이고 있다. 콜량 예측을 위해 현업에서 주로 사용되는 방법은 담당자의 직관에 의존하는 방법으로, 일정기간의 콜량 평균을 담당자가 주관적 판단에 의해 보정함으로써 이루어진다. 하지만 이러한 방식은 담당자의 주관적 성향에 크게 좌우된다는 한계를 갖고 있어서, 최근에는 다양한 예측 모형을 시스템화한 WFMS(Workforce Management System) 패키지가 널리 활용되고 있다. 하지만 이 시스템은 초기 도입 시 매우 고가의 구축비용이 발생하며, 신규 요인 발굴 시 이를 즉각적으로 시스템에 반영하기 어렵다는 한계점을 갖고 있다. 이를 극복하기 위해 본 연구에서는 데이터 마이닝의 대화식 의사결정나무 기법을 이용함으로써, 객관적이면서도 업무 배경 지식을 충분히 활용할 수 있는 예측 모형을 수립하고자 한다. 또한, 본 연구에서 수립한 모형의 정확성 평가를 위해, 국내 최대 규모의 한 자동차 보험사 콜센터의 4년 8개월 간의 실 데이터를 사용한 실험을 수행하고 그 결과를 제시하였다. 실험에서는 기존의 WFMS와 본 연구에서 제안하는 두 가지 모형인 대화식 의사결정나무 기반의 예측 모형, 일반 의사결정나무 기반의 예측 모형의 세 가지 모형에 대해, 다양한 오차 허용범위 하에서의 사고콜 및 고장콜에 대한 예측 적중률을 평가하였다.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.