• 제목/요약/키워드: 데이터 불균형 문제

검색결과 211건 처리시간 0.028초

내용 기반 및 식품 교환 표를 이용한 맞춤형 건강식단 추천 기법 (A Customized Healthy Menu Recommendation Method Using Content-Based and Food Substitution Table)

  • 오유리;김윤희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권3호
    • /
    • pp.161-166
    • /
    • 2017
  • 최근 현대인들은 풍족해진 먹을거리에도 불구하고, 특정 영양소의 과잉 및 부족 섭취로 영양불균형의 문제로 겪고 있다. 이에 따라, 건강 및 식단조절에 관한 관심이 증가하였고, 다양한 모바일시스템을 이용한 어플리케이션들이 등장하였다. 하지만 대부분의 어플리케이션들은 섭취한 식단을 기록하고 단순한 통계를 보여주는데 그치는 수준이며 건강 식단을 위한 일반적인 정보를 제공한다. 건강에 관심 있는 사용자에게는 실질적으로 본인의 음식 선호를 반영하거나 맞춤형 권장 정보를 제공하는 추천서비스가 필요하다. 따라서 본 연구에서는 사용자의 신체 및 활동조건에 따른 권장섭취열량에 대해 식품군별 교환단위수를 부여하고, 과거 섭취이력을 활용하여 음식 선호를 분석하여 식품군별 권장섭취 단위수를 만족하는 식단추천 기법을 제안한다. 또한 실험을 통하여 사용자의 선호만을 고려한 경우, 권장교환단위만을 고려하는 경우와 비교하여 정밀도, 재현율, 건강지수, 그리고 3지표의 조화평균을 도출하고 제안하는 알고리즘의 우수성을 증명하였다. 해당 기법을 활용하여 사용자는 본인의 선호를 반영하는 맞춤형 건강식단을 추천받을 수 있으며 이를 통해 건강한 식습관 개선 및 유지에 도움을 줄 수 있다.

메타분석을 통한 개인정보보호법의 개선과제 (Improvement Issues of Personal Information Protection Laws through Meta-Analysis)

  • 조명근;이환수
    • 디지털융복합연구
    • /
    • 제15권9호
    • /
    • pp.1-14
    • /
    • 2017
  • 빅 데이터 시대에 접어듦에 따라 개인정보의 가치는 더욱 증가하고 있다. 그러나 우리나라의 개인정보보호 관련 법률들은 여러 가지 해결해야 할 문제점들을 가지고 있는 상황이다. 더욱이 기존 연구들은 제시되고 있는 문제들에 대해 개별적으로 접근하고 있어 개인정보보호법 개선방향에 대한 종합적 이해를 돕는데 한계가 있었다. 따라서 본 연구에서는 국내 개인정보보호법의 문제점들을 논의한 기존 연구들을 바탕으로 현행 개인정보보호법제의 개선과제들을 분석한다. 메타분석 기법을 적용하여 개인정보보호법제의 문제점들을 논의한 총 39개의 연구 논문을 선별하고 분석하였다. 분석 결과 개인정보의 의의 및 범위에 대한 논의, 이해관계자의 역할 및 의무에 대한 논의, 개인정보의 제3자 제공에 관한 논의, 각 분야별 특별법과의 중복규제 및 규제 불균형에 관한 논의 등 파편화 되어있는 현행 개인정보보호법이 가지고 있는 다양한 문제점들이 존재하고 있음을 확인하였다. 실무적 측면에서 본 연구는 개인정보보호법과 각 분야별 특별법들 사이의 부정합성을 개선하기 위한 기초 자료로 의미가 있으며. 학문적으로는 연구자들이 거시적 관점에서 개인정보보호법제의 문제점들을 파악하여 향후 개인정보보호법제의 통합적 정비 방안을 제시하는데 기여할 것이다.

TMA 분석을 위한 지능적 의학 전문가 시스템의 설계 및 구현 (Design and Implementation of an Intelligent Medical Expert System for TMA(Tissue Mineral Analysis))

  • 조영임;한근식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.137-152
    • /
    • 2004
  • 모발분석(TMA: Tissue Mineral Analysis)은 머리카락 속에 있는 30여 가지의 미네랄과 8가지의 중금속의 양과 중요 미네랄 비율을 분석하여 체내에 과잉, 결핍 및 불균형 상태를 평가하고, 그 결과가 현재 인체에 미치는 영향을 예측하여, 건강을 유지하는 방향을 제시하는 임상 영양학 및 독성학 모발조직 검사방법을 말한다. 그러나 국내 TMA 분석방법은 몇 가지 문제점이 있다. 첫째, TMA 분석기기는 있으나 분석결과를 해석할 수 있는 한국형 의학 정보 데이타베이스가 없다. 둘째, 미국에서 보내오는 TMA 검사결과 자료가 영문이며 철저한 보안에 바탕을 둔 그래픽 파일 형태이므로 활용성이 적다. 셋째, TMA 관련 데이터베이스가 있어도 의료기관에서 사용하기 어려운 매우 낮은 수준이므로 TMA 분석 및 의료서비스를 위해 매번 미국에 의뢰해야 하므로 심각한 외화낭비를 초래한다. 넷째, TMA 결과가 서구식 생활패턴에서 비롯된 데이터 베이스로부터 구축된 것이므로 검사결과의 신뢰성 문제가 발생한다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 국내 전문 기관으로부터 자료를 제공받아 TMA 관련 국내 최초 지능적 의학 전문가 시스템(IMES: Intelligent Medical Expert System)을 개발하였다. IMES는 TMA 자료를 다단계 통계분석 방법에 의한 결정 트리 분류기를 이용하여 분류하고 다중 퍼지 규칙베이스를 구축하여, 지능적 퍼지추론 방법에 의해 한글화된 데이터베이스로부터 복잡한 자료를 추론하도록 구축하였다. 본 IMES 시스템을 실제 적용한 결과 업무능률과 만족도가 각각 86%, 92% 증가함을 알 수 있었다.

포용적 생활 SOC 정책 추진을 위한 공원결핍지수 개발 연구 (Development of Index of Park Derivation to Promote Inclusive Living SOC Policy)

  • 김용국
    • 한국조경학회지
    • /
    • 제47권5호
    • /
    • pp.28-40
    • /
    • 2019
  • 지역 및 인구집단의 사회경제적 지위에 따른 생활 SOC 공급의 불균형 문제를 해결하기 위해 포용도시 정책에 대한 논의가 확장하고 있다. 본 연구의 목적은 포용적 도시공원 정책 추진을 위한 대안적 지표로 공원결핍지수(Index of Park Derivation, IPD)를 제안하고, 이를 7대 광역시에 적용해 공원 정책 필요도가 상대적으로 높은 지역을 선정하는 것이다. 주요 연구결과는 다음과 같다. 첫째, 포용도시와 공원기능에 대한 관련 이론 및 선행연구 검토를 통해 포용적 도시공원 정책 개념을 "노인, 어린이, 저소득층, 폭염 미세먼지 등의 환경 재난 재해 취약계층 등 사회경제 및 환경적 지위가 낮은 지역 및 인구집단을 우선적으로 고려해 양질의 공원서비스를 공급 관리하는 정책"이라고 조작적으로 정의했다. 둘째, 공원서비스 수준, 인구구조 특성, 경제 및 교육 수준, 건강 수준, 환경적 취약성 등 5개 부문의 17개 변수를 종합하여 공원결핍지수(Index of Park Derivation, IPD)를 개발했다. 공원결핍지수를 구성하는 변수들은 체육시설, 어린이집, 유치원, 공공도서관 등 공원 외의 생활 SOC 정책에도 적용 가능할 것으로 판단된다. 셋째, 7대 광역시 1,148개 읍면동 지역에 공원결핍지수를 적용한 결과 광역시별 공원서비스 필요도가 상대적으로 높은 지역들이 도출되었다. 서울특별시 강북구 삼각산동, 부산광역시 강서구 대저1동, 대구광역시 동구 안심1동, 인천광역시 부평구 삼산1동, 광주광역시 광산구 신창동, 대전광역시 대덕구 회덕동, 울산광역시 북구 농소3동이 지역별 공원 정책필요도 1순위로 도출되었다. 본 연구는 정부 및 지자체가 쉽게 접근 활용할 수 있는 통계 및 지리정보 데이터에 기반해 포용적 도시 공원 정책을 추진할 수 있는 대안적 지표를 제안했다는 의의를 갖는다.

균형 랜덤 포레스트를 이용한 이륜차 보험사기 적발 모형 개발 (Bike Insurance Fraud Detection Model Using Balanced Randomforest Algorithm)

  • 김승훈;이수일;김태호
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.241-250
    • /
    • 2022
  • COVID-19 여파로 인한 비대면 서비스와 가정 재정 불안정성의 증가로 이륜차 보험사기 발생이 예상되고 있다. 이와 함께 보험사기 수법도 갈수록 교묘해지고 있다. 하지만 비대면 배달 수요와 연관된 이륜차 교통사고와 보험사기 적발 모형 관련 연구는 매우 미흡한 실정이다. 이에 본 연구는 보험사기의 표본 편중문제를 해결하기 위해 균형 랜덤포레스트 알고리즘을 이용하고 보험사기 조사 전문가의 정성적인 판단 기준을 반영한 변수를 모델에 포함하여 적용성을 향상시키며 적발력 높은 이륜차 보험사기 모형을 개발하고자 한다. 보험사기 적발 모형 개발 결과, 기존의 비균형 랜덤 포레스트 모형에 비해 균형 랜덤 포레스트가 보험 사기혐의자를 분류하는 데 있어 통계적으로 우수한 점을 확인할 수 있었다. 특히, 총 26개의 변수를 토대로 탐색적 변수 조합을 적용한 모형의 예측 성능이 가장 높았지만 일부 변수만을 사용한 확인적 모형의 예측 성능도 크게 떨어지지 않은 와중에, 정성적인 보험사기 전문가가 선정한 변수만을 사용한 확인적 모형은 예측력이 떨어지는 것을 확인하였다. 또한, 총 26개의 변수 중 운전자 성별, 연령, 운전자 피보험자 일치 여부, 미수선 청구금액, 대인보험금 등이 중요한 변수로 확인되어 이를 활용해 이륜차 보험사기 혐의자 선별을 위한 적극적인 대처가 필요해 보인다.

빅데이터를 활용한 공공계약의 입찰참가자수 영향요인 분석 (Influencing Factors Analysis for the Number of Participants in Public Contracts Using Big Data)

  • 최태홍;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.87-99
    • /
    • 2018
  • 본 연구는 공공계약의 여러 가지 형태 중 나라장터(KONEPS)를 통해 체결된 물품구매, 용역, 시설공사 등의 계약 자료를 수집하여 공공계약에서 입찰참가자수의 영향요인을 분석한다. 공공계약에서 입찰참가자수가 중요한 이유는 경쟁성 확보를 통한 합리적 계약 체결여부를 판단하는 최소한의 기준이 될 수 있으며, 발주기관의 예산절감 또는 입찰참가자의 수익성과 밀접한 관계가 있기 때문이다. 연구 목적은 공공계약에서 입찰참여자들의 입찰참여 여부는 어떤 요인에 의해 결정되는지를 분석하여 현재 공공계약에서 입찰참여에 관한 문제점과 정책적 시사점을 제시하기 위한 것이다. 본 연구는 5만여 공공기관이 나라장터로 발주하여 30만여 개인사업자 및 법인이 참여한 435만여 물품구매, 용역, 시설공사 등 많은 계약 건을 비교 분석함으로써 기존의 샘플링 기반 연구와의 차별성을 가진다. 연구모형으로 공고일수, 예산금액, 계약방법, 낙찰방법 등을 독립변수로, 입찰참가자수를 종속변수로 각각 도출하여 활용한다. 조사 분석은 빅데이터 및 다차원 분석기법을 사용한다. 분석결과 첫째, 공공발주 사업의 예산금액의 규모가 클수록 입찰참가자수가 적고, 이는 입찰참가자들이 예산금액이 클수록 수주할 확률이 매우 낮아진다고 인지하는 것에 기인한 것으로 공공사업에 대한 신뢰성 제고를 위하여 분리발주에 대한 제도적 장치가 필요하다는 것을 의미한다. 둘째, 계약방법으로는 제한경쟁이 일반경쟁 보다 입찰참가자수가 많고, 이는 계약방법이 입찰참가자수와 공공사업의 예산절감에 영향을 줄 수 있다는 것을 의미한다. 셋째, 공고일수는 입찰참가자수에 유의미한 영향을 미치지 않았으며 이는 나라장터를 통해 많은 개인사업자 및 법인들이 입찰정보를 숙지하고 있어 정보불균형의 문제는 심각하지 않다는 것을 의미한다. 넷째, 낙찰방법으로는 적격심사낙찰제가 최저가낙찰제 보다 입찰참가자수가 많고, 이는 낙찰방법이 입찰참가자수와 입찰참가자의 수익성에 영향을 줄 수 있다는 것을 의미한다.

무인기 기반 RGB 영상 활용 U-Net을 이용한 수수 재배지 분할 (Sorghum Field Segmentation with U-Net from UAV RGB)

  • 박기수;유찬석;강예성;김은리;정종찬;박진기
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.521-535
    • /
    • 2023
  • 논·밭 전환 시 수수(sorghum bicolor L. Moench)는 뛰어난 내습성으로 콩과 함께 안정적인 생산이 가능하여 국내 식량작물의 자급률 향상과 쌀 수급 불균형 문제를 해결할 수 있을 것으로 기대되는 작물이다. 그러나 수량 추정을 위한 재배면적과 같은 기본적인 통계조사는 많은 인력을 투입하여도 오래 걸리는 전통적인 조사 방식으로 인해 잘 이루어 지지 않고 있다. 이에 따라 본 연구에서는 무인기 기반 RGB 영상에 U-Net을 적용하여 수수 재배지 비파괴적 분할가능성을 확인하였다. 2022년에 7월 28일, 8월 13일, 8월 25일에 각각 영상이 취득되었다. 각 영상취득 날짜에서 512 × 512 영상크기로 훈련데이터셋 6,000장과 검증데이터셋 1,000장으로 나누어 학습을 진행하였으며 수수 농경지(sorghum), 벼와 콩 농경지(others)와 비 농경지(background)로 구성된 세 개 클래스와 수수 농경지와 배경(others+background)으로 구성된 두 개 클래스 기반으로 분류모델을 개발하였다. 모든 취득 날짜에서 세 개 클래스 기반 모델에서는 수수 재배지 분류 정확도가 0.91 이상으로 나타났지만 8월 데이터셋의 others 클래스에서 학습 혼동이 일어났다. 대조적으로 두 개 클래스 기반 모델에서는 8월 데이터셋의 안정적인 학습과 함께 모든 클래스에서 0.95 이상의 정확도를 나타내었다. 결과적으로 8월에 두개클래스 기반 모델을 현장에 재현하는 것이 수수 재배지 분류를 통한 재배면적 산출에 유리할 것으로 판단된다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

주니어 투수들의 팔꿈치 안쪽 곁인대 손상이 상지 근육의 최대등척성수축력 차이에 미치는 영향 (Effects of Elbow Ulnar Collateral Ligament Injury on Differences in Maximal Isometric Strength of Upper body in Young Baseball Pitchers)

  • 장세홍;김동희
    • 한국산학기술학회논문지
    • /
    • 제17권10호
    • /
    • pp.628-634
    • /
    • 2016
  • 투수들의 경기력은 야구경기에서 아주 중요한 역할을 하는데 많은 투수들은 염좌 인대손상 등 많은 상해에 시달린다. 이러한 이유는 한 관절을 움직일 때 사용되는 주요한 두 가지 근육의 근력 차이가 클수록 부상의 위험성이 높아지기 때문이다. 하지만 이와 관련된 연구는 미비한 실정이다. 따라서 본 연구는 야구선수들을 대상으로 팔꿈치 안쪽 곁인대 통증이 있는 선수들과 통증이 없는 선수들의 투구 동작에 관련된 최대 등척성 수축력의 차이를 알아보고자 하였다. 실험기간은 2주간으로 모든 실험참가자들의 측정이 실시되었다. 실험참가자들(n=36)은 통증이 있는 통증군 (n=18)과 통증이 없는 정상군 (n=18)으로 나뉘어 최대 등척성 수축력을 어깨관절 안쪽과 바깥돌림근, 팔꿉굽힘근과 폄근, 손목굽힘근과 폄근에서 측정하였고 그후 근육그룹간 근력의 차이를 계산하였다. 모든 데이터는 SPSS 18.0을 이용하여서 독립 t-test를 이용하여서 분석되었다. 연구결과는 통증군의 바깥돌림근 (p = 0.035), 팔꿉굽힘근 (p=0.031), 팔꿉폄근 (p=0.041)은 정상군보다 유의하게 낮았고 손목폄근(p=0.047)은 정상군보다 유의하게 높았다. 그리고 통증군의 어깨관절 안쪽과 바깥돌림근(p = 0.008), 팔꿉관절 굽힘근과 폄근(p = 0.002), 손목관절의 굽힘근과 폄근의 (p = 0.032) 최대등척성수축력의 차이가 정상군보다 유의하게 높게 나타났다. 연구결과 통증군의 최대등척성수축력의 차이가 높게 나타나서 부상이 발생한다고 보고하였다. 그러므로 이러한 근력의 불균형 문제를 해결한다면 부상에서 회복하고 더불어 경기력 향상을 이룰 수 있게 된다고 사료된다.

기업문화가 직무스트레스에 미치는 영향 : 주당 초과 근로시간과 조직신뢰의 매개변수 (The Impact of Corporate Culture on Job Stress : A Mediating Variable of Overtime and Organizational Trust)

  • 전영준
    • 벤처혁신연구
    • /
    • 제6권3호
    • /
    • pp.149-164
    • /
    • 2023
  • 혁신과 창의성이 점차 중요해지는 오늘날 인적자원에 대한 관리는 기업의 성과와 경쟁적 우위를 위한 핵심요인이다. 이에 기업은 목표달성과 조직성과 제고를 위해 구성원을 대상으로 다양한 유형의 지원방식을 시행·도입하고 있다. 기업이 가진 조직문화와 조직 신뢰는 구성원의 인지적·정서적 상태에 영향을 미치며 나아가 직무 스트레스, 직무 만족과 같은 조직성과에 변화를 가져올 수 있다. 또한, 제도적인 관점에서 일과 삶의 균형 역시 조직성과에 영향을 미치는 주요 요인으로서, 일과 삶의 불균형은 사기저하, 직무에 대한 불만족 등 조직성과 하락을 초래한다. 일과 삶의 균형과 관련하여 저출산 문제가 심화되며 중요성이 대두되기 시작하였다. 이에 정부는 근로자들의 일과 삶의 균형을 위해 다양한 정책적 지원을 시행하였으며, '주 52시간 근무제'가 대표적인 예에 해당한다. 이에 본 연구는 경쟁가치모형을 적용한 기업의 조직문화가 근로자들의 직무 스트레스 미치는 영향 관계에 대해 분석하고, 주당 초과근로시간, 조직 신뢰가 가지는 매개효과를 분석하였다. 직무 스트레스는 직무 몰입, 직무 만족, 이직의도에 영향을 미치는 전제에 해당한다. 그러나 기존 연구의 경우 직무 스트레스를 조직성과로 측정한 연구는 미비한 실정이다. 더하여 초과근로시간과 조직성과 관계를 분석한 연구가 드물다는 점을 고려했을 때 영향 관계를 파악할 필요가 있다. 따라서 본 연구에서 설정한 가설을 검증하기 위해 ?인적자본기업패널(HCCP)근로자?-(2021년) 데이터를 활용하여 자료를 수집한 후 구조방정식모형(SEM)을 사용하였다. 연구결과는 다음과 같다. 첫째, 위계 지향적인 기업의 조직문화는 근로자들의 직무스트레스를 증가시킨다. 반면 혁신지향, 관계지향, 경쟁지향적인 기업문화는 직무스트레스를 감소시킨다. 둘째, 위계 지향적인 문화는 조직에 대한 신뢰를 감소시켰으며, 이외의 조직문화는 조직에 대한 신뢰를 증가시킨다. 셋째, 관계지향적이며, 경쟁지향적인 기업의 조직문화는 주당 초과 근로시간 감소에 영향을 미쳤으며, 혁신지향적이며 위계지향적인 문화는 초과 근로시간을 증가시키는 것으로 나타났다. 넷째, 조직에 대한 신뢰와 주당 초과 근로시간은 기업의 조직문화와 직무스트레스를 매개하는 효과를 가지는 것으로 나타났다. 이러한 분석결과를 바탕으로 본 연구는 학문적 및 정잭척 시사점을 제시하였다.