• 제목/요약/키워드: 통계예측모델

검색결과 545건 처리시간 0.028초

창업연구 실증연구 분석방법론

  • 이일한
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2017년도 춘계학술대회
    • /
    • pp.17-17
    • /
    • 2017
  • 구조방정식모델(Structural Equation Modeling: SEM)은 변수들 간의 인관관계 및 상관관계를 검증하기 위한 통계기법으로 사회학 및 심리학 분야에서 개발되었지만 현재는 경영학, 광고학, 교육학, 생물학, 체육학, 의학, 정치학 등 여러 학문분야에서 광범위하게 사용되고 있다. Amos는 기본적으로 그래픽(Amos graphics)과 베이직(Amos basic)을 제공하기 때문에 정확한 프로그램의 작성이나 행렬에 대한 지식이 없는 초보자들도 아이콘을 이용하여 복잡한 연구모델이나 다중집단분석모델을 분석할 수 있다. PLS(Partial Least Square)는 모형 추정과정에서 발생하는 잔차 또는 예측오차를 최소화하여 예측력을 극대화하기 위한 프로그램이며, 즉, PLS-SEM는 표본 수가 적고 자료가 정규분포를 보이지 않거나 조형지표 모델이거나 복잡한 연구모델 분석에 유용하다. 최근 빅데이터의 열풍으로 자료들을 분석을 위한 도구로 R이 실무 현장에서 인기를 끌고 있다. R은 통계 프로그래밍 언어이자 오픈 소프트웨어 환경으로 통계, 그래픽, 데이터마이닝 등의 다양하고 방대한 양의 패키지들을 지원한다. R에서 제공되는 패키지들이 오픈 소스이고 선형 및 비선형 모델링, 고전적인 통계분석, 시 계열 분석, 분류 및 군집분석 등의 다양한 통계 패키지들을 제공한다는 측면에서 R은 실무는 물론 학문적인 측면에서도, 특히 통계를 기반으로 실증분석을 수행하는 사회과학연구들에서 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF

설명 가능 인공지능 기술을 적용한 인천광역시 범죄 예측 및 요인 분석 (Crime Prediction and Factor Analysis of Incheon Metropolitan City Using Explainable Artificial Intelligence)

  • 김다현;김유경;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.513-515
    • /
    • 2022
  • 본 연구는 범죄를 발생시키는데 관련된 여러가지 요인들을 기반으로 범죄 예측 모델을 생성하고 설명 가능 인공지능 기술을 적용하여 인천 광역시를 대상으로 범죄 발생에 영향을 미치는 요인들을 분석하였다. 범죄 예측 모델 생성을 위해 XG Boost 알고리즘을 적용하였으며, 설명 가능 인공지능 기술로는 Shapley Additive exPlanations (SHAP)을 사용하였다. 기존 관련 사례들을 참고하여 범죄 예측에 사용된 변수를 선정하였고 변수에 대한 데이터는 공공 데이터를 수집하였다. 실험 결과 성매매단속 현황과 청소년 실종 가출 신고 현황이 범죄 발생에 큰 영향을 미치는 주요 요인으로 나타났다. 제안하는 모델은 범죄 발생 지역, 요인들을 미리 예측하여 제시함으로써 범죄 예방에 사용되는 인력자원, 물적자원 등을 용이하게 쓸 수 있도록 활용할 수 있다.

건강행위정보기반 고혈압 위험인자 및 예측을 위한 통계분석 (Statistical Analysis for Risk Factors and Prediction of Hypertension based on Health Behavior Information)

  • 허병문;김상엽;류근호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.685-692
    • /
    • 2018
  • 본 연구는 통계분석을 이용한 중년 성인의 고혈압 예측모델 개발이 목적이다. 국민건강영양조사자료(2013년-2016년)를 사용하여 통계분석과 예측모델을 개발하였다. 이진 로지스틱 회귀분석으로 통계적 유의한 고혈압 위험인자를 제시하였으며, Wrapper 변수선택기법을 적용한 로지스틱회귀와 나이브베이즈 알고리즘을 이용하여 예측모델을 개발하였다. 통계분석에서 고혈압에 가장 높은 연관성을 갖는 인자는 남성에서 WHtR (p<0.0001, OR = 2.0242), 여성에서 AGE(p<0.0001, OR = 3.9185)로 나타났다. 예측모델의 성능평가에서, 로지스틱 회귀 모델이 남성(AUC = 0.782)과 여성(AUC = 0.858)에서 가장 좋은 예측력을 보였다. 우리의 연구 결과는 고혈압에 대한 대규모 스크리링 도구를 개발하는데 중요한 정보를 제공하며, 고혈압 연구에 대한 기반정보로 활용할 수 있다.

풍력 발전을 위한 분산형 전원전력의 단기예측 모델 설계 (Design of short-term forecasting model of distributed generation power for wind power)

  • 송재주;정윤수;이상호
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.211-218
    • /
    • 2014
  • 최근 풍력에너지는 풍력터빈의 지능화뿐만 아니라 풍력 발전량 예측 부분에서 컴퓨팅과의 결합이 확대되고 있다. 풍력 발전은 기상상태에 따라 출력변동이 심하고 출력 예측이 어려워 효율적인 전력 생산을 위해서 신재생에너지를 전력계통에 안정적으로 연계할 수 있는 기술이 필요하다. 본 논문에서는 분산형 전원의 예측정보를 향상시켜 예측한 발전량과 실제 발전량의 차이를 최소화하기 위한 분산형 전원전력의 단기예측 모델을 설계한다. 제안된 모델은 단기 예측을 위해서 물리모델과 통계모델을 결합하였으며, 물리모델에서 생산된 격자별 예측값 중 예측 지점내 예측지점의 값을 추출하고, 물리 모델 예측값에 통계모델을 적용하여 발전량 산정을 위한 최종 기상 예측값을 생성한다. 또한, 제안 모델에서는 실시간 기상청 관측자료와 실시간 중기 예측 자료를 입력 자료로 사용하여 단기 예측모델을 수행한다.

효율적인 작물 재배를 위한 LSTM 기반 작물 잎 중량 예측 모델 (LSTM-based crop leaf weight prediction model for efficient crop cultivation)

  • 이민서;장혜원;이예람;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.415-416
    • /
    • 2023
  • 지구온난화와 농업 활동 감소로 인해 농작물 생산량이 줄어드는 추세이다. 4차 산업혁명 시대를 맞아 농업 분야에서도 인공지능 기술을 활용하여 효율적인 작물 재배가 가능해지고 있다. 작물의 수확량을 최고로 끌어올릴 수 있는 시간대별 최적 환경을 알아낼 수 있다면 식물 재배와 관련한 제반 사업에 도움이 될 것이다. 본 연구에서는 LSTM 알고리즘을 이용하여 상추의 일별 중량을 예측하는 인공지능 모델을 생성하였다. 제안하는 AI 예측 모델을 통해, 보다 효율적인 작물 재배가 가능해질 수 있을 것으로 보인다.

앙상블 기법을 통한 잉글리시 프리미어리그 경기결과 예측 (Prediction of English Premier League Game Using an Ensemble Technique)

  • 이재현;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권5호
    • /
    • pp.161-168
    • /
    • 2020
  • 스포츠 경기 결과예측은 전반적인 경기의 흐름과 승패에 영향을 미치는 변인들의 분석을 통해 팀의 전략 수립을 가능하게 해준다. 이와 같은 스포츠 경기결과 예측에 대한 연구는 주로 통계학적 기법과 기계학습 기법을 활용하여 진행되어 왔다. 승부예측 모델은 무엇보다 예측 성능이 가장 중요시된다. 그러나 최적의 성능을 보이는 예측 모델은 학습에 사용되는 데이터에 따라 다르게 나타나는 경향을 보였다. 본 논문에서는 이러한 문제를 해결하기 위해 데이터가 달라지더라도 해당 데이터에 대한 예측 시 가장 좋은 성능을 보이는 모델의 선택이 가능한 기존의 축구경기결과 예측에서 좋은 성능을 보여온 통계학적 모델과 기계학습 모델을 결합한 새로운 앙상블 모델을 제안한다. 본 논문에서 제안하는 앙상블 모델은 각 단일모델들의 경기 예측결과와 실제 경기결과를 병합한 데이터로부터 최종예측모델을 학습하여 경기 승부예측을 수행한다. 제안 모델에 대한 실험 결과, 기존 단일모델들에 비해 높은 성능을 보였다.

생성 AI 기반 뉴스 기사 심리지수를 활용한 부동산 가격 예측 모델 (Predictive Model for Real Estate Prices Using Sentiment Index of news articles based on Generative AI )

  • 김수아;권미주;조수빈;김은수;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1198-1199
    • /
    • 2023
  • 부동산 시장은 다양한 요인에 의해 가격이 결정되며 거시경제 변수뿐 만 아니라 뉴스 기사, SNS 등 다양한 비정형 데이터의 영향을 받는다. 특히 뉴스 기사는 국민들이 느끼는 경제 심리를 반영하고 있어 부동산 가격에 영향을 크게 미치는 변수라고 판단된다. 본 연구에서는 뉴스 기사의 세분화된 감정 분석을 통해 전통적인 분석 방법보다 더 의미 있는 결과를 얻을 수 있는 부동산 가격 예측 모델을 생성하였으며 뉴스 기사로부터 심리 지수를 산출하기 위해 생성 AI 를 활용하였다. 제안하는 매매가격지수 예측 모델을 통해 부동산 시장과 뉴스 기사와의 관계성에 대해 파악할 수 있으며, 사회/경제적 동향을 반영한 부동산 가격 변동을 예측할 수 있을 것으로 보인다.

객체 검출을 위한 통계치 적응적인 선형 회귀 기반 객체 크기 예측 (Object Size Prediction based on Statistics Adaptive Linear Regression for Object Detection)

  • 권용혜;이종석;심동규
    • 방송공학회논문지
    • /
    • 제26권2호
    • /
    • pp.184-196
    • /
    • 2021
  • 본 논문은 객체 검출 알고리즘을 위한 통계치 적응적인 선형 회귀 기반 객체 크기 예측 방법을 제안한다. 기존에 제안된 딥 러닝 기반 객체 검출 알고리즘 중 YOLOv2 및 YOLOv3은 객체의 크기를 예측하기 위하여 네트워크의 마지막 계층에 통계치 적응적인 지수 회귀 모델을 사용한다. 하지만, 지수 회귀 모델은 역전파 과정에서 지수 함수의 특성상 매우 큰 미분값을 네트워크의 파라미터로 전파시킬 수 있는 문제점이 있다. 따라서 본 논문에서는 미분 값의 발산 문제를 해결하기 위하여 객체 크기 예측을 위한 통계치 적응적인 선형 회귀 모델을 제안한다. 제안하는 통계치 적응적인 선형 회귀 모델은 딥러닝 네트워크의 마지막 계층에 사용되며, 학습 데이터셋에 존재하는 객체들의 크기에 대한 통계치를 이용하여 객체의 크기를 예측한다. 제안하는 방법의 성능 평가를 위하여 YOLOv3 tiny를 기반으로 제안하는 방법을 적용하여 재설계한 네트워크의 검출 성능과 YOLOv3 tiny의 검출 성능을 비교하였으며, 성능 비교를 위한 데이터셋으로는 UFPR-ALPR 데이터셋을 사용하였다. 실험을 통해 제안하는 방법의 우수성을 검증하였다.

단백질 기능 예측을 위한 그래프 기반 모델링 (Graph-based modeling for protein function prediction)

  • 황두성;정재영
    • 정보처리학회논문지B
    • /
    • 제12B권2호
    • /
    • pp.209-214
    • /
    • 2005
  • 단백질 상호작용 데이터는 현 생물정보학에서 기능이 알려져 있지 않은 단백질의 기능 예측에 높은 신뢰성이 있는 프로티오믹스의 계산 모델에 이용되고 있다. 단백질 기능 예측 관련 연구로는 guilt-by-association 개념을 바탕으로 대규모의 단순 2차원 단백질-단백질 상호작용 맵을 이용하고 있다. 본 논문에서는 단백질-단백질 상호작용 데이터를 이용한 그래프 기반 기능 예측 방법인 neighbor-counting, $\chi^2$-통계치 예측 모델을 살펴보고 대량의 상호작용 데이터로부터 빠른 기능예측에 효과적인 알고리즘을 제안한다. 제안하는 알고리즘은 단백질 상호작용 맵, 서열 유사성 및 경험적 전문가 지식을 이용하는 그래프 기반 모델이다. 제안된 알고리즘은 Yeast 단백질의 기능 예측을 수행하였으며, neighbor-counting, $\chi^2$-통계치 모델의 실험 결과와 비교되었다.

OECD TG데이터를 이용한 그래프 기반 딥러닝 모델 분자 특성 예측 (Toxicity prediction of chemicals using OECD test guideline data with graph-based deep learning models)

  • 황대환;임창원
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.355-380
    • /
    • 2024
  • 본 연구에서는 OECD test guideline 데이터를 이용하여 graph기반 딥러닝 모델들의 성능을 비교하고자 한다. OECD TG는 화학물질들이 인체와 환경에 미칠 잠재적 영향에 대해 시험하는 방법이며, 많은 실험이 동물실험을 통해 독성을 확인한다. 동물실험은 많은 시간과 비용이 들며, 윤리적 이슈가 있어 대안을 찾거나 최소화하는 방법들이 연구되고 있다. 딥러닝은 화학물질을 활용하는 다양한 분야에서 사용되고 있으며, 독성예측 분야에도 사용되고 있으며, 특히 graph 기반 모델에 대한 연구가 활발하다. 우리의 목표는 OECD TG 데이터에 대한 graph기반 딥러닝 모델들의 성능을 비교하여 가장 성능이 좋은 모델을 찾는 것이다. 우리는 OECD에서 운영하는 웹사이트 eChemportal.org에서 OECD TG를 따른 결과를 수집하였으며, 전처리 과정을 통해 학습이 불가능하거나 부적절한 화학물질은 제거하였다. 수집된 OECD TG데이터와 화학물질 특성 예측 성능의 벤치마크 데이터셋인 MoleculeNet 데이터를 활용하여 5개의 graph기반 모델들의 독성 예측 성능을 비교하였다.