• 제목/요약/키워드: software engineering

검색결과 12,330건 처리시간 0.037초

A Study on IT Curriculum Evaluation for College Students

  • Kim, Heon Joo;Kim, Kyung-mi;Yi, Kang
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.255-265
    • /
    • 2022
  • 본 연구는 H대학 전교생 필수인 IT 교과목 강의평가에 영향을 주는 요인에 대해 비교 분석하였다. 본 연구의 목적은 강의만족도가 학업성취도, 출석율, 수강과목군과 유의미한 상관관계를 가지는지 파악하는 것이다. 특별히 컴퓨터를 활용하는 실습이 많이 요구되는 IT 교양과목들의 강의 만족도가 일반 교양과목의 강의만족도 경향과 어떤 차이가 있는가를 확인하고자 하였다. 본 연구를 위해서 H 대학교에서 2019년도 1, 2학기에 진행한 교양 IT 교과교육과정의 12개 교과목에서 2,322명 수강생들이 제출한 2,149건 강의평가 결과를 자료로 사용하였다. 강의평가 결과는 객관식 선택형 문항의 평가점수 외에도 주관식 서술형 문항도 학생들이 제출한 서술문을 긍정형과 부정형으로 분류하여 계량화를 하여 강의평가 결과를 객관화하였다. 연구 결과, 출석률과 학업성취도가 높을수록 강의만족도가 높았으며, 주관식 문항에서는 부정 단어보다는 긍정 단어를 더 많이 사용하였고, 학점이 낮을수록 부정 단어를 더 많이 사용하였다. 초급프로그래밍이나 소프트웨어활용군 과목군에서는 출석률이 높을수록 강의만족도가 높았지만, 중급프로그래밍에서는 출석률과 선택형 평가점수는 상관관계가 없었으며 주관식 문항에서도 타 과목군보다 부정 단어를 많이 사용하였다. IT 교과목에 대한 강의평가 경향은 일반 교과목의 강의평가 경향과 유사한 면도 있지만 중급프로그래밍 교과목에서는 대체로 부정적인 평가를 하는 것으로 나타났다.

농축산식품산업 특수분류 기반 추정적격률을 이용한 모집단 추정 (The Estimation of the Population by Using the Estimated Appropriate Rate Based on Customized Classification of Agriculture, Livestock and Food Industry)

  • 위성승;이민철;김진민;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권3호
    • /
    • pp.117-124
    • /
    • 2023
  • 농림축산식품부는 2008년 조직개편을 통해 식품 정책에 대한 기능이 이관되어 보건복지부 등에 산재하여 있던 식품산업을 통합관리 하게 되었고, 1, 2, 3차 산업을 포괄한 종합 정책을 수립하고 있다. 최근 4차 산업혁명과 더불어 농축산식품산업에도 스마트팜, 푸드테크 등 새로운 사업개념이 등장하였다. 농림축산식품부는 4차산업에 적합한 정책을 수립하기 위해 농축식품산업의 사업체 규모를 정확히 추정하는 것이 필요하게 되었다. 농림축산식품부는 전방과 후방 산업의 연계분석을 통한 부가가치 산출과 농축산식품산업의 정확한 모집단을 추정하기 위해서 2017년부터 농축산식품산업 특수분류를 위해 연구하기 시작하였고 통계청으로부터 농축산식품 특수분류 승인을 받았다. 특수 분류를 기반으로 한 농축산식품산업의 모집단 추정은 매출액, 종사자 수 등 전 산업에서 차지하는 비중이 정책의 수립과 중요도에 많은 영향을 미치기 때문에 매우 중요하다. 본 논문은 농축산식품 특수분류와 한국표준산업분류에서의 추출된 표본을 이용하여 현재적격률을 산정하고 모집단을 추정하는 과정과 현재적격률을 보완하기 위한 추정적격률을 제안하여 보다 모집단을 잘 반영하는 방안을 제시하고자 한다.

머신러닝 기반의 온실 VPD 예측 모델 비교 (Comparison of Machine Learning-Based Greenhouse VPD Prediction Models)

  • 장경민;이명배;임종현;오한별;신창선;박장우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권3호
    • /
    • pp.125-132
    • /
    • 2023
  • 본 연구에서는 식물의 영양분 흡수에 따른 식물 성장뿐만 아니라 기공 기능 및 광합성에도 영향을 끼치는 온실의 수증기압차(VPD, Vapor Pressure Deficit)예측을 위한 머신러닝 모델들의 성능을 비교해보았다. VPD 예측을 위해 온실 내·외부 환경요소 및 시계열 데이터의 시간적 요소들과의 상관관계를 확인하고 상관관계가 높은 요소들이 VPD에 어떤 영향을 미치는지 확인하였다. 예측 모델의 성능을 분석하기 전 분석 시계열 데이터의 양(1일, 3일, 7일), 간격(20분, 1시간)이 예측 성능에 미치는 영향을 확인하여 데이터의 양과 간격을 조절하였다. 마지막으로 4개의 머신러닝 예측 모델(XGB Regressor, LGBM Regressor, Random Forest Regressor 등)을 적용하여 모델별 예측 성능을 비교했다. 모델의 예측 결과로 20분 간격의 1일의 데이터를 사용했을 때 LGBM에서 MAE는 0.008, RMSE는 0.011의 가장 높은 예측 성능을 보였다. 또한 20분 후 VPD 예측에 가장 큰 영향을 미치는 요소는 환경적 요인보다는 과거 20분 전의 VPD(VPD_y__71)임을 확인하였다. 본 연구의 결과를 활용하여 VPD 예측을 통해 작물의 생산성을 높이고, 온실의 결로, 병 발생 예방 등이 가능하다. 향후 온실의 환경 데이터 예측뿐만 아니라 더 나아가 생산량 예측, 스마트팜 제어 모델 등 다양한 분야에 활용할 수 있을 것이다.

딥러닝을 이용한 농경지 팜맵 판독 적용 방안 (The Application Methods of FarmMap Reading in Agricultural Land Using Deep Learning)

  • 위성승;정남수;이원석;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.77-82
    • /
    • 2023
  • 본 논문은 농림축산식품부에서 구축한 농경지 전자지도인 팜맵을 딥러닝을 이용하여 농경지 속성정보인 논, 밭, 인삼, 과수, 시설, 비경지의 속성 정보를 판독하는 방안을 제안한다. 팜맵은 항공 및 위성 영상을 이용하여 현실 세계의 농경지를 디지털화하여 작물 생산 현황 파악과 드론 운영에 공간정보로 활용되고 있으며, 판독 매뉴얼을 작성하여 매년 사람을 통해 농경지의 경계를 구획하고 속성을 판독하여 갱신한다. 사람을 통한 농경지 속성판독은 사람의 판독 역량과 경험에 따라 차이를 보이며, 판독 오류는 예산과 공간적 시간적 한계로 직접 현장에 갈 수 없어 현실적으로 검증이 쉽지 않다. 팜맵은 5가지의 농경지 속성의 이미지에 해당 객체의 위치 정보와 클래스 정보를 가지고 있어 적합한 AI의 기법은 인스턴스 분할 모델인 ResNet50으로 실험을 진행하였으며, 딥러닝을 이용한 농경지 속성판독과 사람에 의한 속성판독 결과를 비교하여, 향후 다른 결과를 나타내는 속성판독에 집중하여 기술을 개발한다면 속성 오류를 줄이고 농경지 전자지도의 정확성 향상에 큰 역할을 할 것으로 기대된다.

딥러닝과 머신러닝을 이용한 아파트 실거래가 예측 (Apartment Price Prediction Using Deep Learning and Machine Learning)

  • 김학현;유환규;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.59-76
    • /
    • 2023
  • 코로나 시대 이후 아파트 가격 상승은 비상식적이었다. 이러한 불확실한 부동산 시장에서 가격 예측 연구는 매우 중요하다. 본 논문에서는 다양한 부동산 사이트에서 자료 수집 및 크롤링을 통해 2015년부터 2020년까지 87만개의 방대한 데이터셋을 구축하고 다양한 아파트 정보와 경제지표 등 가능한 많은 변수를 모은 뒤 미래 아파트 매매실거래가격을 예측하는 모델을 만든다. 해당 연구는 먼저 다중 공선성 문제를 변수 제거 및 결합으로 해결하였다. 이후 의미있는 독립변수들을 뽑아내는 전진선택법(Forward Selection), 후진소거법(Backward Elimination), 단계적선택법(Stepwise Selection), L1 Regularization, 주성분분석(PCA) 총 5개의 변수 선택 알고리즘을 사용했다. 또한 심층신경망(DNN), XGBoost, CatBoost, Linear Regression 총 4개의 머신러닝 및 딥러닝 알고리즘을 이용해 하이퍼파라미터 최적화 후 모델을 학습시키고 모형간 예측력을 비교하였다. 추가 실험에서는 DNN의 node와 layer 수를 바꿔가면서 실험을 진행하여 가장 적절한 node와 layer 수를 찾고자 하였다. 결론적으로 가장 성능이 우수한 모델로 2021년의 아파트 매매실거래가격을 예측한 후 실제 2021년 데이터와 비교한 결과 훌륭한 성과를 보였다. 이를 통해 머신러닝과 딥러닝은 다양한 경제 상황 속에서 투자자들이 주택을 구매할 때 올바른 판단을 할 수 있도록 도움을 줄 수 있을 것이라 확신한다.

마이터 어택과 머신러닝을 이용한 UNSW-NB15 데이터셋 기반 유해 트래픽 분류 (Malicious Traffic Classification Using Mitre ATT&CK and Machine Learning Based on UNSW-NB15 Dataset)

  • 윤동현;구자환;원동호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.99-110
    • /
    • 2023
  • 본 연구는 현 보안 관제 시스템이 직면한 실시간 트래픽 탐지 문제를 해결하기 위해 사이버 위협 프레임워크인 마이터 어택과 머신러닝을 이용하여 유해 네트워크 트래픽을 분류하는 방안을 제안하였다. 마이터 어택 프레임워크에 네트워크 트래픽 데이터셋인 UNSW-NB15를 적용하여 라벨을 변환 후 희소 클래스 처리를 통해 최종 데이터셋을 생성하였다. 생성된 최종 데이터셋을 사용하여 부스팅 기반의 앙상블 모델을 학습시킨 후 이러한 앙상블 모델들이 다양한 성능 측정 지표로 어떻게 네트워크 트래픽을 분류하는지 평가하였다. 그 결과 F-1 스코어를 기준으로 평가하였을 때 희소 클래스 미처리한 XGBoost가 멀티 클래스 트래픽 환경에서 가장 우수함을 보였다. 학습하기 어려운 소수의 공격클래스까지 포함하여 마이터 어택라벨 변환 및 오버샘플링처리를 통한 머신러닝은 기존 연구 대비 차별점을 가지고 있으나, 기존 데이터셋과 마이터 어택 라벨 간의 변환 시 완벽하게 일치할 수 없는 점과 지나친 희소 클래스 존재로 인한 한계가 있음을 인지하였다. 그럼에도 불구하고 B-SMOTE를 적용한 Catboost는 0.9526의 분류 정확도를 달성하였고 이는 정상/비정상 네트워크 트래픽을 자동으로 탐지할 수 있을 것으로 보인다.

Concept Drift에 의한 ML 모델 성능 변화의 정량적 추정 방법 (Quantitative Estimation Method for ML Model Performance Change, Due to Concept Drift)

  • 안순홍;이훈석;김승훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.259-266
    • /
    • 2023
  • 기계학습을 통해 학습된 모델은 업무 활용 시 그 성능을 실측하기 매우 어렵다. 때문에 운영 부서에서는 모델의 성능을 효과적으로 관리하지 못한다. 이로 인해 모델의 상태를 판단하기 위한 Concept drift 탐지 방법이 다양하게 연구되고 있다. 운영 부서에서는 운영 중인 모델의 성능을 정량적으로 관리하려고 한다. 그러나 Concept drift는 모델 상태를 데이터 관계적으로 판단 할 뿐, 모델의 정량적 성능 수치를 추정하지는 못한다. 본 연구에서는 Concept drift의 통계량을 통해 정량적으로 precision 값을 추정하는 성능 예측 모델(PPM, Performance prediction model)을 제안한다. 제안 모델의 Algorithm 1에서는, 학습데이터에서 복원 추출한 샘플링 데이터에 인위적인 drift를 유도하고 이때의 precision을 측정하여 drift와 precision의 데이터 셋을 만들어 학습한다. Algorithm 2에서는 테스트 데이터를 통해 실제 precision과 예측 precision의 차이를 측정하여 성능 예측 모델의 오차를 보정 한다. 현실 비즈니스에서 사용될 수 있는 대출 심사 모델과 신용카드 오사용 탐지 모델에 PPM을 적용하여 성능 예측의 유효성을 확인했다.

균등거리 기준 조명 맵과 색 상관성을 이용한 조명 색도 추정 (Estimation of Illuminant Chromaticity by Equivalent Distance Reference Illumination Map and Color Correlation)

  • 김정엽
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.267-274
    • /
    • 2023
  • 본 논문에서는 입력 영상에 대한 촬영 장면의 조명 색도를 추정하는 방법을 제안한다. 조명 기준영역을 이용하여 입력영상의 촬영 장면에 가장 근접한 조명 색도를 추정한다. 기존의 방법은 일정한 수의 기준조명 정보를 이용한다. 입력 영상으로부터 화소의 색도분포 정보와 기준 조명에 대한 미리 준비된 색도 집합을 대조하여 겹치는 면적이 가장 큰 기준 조명을 해당 입력 영상에 대한 장면 조명으로 간주한다. 겹치는 면적을 계산하는 과정에서 각 기준 조명에 대한 가중치를 가우시안 분포 형태로 적용하였으나, 분산 값에 대하여 명확한 기준을 제시하지 못하였다. 제안한 방법은 주어진 기준조명으로부터 독립적인 기준색도 영역을 추출하고, 입력영상의 모든 화소에 대하여 RGB 칼라좌표계의 r-g 색도 평면에서의 특징치를 계산한 다음, 독립적인 색도영역과 입력영상으로부터의 특징치를 이용하여 유사도를 평가한다. 유사도가 가장 높게 나타나는 조명을 해당 영상의 조명 색도 성분으로 추정하였다. 데이터베이스의 영상과 기준조명 색도를 이용한 성능평가에서 제안한 방법은 기존의 기본 방법에 비하여 평균 60% 정도의 개선을 보였고, 기존의 가우시안 분산 값이 0.1인 경우에 비하여 53% 내외의 개선 성능을 보였다.

검색어 빈도 데이터를 반영한 코로나 19 확진자수 예측 딥러닝 모델 (Predicting the Number of Confirmed COVID-19 Cases Using Deep Learning Models with Search Term Frequency Data)

  • 정성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.387-398
    • /
    • 2023
  • 코로나 19 유행은 인류 생활 방식과 패턴에 큰 영향을 주었다. 코로나 19는 침 방울(비말)은 물론 공기를 통해서도 감염되기 때문에 가능한 대면 접촉을 피하고 많은 사람이 가까이 모이는 장소는 피할 것을 권고하고 있다. 코로나 19 환자와 접촉했거나 코로나 19 환자가 발생한 장소에 있었던 사람이 코로나 19에 감염되었을 것을 염려한다면 구글에서 코로나 19 증상을 찾아볼 것이라고 충분히 예상해 볼 수 있다. 본 연구에서는 과거 독감 감시와 관리에 중요 역할을 했었던 구글 트렌드(Google Trends)를 다시 소환하고 코로나 19 확진자수 데이터와 결합하여 미래의 코로나 19 확진자수를 예측할 수 있을지 딥러닝 모델(DNN & LSTM)을 사용한 탐색적 데이터 분석을 실시하였다. 특히 이 연구에 사용된 검색어 빈도 데이터는 공개적으로 사용할 수 있으며 사생활 침해의 우려도 없다. 심층 신경망 모델(DNN model)이 적용되었을 때 한국에서 가장 많은 인구가 사는 서울(960만 명)과 두 번째로 인구가 많은 부산(340만 명)에서는 검색어 빈도 데이터를 포함하여 예측했을 때 더 낮은 오류율을 기록했다. 이와 같은 분석 결과는 검색어 빈도 데이터가 일정 규모 이상의 인구수를 가진 도시에서 중요한 역할을 할 수 있다는 것을 보여주는 것이다. 우리는 이와 같은 예측이 더 강력한 예방 조치의 실행이나 해제 같은 정책을 결정하는데 근거 자료로 충분히 사용될 수 있을 것으로 믿는다.

멀티모달 맥락정보 융합에 기초한 다중 물체 목표 시각적 탐색 이동 (Multi-Object Goal Visual Navigation Based on Multimodal Context Fusion)

  • 최정현;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.407-418
    • /
    • 2023
  • MultiOn(Multi-Object Goal Visual Navigation)은 에이전트가 미지의 실내 환경 내 임의의 위치에 놓인 다수의 목표 물체들을 미리 정해준 일정한 순서에 따라 찾아가야 하는 매우 어려운 시각적 탐색 이동 작업이다. MultiOn 작업을 위한 기존의 모델들은 행동 선택을 위해 시각적 외관 지도나 목표 지도와 같은 단일 맥락 지도만을 이용할 뿐, 다양한 멀티모달 맥락정보에 관한 종합적인 관점을 활용할 수 없다는 한계성을 가지고 있다. 이와 같은 한계성을 극복하기 위해, 본 논문에서는 MultiOn 작업을 위한 새로운 심층 신경망 기반의 에이전트 모델인 MCFMO(Multimodal Context Fusion for MultiOn tasks)를 제안한다. 제안 모델에서는 입력 영상의 시각적 외관 특징외에 환경 물체의 의미적 특징, 목표 물체 특징도 함께 포함한 멀티모달 맥락 지도를 행동 선택에 이용한다. 또한, 제안 모델은 점-단위 합성곱 신경망 모듈을 이용하여 3가지 서로 이질적인 맥락 특징들을 효과적으로 융합한다. 이 밖에도 제안 모델은 효율적인 이동 정책 학습을 유도하기 위해, 목표 물체의 관측 여부와 방향, 그리고 거리를 예측하는 보조 작업 학습 모듈을 추가로 채용한다. 본 논문에서는 Habitat-Matterport3D 시뮬레이션 환경과 장면 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 모델의 우수성을 확인하였다.