• 제목/요약/키워드: data analytics

검색결과 555건 처리시간 0.028초

케이프선 시장 운임의 결정요인 및 운임예측 모형 분석 (An Analysis on Determinants of the Capesize Freight Rate and Forecasting Models)

  • 임상섭;윤희성
    • 한국항해항만학회지
    • /
    • 제42권6호
    • /
    • pp.539-545
    • /
    • 2018
  • 운임시장의 심한 변동성과 시계열 데이터의 불안정성으로 해운시황 예측에 대한 연구가 큰 성과를 내지 못하고 있지만 최근 대표적인 비선형 모델인 기계학습모델을 적용한 연구들이 활발히 진행되고 있다. 대부분의 기존 연구가 계량모델의 설계단계에서 입력변수에 해당하는 요인들을 기존 문헌연구와 연구자의 직관에 의존하여 선정했기 때문에 요인선정에 대한 체계적인 연구가 필요하다. 본 연구에서는 케이프선 운임을 대상으로 단계적 회귀모형과 랜덤포레스트모델을 이용하여 중요 영향요인을 분석하였다. 해운시장에서 비교적 단순한 수급구조를 가져 요인파악이 용이한 케이프선 운임을 대상으로 하였으며 총 16개의 수급요인들을 사전 추출하였다. 요인간의 상호관련성을 파악하여 단계적 회귀는 8개 요인, 랜덤포레스트는 10개 요인을 분석대상으로 선정하였으며 선정된 변수를 입력변수로 하여 예측한 결과를 비교하였다. 랜덤포레스트의 예측성능이 아주 우수하였는데 수요요인이 주로 선정된 단계적 회귀분석과는 달리 공급요인이 비중 있게 선정되었기 때문인 것으로 판단된다. 본 연구는 운임예측 연구에 있어 운임결정요인에 대한 과학적인 근거를 마련하였으며 이를 위해 기계학습 기반의 모델을 활용하였다는데 연구적 의의가 있다. 또한 시장정보의 분석에 있어 실무자들이 어떤 변수에 중점을 두어야 하는지에 대해 합리적 근거를 제시한 측면에서 해운기업의 의사결정에 실질적 도움이 될 것으로 기대된다.

온라인 소프트웨어 교육에서 학습자의 자기조절학습 관련 특성에 기반한 온라인 학습 유형 분석: 계층적 군집 분석 기법을 활용하여 (Investigating Online Learning Types Based on self-regulated learning in Online Software Education: Applying Hierarchical Cluster Analysis)

  • 한정윤;이성혜
    • 컴퓨터교육학회논문지
    • /
    • 제22권5호
    • /
    • pp.51-65
    • /
    • 2019
  • 본 연구에서는 온라인 소프트웨어 교육 환경에서 학습자의 자기조절학습특성에 따른 온라인 학습 유형을 파악하고 각 유형의 특징을 살펴봄으로써 보다 전략적인 온라인 소프트웨어 교육을 위한 시사점을 제공하고자 하였다. 이를 위해 K대학의 온라인 소프트웨어 교육과정에 참여하고 있는 K-12 학생 809명의 온라인 학습 로그 데이터로부터 자기조절학습 특성 변인을 추출한 후, 계층적 군집 분석 기법(hierarchical cluster analysis)을 활용하여 자기조절학습 특성에 따른 학습자 군집 도출 및 군집 유형에 따른 온라인 학습 특성과 학습 결과의 차이를 비교 분석하였다. 그 결과, 온라인 소프트웨어 교육 학습자들의 자기조절학습 유형은 '고수준 자기조절학습형(군집 1)', '중수준 자기조절학습형(군집 2)', 그리고 '저수준 자기조절학습형(군집 3)'으로 나타났다. 온라인 자기조절학습 유형에 따른 학업성취도 수준은 '고수준 자기조절학습형(군집 1)'이 가장 높고, '저수준 자기조절학습형(군집 3)'이 가장 낮은 것으로 확인되었다. 이러한 결과를 바탕으로 효과적인 온라인 소프트웨어 교육 운영을 위한 시사점을 제시하였다.

텍스트마이닝을 활용한 대학생들의 외계행성 개념 변화 연구 (A Study on the Conceptual Changes of Extra-solar Planet in University Students Using Text-Mining Techniques)

  • 한신;김용기;김형범
    • 대한지구과학교육학회지
    • /
    • 제13권3호
    • /
    • pp.305-316
    • /
    • 2020
  • 이 연구에서는 대학생들이 인식하고 있는 외계행성에 대한 개념을 빅데이터 분석을 하기 위해 외계행성 교육 프로그램과 교육을 받기 전, 후의 개념 변화를 알아보기 위한 질문지를 개발하여 적용하였다. 이를 통한 연구 결과는 다음과 같다. 첫째, 교육을 받기 전에는 외계행성을 단순히 '태양계 바깥(외계)의 행성' 정도의 맥락으로만 이해하고 있었으나, 교육을 받은 후에 중요 키워드 중심으로 '태양계 바깥 항성 주위를 공전하는 행성' 개념으로 확장되었다. 둘째, 대학생들은 매스컴에서 접했던 간접 경험을 토대로 도플러효과, 식현상, 중력렌즈를 활용한 관측한다는 정도의 간단한 답변을 하여 관측 방법에 대한 개념이 매우 부족하였다. 그러나 학생들은 외계행성 탐사와 관련된 내용을 교육 받으면서 외계행성 탐사에 대한 인식이 구체화되었다. 셋째, 대학생들은 외계행성 탐사의 중요성을 단순히 외계생명체의 발견을 넘어서서 태양계를 비롯한 행성의 생성과정과 연구 방법, 인류의 발전으로 확장시키고 있었다. 넷째, 대학생들은 외계행성과 관련된 내용을 지구과학 교육과정에서 소개한다면 과학지식 뿐만 아니라 흥미와 호기심을 일으킬 수 있으므로, 교육과정에서 외계행성에 대한 교육이 필요하다고 인식하였다.

반려동물용 자동 사료급식기의 비용효율적 사료 중량 예측을 위한 딥러닝 방법 (A Deep Learning Method for Cost-Effective Feed Weight Prediction of Automatic Feeder for Companion Animals)

  • 김회정;전예진;이승현;권오병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.263-278
    • /
    • 2022
  • 최근 IoT 기술의 발달로 외출 중에도 반려동물에 급여하도록 자동 사료급식기가 유통되고 있다. 그러나 자동급식에서 중요한 중량을 측정하는 저울 방식은 쉽게 고장이 나고, 3D카메라 방식은 비용이 든다는 단점이 있으며, 2D카메라 방식은 중량 측정의 정확도가 떨어진다. 특히 사료가 복합된 경우 중량 측정 문제는 더욱 어려워질 수 있다. 따라서 본 연구의 목적은 2D카메라를 사용하면서도 중량을 정확하게 추정할 수 있는 딥러닝 접근법을 제안하는 것이다. 이를 위해 다양한 합성곱 신경망을 이용하였으며, 그중 ResNet101 기반 모델이 3.06 gram의 평균 절대 오차와 3.40%의 평균 절대비 오차를 기록하며 가장 우수한 성능을 보였다. 본 연구의 결과로 사료와 같이 규격화된 물체의 중량을 확보가 용이한 2D 이미지를 통해서만 예측할 필요가 있을 경우 유용한 정보로 활용될 수 있다.

부도예측모형에서 도메인 지식을 통합한 반사실적 예시 기반 설명력 증진 방법 (Domain Knowledge Incorporated Counterfactual Example-Based Explanation for Bankruptcy Prediction Model)

  • 조수현;신경식
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.307-332
    • /
    • 2022
  • 부도예측모형은 여러 금융기관의 신용평가모형의 지식기반(knowledge base)로 이용되고 있으며 최근 머신러닝 기법의 발전으로 이를 도입하여 고도화하려는 다양한 시도가 진행 중이다. 그러나 실제 이러한 모형이 도입되기 위해서는 모형을 이용하는 사용자와 설명제공 대상인 고객의 이해와 수용이 전제되어야 한다. 그러나 사용자에게 제공되는 설명이 현실적 타당성(feasibility)이 결여되어 있다면 모형의 신뢰성과 수용도에 부정적인 영향을 미친다. 이에 따라 본 연구는 도메인 지식을 설명 생성 알고리즘에 통합하여 현실적으로 타당한 설명을 사용자에게 제공하고자 한다. 본 연구에서는 머신러닝 기반의 부도예측 모형에 설명력을 더하는 방법으로 반사실적 예시(counterfactual example) 기반의 로컬영역에서의 설명을 제공하는 모델을 제안한다. 제안 모델은 모형에 이용된 재무변수의 특성을 설명력 생성 알고리즘에 통합하여 설명의 현실적 가능성을 확보하고 이를 통해 사용자의 이해와 수용을 도모하고자 한다. 또한 본 연구에서는 반사실적 예시기반 설명을 위해 유전알고리즘(GA)를 이용하며 다목적함수를 목적함수로 설정하여 반사실적 예시의 주요 기준이 되는 항목을 반영하고 있다. 본 연구는 대표적인 머신러닝 기법인 인공신경망을 이용해 부도예측모형을 학습시킨 뒤, 사후적 방법(post-hoc)으로 설명을 위한 알고리즘을 도입하여 기존의 모형 설명 알고리즘인 LIME과 현실적 가능성이 결여된 반사실적 예시 기반 알고리즘과 비교하였다. 더 나아가 제안방법의 금융/회계 분야의 종사자를 대상으로 서베이를 진행하여 제안 방법의 설명의 질을 정성적으로 평가하였다.

디지털 트랜스포메이션 기반 학습모델 연구 (A Study on the Learning Model Based on Digital Transformation)

  • 이진구;이재영;정일찬;김미화
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.765-777
    • /
    • 2022
  • 본 연구의 목적은 급격히 변화하는 환경 속에서 대학이 경쟁력을 가지기 위해 학습 디지털 트랜스포메이션과 관련된 이론 및 사례를 기반으로 대학에서 활용 가능한 디지털 트랜스포메이션 기반 학습모델을 제시하는 것이다. 이를 위해 기초적인 문헌연구와 사례연구, 전문가 초점집단면접(Focus Group Interview)이 진행되었으며 위 연구방법들을 통해 도출된 학습모델 관련 시사점은 다음과 같다. 국내외에서 관련 분야에 두각을 나타내는 대학들은 빅 데이터를 기반으로 학습분석을 대시보드 구현, 예측 모델 개발, 적응형 학습 지원 등에 활발하게 사용하고 있으며, 첨단 에듀테크를 수업에 적극적으로 도입하여 성과를 내고 있다. 또한 국내 대학이 당면한 현실적인 문제와 애로사항 및 현재 K대학이 당면한 디지털 트랜스포메이션 구현 관련 문제점과 기대 사항들도 확인되었다. 이 시사점들을 바탕으로 본 연구는 K대학의 디지털 트랜스포메이션 기반 학습모델을 개발하였다. 이 모델은 진단, 추천, 학습, 성공의 4개 차원으로 구성되어 있으며 학생이 이 모델을 통해 개인의 성공에 필요한 다양한 학습 과정을 진단 및 추천받아 학습을 진행하고, 학습 성과를 체계적으로 관리해 성공할 수 있도록 한다. 마지막으로 연구결과에 대한 학문적 그리고 실무적 시사점이 논의되었다.

CPS 및 DT 연계를 위한 토양-지하수 관측기술 소개 (Introduction to Soil-grondwater monitoring technology for CPS (Cyber Physical System) and DT (Digital Twin) connection)

  • 김병우;최두형
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.14-14
    • /
    • 2023
  • 산업발전에 따른 인구증가, 기후위기에 따른 가뭄 및 물 부족심화, 그리고 수질오염 등은 2015년 제79차 UN총회의 물 안보측면에서 국제사회의 물 분야 위기관리를 위해 2030년을 지속가능한 발전 목표(Sustainable Development Goals)로 하였다. 또한, 현재 물 산업은 빠르게 성장하고 있으며, 2016년 세계경제포럼(World Economic Forum) 의장 클라우스 슈밥(Klaus Schwab)부터 주창된 제4차 산업혁명로 인해 현재 물 산업의 패러다임 또한 급속히 변화하고 있다. 이는 컴퓨터를 기반으로 하는 CPS(Cyber Physical System) 및 DT(Digital Twin) 연계 분석방식의 혁신을 일컫는다. 2002년경에 DT의 기본개념이 제시되었고, 2006년경에는 Embedded System에서의 DT와 같은 개념으로 CPS의 용어가 등장했다. DT는 현실세계에 존재하는 사물, 시스템, 환경 등을 S/W시스템의 가상공간에 동일하게 모사(Virtualization) 및 모의(Simulation)할 수 있도록 하고, 모의결과를 가상시스템으로 현실세계를 최적화 체계 구현 기술을 말한다. DT의 6가지 기능은 ① 실제 데이터(Live Data), ② 모사, ③ 분석정보(Analytics), ④ 모의, ⑤ 예측(Predictions), ⑥ 자동화(Automation) 이다. 또한, CPS는 대규모 센서 및 액추에이터(Actuator)를 가지는 물리적 요소와 이를 실시간으로 제어하는 컴퓨팅 요소가 결합된 복합시스템을 말한다. CPS는 물리세계에서 발생하는 변화를 감지할 수 있는 다양한 센서를 통해 환경인지 기능을 수행한다. 센서로부터 수집된 정보와 물리세계를 재현 및 투영하는 고도화된 시스템 모델들을 기반으로 사이버 물리공간을 인지·분석·예측할 수 있다. CPS의 6가지 구성요소는 ① 상호 운용성(Interoperability), ② 가상화(Virtualization), ③ 분산화(Decentralization), ④ 실시간(Real-time Capability), ⑤ 서비스 오리엔테이션(Service Orientation), ⑥ 모듈화(Modularity)이다. DT와 CPS는 본질적으로 같은 목적, 내용, 그리고 결과를 만들어내고자 하는 같은 종류의 기술이라고 할 수 있다. CPS 및 DT는 물리세계에서 발생하는 변화를 감지할 수 있으며, 토양-지하수 센서를 포함한 관측기술을 통해 환경인지 기능을 수행한다. 지하수 관측기술로부터 수집된 정보와 물리세계를 재현 및 투영하는 고도화된 시스템 모델들을 기반으로 사이버 물리공간 및 디지털 트윈 공간을 인지·분석·예측할 수 있다. CPS 및 DT의 기본 요소들을 실현시키는 것은 양질의 데이터를 모니터링할 수 있는 정확하고 정밀한 1차원 연직 프로파일링 관측기술이며, 이를 토대로 한 수자원 관련 빅데이터의 증가, 빅데이터의 저장과 분석을 가능하게 하는 플랫폼의 개발이다. 본 연구는 CPS 및 DT 기반 토양수분-지하수 관측기술을 이용한 지표수-지하수 연계, 지하수 순환 및 관리, 정수 운영 및 진단프로그램 개발을 위한 토양수분-지하수 관측장치를 지하수 플랫폼 동시성과 디지털 트윈 시뮬레이터 시스템 개발 방향으로 제시하고자 한다.

  • PDF

Digital Groundwater의 기술 소개 (Introduction to the Technology of Digital Groundwater)

  • 김현식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.10-10
    • /
    • 2023
  • 본질적으로 복잡하고 다양한 특성을 가지는 우리나라(도시, 농어촌, 도서산간, 섬 등)의 물 공급 시스템은 생활수준의 향상, 기후변화 및 가뭄위기, 소비환경 중심의 요구와 한정된 수자원을 잘 활용하기 위한 운영 및 관리가 매우 복잡하다. 이로 인한 수자원 고갈과 가뭄위기 등에 관련한 대책 및 방안으로 대체수자원인 지하수 활용방안들이 제시되고 있다. 따라서, 물 관리 시스템과 관련한 디지털 기술은 오늘날 플랫폼과 디지털 트윈의 도입을 통해 네트워크와 가상현실 세계의 연결이 통합되어진 4차 산업혁명 사업이 현실화되고 있다. 물 관리 시스템에 사용된 새로운 디지털 기술 "BDA(Big Data Analytics), CPS(Cyber Physical System), IoT(Internet of Things), CC(Cloud Computing), AI(Artificial Intelligence)" 등의 성장이 증가함에 따라 가뭄대응 위기와 도시 지하수 물 순환 시스템 운영이 증가하는 소비자 중심의 수요를 충족시키기 위해서는 지속가능한 지하수 공급을 효과적으로 관리되어야 한다. 4차 산업혁명과 관련한 기술성장이 증가함으로 인한 물 부문은 시스템의 지속가능성을 향상시키기 위해 전체 디지털화 단계로 이동하고 있다. 이러한 디지털 전환의 핵심은 데이터에 관한 것이며, 이를 활용하여 가치 창출을 위해서 "Digital Groundwater Technology/Twin(DGT)"를 극대화하는 방식으로 제고해야 한다. 현재 당면하고 있는 기후위기에 따른 가뭄, 홍수, 녹조, 탁수, 대체수자원 등의 수자원 재해에 대한 다양한 대응 방안과 수자원 확보 기술이 논의되고 있다. 이에 따른 "물 순환 시스템"의 이해와 함께 문제해결 방안도출을 위하여 이번 "기획 세션"에서는 지하수 수량 및 수질, 정수, 모니터링, 모델링, 운영/관리 등의 수자원 데이터의 플랫폼 동시성 구축으로부터 역동적인 "DGT"을 통한 디지털 트윈화하여, 지표수-토양-지하수 분야의 특화된 연직 프로파일링 관측기술을 다각도로 모색하고자 한다. "Digital Groundwater(DG)"는 지하수의 물 순환, 수량 및 수질 관리, 지표수-지하수 순환 및 모니터링, 지하수 예측 모델링 통합연계를 위해 지하수 플랫폼 동시성, ChatGPT, CPS 및 DT 등의 복합 디지털화 단계로 나가고 있다. 복잡한 지하환경의 이해와 관리 및 보존을 위한 지하수 네트워크에서 수량과 수질 데이터를 수집하기 위한 스마트 지하수 관측기술 개발은 큰 도전이다. 스마트 지하수 관측기술은 BD분석, AI 및 클라우드 컴퓨팅 등의 디지털 기술에 필요한 획득된 데이터 분석에 사용되는 알고리즘의 복잡성과 데이터 품질에 따라 영향을 미칠 수 있기 때문이다. "DG"는 지하수의 정보화 및 네트워크 운영관리 자동화, 지능화 등을 위한 디지털 도구를 활용함으로써 지표수-토양층-지하수 네트워크 통합관리에 대한 비전을 만들 수 있다. 또한, DGT는 지하수 관측센서의 1차원 데이터 융합을 이용한 지하수 플랫폼 동시성과 디지털 트윈을 연계할 수 있다.

  • PDF

거대언어모델의 차별문제 비교 연구 (A Comparative Study on Discrimination Issues in Large Language Models)

  • 이위;황경화;최지애;권오병
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.125-144
    • /
    • 2023
  • 최근 ChatGPT 등 거대언어모델(Large Language Models)의 활용은 대화형상거래, 모바일금융 서비스 등 다양한 분야에서 사용이 증가하고 있다. 그러나 주로 기존 문서를 학습하여 만들어진 거대언어모델은 문서에 내재된 인간의 다양한 편향까지도 학습할 수 있다. 그럼에도 불구하고 거대언어모델에 편향과 차별의 양상에 대한 비교연구는 거의 이루어지지 않았다. 이에 본 연구의 목적은 거대언어모델안에 9가지 차별(Age, Disability status, Gender identity, Nationality, Physical appearance, Race ethnicity, Religion, Socio-economic status, Sexual orientation)의 존재유무 또는 그 정도를 점검하고 발전 방안을 제안하는 것이다. 이를 위해 차별 양상을 특정하기 위한 도구인 BBQ (Bias Benchmark for QA)를 활용하여 ChatGPT, GPT-3, Bing Chat 등 세가지 거대언어모델을 대상으로 비교하였다. 평가 결과 거대언어모델에 적지 않은 차별적 답변이 관찰되었으며, 그 양상은 거대언어모델에 따라 차이가 있었다. 특히 성차별, 인종차별, 경제적 불평등 등 전통적인 인공지능 윤리 이슈가 아닌 노인차별, 장애인차별에서 문제점이 노출되어, 인공지능 윤리의 새로운 관점을 찾을 수 있었다. 비교 결과를 기반으로 추후 거대언어모델의 보완 및 발전 방안에 대해 기술하였다.

촛불 집회와 태극기 집회를 둘러싼 정국 인식: 온라인 뉴스 댓글에 대한 빅데이터 분석 (The Political Recognition Surrounding Candlelight Rally and Taegeukgi Rally: A Big Data Analytics on Online News Comments)

  • 김찬우;정병기
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권6호
    • /
    • pp.875-885
    • /
    • 2018
  • 본 연구는 2016년 10월 24일부터 2017년 3월 19일까지 촛불 집회 기간 포털사이트 정치 섹션에 등록된 촛불 집회와 태극기 집회 관련 뉴스의 댓글을 대상으로 주요 이슈를 개체명 인식기를 이용해 분석하여 두 집회에 대한 정국 인식을 살펴보았다. 주요 분석 항목은 탄핵의 책임 소재, 정국 해결의 주체와 방법, 그 외 주요 이슈를 중심으로 분석하였다. 분석 결과, 촛불 집회 기사의 댓글에서는 탄핵지지와 정권 부역자의 법적 처벌에 대해 집중하고 있었으며, 탄핵 후 차기 대선을 통한 정국 해결을 주장했다. 태극기 집회 기사의 댓글에서는 정권 유지를 위한 탄핵 기각에 대해 집중하고 있었고, 헌법재판소의 탄핵 기각을 주장하였다. 이를 통해 볼 때, 촛불 집회나 태극기 집회의 각 입장을 지지했던 집단들 간의 갈등은 대선 이후 적어도 당분간(박근혜 재판 기간) 지속할 것으로 보인다. 이 갈등은 탄핵과 정권 교체 후 청산과 새 정치를 추구하는 입장과 박근혜 대통령 재판에 영향을 미치려는 입장의 대립으로 전개될 것이다. 따라서 이후 정국에서는 사회 통합을 위한 노력이 필요하다.