• 제목/요약/키워드: learning algorithms

검색결과 2,242건 처리시간 0.031초

온라인 판매촉진활동 분석을 통한 고객 리뷰평점 추천 및 예측에 관한 연구 : S사 Wearable 상품중심으로 (A Study on Customer Review Rating Recommendation and Prediction through Online Promotional Activity Analysis - Focusing on "S" Company Wearable Products -)

  • 신호철
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.118-129
    • /
    • 2022
  • 본 논문에서는 국내 온라인 기업의 Wearable 제품을 선정하고 판매 데이터를 수집해 다양한 분석과 매출 예측을 통해 판촉 활동의 전략 모델을 연구하는 데 목적이 있다. 데이터 분석을 위해 여러 가지의 알고리즘을 사용하여 분석할 것이며, 최상의 모형으로 결과를 선택할 것이다. 최상의 결과로 선택된 모형인 Gradient Boosting 모델은 지도학습을 통해 종속변수 예측에 있어서 판촉 유형, 가격, 판매 수량, 성별, 모델, 판매경로, 제품 성능, 판매 날짜, 지역 등 9개의 독립변수를 투입할 수 있게 된다. 본 연구에서는 판매촉진 유형별로 종속변수로 설정된 리뷰 값을 앙상블 분석 기법을 통해 더욱더 세부적으로 학습하고 분석 및 예측이 주목적이며, 판매촉진 활동을 통한 고객에게 할인 혜택을 주어질 경우와 주어지지 않을 경우에 리뷰 평점을 연구하는 데 목적이 있다. 분석 결과로 본다면 평가 결과는 AUC 95% 수준이며, F1도 93% 정도이다. 결국 판매촉진 활동 유형 중 가치 부가 혜택이 리뷰 수와 리뷰 평점에 영향을 준다고 것을 확인할 수 있었으며, 주요 변인들이 리뷰와 리뷰 평점의 영향을 준다는 것도 확인할 수 있었다.

부도예측모형에서 도메인 지식을 통합한 반사실적 예시 기반 설명력 증진 방법 (Domain Knowledge Incorporated Counterfactual Example-Based Explanation for Bankruptcy Prediction Model)

  • 조수현;신경식
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.307-332
    • /
    • 2022
  • 부도예측모형은 여러 금융기관의 신용평가모형의 지식기반(knowledge base)로 이용되고 있으며 최근 머신러닝 기법의 발전으로 이를 도입하여 고도화하려는 다양한 시도가 진행 중이다. 그러나 실제 이러한 모형이 도입되기 위해서는 모형을 이용하는 사용자와 설명제공 대상인 고객의 이해와 수용이 전제되어야 한다. 그러나 사용자에게 제공되는 설명이 현실적 타당성(feasibility)이 결여되어 있다면 모형의 신뢰성과 수용도에 부정적인 영향을 미친다. 이에 따라 본 연구는 도메인 지식을 설명 생성 알고리즘에 통합하여 현실적으로 타당한 설명을 사용자에게 제공하고자 한다. 본 연구에서는 머신러닝 기반의 부도예측 모형에 설명력을 더하는 방법으로 반사실적 예시(counterfactual example) 기반의 로컬영역에서의 설명을 제공하는 모델을 제안한다. 제안 모델은 모형에 이용된 재무변수의 특성을 설명력 생성 알고리즘에 통합하여 설명의 현실적 가능성을 확보하고 이를 통해 사용자의 이해와 수용을 도모하고자 한다. 또한 본 연구에서는 반사실적 예시기반 설명을 위해 유전알고리즘(GA)를 이용하며 다목적함수를 목적함수로 설정하여 반사실적 예시의 주요 기준이 되는 항목을 반영하고 있다. 본 연구는 대표적인 머신러닝 기법인 인공신경망을 이용해 부도예측모형을 학습시킨 뒤, 사후적 방법(post-hoc)으로 설명을 위한 알고리즘을 도입하여 기존의 모형 설명 알고리즘인 LIME과 현실적 가능성이 결여된 반사실적 예시 기반 알고리즘과 비교하였다. 더 나아가 제안방법의 금융/회계 분야의 종사자를 대상으로 서베이를 진행하여 제안 방법의 설명의 질을 정성적으로 평가하였다.

다중 카메라 네트워크 가상의 관심선(Line of Interest)을 활용한 건물 내 재실자 인원 계수 방법론 개발 (Developing an Occupants Count Methodology in Buildings Using Virtual Lines of Interest in a Multi-Camera Network)

  • 천휘경;박찬혁;지석호;노명일
    • 대한토목학회논문집
    • /
    • 제43권5호
    • /
    • pp.667-674
    • /
    • 2023
  • 건물에서 재난이 발생할경우, 건물 내 인원을 신속히 구조하여 사상자를 최소화하는 것은 단연 최우선순위가 된다. 이러한 구조활동을 위해서는 건물내 어디에 몇 명이 있는지를 알아야 하는데, 실시간으로 알기가 어렵다보니 주로 건물주나 경비원 등 관계자의 진술이나 층별 면적, 수용 인원과 같은 기초자료에 의존하는 실정이다. 따라서 빠르고 정확하게 재실인원 정보를 파악하여 현장에 대한 불확실성을 낮추고 골든타임내 효율적인 구조활동을 지원하는 것이 반드시 필요하다. 본 연구는 컴퓨터 비전 알고리즘을 활용하여 이미 건물에 설치되어 있는 여러대의 CCTV 가 촬영한 이미지 로부터 건물 위치별 재실인원을 계수하는 방법론을 제시한다. 계수 방법론은 (1)카메라별 관심선(LOI) 설정을 통한 다중카메라 네트워크 환경구축, (2)딥러닝을 활용한 모니터링 구역내 사람 탐지 및 추적, (3)다중 카메라 네트워크 환경을 고려한 인원 합산 세단계로 구성된다. 제안된 방법론은 5층 건물을 대상으로 세 개의 시간대 별로 수행된 현장 실험을 통해 검증되었다. 최종 결과는 89.9%의 정확도로 재실자를 인식하는 것으로 나타났으며, 층별, 구역별 합산결과도 93.1%, 93.3%의 정확도로 우수했다. 층별 평균MAE와 RMSE는 각각 0.178과 0.339이었다. 이 처럼 실시간으로 제공하는 건물내 재실자 정보는 초기 재난 대응단계에 신속하고 정확한 구조활동을 지원 할 수있다.

Apriori 알고리즘을 활용한 학습자의 성별과 학교급에 따른 온라인 수업 유형 선호도 분석 (An analysis of students' online class preference depending on the gender and levels of school using Apriori Algorithm)

  • 김진희;황두희;이상숙
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.33-39
    • /
    • 2022
  • 본 연구는 학습자 특성(성별 및 학교 급)에 따른 온라인 수업 유형 선호도를 파악하고자 하는데 그 목적이 있다. 이를 위하여 전국 17개 지역의 초·중·고등학교 학생 4,803명을 대상으로 설문조사를 실시하였다. 이후, 유효데이터인 4,524명 학생들의 성별 및 학교급을 기반한 온라인 수업 유형 선호도 패턴을 확인하기 위해 Apriori 알고리즘을 이용한 연관규칙 분석을 실시하였다. 연구결과 초등 7개, 중등 4개, 고등 5개 등 총 16개의 규칙을 도출하였으며, 학교급과 무관하게 여학생들은 메이커활동 중심 수업을, 초·중 남학생은 가상체험중심 수업을 공통적으로 선호하였다. 보다 구체적으로, 초등학교 남학생은 SW중심수업을, 여학생은 메이커활동 중심 수업을 선호하였으며, 중학생의 경우 남여 모두 가상체험중심 수업을 선호하였다. 반면 고등학생은 교과별 강의중심에 대한 선호도가 높았다. 이러한 연구결과는 학습의 주체자인 학생이 가진 온라인 수업의 요구를 설명하는 실증적 근거로서 제시될 수 있다. 또한, 본 연구는 향후 온라인 수업의 다각화를 위한 개선방향을 제시, 탐색하는 기초자료로 활용될 수 있을 것으로 기대한다. 이상의 연구결과를 바탕으로 추후 연구에서는 다양한 온라인 수업 활동 및 모델 설계, 온라인 수업을 지원하는 플랫폼 개발, 여학생의 이공계 진로동기 형성과정에 대한 심층적 분석이 계속되어야 할 것이다.

포장층 이상구간에서 획득한 열화상 이미지 해석을 위한 CNN 알고리즘의 적용성 평가 (Assessment of Applicability of CNN Algorithm for Interpretation of Thermal Images Acquired in Superficial Defect Inspection Zones)

  • 장병수;김영석;김세원;최현준;윤형구
    • 한국지반공학회논문집
    • /
    • 제39권10호
    • /
    • pp.41-48
    • /
    • 2023
  • 도로 하부에 발생된 이상구간은 사용자의 안전을 위협하고 보수하기 위해서도 많은 사회적 비용이 동반된다. 본 연구에서는 적외선 카메라를 사용하여 이상구간 매질에 따른 온도 분포를 실험적으로 평가하고 이를 머신러닝 기법으로 분석하고자 하였다. 대상 현장은 가로와 세로 및 깊이가 모두 50cm인 정육면체 형태로 설정하였고, 이상구간은 물과 공기로 결정하였다. 실험부지의 상부는 포장층을 모사하기 위해 콘크리트 블록을 설치하였으며, 오후 4시부터 다음날 오후 3시까지 총 23시간 동안 포장층의 온도 분포를 측정하였다. 측정된 값은 이미지 형태로 도출되었으며, 이미지 중간부분에서 측정 온도의 수치를 추출하였다. 최대온도와 최저온도의 차이는 물, 공기, 그리고 원 지반에서 각각 34.8℃, 34.2℃ 그리고 28.6℃로 나타났으며, 이미지 분석 기법인 convolution neural network(CNN) 방법을 활용하여 각 측정 이미지에 해당하는 조건을 분류하였다. 분류를 수행하기 위해서는 res net 101과 squeeze net 네트워크가 이용되었다. res net 101의 분류 정확도는 물, 공기 그리고 원 지반에서 각각 70%, 50% 그리고 80%로 나타났고, squeeze net의 분류 정확도는 60%, 30% 그리고 70%로 나타났다. 해당 연구 결과는 수치데이터로 특징 판단이 어려울 경우 이미지 기반의 CNN 알고리즘을 활용하면 매질 특성 분석이 가능하고 지반내 상태도 예측할 수 있는 방법론을 보여준다.

A Study on the Intelligent Online Judging System Using User-Based Collaborative Filtering

  • Hyun Woo Kim;Hye Jin Yun;Kwihoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.273-285
    • /
    • 2024
  • 교육 분야에서 온라인 저지 시스템이 활발하게 활용됨에 따라 학습자 데이터를 활용하는 다양한 연구가 진행되고 있다. 본 연구에서는 학습자 데이터를 활용하여 학습자의 문제 선택을 지원할 수 있는 사용자 기반 협업 필터링 방식의 문제추천 기능을 제안한다. 온라인 저지 시스템에서 학습자의 문제 선택을 위한 지원은 그들의 향후 학습에 영향을 미치므로 교육의 효과성 제고를 위해 필요하다. 이를 위해 학습자의 문제풀이 성향과 유사한 학습자를 식별하고 그들의 문제풀이 이력을 활용한다. 제안 기능은 충북교육연구정보원에서 운영하는 알고리즘과 프로그래밍 관련 온라인 저지 사이트에 구현됐고, 서비스 유용성과 사용 편이성 측면에서 델파이 기법을 통한 전문가 검토를 수행했다. 또한 사이트 사용자 대상 시범 운영에서 바른코드 제출 비율을 분석한 결과 추천문제에 대해 제출한 경우가 전체 제출에 비해 16% 정도 높았고, 추천문제 사용자 대상 설문조사에서 '도움 된다' 응답은 78%였다. 시범 운영에서는 추천문제 선택과 사용자 피드백 관련 설문 응답 비율이 낮았으므로, 향후 연구과제로 제안 기능의 접근성 향상, 사용자 피드백 수집 및 학습자 데이터 분석 다각화 등을 제시했다.

UAV와 LiDAR를 활용한 토석채취지의 시계열 변화 분석 (Time-series Change Analysis of Quarry using UAV and Aerial LiDAR)

  • 박동환;심우담
    • 한국지리정보학회지
    • /
    • 제27권2호
    • /
    • pp.34-44
    • /
    • 2024
  • 최근 기후변화로 인한 이상기후로 인해 홍수, 산사태, 토사 유출과 같은 자연재난의 피해가 급증하고 있다. 우리나라는 국토의 63% 이상이 산지라는 지형적 특성 때문에 사면 재해에 취약하며, 특히, 토석채취지는 소단형성 과정에서 흙과 암석을 채굴하기 때문에 산사태가 발생할 확률이 높으며, 사업장 내부 뿐만 아니라, 외부까지 재해발생 위험이 높은 지역이다. 이에 따라, 본 연구는 토석채취지의 모니터링을 위해 UAV와 항공LiDAR를 활용하여 DEM을 구축하고 시계열 변화 분석을 수행하였으며, 토석채취지 모니터링을 위한 최적의 DEM 구축방법을 제안하였다. DEM 구축을 위해 UAV와 LiDAR 기반 Point Cloud 구축하고 Aggressive Classification(AC), Conservative Classification(CC), Standard Classification(SC) 등 세가지 알고리즘을 활용하여 지면부를 추출하였다. 알고리즘에 따라 구축한 UAV 및 LiDAR기반 DEM은 수치지형도 기반 DEM과의 비교를 통해 정확도를 평가하였다. 정확도 평가 결과, 알고리즘 방법간의 높이 차는 최대 1 m 내외로 차이가 거의 없었다. 또한, 음영기복도를 활용한 지면부의 질감을 시각적 비교해보았을 때 CC 알고리즘의 성능이 가장 우수하였으며, 산림지역에서 LiDAR 기반 DEM이 높은 정확도를 보였다. 구축한 최적의 DEM을 통해 토석채취지의 시계열 변화량을 비교한 결과, 토석채취지역, 소단 형성지역 등 시계열 변화에 따른 토석채취지의 변화지역 탐지가 가능하였다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

다시기 Landsat TM 영상과 기계학습을 이용한 토지피복변화에 따른 산림탄소저장량 변화 분석 (Change Analysis of Aboveground Forest Carbon Stocks According to the Land Cover Change Using Multi-Temporal Landsat TM Images and Machine Learning Algorithms)

  • 이정희;임정호;김경민;허준
    • 한국지리정보학회지
    • /
    • 제18권4호
    • /
    • pp.81-99
    • /
    • 2015
  • 가속되는 지구온난화로 인해 한반도 주변의 탄소순환에 대한 명확한 이해의 필요성이 제기되고 있다. 산림은 이산화탄소의 주요 흡수원으로 지상 탄소량의 대부분을 저장하고 있어 이에 대한 추정이 필요하다. 우리나라에서는 국가산림자원조사의 표본점에서 측정되는 헥타르당 임목축적량을 활용하여 산림 탄소저장량을 추정한다. 하지만 탄소저장량은 요약된 수치 형태로 발표하고 있어 탄소저장량의 공간적 분포를 파악하는 것이 어렵다. 본 연구에서는 토지피복변화가 빠르고 국가산림자원조사 표본점 배치가 부족한 도시지역을 대상으로 UNFCCC의 Approach 3와 Tier 3를 충족하는 격자 기반 산림탄소저장량을 추정하였다. 토지피복변화 및 산림탄소저장량은 1991, 1992, 2010, 2011년에 취득된 Landsat 5 TM 영상과 고해상도 항공사진, 제 3차 및 제 5, 6차 국가산림자원조사 자료를 이용하여 추정하였다. 토지피복변화는 기계학습을 이용하여 변화된 토지피복과 변화되지 않은 토지피복 항목을 한 번에 분류하여 추정하였으며, 산림탄소저장량은 반사도, 밴드비율, 식생지수, 지형변수를 입력변수로 하여 기계학습을 통해 추정하였다. 연구 결과, 산림이 그대로 산림으로 유지되는 지역의 경우 33.23tonC/ha의 흡수를 하였으며 비산림이 산림으로 변한 지역의 경우 이보다 큰 36.83tonC/ha의 흡수가 진행된 것으로 추정되었다. 산림이 비산림으로 바뀐 경우에는 -7.35tonC/ha로, 배출이 일어난 것으로 추정되었다. 본 연구를 통하여 토지피복변화에 따른 산림탄소저장량 변화를 정량적으로 이해할 수 있었으며, 향후 효율적인 산림관리에 기여할 수 있을 것으로 판단된다.