• 제목/요약/키워드: 성능한계

검색결과 2,595건 처리시간 0.032초

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.

심층신경망과 천리안위성 2A호를 활용한 지상기온 추정에 관한 연구 (Estimation for Ground Air Temperature Using GEO-KOMPSAT-2A and Deep Neural Network)

  • 엄태윤;김광년;조용한;송근용;이윤정;이윤곤
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.207-221
    • /
    • 2023
  • 본 연구는 천리안위성 2A호의 Level 1B (L1B) 정보를 사용해 지상기온을 추정하기 위한 심층신경망(deep neural network, DNN) 기법을 적용하고 검증을 실시하였다. 지상기온은 지면으로부터 1.5 m 높이의 대기온도로 일상생활뿐만 아니라 폭염이나 한파와 같은 이슈에 밀접한 관련을 갖는다. 지상기온은 지표면 온도와 대기의 열 교환에 의해 결정되므로 위성으로부터 산출된 지표면 온도(land surface temperature, LST)를 이용한 지상기온 추정 연구가 활발하였다. 하지만 천리안위성 2A호 산출물 LST는 Level 2 정보로 구름영향이 없는 픽셀만 산출되는 한계가 있다. 따라서 본 연구에서는 Advanced Meteorological Imager 센서에서 측정된 원시데이터에 오직 복사와 위치보정을 마친 L1B 정보를 사용해 지상기온을 추정하기 위한 DNN 모델을 제시하고 그 성능을 가늠하기 위해 위성 LST와 지상관측 기온 사이의 선형회귀모델을 기준모델로 사용하였다. 연구기간은 2020년부터 2022년까지 3년으로 평가기간 2022년을 제외한 기간은 훈련기간으로 설정했다. 평가지표는 기상청의 종관기상관측소에서 정시에 관측된 기온정보로 평균 제곱근 오차를 사용하였다. 관측지점에서 추출된 픽셀 중 손실된 픽셀의 비율은 LST는 57.91%, L1B는 1.63%를 보였으며 LST의 비율이 낮은 이유는 구름의 영향 때문이다. 제안한 DNN의 구조는 16개 L1B 자료와 태양정보를 입력 받는 층과 은닉층 4개, 지상기온 1개를 출력하는 층으로 구성하였다. 연구결과 구름의 영향이 없는 경우 DNN 모델이 root mean square error (RMSE) 2.22℃로 기준모델의 RMSE 3.55℃ 보다 낮은 오차를 보였고, 흐린 조건을 포함한 총 RMSE는 3.34℃를 나타내면서 구름의 영향을 제거할 수 있을 것으로 보였다. 하지만 계절과 시간에 따른 분석결과 여름과 겨울철에 모델의 결정계수가 각각 0.51과 0.42로 매우 낮게 나타났고 일 변동의 분산이 0.11과 0.21로 나타났다. 가시채널을 고려해 태양 위치정보를 추가한 결과에서 결정계수가 0.67과 0.61로 개선되었고 시간에 따른 일 변동의 분산도 0.03과 0.1로 감소하면서 모든 계절과 시간대에 더 일반화된 모델을 생성할 수 있었다.

GOCI-II 기반 괭생이모자반 모니터링 시스템 성능 평가: 황해 및 동중국해 해역 오탐지 제거 결과를 중심으로 (Performance Evaluation of Monitoring System for Sargassum horneri Using GOCI-II: Focusing on the Results of Removing False Detection in the Yellow Sea and East China Sea)

  • 이한빛;김주은;김문선;김동수;민승환;김태호
    • 대한원격탐사학회지
    • /
    • 제39권6_2호
    • /
    • pp.1615-1633
    • /
    • 2023
  • 괭생이모자반은 황해 및 동중국해에서 대규모 번식하는 부유조류 중 하나로 우리나라 연안에 유입되어 환경 파괴 및 양식업 피해 등 다양한 문제점을 야기한다. 효율적인 피해 예방 및 연안 환경 보존을 위하여 최근 인공위성 기반 원격탐사 기술을 활용한 괭생이모자반 탐지 알고리즘 개발이 활발하게 이루어지고 있다. 하지만, 잘못된 탐지 정보는 해상 수거 선박의 이동 거리 증가, 지자체나 유관기관의 대응 혼선 등을 유발하므로 괭생이모자반 공간정보 생산 시 오탐지 최소화는 매우 중요하다. 본 연구는 국립해양조사원 국가해양위성센터의 GOCI-II 기반 괭생이모자반 탐지 알고리즘을 활용하여 자동으로 오탐지 화소를 제거하는 기술을 적용하였다. 주요 오탐지 발생 원인 분석 결과를 바탕으로 선형·산발적 오탐지 및 봄, 여름철에 중국 연안에서 대량으로 발생하는 녹조류를 오탐지로 간주하여 제거하는 과정을 포함하였다. 2022년 2월 24일부터 6월 25일까지 괭생이모자반 발생일을 대상으로 오탐지 자동 제거 기법을 적용하고, 중해상도 위성 영상을 이용하여 육안 판독 결과를 생성하고 정성적, 정량적 평가를 수행하였다. 선형 오탐지는 완전히 제거하였으며, 산발적 및 녹조 오탐지는 분포 파악에 영향을 주는 대부분의 오탐지 결과를 제거하였다. 자동 오탐지 제거 과정 이후에도 육안 판독 결과 대비 괭생이모자반의 분포 면적 확인이 가능하였으며, 이진분류모델을 이용하여 정확도와 정밀도는 각각 평균 97.73%, 95.4%로 산출하였다. 재현율은 매우 낮은 29.03%였는데, 이는 GOCI-II와 중해상도 위성영상의 관측 시간 불일치에 의한 괭생이모자반 이동 영향, 공간해상도 차이, 정사보정에 따른 위치 편차, 그리고 구름 마스킹 영향에 의한 것으로 추정하였다. 본 연구의 괭생이모자반 오탐지 제거 결과는 공간적인 분포 현황을 준실시간으로 파악할 수 있으나 생체량을 정확하게 추정하는 것은 한계가 존재하였다. 따라서, 지속적인 괭생이모자반 모니터링 시스템 고도화 연구를 통해 향후 괭생이모자반 대응계획수립을 위한 자료로 활용하고자 한다.

주요국 AI 창업기업 정책 분석을 통한 국내 시사점 연구 (A Study on the Implications of Korea Through the Policy Analysis of AI Start-up Companies in Major Countries)

  • 김동진;이성엽
    • 벤처창업연구
    • /
    • 제19권2호
    • /
    • pp.215-235
    • /
    • 2024
  • 인공지능(AI) 기술이 미래 국가 경쟁력을 좌우할 핵심 기술로 인식되면서 주요국의 AI 기술 및 산업 육성 정책 경쟁이 치열해지고 있다. 본 연구는 AI 산업 생태계의 근간인 AI 기업 창업에 대한 주요국의 정책을 분석하여 국내 정책 입안에 시사점을 제시하고자 한다. 조사 분석 대상국은 미국 스탠퍼드대학 HAI연구소에서 발표한 『2023 AI Index』의 신규 투자유치 기업 수 최상위 4개 국가와 EU로 선정하였고, 이들 국가와 국내 정책과 비교하여 전략적 함의를 제시하고자 한다. 미국은 2021년 '국가 AI 이니셔티브법(NAIIA)'을 제정했다. 동 법을 통해 AI 연구개발 분야에서 미국의 지속적인 리더십 보장, 공공 및 민간부문에서 신뢰할 수 있는 AI 시스템 개발, 사회 전반에 걸친 AI 시스템 생태계 구축 및 모든 연방기관에서 진행하는 AI 정책에 대한 DB 관리 및 접근성 강화를 추진하고 있다. 중국은 2021년 개최된 제14차 5개년(2021~2025년) 규획 및 2035년 장기 목표에서 7대 전략적 첨단기술 중 첫 번째로 AI를 명시하고 있으며, 2030년까지 글로벌 AI 1위 강국 도약을 목표로 다양한 정책을 전개하고 있다. 영국은 2021년 자금 지원 프로그램'Future Fund Breakthrough'을 통해 획기적인 연구개발 기업에 투자하고 있으며, 2022년 국가 AI 전략의 실행계획 등 AI 선도국 도약을 위한 국가 전략 마련으로 관련 투자를 확대하고 있다. 이스라엘은 혁신청을 중심으로 스타트업 기업에 대한 기술 투자를 지원하고 있는데, 혁신청은 향후 2년~15년 내 성과를 낼 투자와 신기술에 대한 규제 개혁을 주도하고 있다. EU는 중소기업의 AI 활용 지원을 위해 디지털 혁신 허브 네트워크를 강화하고 InvestEU(유럽전략투자기금)와 AI 투자기금을 조성하고 있다. 국내 도입을 검토할 주요국 정책은 국내 ICT 창업기업들로부터 정책 지원 수요가 높은 것으로 나타난 R&D 지원, 사업화 및 판로·마케팅·해외진출 지원 정책자금 지원 측면을 중심으로 도출하였다. 먼저 R&D 지원과 관련하여 미국의 '국가 AI R&D 전략 계획 2023'과 EU의 'AI 혁신 패키지' 검토를 제안한다. 특히 이들 정책은 국가가 관리하는 고성능슈퍼컴퓨터를 R&D에 활용할 수 있도록 하고 있어 AI 창업기업들이 R&D에 들이는 시간과 비용을 절감하는데 크게 도움을 준다. 다음으로 사업화 및 판로·마케팅·해외진출 지원에서는 미국 중소기업청(SBA)의 'SBIR과 STTR 지침' 중 '연방 및 주 기술(Federal And State Technology, FAST) 파트너십 프로그램'과 국방부와 공조하는 '상용화 준비(Commercialization Readiness Pilot. CRP) 프로그램'에 대한 벤치마킹을 제안한다. 이들 프로그램은 정부가 창업기업의 제품과 서비스 상용화를 지원하고 시장 출시 초기에 공공 부문이 적극적으로 구매하는 것을 골자로 한다. 이는 AI 창업기업의 혁신 제품과 서비스가 초기 시장에 안착하는 것은 물론 국내외 시장으로 진출하는 데 중요한 레퍼런스를 제공한다. 세 번째로 정책자금 지원에서는 영국기업은행(BBB)의 공동 투자 프로그램을 제안한다. 영국기업은행은 고성장 혁신기업 투자에 있어 외국계 국부 펀드의 참여도 적극적으로 유도하고 있고, 혁신 창업기업의 자금 조달 라운드에 개인들도 참여할 수 있는 Future Fund: Breakthrough 프로그램을 운영함으로써 AI 창업기업의 자금 마련을 지원하고 있다. 본 연구의 한계로는 제한된 수의 국가 분석, 비교 대상 국가들의 정책환경을 동일 조건 하에서 분석하지 못한 점 등을 들 수 있다.

  • PDF

Development of an Automated Algorithm for Analyzing Rainfall Thresholds Triggering Landslide Based on AWS and AMOS

  • Donghyeon Kim;Song Eu;Kwangyoun Lee;Sukhee Yoon;Jongseo Lee;Donggeun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권9호
    • /
    • pp.125-136
    • /
    • 2024
  • 산사태 예방을 위한 비구조물 대책 중 하나로, 산사태 예·경보 시스템의 임계 강우 기준을 마련하기 위한 강우 특성 분석 자동화 알고리즘을 제안한다. 알고리즘은 파이썬으로 작성했다. 강수 자료는 기상청과 산림청의 관측소 정보를 활용하였고, 산사태 정보는 2020~2023년까지의 데이터를 기반으로 행정안전부의 생활안전지도를 통해 수집했다. 알고리즘은 3단계이다. 첫째, 강수 자료를 입력받아 지점 정보 불일치와 결측값을 정제한다. 둘째, 산사태 위치와 가장 가까운 관측소를 찾아내고, 무강우 기간 및 반감기를 고려하여 강우 사상을 분류하고 분석한다. 셋째, 강우 특성에 대해 기초 통계를 수행한 후, 적절한 통계 모델을 선정·분석한다. 분석 결과, 강우강도-지속시간, 유효 강우량-지속 시간, 선행강우량-지속 시간, 최대강우량-지속 시간의 관계에 대해 멱법칙과 비선형 회귀분석을 실시하였으며, 평균 R2 값이 0.45로 나타났다. 분석된 임계 강우 기준은 강우강도 0.9~1.4mm/hr, 유효강우량 68.5~132.5mm, 선행강우량 81.6~151.1mm, 최대강우량 17.5~26.5mm로 분석되었다. 기준 검증을 위해 AUC-ROC 분석을 수행한 결과, AUC 값이 0.5로 낮게 나타났다. 마지막으로 알고리즘의 속도 성능을 평가한 결과 총 30분의 시간이 소요되었다. 즉, 강우 자료만으로 재해를 예측하는 데에는 한계가 있음을 시사한다. 단, 재해로 인한 인명과 재산 피해를 막기 위해서는 정량적이나 해석이 편리한 방법으로 기준 선정이 필요하다. 따라서 본 연구에서 개발한 알고리즘을 활용하여 산사태 발생 임계 강우 기준의 정량적 평가를 통해 인명 및 재산 피해를 저감하는 데 기여할 수 있을 것으로 기대한다.

특정토양오염관리대상시설의 최적 관리방안에 관한 연구 (Optimum Management Plan for Soil Contamination Facilities)

  • 박재수;김기호;김해금;최상일
    • 한국토양비료학회지
    • /
    • 제45권2호
    • /
    • pp.293-300
    • /
    • 2012
  • 본 연구에서는 국내 한 토양관련전문기관에서 실시한 석유류저장시설에 대한 법정누출검사와 자체정밀조사에서 실제 특정토양오염관리대상시설로부터 오염물질이 누출되는 기준으로는 25.7%, 저장탱크의 결함 등으로 부적합 경우를 포함하면 53.6%가 부적합으로 나타나 환경부의 누출검사 통계의 평균 부적합률 3.1%와는 현저한 차이가 있으며, 누출검사를 실시하는 동기와 점검방식 등에 따른 부적합률이 매우 다르게 나타났다. 또한, 제작 당시에 발생된 결함이 남아 누출의 잠재적 요인이 되고 있는 탱크가 약 20%에 이르고 있으며, 시설의 사용년수 경과에 따른 조사에서는 설치 후 10년 이하 시설의 부적합률이 상대적으로 높게 나타났다. 이와 같은 결과들을 토대로 도출한 특정토양오염관리대상시설에 대한 최적의 사후관리방안은 다음과 같다. 본 연구 결과를 토대로 한 법정누출검사의 이상적인 부적합률은 직접법의 경우 53.6%, 간접법의 경우 30.7%로서 현재의 부적합률과는 많은 차이가 있으며 이는 누출이 되더라도 이를 감지하는 확률이 떨어지는 간접법과, 누출이 없더라도 결함 등으로 부적합으로 판정되는 직접법 등 검사방식에서 비롯된 원천적 차이와, 검사자의 부정 또는 부실검사 등 운용상의 문제로부터 야기되는 결과로 판단되며, 이를 개선하기 위해서는 현재 누출의 감지율이 극히 낮은 가압법 등의 검사방식은 전문적인 실험을 통해 실제 누출을 감지할 수 있는 수준의 시험기준을 마련하는 한편, 토양관련전문기관 및 이에 소속된 검사자에 대한 교육과 검사결과에 대한 사후검증을 통해 부실 부정검사가 이루어지지 않도록 해야 한다. 설치경과년수 10년 이하의 시설이 업소단위의 부적합률, 저장탱크 및 배관계통의 시설단위 부적합률에서 공히 상대적으로 높은데 이는 부실 시공 등으로 인한 문제가 초기에 집중적으로 발생하는 결과로 보이며, 이와 같은 문제를 해소하기 위해서는 신규 시설에 대한 관리제도를 개선하는 한편, 특정토양오염관리대상시설을 설치한 후 10년이 경과하였을 때에는 6개월 이내 누출검사를 받도록 한 현재의 토양환경보전법 시행령 제8조제1항제2호의 규정은 설치 후 5년이 경과한 시점으로 변경하는 방안을 고려해야 한다. 시설을 설치한 후 10년 이상 경과하면 업소단위의 부적합률은 년평균 약 1.4%씩, 시설로부터 누출 발생률은 약 0.25% 씩 증가하고 있는데, 누출검사의 주기는 새로이 발생되는 누출로 인한 환경적 피해와 복구비용, 누출검사에 따른 직접적인 경제적 비용, 행정규제에 따른 국가차원의 득실을 고려하여 결정하는 것이 타당하나 누출검사와 정화에 따른 직접적인 비용만을 비교하여 결정하는 것도 하나의 방안이 될 수 있다. 예를들어, 누출검사 비용을 업소당 150만원, 오염된 업소의 토양정화비용을 1억원으로 하면 경제성 관점에서의 바람직한 점검주기는 약 6년이 된다. 그러나, 업소에 설치된 저장탱크와 배관계통의 품질은 거의 동등하여 하나의 탱크나 배관에서 문제가 발생되면 나머지 시설에서도 순차적으로 유사한 문제가 발생되고, 시설이 내구연한에 도래할수록 그 경향이 뚜렷해지므로, 일련의 시설계통에서 누출이 발생된 경우에는 검사주기를 점차 단축하여 적용하는 것을 고려할 필요가 있다. 본 연구에서 검사방식에 따른 점검결과를 보면, 업소단위의 부적합률에서는 58.9%와 22.5%, 저장탱크에 대한 검사에서 23.1%와 1.6%, 주입배관의 경우 4.1%와 0.5%, 주유 배관의 경우 5.5%와 4.1% 등 직접법으로 점검한 경우가 간접법에 비해 현저히 높아, 간접법으로만 점검을 지속하는 경우 그 차이만큼 누출을 방치하는 결과가 초래되는 것으로 나타났다. 이와 같은 문제를 해소하기 위해서는, 일정 주기마다 반드시 직접법으로 점검을 실시토록 하거나 직접법과 간접법을 교차하여 적용토록 개선할 필요가 있다. 비파괴검사에서 부적합 된 저장탱크를 결함의 유형별 분류한 결과 기공 또는 미용접 등 제작하는 과정에서 발생되는 선천적 결함으로 부적합 된 것이 약 20%에 이르고 있는데, 이는 시설의 노후화로 인한 두께미달과 국부부식 등의 후천적 결함에 의한 불합격률 보다 높은 것이다. 이와 같은 선천적 결함은 당해 저장탱크를 제작할 당시의 기술수준과 점검제도 등에서 기인한 것으로 이를 해소하기 위해서는 차기의 누출검사를 반드시 직접법으로 실시하여 원천적 결함을 보수하도록 하고, 현재의 위험물안전관리법에 의한 탱크 성능시험기준을 개정하여 새로이 설치되는 저장탱크는 모두 비파괴시험을 실시하여 제작과정에서 발생된 결함이 제거되도록 하여야 한다. 검사를 실시하게 된 동기를 자체정밀조사와 법정누출검사로 분류하여 평가한 결과, 자체정밀조사에서의 부적합률이 법정누출검사에서의 부적합률에 비해 현저히 높게 나타났는데, 검사결과 부적합 되는 경우 수반되는 2차적인 부담을 회피하려는 심리가 크게 작용하고 있는 것으로 판단된다. 즉, 법정누출검사에서 부적합 되는 경우 행정관서로부터 받게 되는 시설에 대한 보완 및 재검사, 토양정밀조사 및 오염토양 정화 등 일련의 조치를 회피하기 위하여 검사를 취소하거나 즉시 보수를 행하여 재검사를 받도록 함으로서 검사결과가 왜곡되고 있다. 이와 같은 문제를 해결하기 위해서는 법정누출검사 결과 부적합된 시설에 대한 시정명령을 시설 보완과 재검사로 한정하여 특정토양오염관리대상시설의 소유자가 사실적으로 점검할 수 있도록 하고, 시설로부터 저장물질의 누출에 의한 부지의 오염은 소유주가 상황을 고려하여 자발적으로 사후조치를 하게 하거나 차기토양오염도 검사를 통해 오염여부를 확인하도록 부담을 완화 할 필요가 있다. 특정토양오염관리대상시설은 설치시기가 오래된 것 일수록 높은 부적합률을 나타내고 있다. 철판의 부식속도를 시설의 설치경과년수에 따른 평균최소두께의 추이에서 확인된 $0.1mm\;yr^{-i}$을 적용할 경우, 6 mm의 철판을 사용한 탱크는 위험물안전관리법상 탱크의 최소두께 (3.2 mm)에 이르기까지 이론상 내구연한은 28년으로서, 2012년 기준 내구연한을 초과한 시설이 7.3%에 이르고 있으며, 동시기에 설치된 주유배관 (표준두께 3.7 mm)의 경우 이론상의 잔존두께는 0.9 mm에 불과하다는 결론이다. 이와 같이 한계수명에 다다른 시설이나 이론상 내구연한을 초과한 시설에 대하여는 조속히 국가적 차원의 조사를 통해 그 실태를 파악하고 그 결과에 따라 폐쇄 또는 Upgrade 방안을 강구해야 한다.

기술 성숙도 및 의존도의 네트워크 분석을 통한 유망 융합 기술 발굴 방법론 (Discovering Promising Convergence Technologies Using Network Analysis of Maturity and Dependency of Technology)

  • 최호창;곽기영;김남규
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.101-124
    • /
    • 2018
  • 최근 다양한 분야에서 새로운 기술이 출현하고 있으며, 이들 대부분은 기존 기술들의 융합(Convergence)을 통해 형성되고 있다. 또한 가까운 미래에 출현하게 될 유망한 융합 기술을 예측함으로써 변화하는 기술 지형에 선제적으로 대응하기 위한 수요가 꾸준히 증가하고 있으며, 이러한 수요에 부응하여 많은 기관과 연구자들은 미래 유망 융합 기술 예측을 위한 분석을 수행하고 있다. 하지만 이와 관련한 기존의 많은 연구들은 (i) 고정된 기술 분류 기준을 분석에 사용함으로써 기술 분야의 동적 변화를 반영하지 못했다는 점, (ii) 예측 모형 수립 과정에서 주로 범용성 네트워크 지표를 사용함으로써 기술의 융합이라는 목적에 부합하는 고유 특성을 활용하지 못했다는 점, 그리고 (iii) 유망 분야 예측 모형의 정확성 평가를 위한 객관적 방법을 제시하지 못했다는 점 등에서 한계를 갖고 있다. 이에 본 연구에서는 (i) 토픽 모델링을 통해 기존의 고정된 분류 기준이 아닌 실제 기술시장의 동적 변화에 따른 새로운 기술군을 도출하고, (ii) 기술 성숙도 및 기술군 간 의존 관계에 따라 각 기술군의 융합적 특성을 반영하는 잠재 성장 중심성(Potential Growth Centrality) 지표를 산출하였으며, (iii) 잠재 성장 중심성에 근거하여 예측한 유망 기술의 성숙도 증가량을 시기별로 측정하여 예측 모형의 정확도를 평가하는 방안을 제시한다. 이와 더불어 제안 방법론의 성능 및 실무 적용 가능성의 평가를 위해 특허 문서 13, 477건에 대한 실험을 수행하였으며, 실험 결과 제안한 잠재 성장 중심성에 따른 예측 모형이 단순히 현재 활용되는 영향도 기반의 예측 모형에 비해 최대 약 2.88배 높은 예측 정확도를 보임을 확인하였다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

캐릭터 상품 제작 교육에 적합한 3D프린터 연구 (Study on 3D Printer Suitable for Character Merchandise Production Training)

  • 권동현
    • 만화애니메이션 연구
    • /
    • 통권41호
    • /
    • pp.455-486
    • /
    • 2015
  • 1986년 특허등록으로 시작된 3D프린팅 기술은 당시에는 인식 부족으로 일부 기업 외에는 주목받지 못하는 기술이었다. 그러나 20년이 지나 만료되는 특허들이 나오는 오늘날에는 가격도 개인이 구매가능한 선까지 낮아졌고 컴퓨터 성능향상 및 인터넷 정보교류의 보편화로 3D 콘텐츠에 대한 인식이 보편화 되어 산업계는 물론 일반인들에게도 주목 받고 있다. 수정 및 유통이 편리한 디지털 데이터를 기반으로 하면서 금형제작이 필요없는 3D프린터는 제작 공정에서 획기적인 변화를 가져 올 수 있으며 캐릭터 콘텐츠상품 분야에서도 동일한 효과를 얻을 수 있다. 최근 들어 관심을 받고 있는 키덜트 문화의 가장 선두에 있는 다양한 캐릭터 상품 제작에는 3D프린터를 사용하는 것이 필수적인 공정이 되고 있으며 이 같은 캐릭터 콘텐츠 관련 산업현장 수요를 예측해 볼 때, 그리고 특허 만료 및 기술의 공유로 저렴해진 가격 등을 고려해 볼 때, 앞으로 교육현장에서 3D프린터를 활용할 수 있는 인재를 양성하는 교육과정을 도입하여 보다 창의적인 작업을 할 수 있는 인재를 양성하고 취업의 영역과 기회를 확대하는 것은 꼭 진행되어야 할 것이다. 그러나 학교 교육에서 3D프린터를 도입하고자 할 때 얻을 수 있는 정보는 한계가 있다. 언론이나 정보매체에서는 3D 프린터에 대한 장밋빛 미래가치나 산업규모 성장과 같은 일반적인 정보만을 거론하고 있으며 학계에서도 연구의 수준의 프린팅 기술 소개나 산업에서의 적용, 산업 규모 데이터 분석 등 개론수준의 내용 정리에 머무르고 있다. 이러한 정보의 부족은 교육현장에서 문제를 발생시킨다. 장점과 단점 비교와 같은 실질적인 정보 비교 없이 일단 도입 하여 시행착오의 과정 이후에서야 사용을 할 수 있게 됨으로서 시간적, 기회비용이 발생할 수밖에 없는 상황이다. 특히 많은 비용을 들여 도입한 장비가 학교 교육의 특성에 맞지 않는다면 그로 인한 비용손실은 클 것이다. 본 연구의 목적은 관련 전문가들이 아닌 기술관련 기반이 없는 일반 사용자들을 대상으로 하였다. 기존의 의 3D프린터 기술소개의 정도가 아닌 대표적 기술에 따른 사용상의 주의 점과 문제점을 분석하고 장단점을 비교하여 학교 교육, 특히 애니메이션 관련 학과에서 캐릭터 상품 개발과 관련한 교육에서 필요한 3D 프린터는 어떤 특성을 가져야 하는지를 설명하고 앞으로 3D프린터 이용한 교육을 시행하고자 할 때 실질적인 도움이 될 수 있는 정보를 제공하고자 하였다. 본론에서는 지지대 방식, 재료의 종류, 이차원 프린팅 방법, 삼차원 프린팅 방법과 같이 새로운 관점으로 기술을 구분하여 설명하였다. 이렇게 다른 구분 방식을 선택 하게 된 이유는 사용상의 실질적인 문제들을 상호 비교하기 용이하도록 하기 위함이다. 결론적으로 가장 적합한 3D프리터는 출력물의 품질은 다소 부족하지만 비교적 가격대가 저렴하고 재료 및 유지보수비용이 적게 드는 FDM방식의 프린터로 선정하였으며 부가적으로 기술지원이 잘되는 업체를 선정하기를 추천한다.