• 제목/요약/키워드: fields and items

검색결과 391건 처리시간 0.032초

창업가가 인식한 정부창업지원사업 중요도와 만족도 및 기대충족도가 창업기업의 경영성과에 미치는 영향 (An Impact of Startup Business Performance by Entrepreneurs' Perceived Importance, Satisfaction, and Level of Meeting to Expectation over Government Startup Business Aid Programs)

  • 이영주;양영석
    • 벤처창업연구
    • /
    • 제13권1호
    • /
    • pp.31-41
    • /
    • 2018
  • 본 논문은 정부의 창업지원사업이 외형적 예산투입관점에서는 크게 증가함에도 불구하고 창업기업들의 현장에서 필요로 하는 니즈에 맞게 적절하게 이루어지지 못한다는 문제에 대해, 창업지원사업을 수혜 받은 기업들을 대상으로 정부지원 세부사업에 대한 중요도와 만족도를 조사하고 이의 차이인 기대충족도를 분석하여 그 원인을 분석하고 개선방안을 제시하는데 목적이 있다. 이를 위해, 본 연구는 충청남북도에 소재한 창업기업들을 대상으로 창업가가 인식한 정부의 창업지원사업 만족도가 경영성과에 미치는 영향을 살펴보았다. 특히 본 논문은 창업지원사업 중 어떠한 정부지원이 경영성과에 가장 큰 유의미한 영향을 미치는지를 분석하였다. 연구결과는 다음과 같다. 첫째, 창업지원사업의 창업교육, 시설 공간, 컨설팅, 자금지원 각각 분야의 중요도와 만족도의 차이에 대한 통계적 유의성을 검정한 결과 모든 분야에서 유의미한 차이가 있는 것으로 나타났다. 또한 중요도와 만족도의 차이가 가장 큰 분야는 자금지원으로 나타났다. 둘째, 창업지원사업과 재무적 성과와의 영향관계를 분석한 결과 시설 공간 만족도가 재무적 성과에 정(+)의 영향을 미쳐 시설 공간 만족도가 높을수록 재무적 성과가 높아지는 것을 알 수 있다. 창업지원사업과 비재무적 성과와의 영향관계를 분석한 결과 창업교육 및 컨설팅 만족도가 비재무적 성과에 정(+)의 영향을 미쳐 창업교육 및 컨설팅 만족도가 높을수록 비재무적 성과가 높아지는 것을 알 수 있다. 마지막으로 본 논문은 기대충족도가 가장 낮은 자금지원사업에 대해 그 수치가 가장 높은 창업교육 및 컨설팅사업과 연계하여 맞춤형 지원사업을 개발하는 것을 정책대안으로 제시하였다.

치위생학과 학생에게 바라는 역량에 대한 특성화 선택과정 실습기관 실무자의 의견: 심층면접 (Field Manager's Opinion of the Dental Hygiene Student's Competency: In-Depth Interview Study)

  • 김소망;김지엽;박은비;최정음;최혜인;박고은;김남희
    • 치위생과학회지
    • /
    • 제14권1호
    • /
    • pp.81-86
    • /
    • 2014
  • 이 연구는 2013년 3월부터 6월까지 3개월간 연세대학교 치위생학과 특성화 선택과정 실습기관 현장실무자 12명을 대상으로 실습학생에게 바라는 역량과 실습체계에 대해 심층 면접한 결과로 내용분석을 하였다. 현장실무자들이 치위생학을 전공하는 학생에게 바라는 역량을 종합해보면, 현장실무 수행과정에서 '의욕적 태도와 활발함', '우수한 발표능력과 결과물' 그리고 '창의력과 리더십', '영어 등의 외국어 능력'을 발휘할 때 좋은 역량을 갖춘학생으로 평가하고 있었다. 그에 반해, '현장실무에 대한 준비'와 '직업에 대한 헌신과 소명'이 부족해 보일 경우는 그 학생의 역량을 낮게 평가하게 된다는 의견으로 수렴되었다. 더 나은 특성화 선택과정 실습체계 마련을 위해서는 '학교와 현장이 지속적으로 협력할 수 있는 프로젝트', '현장실무를 위한 기관 간의 원활한 행정교류'와 '학생들이 수행하길 원하는 구체적인 활동사항 리스트'를 구축하고, '실습과 관련된 제반 사항에 대한 과정평가'가 필요하다는 의견으로 모아졌다. 이 연구를 통해 특성화 선택과정 실습 현장실무자들이 학생들의 역량에 대해 긍정적으로 인식하고 있었고, 기대하는 바도 큰 것을 알 수 있었다. 따라서 학교 밖 현장교육을 보다 체계적이고 지속적으로 활성화할 필요가 있다. 특성화 선택과정 실습은 학생에게는 진로모색을 구체화 할 수 있는 좋은 기회를 제공한다. 그리고 현장실무자에게는 학생의 역량을 미리 엿보는 계기가 되고 있음을 알 수 있었다. 따라서 특성화 선택과정 실습이 현장실무자에게 향후 치과위생사 인력선발 과정에 긍정적이고 수월하게 영향을 미칠 수 있을 것으로 기대한다.

상처와 주름이 있는 지문 판별에 효율적인 심층 학습 비교연구 (A Comparative Study on the Effective Deep Learning for Fingerprint Recognition with Scar and Wrinkle)

  • 김준섭;림빈 보니카;성낙준;홍민
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.17-23
    • /
    • 2020
  • 인간의 특성과 관련된 측정 항목을 나타내는 생체정보는 도난이나 분실의 염려가 없으므로 높은 신뢰성을 가진 보안 기술로서 큰 주목을 받고 있다. 이러한 생체정보 중 지문은 본인 인증, 신원 파악 등의 분야에 주로 사용된다. 신원을 파악할 때 지문 이미지에 인증을 수행하기 어려운 상처, 주름, 습기 등의 문제가 있을 경우, 지문 전문가가 전처리단계를 통해 직접 지문에 어떠한 문제가 있는지 파악하고 문제에 맞는 영상처리 알고리즘을 적용해 문제를 해결한다. 이때 지문에 상처와 주름이 있는 지문 영상을 판별해주는 인공지능 소프트웨어를 구현하면 손쉽게 상처나 주름의 여부를 확인할 수 있고, 알맞은 알고리즘을 선정해 쉽게 지문 이미지를 개선할 수 있다. 본 연구에서는 이러한 인공지능 소프트웨어의 개발을 위해 캄보디아 왕립대학교의 학생 1,010명, Sokoto 오픈 데이터셋 600명, 국내 학생 98명의 모든 손가락 지문을 취득해 총 17,080개의 지문 데이터베이스를 구축했다. 구축한 데이터베이스에서 상처나 주름이 있는 경우를 판별하기 위해 기준을 확립하고 전문가의 검증을 거쳐 데이터 어노테이션을 진행했다. 트레이닝 데이터셋과 테스트 데이터셋은 캄보디아의 데이터, Sokoto 데이터로 구성하였으며 비율을 8:2로 설정했다. 그리고 국내 학생 98명의 데이터를 검증 데이터 셋으로 설정했다, 구성된 데이터셋을 사용해 Classic CNN, AlexNet, VGG-16, Resnet50, Yolo v3 등의 다섯 가지 CNN 기반 아키텍처를 구현해 학습을 진행했으며 지문의 상처와 주름 판독에서 가장 좋은 성능을 보이는 모델을 찾는 연구를 수행했다. 다섯가지 아키텍처 중 지문 영상에서 상처와 주름 여부를 가장 잘 판별할 수 있는 아키텍처는 ResNet50으로 검증 결과 81.51%로 가장 좋은 성능을 보였다.

폐기물처리시설의 세부검사방법 마련연구(II): 세부검사방법 문제점도출 및 개선방향 설정 (A study on inspection methods for waste treatment facilities(II): Derivation of problems and improvement direction in inspection methods)

  • 이풀잎;권은혜;손준익;강준구;전태완;이동진
    • 유기물자원화
    • /
    • 제31권1호
    • /
    • pp.85-100
    • /
    • 2023
  • 본 연구는 폐기물처리시설의 설치·정기검사방법 개선을 도모하기 위해 6개 분야로 분류된 폐기물처리시설을 현장조사하여 검사방법의 문제점을 파악하고 그에 따른 개선방향을 마련하여 폐기물처리시설 세부검사방법을 개정하고자 하였다. 그 결과 소각, 소각열회수 분야에서는 열화상카메라를 활용한 전체온도 측정 및 1년간의 TMS 데이터를 비교 등의 검사방법을 마련하였으며, 멸균분쇄시설의 경우 「폐기물의 조성비 검사」는 검사자 및 피검사자의 안전상의 이유로 폐기물을 개봉하지 않고 서류로 대체할 수 있도록 적용하였다. 매립시설의 경우 영상정보처리기기 활용 및 매립시설 상부를 덮는 시설물의 관리에 대한 내용 등 법에는 제시되어 있으나 세부검사방법이 마련되어있지 않은 항목을 세부검사방법에 적용하였다. 음식물류폐기물처리시설의 경우 민원의 주요원인인 악취관리에서 악취배출허용기준을 준수하도록 검사방법을 마련하였다. 그 결과, 소각 및 멸균분쇄, 시멘트소성로, 소각열회수시설에서는 총 18개의 개선(안) 중 10개가 반영되었으며, 매립시설의 경우 총 12개의 개선(안)중에서 11개가 반영되었다. 또한 음식물류폐기물처리시설의 경우 총 12개의 개선(안)중에서 10개가 반영되어 총 31개의 검사방법이 개선되었다.

COVID-19로 인한 자폐스펙트럼 장애아동의 놀이 활동 참여 변화: 주제범위 문헌고찰 (The Change in Participation Patterns in Play Activities of Children with Autism Spectrum Disorder during COVID-19: A Scoping Review)

  • 김향원;송예지;강성현;원하은;정윤화
    • 대한감각통합치료학회지
    • /
    • 제21권1호
    • /
    • pp.59-73
    • /
    • 2023
  • 목적 : 본 연구는 COVID-19 상황 속 자폐스펙트럼 장애아동의 놀이 활동과 관련된 문헌을 분석하여 재난으로 인한 아동의 놀이 활동 참여 변화를 살펴보고자 하였다. 연구방법 : Arskey와 O'Malley가 제시한 주제범위 문헌고찰의 5단계에 따라 진행되었다. COVID-19가 발표된 2020년 3월부터 2022년 8월까지 CINAHL, PubMed, ERIC, MEDLINE, Google scholar 데이터베이스와 Google 검색엔진을 통해 영문 문헌과 웹사이트 정보를 검색하였다. 문헌의 출판연도, 연구가 이루어진 국가, 연구유형, 대상자 연령, 대상자 수, 연구 결과 등의 10가지 항목에 따라 데이터를 정리하였다. 양적 자료를 통해 관련 주제의 일반적 특성을 알아보았고, 주제 분석을 통해 COVID-19로 인한 아동의 놀이 양상 변화를 확인하였다. 결과 : 437개의 문헌 및 152개의 웹사이트 정보를 검토하여 최종적으로 6개의 문헌이 분석되었다. 분석된 연구는 다양한 나라와 분야의 전문가들에 의해 수행되었다. 문헌에서 공통으로 강조된 5가지 주제는 COVID-19로 인한 자폐스펙트럼 장애아동의 실외 놀이 감소, 스크린 이용 시간 증가, 가족 간 시간 증가, 감각적 어려움, 그리고 연구자가 권고하는 서비스로 나타났다. 결론 : 본 연구에서는 재난 상황 시 자폐스펙트럼 장애아동이 경험하는 놀이 활동 참여의 어려움을 해결하기 위해 주양육자와 자녀가 함께할 수 있는 공동 미디어 참여, 부모 행동 전략 교육 등의 비대면 프로그램을 제안한다. 연구 결과는 향후 재난 상황 시 장애아동의 놀이 활동의 중요성을 강조하고, 이를 지원하기 위한 작업치료사의 역할과 서비스 지침을 체계화하는 데에 기초자료로 활용될 수 있다.

협업필터링에서 고객의 평가치를 이용한 선호도 예측의 사전평가에 관한 연구 (Pre-Evaluation for Prediction Accuracy by Using the Customer's Ratings in Collaborative Filtering)

  • 이석준;김선옥
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.187-206
    • /
    • 2007
  • The development of computer and information technology has been combined with the information superhighway internet infrastructure, so information widely spreads not only in special fields but also in the daily lives of people. Information ubiquity influences the traditional way of transaction, and leads a new E-commerce which distinguishes from the existing E-commerce. Not only goods as physical but also service as non-physical come into E-commerce. As the scale of E-Commerce is being enlarged as well. It keeps people from finding information they want. Recommender systems are now becoming the main tools for E-Commerce to mitigate the information overload. Recommender systems can be defined as systems for suggesting some Items(goods or service) considering customers' interests or tastes. They are being used by E-commerce web sites to suggest products to their customers who want to find something for them and to provide them with information to help them decide which to purchase. There are several approaches of recommending goods to customer in recommender system but in this study, the main subject is focused on collaborative filtering technique. This study presents a possibility of pre-evaluation for the prediction performance of customer's preference in collaborative filtering before the process of customer's preference prediction. Pre-evaluation for the prediction performance of each customer having low performance is classified by using the statistical features of ratings rated by each customer is conducted before the prediction process. In this study, MovieLens 100K dataset is used to analyze the accuracy of classification. The classification criteria are set by using the training sets divided 80% from the 100K dataset. In the process of classification, the customers are divided into two groups, classified group and non classified group. To compare the prediction performance of classified group and non classified group, the prediction process runs the 20% test set through the Neighborhood Based Collaborative Filtering Algorithm and Correspondence Mean Algorithm. The prediction errors from those prediction algorithm are allocated to each customer and compared with each user's error. Research hypothesis : Two research hypotheses are formulated in this study to test the accuracy of the classification criterion as follows. Hypothesis 1: The estimation accuracy of groups classified according to the standard deviation of each user's ratings has significant difference. To test the Hypothesis 1, the standard deviation is calculated for each user in training set which is divided 80% from MovieLens 100K dataset. Four groups are classified according to the quartile of the each user's standard deviations. It is compared to test the estimation errors of each group which results from test set are significantly different. Hypothesis 2: The estimation accuracy of groups that are classified according to the distribution of each user's ratings have significant differences. To test the Hypothesis 2, the distributions of each user's ratings are compared with the distribution of ratings of all customers in training set which is divided 80% from MovieLens 100K dataset. It assumes that the customers whose ratings' distribution are different from that of all customers would have low performance, so six types of different distributions are set to be compared. The test groups are classified into fit group or non-fit group according to the each type of different distribution assumed. The degrees in accordance with each type of distribution and each customer's distributions are tested by the test of ${\chi}^2$ goodness-of-fit and classified two groups for testing the difference of the mean of errors. Also, the degree of goodness-of-fit with the distribution of each user's ratings and the average distribution of the ratings in the training set are closely related to the prediction errors from those prediction algorithms. Through this study, the customers who have lower performance of prediction than the rest in the system are classified by those two criteria, which are set by statistical features of customers ratings in the training set, before the prediction process.

초등학교 과학교과서에 기술된 과학이야기에 대한 학생들의 어려움 분석 - 6학년 과학을 중심으로 - (An Analysis of Students' Difficulty on Science Stories in Elementary School Science Textbooks - Focusing on 6th Grade Science)

  • 임영현;신영준
    • 과학교육연구지
    • /
    • 제38권3호
    • /
    • pp.525-542
    • /
    • 2014
  • 이 연구의 목적은 6학년 과학교과서에 실린 과학이야기의 내용 분석 및 과학이야기를 읽고 이해하는데 있어서 학생들이 겪는 어려움과 그 요인을 살펴보고자 하는 데 있다. 연구대상은 경기도 시흥시에 위치한 J초등학교 6학년 2개반(65명)이다. 초등학교 6학년 과학교과서에 제시된 과학이야기 총 26편을 영역별, 내용별(지식의 심화 보충, 과학자와 과학사, 생활 속 과학, 첨단 과학 기술, 환경 문제)로 분류하고 그 성격을 조사, 분석하였다. 또 과학이야기(26개)를 이해하는데 학생들이 겪는 어려움에 대한 설문을 실시하였으며(65명), 그리고 설문을 통해 수집한 자료의 의미를 명확히 하기 위한 목적으로 반구조화된 면담을 실시하였다(4명). 과학교과서에 나온 과학이야기 내용과 설문지의 응답, 면담결과를 분석한 결과 과학이야기는 '에너지', '물질', '생명', '지구'의 4개 영역이 고르게 제시되었으며 내용별로 생활 속 과학과 지식의 심화보충 관련 내용이 가장 많이 제시 되었는데 이는 학습한 지식을 실제 사회 문제에 적용할 수 있는 기회를 많이 제공하고자 한 과학교과의 성격과 관련이 있었다. 과학이야기에 대한 학생들의 반응은 과학을 공부하는데 도움이 된다고 느끼는 등 전반적으로 긍정적이었지만 과학이야기를 제대로 이해하는 데 있어서 어려움을 겪는 부분도 있었다. 내용 이해의 어려움, 교과서 내용 제시 방식의 문제, 과학 용어의 어려움, 흥미 부족 등이 요인으로 분석되었으며 그 세부적 원인으로 설명식 수업과 중요하지 않은 내용이라는 생각, 교과서에 제시된 내용의 설명 부족, 삽화의 문제점 등 다양한 학생들의 반응이 나왔다. 연구를 통해 학생들과 교사들 모두 과학 수업을 하는데 있어서 과학이야기가 흥미를 돋우며 과학적 지식을 이해하고 적용하는데 많은 도움을 준다는데 같은 생각을 가지고 있음을 알 수 있었다. 그러므로 이런 도움을 주는 과학이야기를 이해하는데 조금이라도 겪게 되는 어려움이 있다면 앞으로도 그 원인을 제대로 파악하고 좀 더 나은 내용을 제시하여 학습 현장에 적용시킬 수 있어야 하겠다.

  • PDF

네트워크 분석을 활용한 딥러닝 기반 전공과목 추천 시스템 (Major Class Recommendation System based on Deep learning using Network Analysis)

  • 이재규;박희성;김우주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.95-112
    • /
    • 2021
  • 대학 교육에 있어서 전공과목의 선택은 학생들의 진로에 중요한 역할을 한다. 하지만, 산업의 변화에 발맞춰 대학 교육도 학과별 전공과목의 분야가 다양해지고 그 수가 많아지고 있다. 이에 학생들은 본인의 진로에 맞게 수업을 선택하여 수강하는 것에 어려움을 겪고 있다. 본 연구는 대학 전공과목 추천 모델을 제시함으로써 개인 맞춤형 교육을 실현하고 학생들의 교육만족도를 제고하고자 한다. 모델 연구에는 대학교 학부생들의 2015년~2017년 수강 이력 데이터를 활용하였으며, 메타데이터로는 학생과 수업의 전공 명을 사용했다. 수강 이력 데이터는 컨텐츠 소비 여부만을 나타낸 암시적 피드백 데이터로, 수업에 대한 선호도를 반영한 것이 아니다. 따라서 학생과 수업의 특성을 나타내는 임베딩 벡터를 도출했을 시, 표현력이 낮다. 본 연구는 이러한 문제점에 착안하여, 네트워크 분석을 통해 학생, 수업의 벡터를 생성하고 이를 모델의 입력 값으로 활용하는 Net-NeuMF 모델을 제시한다. 모델은 암시적 피드백을 가진 데이터를 이용한 대표적인 모델인 원핫 벡터를 이용하는 NeuMF의 구조를 기반으로 하였다. 모델의 입력 벡터는 네트워크 분석을 통해 학생과 수업의 특성을 나타낼 수 있도록 생성하였다. 학생을 표현하는 벡터를 생성하기 위해, 각 학생을 노드로 설정하고 엣지는 두 학생이 같은 수업을 수강한 경우 가중치를 가지고 연결되도록 설계했다. 마찬가지로 수업을 표현하는 벡터를 생성하기 위해 각 수업을 노드로 설정하고 엣지는 공통으로 수강한 학생이 있는 경우 연결시켰다. 이에 각 노드의 특성을 수치화 하는 표현 학습방법론인 Node2Vec을 이용하였다. 모델의 평가를 위해 추천 시스템에서 주로 활용하는 지표 4가지를 사용하였고, 임베딩 차원이 모델에 미치는 영향을 분석하기 위해 3가지 다른 차원에 대한 실험을 진행하였다. 그 결과 기존 NeuMF 구조에서 원-핫 벡터를 이용하였을 때보다 차원과 관계없이 평가지표에서 좋은 성능을 보였다. 이에 본 연구는 학생(사용자)와 수업(아이템)의 네트워크를 이용해 기존 원-핫 임베딩 보다 표현력을 높였다는 점, 모델을 구성하는 각 구조의 특성에 맞도록 임베딩 벡터를 활용하였다는 점, 그리고 기존의 방법론에 비해 다양한 종류의 평가지표에서 좋은 성능을 보였다는 점을 기여점으로 가지고 있다.

RFM 기반 SOM을 이용한 매장관리 전략 도출 (Strategy for Store Management Using SOM Based on RFM)

  • 정윤정;최일영;김재경;최주철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.93-112
    • /
    • 2015
  • 소비자의 소비성향이 필요 품목을 중심으로 근거리에서 구매하는 근린형으로 변화함에 기존의 소매점은 식료품, 생활용품을 위주로 제공하는 슈퍼마켓, 하이퍼마켓 또는 편의점으로 진화하고 있다. 따라서 소매점이 한정된 공간에서 효율적으로 공간을 활용하고 매출을 증대하기 위해서는 소비자의 구매욕을 충족시킬 수 있는 상품배치와 적정한 재고수준을 유지하는 것이 매우 중요하다. 본 연구에서는 소매점의 판매 상품에 대하여 RFM 기반 SOM 군집화를 하여 효율적으로 매장을 관리할 수 있는 상품 배치전략 및 재고전략을 제안하였다. 실제 M마트의 판매데이터를 이용하여 RFM모델을 상품에 적용한 후, 기존 문헌 연구뿐만 아니라 해석 가능성, 응용 가능성 등을 고려하여 3X3 총 9개의 군집으로 분류하여 분석한 결과, 주요 군집으로 R값, F값, M값이 모두 높은 군집, R값, F값, M값 모두 낮은 군집, R값만 높은 군집, F값만 높은 군집이 도출되었다. 본 논문에서는 다른 군집과 비교시 R값, F값, M값이 차이를 보이는 주요 4개의 군집의 상품 배치 및 재고 전략을 제시하였다. R값, F값, M값이 모두 높은 군집의 상품은 소비자 동선을 늘림으로써 상품 노출을 확대시킬 수 있는 장소에 배치하여야 할 뿐만 아니라 높은 수준의 재고를 보유할 필요가 있다. 반면에 R값, F값, M값이 모두 낮은 군집의 상품은 가시성이 낮은 곳에 배치하고 최소한의 안전재고만 보유할 필요가 있다. 또한 R값이 높은 군집은 신상품으로 매장 입구에 배치하여 상품의 판매를 유도할 필요가 있다. 그리고 F값만 높은 군집의 경우, R값과 M값이 평균 값 보다 작은 상품들의 군집이므로 최근에는 판매가 저조하며 빈도 수에 비해 총 판매액이 낮다는 것을 유추할 수 있다. 따라서 현재보다 과거에 많이 판매된 저가의 상품군집으로 재고 수준을 점차 감소시킬 필요가 있다. 본 연구에서 제시한 방법은 POS 시스템의 보유한 소매점에서 상품배치 및 재고관리 방법으로 활용되어 매장의 수익성 증대에 기여할 수 있을 것으로 기대된다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.