• 제목/요약/키워드: Structured Big Data

검색결과 122건 처리시간 0.026초

빅데이터를 활용한 직업관련 분석 및 시각화 (Job-related analysis and visualization using big data distributed processing system)

  • 최동철;최낙진;김민석;박준욱;이준동
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.249-251
    • /
    • 2020
  • 본 논문에서는 코로나바이러스감염증19 사태가 국내 취업시장에 어떠한 영향을 미쳤는지에 대해 알아보기 위하여 빅데이터를 활용한 직업 관련 분석 및 시각화를 수행하였다. 빅데이터를 위한 기본 자료는 통계청 자료와 워크넷 Open API를 활용하였으며, 빅데이터 처리 과정을 거쳐 결과값을 예측을 시도하였다. 2020년도 워크넷 Open API를 통해 고용수와 통계청 자료를 통해 비교 분석 및 시각화를 실시하였고, 08년~20년 취업자수를 통해 시계열 분석 및 예측을 진행해 앞으로의 횡보를 예상해보았다. 분석한 결과 19년, 20년도를 비교 분석했을 때에는 크게 차이가 나지 않았다. 추가적으로 시계열 분석기법을 활용해 보았을 때 매년 고용수는 전체적으로 증가하고 4월에는 감소, 7월에는 증가하는 추세가 나왔다. 코로나바이러스감염증19 사태로 인해 공공기관과 언택트 시대에 따른 화상회의나 재택근무로 인해 운수·통신 취업률은 상승한다는 결과값이 도출되었고, 자영업이나 서비스 직업 등은 다른 직종에 비해 큰 감소를 보여줬으나 국가 경제 활성화에 따른 고용수는 점차 증가할 것이라 예측된다.

  • PDF

빅데이터 도입의도에 미치는 영향요인에 관한 연구: 전략적 가치인식과 TOE(Technology Organizational Environment) Framework을 중심으로 (An Empirical Study on the Influencing Factors for Big Data Intented Adoption: Focusing on the Strategic Value Recognition and TOE Framework)

  • 가회광;김진수
    • Asia pacific journal of information systems
    • /
    • 제24권4호
    • /
    • pp.443-472
    • /
    • 2014
  • To survive in the global competitive environment, enterprise should be able to solve various problems and find the optimal solution effectively. The big-data is being perceived as a tool for solving enterprise problems effectively and improve competitiveness with its' various problem solving and advanced predictive capabilities. Due to its remarkable performance, the implementation of big data systems has been increased through many enterprises around the world. Currently the big-data is called the 'crude oil' of the 21st century and is expected to provide competitive superiority. The reason why the big data is in the limelight is because while the conventional IT technology has been falling behind much in its possibility level, the big data has gone beyond the technological possibility and has the advantage of being utilized to create new values such as business optimization and new business creation through analysis of big data. Since the big data has been introduced too hastily without considering the strategic value deduction and achievement obtained through the big data, however, there are difficulties in the strategic value deduction and data utilization that can be gained through big data. According to the survey result of 1,800 IT professionals from 18 countries world wide, the percentage of the corporation where the big data is being utilized well was only 28%, and many of them responded that they are having difficulties in strategic value deduction and operation through big data. The strategic value should be deducted and environment phases like corporate internal and external related regulations and systems should be considered in order to introduce big data, but these factors were not well being reflected. The cause of the failure turned out to be that the big data was introduced by way of the IT trend and surrounding environment, but it was introduced hastily in the situation where the introduction condition was not well arranged. The strategic value which can be obtained through big data should be clearly comprehended and systematic environment analysis is very important about applicability in order to introduce successful big data, but since the corporations are considering only partial achievements and technological phases that can be obtained through big data, the successful introduction is not being made. Previous study shows that most of big data researches are focused on big data concept, cases, and practical suggestions without empirical study. The purpose of this study is provide the theoretically and practically useful implementation framework and strategies of big data systems with conducting comprehensive literature review, finding influencing factors for successful big data systems implementation, and analysing empirical models. To do this, the elements which can affect the introduction intention of big data were deducted by reviewing the information system's successful factors, strategic value perception factors, considering factors for the information system introduction environment and big data related literature in order to comprehend the effect factors when the corporations introduce big data and structured questionnaire was developed. After that, the questionnaire and the statistical analysis were performed with the people in charge of the big data inside the corporations as objects. According to the statistical analysis, it was shown that the strategic value perception factor and the inside-industry environmental factors affected positively the introduction intention of big data. The theoretical, practical and political implications deducted from the study result is as follows. The frist theoretical implication is that this study has proposed theoretically effect factors which affect the introduction intention of big data by reviewing the strategic value perception and environmental factors and big data related precedent studies and proposed the variables and measurement items which were analyzed empirically and verified. This study has meaning in that it has measured the influence of each variable on the introduction intention by verifying the relationship between the independent variables and the dependent variables through structural equation model. Second, this study has defined the independent variable(strategic value perception, environment), dependent variable(introduction intention) and regulatory variable(type of business and corporate size) about big data introduction intention and has arranged theoretical base in studying big data related field empirically afterwards by developing measurement items which has obtained credibility and validity. Third, by verifying the strategic value perception factors and the significance about environmental factors proposed in the conventional precedent studies, this study will be able to give aid to the afterwards empirical study about effect factors on big data introduction. The operational implications are as follows. First, this study has arranged the empirical study base about big data field by investigating the cause and effect relationship about the influence of the strategic value perception factor and environmental factor on the introduction intention and proposing the measurement items which has obtained the justice, credibility and validity etc. Second, this study has proposed the study result that the strategic value perception factor affects positively the big data introduction intention and it has meaning in that the importance of the strategic value perception has been presented. Third, the study has proposed that the corporation which introduces big data should consider the big data introduction through precise analysis about industry's internal environment. Fourth, this study has proposed the point that the size and type of business of the corresponding corporation should be considered in introducing the big data by presenting the difference of the effect factors of big data introduction depending on the size and type of business of the corporation. The political implications are as follows. First, variety of utilization of big data is needed. The strategic value that big data has can be accessed in various ways in the product, service field, productivity field, decision making field etc and can be utilized in all the business fields based on that, but the parts that main domestic corporations are considering are limited to some parts of the products and service fields. Accordingly, in introducing big data, reviewing the phase about utilization in detail and design the big data system in a form which can maximize the utilization rate will be necessary. Second, the study is proposing the burden of the cost of the system introduction, difficulty in utilization in the system and lack of credibility in the supply corporations etc in the big data introduction phase by corporations. Since the world IT corporations are predominating the big data market, the big data introduction of domestic corporations can not but to be dependent on the foreign corporations. When considering that fact, that our country does not have global IT corporations even though it is world powerful IT country, the big data can be thought to be the chance to rear world level corporations. Accordingly, the government shall need to rear star corporations through active political support. Third, the corporations' internal and external professional manpower for the big data introduction and operation lacks. Big data is a system where how valuable data can be deducted utilizing data is more important than the system construction itself. For this, talent who are equipped with academic knowledge and experience in various fields like IT, statistics, strategy and management etc and manpower training should be implemented through systematic education for these talents. This study has arranged theoretical base for empirical studies about big data related fields by comprehending the main variables which affect the big data introduction intention and verifying them and is expected to be able to propose useful guidelines for the corporations and policy developers who are considering big data implementationby analyzing empirically that theoretical base.

TF-IDF와 네트워크분석을 이용한 특허 데이터 분석과 경쟁우위 전략수립에 관한 연구 (A Study on Patent Data Analysis and Competitive Advantage Strategy using TF-IDF and Network Analysis)

  • 윤석용;한경석
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.529-535
    • /
    • 2018
  • 데이터는 폭발적으로 증가하고 있으나 아직도 많은 기업이 데이터 분석을 현황 설명(descriptive analysis)이나 진단 분석(diagnostic analysis)에만 활용하고 예측분석(predictive analysis)이나 기업의 기술전략 분석 등에는 적절하게 활용하고 있지 못하다. 본 연구는 오픈 되어 있는 특허의 IPC 코드, 발명자, 출원일 등의 정형데이터와 청구항 등의 비정형 데이터를 네트워크분석, TF-IDF 등의 빅데이터 분석기법을 활용하여 경쟁기업의 확보 기술과 핵심 기술의 분포, 해외 진출 전략을 파악하기 위한 분석 프로세스를 제시하고 이를 데이터 분석을 통하여 증명하고자 한다.

Comparative Analysis of the Status of Restaurant Start-ups Before and After the Lifting of Social Distancing Through Big Data Analysis

  • Jong-Hyun Park;Yang-Ja Bae;Jun-Ho Park;Gi-Hwan Ryu
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.353-360
    • /
    • 2023
  • This paper explores notable shifts in the restaurant startup market following the lifting of social distancing measures. Key trends identified include an escalated interest in startups, a heightened focus on the quality and diversity of food, a relative decline in the importance of delivery services, and a growing interest in specific industry sectors. The study's data collection spanned three years, from April 2021 to May 2023, encompassing the period before and after social distancing. Data were sourced from a range of online platforms, including blogs, news sites, cafes, web documents, and intellectual forums, provided by Naver, Daum, and Google. From this collected data, the top 50 words were identified through a refinement process. The analysis was structured around the social distancing application period, comparing data from April 2021 to April 2022 with data from May 2022 to May 2023. These observed trend changes provide founders with valuable insights to seize new market opportunities and formulate effective startup strategies. In summary, We offer crucial insights for founders, enabling them to comprehend the evolving dynamics in food service startups and to adapt their strategies to the current market environment.

디지털화된 족보 빅데이터 및 네트워크 연구 - 김해김씨와 혼인한 본관을 중심으로 (Big data and network analysis on genealogy focusing on marital relationships of Kimhae Kim's family)

  • 남윤재;박진홍
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.39-51
    • /
    • 2019
  • 본 연구는 혼맥 관계 네트워크를 활용하여 조선시대 집안과 집안간의 연결관계를 시계열적으로 분석하려는 목적을 갖는다. 이에 김해김씨 족보자료를 중심으로 1500년대부터 1800년대까지 김해김씨와 혼인을 맺은 집안들의 혼맥 관계를 네트워크화 하고, 각 집안들의 네트워크 중심성을 산출하였다. 또한, 50년 간격으로 8개의 네트워크를 도출하여 김해김씨와 혼맥 관계를 맺은 집안들의 네트워크 밀도와 네트워크 집중화 경향, 그리고 네트워크효과를 분석하였다. 연구 결과로는 전체 네트워크의 크기는 시대가 지남에 따라 증가하였으며, 네트워크집중화 경향성은 점차 감소하는 추세를 보여주었으나, 네트워크상의 혼맥 관계 상위 집안들은 큰 변화가 없는 것으로 나타났지만, 네트워크효과는 시간이 지남에 따라 크게 증대되었다. 본 연구는 기존의 족보연구가 한 집안에 집중되거나 정보 기재 방식에 집중되었지만, 디지털화된 빅데이터 족보자료를 활용하여 더욱 다양한 함의를 도출할 수 있음을 보여주며, 이에 족보의 디지털 데이터화 추진을 제안한다.

관세 정형 빅데이터를 활용한 우범공급망 거래패턴 선별 (Transaction Pattern Discrimination of Malicious Supply Chain using Tariff-Structured Big Data)

  • 김성찬;송사광;조민희;신수현
    • 한국콘텐츠학회논문지
    • /
    • 제21권2호
    • /
    • pp.121-129
    • /
    • 2021
  • 본 연구에서는 데이터마이닝(Data Mining) 기법 중 하나인 연관관계분석(Association Rule Mining)을 적용하여 위험화물 선별모델을 구축함으로써 관세위험을 최소화하고자 한다. 이를 위해 관세청 수입신고서 빅데이터를 활용하여 연관관계분석 알고리즘인 어프라이어리 알고리즘(Apriori Algorithm)을 적용하고 공급망 간의 위험정도를 계산한다. 대규모의 수입신고 데이터로부터 해외공급자와 수입업체 간의 세율관련(과세가격, 품목, 중수량 등), 원산지표시 위반 등에 관련한 적발결과 관한 규칙셋(Rule Set)과 이 규칙들의 신뢰도(Confidence)을 확보하여 우범공급망 간의 거래패턴을 예측할 수 있는 선별모델을 구축한다. 총 2년 6개월 치의 수입신고 데이터를 활용하여 5-겹 교차검증(5-fold cross validation)을 수행한 결과 16.6%의 Precision과 33.8%의 Recall을 보였다. 이는 빈도기반 방법보다 Precision 기준 약 3.4배 Recall 기준 약 1.5배 높은 결과이다. 이로써 논문에서 제안하고 있는 방법이 관세위험을 줄일 수 있는 효과적인 방법임을 확인하였다.

웨어러블 기술 알고리즘에 숨겨진 입는 욕망에서부터 시선의 권력까지(시스템 설계 관점에서) (From wearing desires to the power of gazing hidden wearable technology algorithm (Based on system design))

  • 강장묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.205-210
    • /
    • 2018
  • 이글은 웨어러블 기술을 두 가지 측면에서 고찰하였다. 첫째, 스마트 기술이 접목된 옷에 스며든 욕망이다. 둘째, 옷을 입은 이용자를 바라보는 시선에 대한 고찰이다. 이 글은 웨어러블 기술로 새롭게 등장할 옷에 대한 연구이다. 그러나 이 옷은 단순히 기술적인 문제가 아니다. 오히려, 옷에 대한 인간 본능을 고려한 시스템 설계이다. 따라서 이 연구는 사회과학적 경계를 아우른다. 이 글은 웨어러블에서 수집된 데이터가 단순한 센싱 기반의 데이터라 보지 않는다. 오히려, 웨어러블 기술은 인간 고유의 생명활동과 감정을 드러낸다. 이글은 인문학과 기술을 융합 또는 복합한 시도이다.

Efficient Query Retrieval from Social Data in Neo4j using LIndex

  • Mathew, Anita Brigit
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2211-2232
    • /
    • 2018
  • The unstructured and semi-structured big data in social network poses new challenges in query retrieval. This requirement needs to be met by introducing quality retrieval time measures like indexing. Due to the huge volume of data storage, there originate the need for efficient index algorithms to promote query processing. However, conventional algorithms fail to index the huge amount of frequently obtained information in real time and fall short of providing scalable indexing service. In this paper, a new LIndex algorithm, which is a heuristic on Lucene is built on Neo4jHA architecture that holds the social network Big data. LIndex is a flexible and simplified adaptive indexing scheme that ascendancy decomposed shortest paths around term neighbors as basic indexing unit. This newfangled index proves to be effectual in query space pruning of graph database Neo4j, scalable in index construction and deployment. A graph query is processed and optimized beyond the traditional Lucene in a time-based manner to a more efficient path method in LIndex. This advanced algorithm significantly reduces query fetch without compromising the quality of results in time. The experiments are conducted to confirm the efficiency of the proposed query retrieval in Neo4j graph NoSQL database.

시민 니즈와 참여 기반의 스마트시티 문제해결을 위한 빅 데이터 활용 절차에 관한 연구 (A Study on the Procedure of Using Big Data to Solve Smart City Problems Based on Citizens' Needs and Participation)

  • 장혜정
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.102-112
    • /
    • 2020
  • 스마트시티의 목표는 스마트시티의 요소기술을 통해 도시문제를 해결하여 친환경적이고 지속가능한 경제발전 및 시민의 삶의 질을 향상하는 것이라 할 수 있다. 지금까지 스마트시티는 요소기술 중심으로 발전해왔지만 이제는 스마트시티에서 생활을 하는 시민들의 니즈나 참여에 대해 관심을 두어야 할 때이다. 본 논문에서는 시민 니즈와 참여를 기반으로 스마트시티의 문제해결을 위한 빅 데이터 절차를 제시한다. 이를 위하여 지역별 주요산업별 스마트시트 프로젝트 시장과 분야별 스마트시티 시장 영역 발전단계를 살펴본다. 또한 시민 참여에 대한 분야별 정의와 필요성을 이해하고 빅 데이터를 통한 문제해결 방법으로 7단계 빅 데이터 문제해결 프로세스에 접목 방안을 제시한다. 문제해결을 위한 7단계 빅데이터 프로세스는 스마트시티의 각 부문별 정형·비정형 데이터 수집 분석 후 과제를 도출하고 이에 따른 정책 프로그램을 도출하는 방법이다. 이러한 절차에 시민 참여를 이끌어 내기 위하여 비정형 데이터 수집과정에서 디자인싱킹 방법론의 공감단계를 활용한다. 또한 스마트시티 도시문제 해결을 위한 시민 니즈를 찾는 방법으로 비정형 데이터 분석과정에 디자인싱킹 방법론의 문제정의 단계를 접목시켰다.

빅데이터 기반 군수품 품질정보 활용방안에 대한 연구 (A Study on the Application Method of Munition's Quality Information based on Big Data)

  • 전수연;이동헌;배만재
    • 한국산학기술학회논문지
    • /
    • 제17권6호
    • /
    • pp.315-325
    • /
    • 2016
  • 국방산업에 관련된 데이터의 양적팽창과 기술성장에 따라, 유의미한 품질정보를 추출하고 이를 통해 정책 제정 및 품질보증 업무에 활용하는 것이 요구되고 있다. 데이터에 기반한 경향 파악 및 의사결정 도출은 다수의 상황에 유연하게 대처할 수 있도록 하여 업무의 생산성을 높이고 새로운 기회를 발견하는 핵심 수단으로 활용될 수 있다. 따라서 국방산업에서는 개발단계부터 양산단계까지 다양한 품질정보들을 수집하고 이를 활용할 수 있도록 빅데이터 기반의 업무체계 구축이 필요하며, 축적된 정보를 활용하기 위한 방안이 필요하다. 본 연구는 정보체계 운용을 통해 신뢰성이 확보된 군수품의 품질정보를 수집하여 정형화된 빅데이터를 구축하는 방안을 제시하였으며, 사용자가 이를 활용할 수 있는 종합표준플랫폼을 제시하였다. 제안된 종합표준플랫폼은 군수품시험성적서 정보시스템(Test Report Information Service for Military Supplies, TRIS 시스템) 구축을 통하여 수행하였으며, TRIS 시스템을 통해 축적되는 정형 데이터의 활용방안을 제안하였다. 더불어 국방산업 비정형 데이터 활용방안에 대해 연구하였다. 본 연구의 결과는 향후 국방산업의 데이터 인프라 형성에 기여할 것으로 기대되며, 종합표준플랫폼을 통해 수집된 정보들은 군수품 품질보증에 관한 무기체계 별 전략 수립 및 동향 파악에 유용하게 활용될 것이다.