• 제목/요약/키워드: data mining use factor

검색결과 38건 처리시간 0.024초

빅데이터 분석과 헬스케어에 대한 동향 (A review of big data analytics and healthcare)

  • 문석재;이남주
    • 한국응용과학기술학회지
    • /
    • 제37권1호
    • /
    • pp.76-82
    • /
    • 2020
  • Big data analysis in healthcare research seems to be a necessary strategy for the convergence of sports science and technology in the era of the Fourth Industrial Revolution. The purpose of this study is to provide the basic review to secure the diversity of big data and healthcare convergence by discussing the concept, analysis method, and application examples of big data and by exploring the application. Text mining, data mining, opinion mining, process mining, cluster analysis, and social network analysis is currently used. Identifying high-risk factor for a certain condition, determining specific health determinants for diseases, monitoring bio signals, predicting diseases, providing training and treatments, and analyzing healthcare measurements would be possible via big data analysis. As a further work, the big data characteristics provide very appropriate basis to use promising software platforms for development of applications that can handle big data in healthcare and even more in sports science.

기업과 소비자간 전자상거래에서의 웹 마이닝을 이용한 상품관리 (Merchandise Management Using Web Mining in Business To Customer Electronic Commerce)

  • 임광혁;홍한국;박상찬
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.97-121
    • /
    • 2001
  • 본 연구에서는 웹 마이닝을 이용하여 기업과 소비자간 전자상거래(Business-To-Customer Electronic Commerce)환경에 기초한 가상상점(Cyber market)의 상품 관리자 입장에서 효율적인 상품관리를 가능케 하는 시스템적 접근방법을 통한 상품관리 방법론을 제시하고자 한다. 또한 이 상품 관리 방법론을 실제 웹 상에서 운영되고 있는 가상상점에 직접 적용하여 봄으로써 실증적인 예를 보여주고자 한다.

  • PDF

Application of data mining and statistical measurement of agricultural high-quality development

  • Yan Zhou
    • Advances in nano research
    • /
    • 제14권3호
    • /
    • pp.225-234
    • /
    • 2023
  • In this study, we aim to use big data resources and statistical analysis to obtain a reliable instruction to reach high-quality and high yield agricultural yields. In this regard, soil type data, raining and temperature data as well as wheat production in each year are collected for a specific region. Using statistical methodology, the acquired data was cleaned to remove incomplete and defective data. Afterwards, using several classification methods in machine learning we tried to distinguish between different factors and their influence on the final crop yields. Comparing the proposed models' prediction using statistical quantities correlation factor and mean squared error between predicted values of the crop yield and actual values the efficacy of machine learning methods is discussed. The results of the analysis show high accuracy of machine learning methods in the prediction of the crop yields. Moreover, it is indicated that the random forest (RF) classification approach provides best results among other classification methods utilized in this study.

건설생산성 관리 시스템 구축을 위한 데이터웨어하우스의 적용 (The Application of Data Warehouse for Developing Construction Productivity Management System)

  • 오세욱;김명호;김영석
    • 한국건설관리학회논문집
    • /
    • 제7권2호
    • /
    • pp.127-137
    • /
    • 2006
  • 건설생산성은 단위작업에서 발생되는 자원의 활동과 이로 인한 산출물간의 관계를 지표로 표현한 것을 의미하며 수집된 건설 생산성 정보는 공사 진행의 효율성 파악, 작업여건 및 투입자원의 성능이 공정에 미치는 영향도 분석, 프로젝트별 성과 측정, 향후 공사계획을 위한 참고자료로서의 활용 등 프로젝트 관리를 위한 다양한 목적으로 이용될 수 있다. 본 연구의 목적은 데이터웨어하우스, OLAP, 데이터 마이닝 기술을 활용하여 PDA 및 바코드를 통해 수집된 생산성 데이터를 축적 및 분석하고, 생산성 예측 모델을 제시하기 위한 방법론을 제안하는 것이다. 이를 통해 보다 효율적이고도 다차원적인 생산성 분석이 가능한 건설 생산성 관리 시스템을 개발하는 것이며, 개발된 시스템은 건설 사업의 합리적인 성과 측정과 유사 프로젝트의 공사계획 수립에 활용할 실적데이터를 축적할 수 있을 것이다.

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

대학도서관 이용조사를 통한 경영개선 연구 - C 대학도서관 이용자의 대출기록 분석을 중심으로- (A Management Improvement Study by the Use Survey of an Academic Library - Focused on the Analysis of Circulation Records of the C-Academic Library Users -)

  • 유경종;박일종
    • 정보관리학회지
    • /
    • 제24권3호
    • /
    • pp.93-117
    • /
    • 2007
  • 본 논문은 C대학도서관의 학술정보시스템(LAS)에 구축되어 있는 장서와 대출기록 및 고객관련 데이터를 수집하여 이를 분석하고 그 결과를 고객관계관리(CRM)에 적용할 수 있는 방안을 제시하였다. 수집된 자료는 C대학도서관에서 소장하고 있는 대출이 가능한 단행본 총 269,387책의 서지데이타와 고객 12,281명의 데이터, 이용자 대출기록 39,269건이었다. 대출기록 분석 데이터에서 관계변수로 이용자 신분, 대출빈도, 대출책수와 대출횟수, 출판년도를 추출하여 데이터 마이닝 기법으로 분석하고, 상관계수로 검증하였다.

한국의 폐광산 지하 채굴갱도 기초형상 분석 및 개선된 광산 지하공동 측정·분석 기술 연구 (A Study on the Basic Geometry Analysis of Abandoned Underground Mine Tunnels in Korea and Advanced Measuring-Analysis Technology for Underground Mine Cavities)

  • 김수로;박성빈;최병희;윤중만;정교철
    • 터널과지하공간
    • /
    • 제26권6호
    • /
    • pp.455-465
    • /
    • 2016
  • 광물자원 채굴을 위한 지하 채굴공동의 붕괴는 인간이 생활하고 있는 지역의 지반침하 피해를 유발할 수 있다. 지반침하를 방지하기 위하여 과거 광산지역에 대한 도면이나 사진 자료는 광해방지사업을 위하여 중요한 정보가 되고 있다. 광산지역의 조사, 광산 안정성 평가, 보강공사 등 일련의 과정은 통상적으로 과거 폐광산의 도면 및 사진정보에 근거하여 수행된다. 한국은 일제강점기 및 1960년대 광산 활황기에 수많은 광산이 무질서하게 개발되었다. 그러나 광산 관련 정보는 사용에 제한적인 상황이며, 시간이 지남에 따라 더 희소해질 것으로 본다. 한국광해관리공단은 현실적인 대안을 수립코자 한다. 본 연구에서는 과거 광산개발 굴진에 관련한 대한 기초정보를 통계적으로 검토하고, 진보된 폐광산 지하공동 측정기술에 대하여 연구하였다. 한국의 1,784개 폐광산에 대한 4473개 갱도(갱구) 조사자료를 수집하여 정리하였다. 분석결과, 한국의 소규모 갱도(갱구) 평균 수치는 높이 1.982 m이며, 폭 1.959 m로 분석되었다. 또한 형상계수(shape factor, S)의 평균값은 0.485로 분석되었다. 이러한 폐광산 수치 자료는 한국의 폐광산을 이해하고 연구하는 데 도움이 된다. 따라서, 광산 지하공동 측정기술의 발전은 미래의 광산 지반침하방지사업의 효율화에 기여할 것으로 본다.

서비스 부문의 기술혁신목적별 정부 지원제도의 활용도 분석 연구 (Data Mining for the Effectiveness of Government Support Strategies for Technology Innovation in Service Sectors)

  • 황두현;김우진;손소영
    • 산업공학
    • /
    • 제21권2호
    • /
    • pp.237-246
    • /
    • 2008
  • In today's competitive global environment, technological innovation is an important issue. Many countries are devising national level strategies to further strengthen industrial capacity in support of innovative companies. South Korea is no exception, and multiple strategies are in place to aid innovative development in the private sector. This study postulates that such national level strategies are applied differently depending on the innovation goal pursued by the service sector in Korea. We use data mining methods to test such research hypothesis. Factor analysis is used for clustering of various service companies, while association rule is used in finding the relationship per each cluster. The results show that national level strategies are underutilized and unequally distributed. This may be attributed to the disparity between the demand and needs of the private sector and the opinion of the government, which lead to underutilized and indistinguishable strategies.

Predicting movie audience with stacked generalization by combining machine learning algorithms

  • Park, Junghoon;Lim, Changwon
    • Communications for Statistical Applications and Methods
    • /
    • 제28권3호
    • /
    • pp.217-232
    • /
    • 2021
  • The Korea film industry has matured and the number of movie-watching per capita has reached the highest level in the world. Since then, movie industry growth rate is decreasing and even the total sales of movies per year slightly decreased in 2018. The number of moviegoers is the first factor of sales in movie industry and also an important factor influencing additional sales. Thus it is important to predict the number of movie audiences. In this study, we predict the cumulative number of audiences of films using stacking, an ensemble method. Stacking is a kind of ensemble method that combines all the algorithms used in the prediction. We use box office data from Korea Film Council and web comment data from Daum Movie (www.movie.daum.net). This paper describes the process of collecting and preprocessing of explanatory variables and explains regression models used in stacking. Final stacking model outperforms in the prediction of test set in terms of RMSE.

비접지식 전기비저항 탐사 - 적용성과 한계 (Capacitively-coupled Resistivity Method - Applicability and Limitation)

  • 이성곤;조성준;송윤호;정승환
    • 지구물리와물리탐사
    • /
    • 제5권1호
    • /
    • pp.23-32
    • /
    • 2002
  • 비접지식 전기비저항 탐사는 땅에 접지전극을 설치하기 어려운 곳에서 전기비저항 탐사를 수행할 수 있는 방법으로 국내에서도 관심이 높아지고 있는 방법이다. 이 방법의 기본원리는 땅과 송수신 안테나의 용량결합(capacitive coupling)에 의하여 지하로 전류를 주입하고 이에 의한 전위차를 측정하여 자료를 획득하는 것이다. 본 연구에서는 쌍극자 및 단극 형태의 송수신 안테나를 일렬로 배치하는 방사 배열(radial array)에 대한 기하학적 상수를 유도하였다. 또한, 기존의 접지식 전기비저항 해석 알고리듬을 이용하여 비접지식 전기비저항 자료를 해석하기 위한 자료 전처리 및 변환 과정을 제시하였다. 즉, 획득된 탐사 자료를 기하학적 상수를 이용하여 일단 겉보기 비저항으로 변환한 후 쌍극자 배열이나 변형된 쌍극자 배열 자료로 보간 혹은 재샘플링함으로써 기존의 접지식 전기비저항 역산 알고리듬을 이용하여 해석하였는데, 동일 측선에서 수행한 접지식 및 비접지식 탐사 자료와 비교하여 그 타당성을 검증하였다. 비접지식 전기비저항 탐사법은 전류를 많이 주입할 수 없는 기기 상의 단점을 갖고 있음을 알 수 있었는데, 특히 전기비저항이 낮은 곳이나, 전기적 잡음이 심한 곳, 그리고 송수신 안테나의 접촉이 좋지 않은 지역에 적용함에 있어 세심한 주의가 요구된다. 그러나, 송수신 안테나를 일렬로 배열하여 견인함으로써 연속적으로 탐사 자료를 획득할 수 있고 전극 설치가 불가능한 지역에서 전기비저항 탐사를 수행할 수 있으므로, 신속하게 지하 천부에 대한 전기비저항 분포를 알고자 할 때 유용하게 쓰일 것으로 생각된다.