• 제목/요약/키워드: big data service

검색결과 1,019건 처리시간 0.03초

빅데이터 분석 기반의 정보 검색을 위한 웹 크롤러 서비스 구현 (Web Crawler Service Implementation for Information Retrieval based on Big Data Analysis)

  • 김희숙;한나;임숙자
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.933-942
    • /
    • 2017
  • 본 논문에서는 대학생 및 취업준비생의 대외활동, 공모전, 장학금에 대한 효율적인 정보 수집을 위한 웹 크롤러 서비스 방식을 제안한다. 제안된 웹 크롤러 서비스는 빠른 속도로 크롤링하면서 중복해서 크롤링되는 문제를 회피하기 위하여 Jsoup 트리 분석과 Json 형식의 데이터 전송 방식을 이용하였다. 24시간 동안 관련 정보를 수집한 결과 100%의 정확도로 웹 크롤러 서비스가 실행되고 있음을 확인할 수 있었다. 향후 제안된 웹 크롤러 서비스를 적용할 수 있는 웹 페이지 범위를 확대하여 다양한 웹 사이트에 동시에 적용할 수 있도록 개선하면 웹 크롤러 서비스의 양적 내용을 보충할 수 있을 것으로 기대한다.

생체신호 습득과 건강 모니터링을 위한 스마트 헬스케어 의복 개발 (Development of Smart Healthcare Wear System for Acquiring Vital Signs and Monitoring Personal Health)

  • 주문일;고동희;김희철
    • 한국멀티미디어학회논문지
    • /
    • 제19권5호
    • /
    • pp.808-817
    • /
    • 2016
  • Recently, the wearable computing technology with bio-sensors has been rapidly developed and utilized in various areas such as personal health, care-giving for senior citizens who live alone, and sports activities. In particular, the wearable computing equipment to measure vital signs by means of digital yarns and bio sensors is noticeable. The wearable computing devices help users monitor and manage their health in their daily lives through the customized healthcare service. In this paper, we suggest a system for monitoring and analyzing vital signs utilizing smart healthcare clothing with bio-sensors. Vital signs that can be continuously acquired from the clothing is well-known as unstructured data. The amount of data is huge, and they are perceived as the big data. Vital sings are stored by Hadoop Distributed File System(HDFS), and one can build data warehouse for analyzing them in HDFS. We provide health monitoring system based on vital sings that are acquired by biosensors in smart healthcare clothing. We implemented a big data platform which provides health monitoring service to visualize and monitor clinical information and physical activities performed by the users.

빅데이터 연구동향 분석: 토픽 모델링을 중심으로 (Research Trends Analysis of Big Data: Focused on the Topic Modeling)

  • 박종순;김창식
    • 디지털산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.1-7
    • /
    • 2019
  • The objective of this study is to examine the trends in big data. Research abstracts were extracted from 4,019 articles, published between 1995 and 2018, on Web of Science and were analyzed using topic modeling and time series analysis. The 20 single-term topics that appeared most frequently were as follows: model, technology, algorithm, problem, performance, network, framework, analytics, management, process, value, user, knowledge, dataset, resource, service, cloud, storage, business, and health. The 20 multi-term topics were as follows: sense technology architecture (T10), decision system (T18), classification algorithm (T03), data analytics (T17), system performance (T09), data science (T06), distribution method (T20), service dataset (T19), network communication (T05), customer & business (T16), cloud computing (T02), health care (T14), smart city (T11), patient & disease (T04), privacy & security (T08), research design (T01), social media (T12), student & education (T13), energy consumption (T07), supply chain management (T15). The time series data indicated that the 40 single-term topics and multi-term topics were hot topics. This study provides suggestions for future research.

Characteristics on Big Data of the Meteorology and Climate Reported in the Media in Korea

  • Choi, Jae-Won;Kim, Hae-Dong
    • Quantitative Bio-Science
    • /
    • 제37권2호
    • /
    • pp.91-101
    • /
    • 2018
  • This study has analyzed applicable characteristics on big data of the meteorology and climate depending on press releases in the media. As a result, more than half of them were conducted by governmental departments and institutions (26.9%) and meteorological administration (25.0%). Most articles were written by journalists, especially the highest portion stems from straight articles focusing on delivering simple information. For each field, the number of cases had listed in order of rank to be exposed to the media; information service, business management, farming, livestock, and fishing industries, and disaster management, but others did rank far behind; insurance, construction, hydrology and energy. Application of big data about meteorology and climate differed depending on the seasonal change, it was directly related to temperature information during spring, to weather phenomenon such as monsoon and heat wave during summer, to meteorology and climate information during fall, and to weather phenomenon such as cold wave and heavy snow during winter.

빅데이터 분석결과에 대한 해석 : 브랜드 인지도와 선호도를 중심으로 (The Interpretation of Results from Big Data Analysis : Focusing on Brand Awareness and Preference)

  • 김도관
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.117-119
    • /
    • 2016
  • 빅데이터 분석 결과를 제공하는 사이트들은 분석 결과에 있어 단순한 수치결과만을 제시해주고 있으며, 그 결과에 대한 사회현상 및 트랜드에 대한 해석을 제공하지는 않고 있다. 이러한 점에서 본 연구에서는 빅데이터 분석 결과의 검토를 통해서 브랜드와 선호도를 파악하는 방법을 통하여 빅데이터 분석결과에 대한 해석 방법을 제시하고 한다.

  • PDF

공공데이터 인프라기반 b-Traffic 서비스 플랫폼 연구 (A Study on b-Traffic Service Platform based on Open data Infrastructure)

  • 손석현;송석현;신효섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.117-118
    • /
    • 2014
  • 최근 공공기관의 공공데이터 제공이 활성화 되고 있으며, 이를 활용한 응용서비스에 대한 요구도 증가하고 있는 추세이다. 현재 교통정보예측 플랫폼은 실시간 교통정보 또는 과거 교통정보이력을 분석하여 미래의 교통량이나 도착시간정보를 제공하고 있으나 날씨, 사고 등과 같은 미래 교통정보에 즉각적인 영향을 줄 수 있는 요소를 배제하고 있어 높은 신뢰도를 확보하기 어렵다. 본 논문에서는 교통정보예측에 영향을 주는 요소인 기상, 사고, 교통정보와 같은 공공데이터를 효율적으로 수집 저장 처리할 수 있는 저장방식 및 신뢰도 높은 교통정보를 예측할 수 있는 예측기술이 포함된 b-Traffic 서비스 플랫폼을 제시한다.

  • PDF

과학빅데이터 고속전송을 위한 ScienceDMZ 구축 방안 연구 (A Study on ScienceDMZ Construction for High Speed Transfer of Science Big Data)

  • 문정훈;곽재승;홍원택;김기현;이상권;김동균;김용환;유기성
    • KNOM Review
    • /
    • 제22권2호
    • /
    • pp.12-21
    • /
    • 2019
  • 과학빅데이터 실험 장비와 ICT 기술의 비약적인 발전으로 엑사바이트 이상 규모의 데이터가 생성되고 있으나, 이러한 빅데이터를 전송하는 기술은 응용과학연구자의 요구에 맞는 수준에 이르지 못하고 있다. 과학빅데이터에 대한 고성능 데이터 전송을 위하여 QoS(Quality of Service) 기반의 다양한 기술이 개발되고 있지만, 기반이 되는 인프라 네트워크의 전반적인 변경을 요구하기도 한다. 반면 ScienceDMZ 기술은 전송 성능에 큰 지장을 초래하는 방화벽을 우회함으로써, 과학빅데이터 전송 성능 향상을 도모하며, 또한 기존 네트워크의 큰 변화 없이 구현이 가능하다. 본 논문에서는, KREONET(국가과학기술연구망) 기반의 국제간 장거리 환경에서 과학빅데이터 고속 전송을 통하여 ScienceDMZ를 구축하고 성능을 검증하였다. 또한, ScienceDMZ의 확장으로써, GPU 플랫폼을 분산 환경에서 연계하는 방안을 소개하고자 한다.

인간 친화적 로봇 서비스를 위한 대용량 분산 처리 기술 및 사용자 인증에 관한 연구 (A Study on Distributed Processing of Big Data and User Authentication for Human-friendly Robot Service on Smartphone)

  • 최옥경;정우열;이봉규;문승빈
    • 인터넷정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.55-61
    • /
    • 2014
  • 현재 기업에서는 다양한 인간 친화적 로봇 서비스와 인터넷을 이용해 IT 자원을 필요한 만큼 빌려 쓰는 컴퓨팅 패러다임인 모바일 클라우드 컴퓨팅을 이용한 업무 처리 프로세스가 활발히 진행되고 있다. 그러나 모바일 클라우드 컴퓨팅 접속시 필요한 인증 서비스와 대용량 분산 처리 기술에 대한 부분은 현재 많은 취약점들을 내포하고 있는 실정이다. 본 연구에서는 모바일 클라우드 컴퓨팅 모델의 인증 서비스 취약점을 분석하고 이러한 문제점을 개선시킨 모바일 클라우드 컴퓨팅 모델을 구축하여 효율적이고 안전한 업무 처리 프로세스가 가능하도록 하고자 한다. 제안하는 모바일 클라우드 컴퓨팅 모델은 실시간 비정형 데이터를 분석하고 처리하는 기술에 대한 연구를 함께 진행함으로써 향후 비정형 데이터를 활용한 개개인 맞춤 정보 제공 서비스가 가능하다.

활동기반 교통모형 분석자료 구축을 위한 소셜네트워크 공간빅데이터 활용방안 연구 (A Study on the Application of Spatial Big Data from Social Networking Service for the Operation of Activity-Based Traffic Model)

  • 김승현;김주영;이승재
    • 한국ITS학회 논문지
    • /
    • 제15권4호
    • /
    • pp.44-53
    • /
    • 2016
  • 오늘날 우리 주변에는 규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 '빅데이터(Big Data)'의 시대가 도래 하였으며, 그 중요성이 날로 커지고 있다. 교통분야에서는 전통적인 통행기반교통모형(Trip-Based Model)인 4단계 교통수요추정법의 한계가 드러나고 있으며, 활동기반교통모형(Activity-Based Model)을 이용한 수요 추정 방법이 교통계획에 새로운 패러다임으로 떠오르고 있다. 교통은 사람이나 물류의 공간상의 시간적 이동을 의미한다고 봤을 때 공간데이터와 밀접한 관련이 있다. 따라서 공간정보를 포함하고 있는 SNS를 대상으로 시계열적 공간정보를 추출하고, 이를 현재의 통행기반교통모형(Trip-Based Model) O/D와 비교 분석하여 그 특성을 파악하고 유용성을 검증하였다. 또한, 활동기반교통모형(Activity-Based Model)의 분석자료를 구축하여 교통시뮬레이터 프로그램을 이용해 시뮬레이션을 수행하고 그 결과를 고찰하였다. 연구결과 다수의 활동기반 교통모형 분석자료를 구축할 수 있었으며, 이번 연구를 통해 교통분야 빅데이터 활용의 기술적 한계를 극복할 수 있는 가능성을 확인하였고, 향후 발전방향을 모색하는 기회가 되었다.

진료비 고가도 지표의 한계와 개선 방향 (Limitations and Improvement of Using a Costliness Index)

  • 장호연;강민석;정서현;이상아;강길원
    • 보건행정학회지
    • /
    • 제32권2호
    • /
    • pp.154-163
    • /
    • 2022
  • Background: The costliness index (CI) is an index that is used in various ways to improve the quality of medical care and the management of appropriate treatment in medical institutions. However, the current calculation method for CI has a limitation in reflecting the actual medical cost of the patient unit because the outpatient and inpatient costs are evaluated separately. It is desirable to calculate the CI by integrating the medical cost into the episode unit. Methods: We developed an episode-based CI method using the episode classification system of the Centers for Medicare and Medicaid Services to the National Inpatient Sample data in Korea, which can integrate the admission and ambulatory care cost to episode unit. Additionally, we compared our new method with the previous method. Results: In some episodes, the correlation between previous and episode-based CI was low, and the proportion of outpatient treatment costs in total cost and readmission rates are high. As a result of regression analysis, it is possible that the level of total medical costs of the patient unit in low volume medical institute and rural area has been underestimated. Conclusion: High proportion of outpatient treatment cost in total medical cost means that some medical institutions may have provided medical services in the ambulatory care that are ancillary to inpatient treatment. In addition, a high readmission rate indicates insufficient treatment service for inpatients, which means that previous CI may not accurately reflect actual patient-based treatment costs. Therefore, an integrated patient-unit classification system which can be used as a more effective CI indicator is needed.