• 제목/요약/키워드: Big Data Environment

검색결과 959건 처리시간 0.04초

도시 열환경 분석을 위한 공간정보 빅데이터 구축 (Construction of Spatial Information Big Data for Urban Thermal Environment Analysis)

  • 이준호;윤성환
    • 대한건축학회논문집:계획계
    • /
    • 제36권5호
    • /
    • pp.53-58
    • /
    • 2020
  • The purpose of this study is to build a database of Spatial information Bigdata of cities using satellite images and spatial information, and to examine the correlations with the surface temperature. Using architectural structure and usage in building information, DEM and Slope topographical information for constructed with 300 × 300 mesh grids for Busan. The satellite image is used to prepare the Normalized Difference Built-up Index (NDBI), Normalized Difference Vegetation Index (NDVI), Bare Soil Index (BI), and Land Surface Temperature (LST). In addition, the building area in the grid was calculated and the building ratio was constructed to build the urban environment DB. In architectural structure, positive correlation was found in masonry and concrete structures. On the terrain, negative correlations were observed between DEM and slope. NDBI and BI were positively correlated, and NDVI was negatively correlated. The higher the Building ratio, the higher the surface temperature. It was found that the urban environment DB could be used as a basic data for urban environment analysis, and it was possible to quantitatively grasp the impact on the architecture and urban environment by adding local meteorological factors. This result is expected to be used as basic data for future urban environment planning and disaster prevention data construction.

빅데이터 분석을 활용한 사물인터넷 키워드에 관한 조망 (An Insight Study on Keyword of IoT Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.146-147
    • /
    • 2017
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2017년 10월 8일 시점 1개월 기간을 설정하여 "사물인터넷" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 사물인터넷 키워드에 대한 1위 연관 검색어는 기술(995)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

빅데이터를 활용한 폐교시설의 지표 개발에 관한 연구 -텍스트마이닝 기법을 중심으로- (A Study on the Development of the Use Index of Closed School Facilities Using Big Data -Focused on Text-Mining Techniques-)

  • 김재영;이종국
    • 교육녹색환경연구
    • /
    • 제18권2호
    • /
    • pp.1-11
    • /
    • 2019
  • 본 연구는 지속적으로 증가가 예상되는 폐교시설의 효율적인 활용을 위하여 활용지표의 개발을 통해 폐교 활용 시 객관적인 의사결정을 위한 목적을 가진다. 연구 단계는 크게 폐교 활용 예비지표 도출, 빅데이터를 활용한 최종지표 도출, 지표의 정량화 단계로 구분하여 진행하였으며, 최종적으로 지표를 정량화함으로써 객관화하였다. 향후 지표를 기준으로 시설에 적용 및 검증하고자 한다. 본 연구는 지금까지 폐교시설의 활용을 위한 계획 및 연구에 있어서 시도되지 않았던 빅데이터 분석기법을 적용한 것에 그 의의가 있다.

금융산업의 빅데이터 경영 사례에 관한 연구: 은행의 빅데이터 활용 조직 및 프로세스를 중심으로 (A Study on Big Data-Driven Business in the Financial Industry: Focus on the Organization and Process of Using Big Data in Banking Industry)

  • 김규배;김용철;김문섭
    • 아태비즈니스연구
    • /
    • 제15권1호
    • /
    • pp.131-143
    • /
    • 2024
  • Purpose - The purpose of this study was to analyze cases of big data-driven business in the financial industry, focusing on organizational structure and business processes using big data in banking industry. Design/methodology/approach - This study used a case study approach. To this end, cases of two banks implementing big data-driven business were collected and analyzed. Findings - There are two things in common between the two cases. One is that the central tasks for big data-driven business are performed by a centralized organization. The other is that the role distribution and work collaboration between the headquarters and business departments are well established. On the other hand, there are two differences between the two banks. One marketing campaign is led by the headquarters and the other marketing campaign is led by the business departments. The two banks differ in how they carry out marketing campaigns and how they carry out big data-related tasks. Research implications or Originality - When banks plan and implement big data-driven business, the common aspects of the two banks analyzed through this case study can be fully referenced when creating an organization and process. In addition, it will be necessary to create an organizational structure and work process that best fit the special situation considering the company's environment or capabilities.

빅데이터 분산처리시스템의 품질평가모델 (A Quality Evaluation Model for Distributed Processing Systems of Big Data)

  • 최승준;박제원;김종배;최재현
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.533-545
    • /
    • 2014
  • IT기술이 발전함에 따라, 우리가 접하는 데이터의 양은 기하급수적으로 늘어나고 있다. 이처럼 방대한 데이터들을 분석하고 관리하기 위한 기술로 등장한 것이 빅데이터 분산처리시스템이다. 기존 분산처리시스템에 대한 품질평가는 정형 데이터 중심의 환경을 바탕으로 이루어져 왔다. 그러므로, 이를 비정형 데이터 분석이 핵심인 빅데이터 분산처리시스템에 그대로 적용시킬 경우, 정확한 품질평가가 이루어질 수 없다. 따라서, 빅데이터 분석 환경을 고려한 분산처리시스템의 품질평가모델에 대한 연구가 필요하다. 본 논문에서는 소프트웨어 품질에 관한 국제 표준인 ISO/IEC9126에 근거하여 빅데이터 분산처리 시스템에서 요구되는 품질평가 요소를 도출하고, 이를 측정하기 위한 메트릭을 정의함으로써 새로이 품질평가모델을 제안한다.

빅데이터를 활용한 음식관광관련 의미연결망 분석의 탐색적 적용 (An Exploratory Study on the Semantic Network Analysis of Food Tourism through the Big Data)

  • 김학선
    • 한국조리학회지
    • /
    • 제23권4호
    • /
    • pp.22-32
    • /
    • 2017
  • The purpose of this study was to explore awareness of food tourism using big data analysis. For this, this study collected data containing 'food tourism' keywords from google web search, google news, and google scholar during one year from January 1 to December 31, 2016. Data were collected by using SCTM (Smart Crawling & Text Mining), a data collecting and processing program. From those data, degree centrality and eigenvector centrality were analyzed by utilizing packaged NetDraw along with UCINET 6. The result showed that the web visibility of 'core service' and 'social marketing' was high. In addition, the web visibility was also high for destination, such as rural, place, ireland and heritage; 'socioeconomic circumstance' related words, such as economy, region, public, policy, and industry. Convergence of iterated correlations showed 4 clustered named 'core service', 'social marketing', 'destinations' and 'social environment'. It is expected that this diagnosis on food tourism according to changes in international business environment by using these web information will be a foundation of baseline data useful for establishing food tourism marketing strategies.

빅데이터 분석 도구 R을 이용한 비정형 데이터 텍스트 마이닝과 시각화 (Text Mining and Visualization of Unstructured Data Using Big Data Analytical Tool R)

  • 남수태;신성윤;진찬용
    • 한국정보통신학회논문지
    • /
    • 제25권9호
    • /
    • pp.1199-1205
    • /
    • 2021
  • 빅데이터 시대에는 단순히 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 실시간 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 빅데이터를 효과적으로 분석하는 것이 매우 중요하다. 빅데이터 분석은 데이터 저장소에 저장된 빅데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다. 빅데이터 분석 도구인 R 언어를 이용하여 비정형 논문 데이터를 빈도분석을 통해 분석결과를 요약과 시각화하고자 한다. 본 연구에서 사용된 데이터는 한국정보통신학회 학회지 논문 중에서 2021년 1월호-5월호 총 논문 104편을 대상으로 분석하였다. 최종 분석결과 가장 많이 언급된 키워드는 "데이터"가 1,538회로 1위를 차지하였다. 따라서 분석결과를 바탕으로 연구의 한계와 이론적 실무적 시사점을 제시하고자 한다.

소셜네트워크서비스 기반 데이터를 이용한 빅데이터 분석 (Big Data Analysis Using on Based Social Network Service Data)

  • 남수태;신성윤;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.165-166
    • /
    • 2019
  • 빅데이터 분석은 기존 데이터베이스 관리 도구로부터 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 말한다. 빅데이터는 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터뿐만 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 빅데이터는 기존 방식으로는 관리와 분석이 어려운 데이터를 의미하며, 거대한 크기(Volume), 다양한 형태(Variety), 빠른 생성 및 유통속도(Velocity)의 특징을 가지고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 가치 창출을 위한 노력을 기하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석도구인 소셜 매트릭스를 활용하여 키워드 의미를 분석하였다. 또한, 분석결과를 바탕으로 이론적 실무적 시사점을 제시하고자 한다.

  • PDF

Characteristics on Big Data of the Meteorology and Climate Reported in the Media in Korea

  • Choi, Jae-Won;Kim, Hae-Dong
    • Quantitative Bio-Science
    • /
    • 제37권2호
    • /
    • pp.91-101
    • /
    • 2018
  • This study has analyzed applicable characteristics on big data of the meteorology and climate depending on press releases in the media. As a result, more than half of them were conducted by governmental departments and institutions (26.9%) and meteorological administration (25.0%). Most articles were written by journalists, especially the highest portion stems from straight articles focusing on delivering simple information. For each field, the number of cases had listed in order of rank to be exposed to the media; information service, business management, farming, livestock, and fishing industries, and disaster management, but others did rank far behind; insurance, construction, hydrology and energy. Application of big data about meteorology and climate differed depending on the seasonal change, it was directly related to temperature information during spring, to weather phenomenon such as monsoon and heat wave during summer, to meteorology and climate information during fall, and to weather phenomenon such as cold wave and heavy snow during winter.

Sequential Pattern Mining for Intrusion Detection System with Feature Selection on Big Data

  • Fidalcastro, A;Baburaj, E
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.5023-5038
    • /
    • 2017
  • Big data is an emerging technology which deals with wide range of data sets with sizes beyond the ability to work with software tools which is commonly used for processing of data. When we consider a huge network, we have to process a large amount of network information generated, which consists of both normal and abnormal activity logs in large volume of multi-dimensional data. Intrusion Detection System (IDS) is required to monitor the network and to detect the malicious nodes and activities in the network. Massive amount of data makes it difficult to detect threats and attacks. Sequential Pattern mining may be used to identify the patterns of malicious activities which have been an emerging popular trend due to the consideration of quantities, profits and time orders of item. Here we propose a sequential pattern mining algorithm with fuzzy logic feature selection and fuzzy weighted support for huge volumes of network logs to be implemented in Apache Hadoop YARN, which solves the problem of speed and time constraints. Fuzzy logic feature selection selects important features from the feature set. Fuzzy weighted supports provide weights to the inputs and avoid multiple scans. In our simulation we use the attack log from NS-2 MANET environment and compare the proposed algorithm with the state-of-the-art sequential Pattern Mining algorithm, SPADE and Support Vector Machine with Hadoop environment.