• Title/Summary/Keyword: 지역 데이터

Search Result 4,665, Processing Time 0.035 seconds

Local Clustering for Multidimensional Data (다차원 데이터의 일부 차원을 반영한 지역 클러스터링)

  • Lee, Sun-A;Hwang, Kyung-Soon;Lee, Keon-Myung;Lee, Chan-Hee
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.17-18
    • /
    • 2008
  • 다차원 데이터들에 대한 거리기반 클러스터링에서는 데이터의 전체 차원을 고려한 거리 정보를 이용하여 근접한 것들을 인접하게 만든다. 마이크로어레이 데이터의 경우에는 일부 차원 관점에서 유사한 지역 클러스터를 찾는 것이 분석에서 유용한 경우가 있다. 이 논문에서는 마이크로어레이 데이터에 대한 지역 클러스터를 찾는 방법을 제안한다.

  • PDF

Design of Twitter data collection system for regional sentiment analysis (지역별 감성 분석을 위한 트위터 데이터 수집 시스템 설계)

  • Choi, Kiwon;Kim, Hee-Cheol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.10a
    • /
    • pp.506-509
    • /
    • 2017
  • Opinion mining is a way to analyze the emotions in the text and is used to identify the emotional state of the author and to find out the opinions of the public. As you can analyze individual emotions through opinion mining, if you analyze the text by region, you can find out the emotional state you have in each region. The regional sentiment analysis can obtain information that could not be obtained from personal sentiment analysis, and if a certain area has emotions, it can understand the cause. For regional sentiment analysis, we need text data created by region, so we need to collect data through Twitter crawling. Therefore, this paper designs a Twitter data collection system for regional sentiment analysis. The client requests the tweet data of the specific region and time, and the server collects and transmits the requested tweet data from the client. Through the latitude and longitude values of the region, it collects the tweet data of the area, and it can manage the text by region and time through collected data. We expect efficient data collection and management for emotional analysis through the design of this system.

  • PDF

Covid 19 News Data Analysis and Visualization

  • Hur, Tai-Sung;Hwang, In-Yong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.4
    • /
    • pp.37-43
    • /
    • 2022
  • In this paper, we calculate the word frequency by date and region using news data related to COVID-19 distributed for about 8 months from December 2019 to July 2020, and visualized the correlation with the current state data of COVID-19 patients using the results. News data was collected from Big Kids, a news big data system operated by the Korea Press Promotion Foundation. The visualization system proposed in this paper shows the news frequency of the selected region compared to the overall region, the key keyword of the selected region, the region of the main keyword, and the date change of the selected region. Through this visualization, the main keywords and trends of COVID-19 confirmed and infected people can be identified for previous events.

Ensemble Learning of Region Based Classifiers (지역 기반 분류기의 앙상블 학습)

  • Choe, Seong-Ha;Lee, Byeong-U;Yang, Ji-Hun;Kim, Seon-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.267-270
    • /
    • 2007
  • 기계학습에서 분류기들의 집합으로 구성된 앙상블 분류기는 단일 분류기에 비해 정확도가 높다는 것이 입증되었다. 본 논문에서는 새로운 앙상블 학습으로서 데이터의 지역 기반 분류기들의 앙상블 학습을 제시하여 기존의 앙상블 학습과의 비교를 통해 성능을 검증하고자 한다. 지역 기반 분류기의 앙상블 학습은 데이터의 분포가 지역에 따라 다르다는 점에 착안하여 학습 데이터를 분할하고 해당하는 지역에 기반을 둔 분류기들을 만들어 나간다. 이렇게 만들어진 분류기들로부터 지역에 따라 가중치를 둔 투표를 하여 앙상블 방법을 이끌어낸다. 본 논문에서 제시한 앙상블 분류기의 성능평가를 위해 UCI Machine Learning Repository에 있는 11개의 데이터 셋을 이용하여 단일 분류기와 기존의 앙상블 분류기인 배깅과 부스팅등의 정확도를 비교하였다. 그 결과 기본 분류기로 나이브 베이즈와 SVM을 사용했을 때 새로운 앙상블 방법이 다른 방법보다 좋은 성능을 보이는 것을 알 수 있었다.

  • PDF

A SLA negotiation mechanism to facilitate load balancing in a cloud infrastructure consisting of geographically distributed data centers (지역적 분산 데이터센터 환경에서 부하 분산을 촉진하기 위한 SLA 협상 메커니즘 기반의 클라우드 컴퓨팅)

  • Son, Seok-Ho;Jung, Gi-Hun;Jun, Sung-Chan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.239-241
    • /
    • 2012
  • 최근 클라우드 서비스 공급자들은 세계적으로 증가하는 고객의 수요에 대응하기 위하여, 다양한 지역에 데이터센터들을 구축하고 시스템의 규모를 확장시키고 있다. 클라우드는 통합된 자원을 이용하기 때문에 부하 분산(load balancing)을 통해서 시스템의 성능 및 안정성을 향상시킬 수 있다. 하지만 지역적으로 분산된 데이터센터들을 운영하는 클라우드 컴퓨팅 환경에서는 자원 부하의 분산과 서비스 응답 속도(service response time) 사이의 상관 관계를 고려할 필요가 있다. 그럼에도 불구하고 대부분의 클라우드 서비스 공급자들은 고정된 최소 서비스 응답 속도를 서비스 수준 협약(SLA: Service-Level Agreements)을 제시하고 있는 현실이다. 이와 같이 SLA에 최소 서비스 응답 속도를 임의로 고정할 경우, 거리차이가 있는 데이터센터(SLA에 명시된 응답 속도 보다 느린 데이터센터)에는 부하가 분산되기 어렵다. 따라서 지역적으로 분산된 데이터센터 환경에서는 응답 속도에 대한 가변 SLA를 적용할 필요가 있다. 본 연구에서는 지역적으로 분산된 데이터센터를 운영하는 클라우드 컴퓨팅 환경에서 가변 응답 속도를 적용하기 위한 방법으로써 서비스 응답 속도와 가격을 고려한 자동화된 SLA 협상 메커니즘을 적용하고 그 유효성을 평가하였다. 시뮬레이션을 이용한 실험 결과를 통해서 SLA 협상을 통한 가변 SLA를 이용하는 방법이 고정된 SLA를 이용하는 방법에 비해서 더 높은 SLA 보장률을 지원하고 클라우드 공급자에게 더 높은 수익을 제공함을 확인하였다.

Archaeomagnetic Study of Historic Sites in Chungcheong Region Regional Difference of Geomagnetic Field and Issues on Reliability of Data (충청지역 유적에 대한 고고지자기학적 연구 지자기의 지역적인 차이와 데이터의 신뢰도 문제를 중심으로)

  • Sung, Hyong Mi
    • Korean Journal of Heritage: History & Science
    • /
    • v.41 no.1
    • /
    • pp.21-33
    • /
    • 2008
  • In this study, the researcher examined archaeomagnetic secular variation of Chungcheong Region through measured data of archaeomagnet obtained from 34 relics, which discovered in the baked earth from varied historic sites within the region. Furthermore, the researcher closely reviewed regional differences of geomagnetic field in the domestic territory. Reviewing the comparison between the measured data of archaeomagnet in Chungcheong Region and the archaeomagnetic secular variation of Japan, which has difference in distance, it reveals a noticeable change in declination by tilting more than 10 degree toward East in the year of about A.D. 300, although the feature of whole variation is quite similar. In other period of times, it was confirmed that the regional differences of geomagnetic field in which the magnetic dip became deeper to some degree, and the declination was tilted westward a little bit. Such patterns do not differ significantly from the pattern of entire archaeomagnetic secular variation of our country, and even in the direct comparison to the data of Chungcheong Region, the distinct regional difference in both periods before and after Christian era was not confirmed. The fact may become clearer that, when the volume of the measured data of archaeomagnet increases further, and when more data connected with varied time period are filled, the problem such as deviation of the measurement period of archaeomagnet caused by the regional difference of geomagnetic field would not be worrisome issue, especially in Korean territory, judging from the measured data of archaeomagnet of historic relics in Chungcheong Region. Besides, as great efforts are being exerted in order to get the most reliable measured data as much as possible in taking both samples and measurement, it is thought that there would be no problem not only in the issue of deviation of the measurement period involving with the measured data of archeomagnet, but also in the aspect of reliability of data.

The Study of Flood Simulations using LiDAR Data (LiDAR 자료를 이용한 홍수 시뮬레이션에 관한 연구)

  • Shim, Jung-Min;Lee, Suk-Bae
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.14 no.4 s.38
    • /
    • pp.53-60
    • /
    • 2006
  • The purpose of this paper is forcasting of flooding area using LiDAR surveying data, and flood map for damage prevention is established for this purpose. Teahwa river at Ulsan city was chosen as test area and the flood simulation was produced in this area. For the flood simulation, each DEM using LiDAR data and digital map was established and then HEC model program and MIKE program was used to decide the amount of flood flowing and flood height. To improve the rainfall-overflow simulation confidence using inspection comparison of LiDAR data this paper analyzed and compared the LiDAR DEM accuracy and 1/5000 digital map DEM. The height accuracy is important factor to make flood map, however, LiDAR survey execution of all river area is not economic so, LiDAR survey execution of only important area is possible to be make high accuracy and economic flood map. The expectation effect of flood simulation is flood damage prevention and economic savings of recovery cost by forcasting of rainfall-overflow area and establishment of counter-measure.

  • PDF

Visualization of Local Eating-Out Trend Using AR Graph (증강현실 그래프를 이용한 지역별 외식 성향 시각화)

  • Kim, Sang-Joon;Ko, Yu-Jin;Park, Goo-Man;Choi, Yoo-Joo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.700-701
    • /
    • 2019
  • 본 논문에서는 지역 데이터의 시각화에 적합한 증강현실 그래프를 제안하고, 이를 카드 사용 빅데이터에 적용하여 지역별 외식 성향 시각화 도구로 활용한 사례를 제시한다. 증강현실 그래프는 사용자가 위치한 해당 지역의 GPS 정보를 기반으로 빅데이터에서 분석 대상 지역을 선별하고, 지역별 특수 데이터를 찾아내어 해당 지역에 대한 빅데이타 분석 내용을 카메라 영상과 함께 시각화한 그래프이다. 증강현실 그래프를 적용한 외식 성향 시각화 사례에서는 카드 사용 가맹점 소재지 정보, 가맹점 업종, 카드사용시점(월), 카드 사용자 성별구분, 연령대, 월 카드사용금액 및 월 사용 건수 정보등을 수집하였다. 그리고, 분석 대상 지역에 대한 연령대별 외식 선호도 내용을 카드사용건수가 많은 업종별 순위 그래프로 시각화 하여 사용자의 위치에서 확인할 수 있도록 하였다. 제안 증강현실 그래프는 지역별 상권 현황, 아파트 시세 등에 효과적으로 적용될 수 있을 것으로 기대된다.

Flood monitoring and prediction using online unstructured data (비정형데이터를 활용한 홍수 모니터링 및 예측)

  • Lee, Jeong Ha;Hwang, Seok Hwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.118-118
    • /
    • 2019
  • 현재 홍수예보는 정형데이터인 유량 및 수위 등을 활용하여 이뤄지고 있다. 하지만 실제 사람들이 체감하는 홍수에 대한 위험도는 홍수예보 발령과는 달라 홍수예보가 이뤄지지 않은 지역에서 인명사고가 발생하기도 한다. 이는 수위 측정이 이뤄지지 않는 소규모 하천이나 사람들의 유동성이 큰 도심지역에서 빈번하게 발생한다. 이를 보완하기 위해서는 사람들의 체감 정도 및 인구의 유동성을 고려한 비정형데이터를 활용해야 한다. 특히 소셜 네트워크 서비스(Social Network Commuinty, SNS)를 사용하는 사람들이 많아지면서 기존에 사용되어 왔던 정형데이터 센서 이외의 데이터를 제공한다. 또한 개개인이 작성하는 글은 실시간으로 활용이 가능하여 인구의 유동성 및 시 공간적 데이터를 얻기에 유용하여 활용성이 매우 높은 비정형데이터이다. 따라서 본 연구에서는 SNS 데이터를 추출하고 이를 분석하여 2018년에 발생했던 강우사상과의 패턴을 비교하여 홍수예보에서의 활용성을 분석하였다. 홍수와 관련한 키워드를 중심으로 시 공간적 정보 및 추출이 가능한 웹 크롤러(Web Crawler) 프로그램을 작성하였으며 이를 토대로 데이터를 수집하였다. 수집한 데이터와 실제 홍수사상을 비교 분석을 한 결과 강우량 및 수위와 해당 지역에 대한 데이터의 양이 유사한 패턴을 보인 것으로 확인되었다. 실시간으로 데이터를 수집하고 이를 분석하여 리드타임을 충분히 확보한다면 홍수예측에 활용 가능할 것이라 생각된다. 본 연구는 한국건설기술연구원 19주요-대4-시드사업인 '커뮤니티 빅데이터 패턴 해석을 통한 수난(水難) 발생 및 규모 예측 기술 개발(20190126-001) '로 수행되었습니다.

  • PDF

Regionalized TSCH Slotframe-Based Aerial Data Collection Using Wake-Up Radio (Wake-Up Radio를 활용한 지역화 TSCH 슬롯프레임 기반 항공 데이터 수집 연구)

  • Kwon, Jung-Hyok;Choi, Hyo Hyun;Kim, Eui-Jik
    • Journal of Internet of Things and Convergence
    • /
    • v.8 no.2
    • /
    • pp.1-6
    • /
    • 2022
  • This paper presents a regionalized time slotted channel hopping (TSCH) slotframe-based aerial data collection using wake-up radio. The proposed scheme aims to minimize the delay and energy consumption when an unmanned aerial vehicle (UAV) collects data from sensor devices in the large-scale service area. To this end, the proposed scheme divides the service area into multiple regions, and determines the TSCH slotframe length for each region according to the number of cells required by sensor devices in each region. Then, it allocates the cells dedicated for data transmission to the TSCH slotframe using the ID of each sensor device. For energy-efficient data collection, the sensor devices use a wake-up radio. Specifically, the sensor devices use a wake-up radio to activate a network interface only in the cells allocated for beacon reception and data transmission. The simulation results showed that the proposed scheme exhibited better performance in terms of delay and energy consumption compared to the existing scheme.