• 제목/요약/키워드: 공간 빅 데이터

검색결과 307건 처리시간 0.023초

디지털 리터러시에 기반한 디지털 기기 활용방안 연구 (A Study on the Usage of Digital Device Based on Digital Literacy)

  • 고학능;이영준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.219-222
    • /
    • 2019
  • 4차 산업혁명이 언급되면서 3D 프린터, 로봇, 인공지능, 빅데이터 등 신기술이 발전하고 이는 사회 구조를 변화시킬 것으로 예상된다. 이에 새로운 디지털 기기, 기술들을 이해하는 디지털 리터러시가 중요해지고 있다. 2015 OECD PISA에서 ICT 배경조사 중 한국은 접근성, 활용성 부분과 2018 국가수준 디지털 리터러시 수준 측정연구, 학생들의 디지털 기기의 인식 여부 및 활용 여부 실태조사를 바탕으로 디지털 기기 활용 공간 구성 및 디지털 기기 활용 콘텐츠를 다음과 같이 제안하였다. 먼저 구체적 조작기인 초등학생임을 고려하여 디지털 기기 위주 프로그램으로 선정하였다. 디지털 기기 활용 공간은 기반 기기로 컴퓨터(노트북), 유 무선 인터넷, 디지털 기기로 3D 프린터 및 3D 프린팅 펜, 스마트폰 기반 VR기기, AR마커, 블록코딩 기반 피지컬 컴퓨팅 교구 등을 이용해서 구성하였다. 활용하는 콘텐츠는 학생들의 인식 여부 및 수준에 맞춰 체험 위주의 프로그램과 학습, 콘텐츠 제작, 문제해결 프로그램으로 제시하였다.

  • PDF

공간 데이터 재구축을 통한 음식업종 매출액 영향 요인 분석 : 이종 공간 데이터의 집계단위 변환을 중심으로 (Analyzing Influence Factors of Foodservice Sales by Rebuilding Spatial Data : Focusing on the Conversion of Aggregation Units of Heterogeneous Spatial Data)

  • 노은빈;이상경;이병길
    • 한국측량학회지
    • /
    • 제35권6호
    • /
    • pp.581-590
    • /
    • 2017
  • 이 연구에서는 서울연구원 제공 집계구 자료를 이용하여 유동인구와 공간 특성, 공간자기상관이 음식업종의 매출액에 미치는 영향을 분석한다. 최근 공공 분야의 빅데이터가 증가하고 있지만 자료집계 단위가 달라 연구에 어려움을 야기하는 경우가 많다. 본 연구에서도 종속변수인 매출액은 SKT 집계구 단위로, 공간 특성은 통계청 집계구와 행정동 단위로, 그리고 유동인구는 Point 정보로 구축되어 있다. 분석을 위해 먼저 SKT 집계구 단위로 모든 독립변수의 집계단위를 변환하였다. 공간자기상관 효과를 검정할 수 있는 모형인 SEM을 이용하여 회귀분석을 수행한 결과 매출액에 대한 공간자기상관의 영향이 확인되었으며, 또한 유동인구와 주변 종사자수, 집계 구 면적이 매출액에 정의 영향을 주는 것으로 나타났다. 또한, 강남구에 비해 중구, 영등포구, 송파구 매출액이 더 적은 것으로 나타났다. 이 같은 결과는 유동인구가 많고 주변 종사자수가 많은 지역, 그리고 음식업종 점포들이 몰려있는 지역이 창업에 유리하다는 것을 시사한다. 이 연구는 이종 공간 데이터의 집계단위 변환의 유용성 과 함께 지도상의 면적 비례로 집계단위를 변환하는 것의 한계를 보여줌으로써 후속 연구에 시사점을 제공한다.

GPGPU를 활용한 스파크 기반 공간 연산 (Spatial Computation on Spark Using GPGPU)

  • 손찬승;김대희;박능수
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권8호
    • /
    • pp.181-188
    • /
    • 2016
  • 최근 급격히 증가하는 공간 데이터를 효율적으로 처리하기 위해 많은 연구들이 진행되고 있다. 기존 관계형 데이터베이스 시스템을 확장한 공간 데이터베이스 시스템은 확장성에 대한 문제가 있으며, 분산 처리 플랫폼인 하둡을 확장한 SpatialHadoop은 중간 연산 결과를 디스크에 작성하기 때문에 파일 입출력의 오버헤드로 성능이 저하되는 문제가 있다. 본 논문은 인-메모리 기반 분산 처리 프레임워크인 스파크를 확장한 공간 연산 스파크를 제안하였다. 또한 공간 연산 스파크의 성능을 향상시키기 위하여 GPGPU를 결합한 모델을 개발하였다. 공간 연산 스파크는 중간 연산 결과를 메모리에 유지시키는 스파크의 특징을 그대로 사용하고 있으며, GPGPU 기반 공간 연산 스파크의 경우 다수의 PE를 이용하여 병렬처리하기 때문에 효율적으로 공간 연산을 수행할 수 있다. 본 논문은 단일 AMD 시스템에서 공간 연산 스파크와 GPGPU 기반 공간 연산 스파크를 구현하였다. 공간 연산 스파크와 GPGPU 기반 공간 연산 스파크의 성능을 평가하기 위하여 Point-in-Polygon 연산과 Spatial Join 연산을 수행하였으며, SpatialHadoop에 비하여 최대 8배의 성능 향상을 확인하였다.

임의 접근을 지원하는 간단한 정수 배열 코드 시스템 (A Simple Integer Sequence Code System Supporting Random Access)

  • 이준희;스리니바사 라오 사티
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권10호
    • /
    • pp.594-598
    • /
    • 2017
  • 정수 형태의 배열로 이루어진 데이터가 주식 시장과 같은 원본으로부터 셀 수 없을 정도로 매일 생성되고 있다. 정수 배열을 저장하는 데에 감마 코드, 델타 코드, 피보나치 코드 등을 포함한 범용 코드가 일반적으로 사용된다. 이 배열을 적은 공간을 차지하게 하면서 빠른 시간에 특정 원소에 접근하는 연산을 수행할 수 있게 하려는 시도가 진행되었다. 본 논문에서는 간결한 자료구조의 특성을 활용하여 부호화된 정수 배열에서의 임의 접근을 가능하도록 한 코드 시스템을 제시한다. 이는 코드 시스템에 사용되는 구획 문자 비트열을 압축하면서 질의 수행 시간을 상수 시간에 지원하는 자료구조를 통해 구현되었다. 실험 결과를 통해 범용 코드 시스템보다 더 적은 공간과 시간을 사용해 정수 배열을 표현할 수 있다는 것을 보인다.

현대 소비자의 공간소비행동에 관한 연구 -소셜미디어 데이터 분석을 중심으로- (A Study on Space Consumption Behavior of Contemporary Consumers -Focusing on Analysis of Social Media Big Data-)

  • 안서영;고애란
    • 한국의류학회지
    • /
    • 제44권5호
    • /
    • pp.1019-1035
    • /
    • 2020
  • This study examines the millennial generation, who express themselves and share information on social media after experiencing constantly changing 'hot places' (places of interest) in contemporary cities, with the goal of analyzing space consumption behaviors. Data were collected via an Instagram crawler application developed with Python 3.4 administered to 19,262 posts using the term 'hot places' from November 1 and December 15, 2019. Issues were derived from a text mining technique using Textom 2.0; in addition, semantic network analysis using Ucinet6 and the NetDraw program were also conducted. The results are as follows. First, a frequency analysis of keywords for hot places indicated words frequently found in nouns were related to food, local names, SNS and timing. Words related to positive emotions felt in experience, and words related to behavior in hot places appeared in predicate. Based on importance, communication is the most important keyword and influenced all issues. Second, the results of visualization of semantic network analysis revealed four categories in the scope of the definition of "hot place": (1) culinary exploration, (2) atmosphere of cafés, (3) happy daily life of 'me' expressed in images, (4) emotional photos.

공간 빅데이터를 활용한 중소도시 지역맞춤형 도시재생·유지관리 연구 - 주거지역 집계구를 중심으로 - (A Study on the Regionally Customized Urban Regeneration and Maintenance of Small and Medium Cities Using Spatial Big-Data - Focused on the Residential Census Output Area -)

  • 한다혁;이민석
    • 한국농촌건축학회논문집
    • /
    • 제23권2호
    • /
    • pp.9-16
    • /
    • 2021
  • The purpose of this study is to maintain the existing characteristics of the city by utilizing the physical decline status and floating population in small and medium cities residential areas. In addition, it intends to present the direction of flexible urban regeneration and maintenance by reflecting regional characteristics and current status. A total of three data were used in this study. Building data, floating population data, and census output area data were used. Building data and floating population data were classified into five classes. The graded data were joined to the census output area data and analyzed by overlapping the two data. As a result of analysis of 17 residential areas in 5 small and medium cities in Jeollanam-do, 4 types, 2 management models, and 4 indicators could be presented by grade and regional characteristics. This study is meaningful in that it is possible to plan regionally customized urban regeneration/maintenance management plans and projects through the typology of the current status and characteristics of the region, which is an important step in the bottom-up form.

공간 기반의 개별 차량 대용량 정보 맵핑에 관한 연구 (A Study on Map Mapping of Individual Vehicle Big Data Based on Space)

  • 정규수
    • 한국ITS학회 논문지
    • /
    • 제20권5호
    • /
    • pp.75-82
    • /
    • 2021
  • 국내 2020년 기준 교통사고 건수는 약 23만 건으로, 고속도로는 비반복적 정체와 높은 주행 속도로 인해 다른 도로 대비 교통사고 발생 건수당 사망자수가 2배 이상으로 나타나고 있다. 고속도로의 교통정보는 도로의 중심선을 이용한 노드, 링크를 기준으로 제공하고 있으나 세분화된 속도정보를 주지 못하고 있다. 최근 자율주행차 뿐만 아니라 일반 차량에서도 장애물 모니터링, 위치 측정을 위한 차량용 센서 장착이 일반화되고 있어, 대용량 위치 기반 데이터를 이용한 분석은 처리속도에 따라 실시간 서비스가 가능하다. 본 연구는 대용량 위치기반 개별 차량 정보의 분석을 위한 공간 기반의 맵핑 방법을 제시하였다. 경위도 각각 2개로 분할하는 4진법 기준의 분할 방법을 적용하여 개별 차량의 공간 코드를 생성하여 지오코딩 하는 방법으로 처리 속도를 대폭 증가 시켰다. 공간이 세분됨에 따라 평균속도는 유사하였으나 속도의 표준편차는 점차 감소하였으며 9회 분할 이후는 그 감소 폭이 작아 졌다.

PPFP(Push and Pop Frequent Pattern Mining): 빅데이터 패턴 분석을 위한 새로운 빈발 패턴 마이닝 방법 (PPFP(Push and Pop Frequent Pattern Mining): A Novel Frequent Pattern Mining Method for Bigdata Frequent Pattern Mining)

  • 이정훈;민연아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.623-634
    • /
    • 2016
  • 현존하는 빈발 패턴 마이닝 방법은 대부분 시간 효율성을 목표로 하고, 물리적 메모리 사용에 매우 의존적이다. 하지만 빅데이터 시대가 도래함에 따라 실제 세상의 데이터베이스는 급속도로 증가하고 있으며, 그에 따라 기존의 방법으로 현실적인 거대한 양의 데이터를 마이닝하기에 물리적 메모리 공간이 부족한 실정이다. 이러한 문제를 해결하기 위해, 빈발 패턴 마이닝의 메모리 의존성을 줄이기 위한 보조저장장치 기반의 연구들이 진행되었으나, 메모리 기반의 방법들에 비해 처리 시간이 너무 많이 소비된다는 한계가 있었다. 따라서 확장성을 가지며, 기존의 디스크 기반의 방법들에 비해 시간효율성을 높인 새로운 빈발 패턴 마이닝이 필요하게 되었다. 본 논문에서는 빅데이터로부터 빈도 아이템 집합들을 마이닝하기 위해 메모리와 디스크를 함께 사용하는 스택 기반의 새로운 접근법인 PPFP 알고리즘을 제안하였다. PPFP는 빈발 패턴 마이닝 접근법 중 가장 인기 있고 효율적인 접근법 중 하나인 FP-growth를 기반으로 하고 있다. PPFP 마이닝 방법은 다음과 같이 두 단계로 진행된다. (1) IFP-tree 구축: FP-tree를 생성한 후, 새로운 인덱스 번호 부여 방법으로 FP-tree의 각 노드에 인덱스 번호를 부여하고, 이 인덱스 번호가 부여된 FP-tree(IFP-tree)를 테이블로 변환하여(IFP-table) 디스크에 저장한다. (2) PPFP 알고리즘을 이용한 빈발 패턴 마이닝: 스택 기반의 PUSH-POP 방식으로 패턴을 확장시켜 나가며 빈발 패턴을 마이닝한다. 이러한 방식을 통해 메모리 기반의 방법에 비해 반복적으로 많은 시간이 소모되는 연산에 매우 적은 양의 메모리를 활용하여 확장성과 함께 시간효율성 또한 향상시킬 수 있었다. 그리고 기존의 연구 방법들과 비교 실험을 통해 새로운 알고리즘의 성능을 증명하였다.

낸드 플래시 메모리기반 저장 장치에서 다양한 초과 제공을 통한 성능 분석 및 예측 (Performance analysis and prediction through various over-provision on NAND flash memory based storage)

  • 이현섭
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.343-348
    • /
    • 2022
  • 최근 급격한 기술의 발달로 다양한 시스템에서 발생하는 데이터양이 증가하고 있으며, 많은 양의 빅데이터(big data)를 처리해야 하는 엔터프라이즈 서버(enterprise server)와 데이터 센터(data center)의 경우 비용이 증가하더라도 높은 안정성과 고성능의 저장 장치를 적용하는 것이 필요하다. 이러한 시스템에서는 고성능의 읽기/쓰기 성능을 제공하는 SSD(solid state disk)를 저장 장치로 사용하는 경우가 많다. 그러나, 페이지 단위로 읽기 쓰기를 하고 블록단위로 지우기 연산을 해야하고 쓰기 전 지우기 연산을 수행해야 하는 특징 때문에 중복 쓰기가 다발할 경우 성능이 저하되는 문제가 있다. 따라서 이러한 성능 저하 문제를 지연시키기 위해 SSD의 내부적으로 초과 제공(over-provision) 기술을 적용하고 있다. 그러나 초과 제공 기술은 성능 대신 많은 저장공간의 비용을 소모하는 단점이 있기 때문에 적정 성능 이상의 비효율적인 기술의 적용은 과대한 비용을 지불하게 만드는 문제가 있다. 본 논문에서는 SSD에서 다양한 초과 제공을 적용하였을 때 발생하는 성능과 비용을 측정하고, 이를 기반으로 시스템에 최적화된 초과 제공 비율을 예측하는 방법을 제안했다. 본 연구를 통해 빅데이터를 처리하는 시스템에서 성능의 요구사항을 만족하기 위한 비용과의 절충점(trade-off)를 찾을 수 있을 것으로 기대한다.

Tableau Public을 이용한 인포그래픽 제작 사례연구 (A Case Study of Producing Infographics Using Tableau Public)

  • 김동환
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.21-29
    • /
    • 2015
  • 최근 디지털 데이터가 폭발적으로 증가함에 따라 빅데이터, 데이터시각화, 정보시각화, 인포그래픽 등에 각종 언론매체 및 기관에서 관심을 기울이고 있다. 국내에서는 조선닷컴, 한겨레 신문 온라인판 등에서 데이터 시각화 및 인포그래픽을 선도적으로 다루고 있으며, 국외에서는 영국의 가디언, 월스트리트저널, 뉴욕타임즈 등에서 데이터 시각화 분야에서 두각을 나타내고 있다. 우리나라의 경우 데이터시각화 분야는 아직까지 디자인적인 측면에 중점을 두고 있다. 그러나 최근 주목받고 있는 데이터시각화 프로그램 중 Tableau Public 프로그램을 이용하면 좀 더 효율적인 인포그래픽을 제작할 수 있다. 본 연구에서는 Tableau Public을 통해 데이터 분석 및 인포그래픽을 제작하였다. 인포그래픽 제작을 위해 세계은행 데이터가 사용되었으며, 전세계자동차보유율을 분석하여 두 가지 결과가 도출되었다. 첫째, 고소득국가 그룹에서는 1인당 국민총소득이 증가할수록 기울기는 감소추세를 보였고, 중위소득국가에서는 증가추세를 보였다. 둘째, 기준기간에 비해 금융위기 기간에는 1인당 국민총소득 증가율에 따른 전년대비 자동차보유율 증가율이 1.7배 높게 나타났다. 본 논문에서는 Tableau Public을 이용한 데이터 시각화 사례연구를 통해, 기존 디자인 중심의 인포그래픽 제작환경에서, 향후 데이터 중심의 인포그래픽 제작 설계를 활성화시키고자 하였다. 그리고 더 나아가 데이터 중심의 인포그래픽은 과학적 연구, 그리고 정책결정을 위한 도구로써 널리 이용되어야 할 것이다.