• 제목/요약/키워드: Big data Era

검색결과 365건 처리시간 0.026초

소셜 네트워크 분석을 이용한 팬덤 페르소나 디자인 (Fandom-Persona Design based on Social Network Analysis)

  • 설상훈;성기훈
    • 인터넷정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.87-94
    • /
    • 2019
  • 본 논문에서는 4차 산업혁명시대에 소셜 네트워크 상에서 축적된 소비자들의 비정형 데이터를 서비스디자인과 사회심리학적 측면에서 데이터를 활용해 분석하는 방법을 제안하였다. 먼저 물리적인 공간보다 소셜 네트워크 상의 공간에서 주관적이며 집단적 행위를 보여주는 팬덤 현상을 데이터서비스의 관점에서 정의하였다. 팬덤 모델은 기존의 서비스디자인에서 개인적인 수준으로 분석하였던 고객의 페르소나를 집단적인 수준으로 변환시켰으며, 소비자의 빅데이터를 분석하는 소셜 네트워크 분석은 이를 패턴화하고 시각적으로 분석할 수 있는 효율적인 방법으로 제시하였다. 소셜 리스닝으로 수집한 소비자의 데이터는 연관성, 안정성, 결측정도, 그리고 고유성을 기준으로 Column별 데이터전처리를 진행하였다. 위의 데이터를 기반으로 기업의 브랜드 전략을 적극적 개입형과 소극적 개입형으로 나누고 이러한 전략적 태도가 소비자의 팬덤 커뮤니티의 성장방향성에 미치는 영향을 분석하였다. 이를 위해 소비자의 팬덤 모델을 브랜드전략이 가지는 총 4가지 전략인 독립형, 분산형, 통합형, 그리고 중앙집중형으로 나누어서 제안하였고, 소비자의 팬덤 형상을 시간에 따라 변화추이를 분석하는 성장모델분석 기법으로 제안하였다.

이질적 이미지의 딥러닝 분석을 위한 적대적 학습기반 이미지 보정 방법론 (Adversarial Learning-Based Image Correction Methodology for Deep Learning Analysis of Heterogeneous Images)

  • 김준우;김남규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.457-464
    • /
    • 2021
  • 빅데이터 시대의 도래는 데이터에서 스스로 규칙을 배우는 딥러닝의 비약적인 발전을 가능하게 하였으며, 특히 CNN 알고리즘이 거둔 성과는 모델의 구조를 넘어 소스 데이터 자체를 조정하는 수준에 이르렀다. 하지만 기존의 이미지 처리 방법은 이미지 데이터 자체를 다룰 뿐, 해당 이미지가 생성된 이질적 환경을 충분히 고려하지 않았다. 이질적 환경에서 촬영된 이미지는 동일한 정보임에도 촬영 환경에 따라 각 이미지의 특징(Feature)이 상이하게 표현될 수 있다. 이는 각 이미지가 갖는 상이한 환경 정보뿐 아니라 이미지 고유의 정보조차 서로 상이한 특징으로 표현되며, 이로 인해 이들 이미지 정보는 서로 잡음(Noise)으로 작용해 모델의 분석 성능을 저해할 수 있음을 의미한다. 따라서 본 논문은 이질적 환경에서 생성된 이미지 데이터들을 동시에 사용하는 앤드-투-앤드(End-To-End) 구조의 적대적 학습(Adversarial Learning) 기반의 이미지 색 항상성 모델 성능 향상 방안을 제안한다. 구체적으로 제안 방법론은 이미지가 촬영된 환경인 도메인을 예측하는 '도메인 분류기'와 조명 값을 예측하는 '조명 예측기'의 상호 작용으로 동작하며, 도메인 분류의 성능을 떨어뜨리는 방향의 학습을 통해 도메인 특성을 제거한다. 제안 방법론의 성능을 평가하기 위해 이질적 환경에서 촬영된 이미지 데이터 셋 7,022장에 대한 색 항상성 실험을 수행한 결과, 제안 방법론이 기존 방법론에 비해 Angular Error 측면에서 우수한 성능을 나타냄을 확인하였다.

SWAT: 분산 인-메모리 시스템 기반 SWRL과 ATMS의 효율적 결합 연구 (SWAT: A Study on the Efficient Integration of SWRL and ATMS based on a Distributed In-Memory System)

  • 전명중;이완곤;바트셀렘;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.113-125
    • /
    • 2018
  • 최근 빅데이터의 시대가 도래하여 다양한 분야로부터 다량의 지식을 얻을 수 있다. 수집된 지식은 정형화된 형태의 지식으로 가공하여 표현되며, 그 중 W3C의 온톨로지 표준 언어인 OWL이 대표적인 정형화 표현 형식이다. 이렇게 표현된 대용량의 온톨로지로부터 내재된 정보를 도출하기 위해 다양한 방법의 심볼릭 추론(Symbolic Reasoning) 연구가 활발하게 진행되고 있다. 그러나 대부분의 추론 연구들은 서술논리(Description Logic)표현 기반의 제한적인 규칙표현을 지원하며 실생활 기반의 서비스를 구축하기에는 많은 제약이 따른다. 또한 잘못된 지식으로부터 도출된 결과는 규칙들 사이의 종속관계에 따라 연쇄적으로 잘못된 지식이 생산될 수 있기 때문에 이러한 잘못된 지식에 대한 처리를 위한 지식관리가 필요하다. 따라서 본 논문에서는 해당 문제를 해결하기 위해 SWRL(Semantic Web Rule Language) 기반의 추론과 ATMS(Assumption-based Truth Maintenance System)간의 결합을 통해 새롭게 도출된 지식에 대한 관리를 할 수 있는 SWAT(SWRL + ATMS) 시스템을 제안한다. 또한 이 시스템은 대용량 데이터를 처리하기 위해 분산 인-메모리 프레임워크 기반의 SWRL추론과 ATMS를 병합 구축하였으며 이를 바탕으로 웹 형태의 ATMS 모니터링 시스템을 통하여 사용자가 손쉽게 잘못된 지식을 검색 및 수정할 수 있도록 한다. 본 논문에서 제안하는 방법에 대한 평가를 위해 LUBM(Lehigh University Benchmark)데이터 셋을 사용하였으며, 대용량 데이터에 대한 SWRL 추론과 잘못 추론된 정보에 대한 삭제를 통해 효율적인 추론과 관리가 가능한 결합 방법임을 증명한다.

실시간 웹 크롤링 분산 모니터링 시스템 설계 및 구현 (Design and Implemention of Real-time web Crawling distributed monitoring system)

  • 김영아;김계희;김현주;김창근
    • 융합정보논문지
    • /
    • 제9권1호
    • /
    • pp.45-53
    • /
    • 2019
  • 급변하는 정보화 시대에서 웹사이트에 서비스되는 정보 과잉에 대한 문제들을 접하곤 한다. 정보가 많아도 쓸모 있는 정보는 없고, 필요한 정보를 선택하는데 불필요한 시간이 많이 소비 된다. 검색 엔진과 같은 여러 사이트에서는 데이터의 최신 상태 유지를 위해 웹 크롤링을 한다. 웹 크롤링은 대부분 방문한 사이트의 모든 페이지의 복사본을 생성하는 데 사용되며 검색 엔진은 이렇게 생성된 페이지를 더욱 빠른 검색을 위해 인덱싱 한다. 많은 데이터 중에 정보가 실시간으로 변경되는 도매정보, 주문정보 등의 제한된 웹 데이터 수집은 일반적인 주제 중심의 웹 데이터 수집으로 무리가 있다. 현재 제한적 웹 정보를 실시간으로 수집하고 저장하는 방법에 대한 대안이 제시되고 있지 않다. 본 논문에서는 제한된 웹 사이트의 정보를 수집하고, 데이터의 상세분석을 통한 수집 시간 예측과 분류 작업을 통해 병렬 시스템에 저장하는 웹 크롤링 분산 모니터링 시스템(R-WCMS)을 제안한다. 실험 결과 웹 사이트 정보 검색을 제안모델에 적용하여 15-17% 시간이 감소됨을 입증했다.

4차 산업혁명시대의 비즈니스 모델 유형 (Types of business model in the 4th industrial revolution)

  • 정상희;정병규
    • 벤처혁신연구
    • /
    • 제1권1호
    • /
    • pp.1-14
    • /
    • 2018
  • 4차 산업혁명이 쓰나미와 같이 우리 기업에 큰 변화를 주고 있다. 디지털시대로 대변되는 CPS시스템은 물리적인 영역에서 축적된 데이터를 기반으로 디지털 기술을 통해 과거에 상상하지 못했던 비즈니스를 현실로 만들어 내고 있다. 이로 인해 4차 산업혁명시대의 비즈니스 모델은 이전과는 다른 양상을 보이고 있다. 이에 본 연구에서는 비즈니스혁신 이론 연구의 흐름을 시대별 흐름과 쟁점을 분석하였다. 이후 디지털시대의 비즈니스 혁신 모델을 이전 시대와 비교 분석하였다. 이를 기반으로 4차 산업혁명 시대에 적합한 비즈니스 모델을 탐색하였으며, 기존 비즈니스 모델들로는 디지털 시대의 모형을 설명하기에는 많은 어려움이 있었고, 보다 많은 실증적인 연구가 뒷받침 되어야하겠지만 마이클 포터의 다이아몬드 모델이 가장적합함을 확인하였고, 이를 응용하여 4가지 유형의 비즈니스 모델을 도출하여 해당 사례를 살펴보았다. Type A : sharing outcome with customer로 고객 성과 창출 기반에 따라 차등적으로 비용을 지불하는 모델이며, Type B : Value Chain Digitalization로 제품, 서비스 및 SCM 디지털화로 보다 빠르고 저렴한 비용으로 제품, 서비스를 고객에 제공함으로 경쟁우위를 가지는 모델이며, Type C : Digital Platform는 가장 큰 파급효과를 가져다 주는 모델로 디지털 플랫폼 기반의 공유 경제 창출로 새로운 시장을 창출하여 더 확실한 수익성 확보가 가능한 모델이다. 마지막으로 Type D : Sharing Resources는 관련 산업 내 파트너와 협업으로 경쟁 우위 모델 구축하는 모델로 다른 파트너의 핵심 역량과 자신의 핵심 역량을 서로 보완하는 가장 효과적인 성공 방법이라 할 수 있겠다. 4차 산업혁명시대에 다수의 요소 기술과 수많은 유니콘, 데카콘 기업들이 자신들이 속해 있는 산업별 차별적 디지털 경쟁우위를 가지고 있음에도 불구하고 특정 대표기업의 디지털 비즈니스 모델을 상세 분석하여 학문적이고 실무적인 시사점을 도출하는 것 보다는 단편적으로 나열함에 한계가 있었다. 향후 연구에서는 더욱더 구체적인 실증적인 분석을 통해 디지털시대의 비즈니스모델을 더욱더 상세하게 규명할 필요가 있다. 아울러 산업별로 디지털 비즈니스 모델이 상이할 수 있으므로 산업간 비교분석을 해볼 필요 역시 있다.

정보연계 시스템의 성숙도 모델에 관한 연구 (A Study on Maturity Model of Information Integration System)

  • 하효동;이욱
    • 한국산학기술학회논문지
    • /
    • 제20권8호
    • /
    • pp.570-578
    • /
    • 2019
  • 빅데이터 시대에 다양한 분야의 정부 조직은 정보연계를 통한 새로운 부가가치를 창출하고자 시도하고 있다. 이에 정부 기관 간 정보공유, 시스템 연계 및 통합과 관련된 프로젝트가 늘어나고 있다. 하지만 정보연계 시스템이 늘어남에 따라 시스템 운영에 대한 위험 요소가 더욱 증가하고 있다. 프로젝트 종료 이후 시스템 운영단계에서 인프라, 소프트웨어, 데이터 품질 및 보안 등으로 인한 다양한 시스템 장애로 이어져 정보연계가 이루어지지 않는다면, 조직의 직간접적인 손실과 사회에 미치는 영향은 커진다. 정보시스템의 유지보수와 관련된 다양한 연구가 이루어져 왔지만, 정부 기관간 운영 중인 시스템의 정보연계에 관한 평가 체계가 부재하다. 이에 본 논문은 정보시스템의 구성요소인 Data, IT, People, Process로 구분하고 계획-실행-점검(Plan-Do-See)으로 체계화하여, 이를 적용한 정보연계 시스템의 성숙도 모델을 제시한다. 도출된 9개의 프로세스는 현재 정보연계 시스템 담당자들을 대상으로 인터뷰 및 설문조사를 통해 분석한다. 그리고 CMMI를 적용한 성숙 단계를 제시한다. 이를 통해 정보연계 시스템의 성숙 수준을 진단할 수 있으며, 프로세스 개선 작업을 수행할 수 있는 정보로 활용될 것으로 기대한다.

산업군 내 동질성을 고려한 온라인 뉴스 기반 주가예측 (Online news-based stock price forecasting considering homogeneity in the industrial sector)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.1-19
    • /
    • 2018
  • 주가 예측은 학문적으로나 실용적으로나 중요한 문제이기에, 주가 예측에 관련된 연구가 활발히 진행되었다. 빅 데이터 시대에 도입하면서, 빅 데이터를 결합한 주가 예측 연구도 활발히 진행되고 있다. 다수의 데이터를 기반으로 기계 학습을 이용한 연구가 주를 이룬다. 특히 언론의 효과를 접목한 연구 방법들이 주목을 받고 있는데, 그중 온라인 뉴스를 분석하여 주가 예측에 활용하는 연구가 주를 이루고 있다. 기존 연구들은 온라인 뉴스가 개별 회사에 대한 미치는 영향을 주로 살펴보았다. 또한, 관련성이 높은 기업끼리 서로 영향을 주는 것을 고려하는 방법도 최근에 연구되고 있다. 이는 동질성을 가지는 산업군에 대한 효과를 살펴본 것인데, 기존 연구에서 동질성을 가지는 산업군은 국제 산업 분류 표준에 따른다. 즉, 기존 연구들은 국제 산업 분류 표준으로 나뉜 산업군이 동질성을 가진다는 가정하에서 분석을 시행하였다. 하지만 기존 연구들은 영향력을 가지는 회사를 고려하지 못한 채 예측하였거나 산업군 내에서 이질성이 존재하는 점을 반영하지 못했다는 한계점을 가진다. 본 연구는 산업군 내에 이질성이 존재함을 밝히고, 이질성을 반영하지 못한 기존 연구의 한계점을 K-평균 군집 분석을 적용하여, 주가에 영향을 미치는 산업군의 동질적인 효과를 반영할 수 있는 방법론을 제안하였다. 방법론이 적합하다는 것을 증명하기 위해 3년간의 온라인 뉴스와 주가를 통해 실험한 결과, 다수의 경우에서 본 논문에서 제시한 방법이 좋은 결과를 나타냄을 확인할 수 있었으며, 국제 산업 분류 표준 산업군 내에서 이질성이 클수록 본 논문에서 제시한 방법이 좋은 효과를 보인다는 것을 확인할 수 있었다. 본 연구는 국제 산업 분류 표준으로 나누어진 기업들이 높은 동질성을 가지지 않는 다는것을 밝히고 이를 반영한 예측 모형의 효율성을 입증하였다는 점에서 의의를 가진다.

COVID-19 발생 전·후 생활권 공원녹지 모빌리티 변화 분석 (Mobility Change around Neighborhood Parks and Green Spaces before and after the Outbreak of the COVID-19 Pandemic)

  • 최가윤;김용국;권오규;유예슬
    • 한국조경학회지
    • /
    • 제51권4호
    • /
    • pp.101-118
    • /
    • 2023
  • 팬데믹 기간 동안 도시민의 생활권 공원녹지 이용률은 크게 증가하였으며 COVID-19의 발생은 도시민들에게 생활권 공원녹지의 가치와 기능을 부각시키는 계기가 되었다. 본 연구에서는 COVID-19 발생 전·후 시민들의 이동 및 생활권 공원녹지 이용이 어떻게 변화했는지 실증 분석하고, 이러한 변화에 영향을 미친 사회·공간적 특성을 살펴보고자 한다. 분석 방법으로는 첫째, 통신사 시그널 데이터를 활용하여 생활권 공원녹지 모빌리티 변화를 분석하였다. 체류시간 및 이동량 변화 분석을 통해 COVID-19 발생 이후 나타난 시민들의 이동 특성과 보행 기반의 생활권 공원녹지 방문량 변화를 살펴보았다. 둘째, 생활권 공원녹지 모빌리티 변화에 영향을 미치는 요인을 분석하였다. 상관관계분석과 다중회귀분석을 통해 COVID-19 발생 전·후 시민들의 생활권 공원녹지 방문량에 영향을 미치는 사회·공간적 특성을 살펴보았다. 이후 군집분석을 통해 생활권 공원녹지 서비스의 공급 및 관리 관점에서 포스트 코로나 대응을 위한 생활권 유형을 구분하고, 유형별 생활권 공원녹지 개선 방향을 제시하였다. 주요 연구 결과는 다음과 같다. 첫째, COVID-19 발생 이후 거주지 주변 500m 이내에서의 활동이 증가하였다. 도보생활권에서의 체류시간과 보행 이동량은 2020년과 2021년 모두 증가하였으며 이는 변화한 도보생활권의 범위를 고려해 공원녹지의 양적 확보 기준과 유치거리 등을 재검토할 필요성이 높아졌음을 의미한다. 둘째, 보행을 통한 생활권 공원녹지 방문량이 COVID-19 발생 이후 전반적으로 증가하였다. 집을 중심으로 한 생활권 공원녹지 방문량뿐만 아니라 직장을 중심으로 한 방문량 역시 크게 증가하였다. 팬데믹 시대의 공원녹지 정책은 주거지와 상업·업무시설 밀집지역을 중심으로 서비스 소외지역을 발굴하고, 해당 지역의 공원녹지 서비스를 양적·질적으로 개선하는 방향으로 추진되어야 할 것이다. 셋째, 공원녹지 서비스 수준이 높은 지역일수록 보행을 통한 이동이 많은 것으로 나타났다. 공원녹지의 확보 기준을 단순 면적으로 볼 것이 아니라 보행 접근성 등 시민들의 실제 공원녹지 서비스 향상에 기여하는 지표를 활용할 필요가 있겠다. 넷째, 군집분석 결과 팬데믹 시대에 대응한 생활권 공원녹지의 개선 유형이 다섯 가지로 도출되었다. 이는 앞으로의 공원녹지 정책에서 소규모 생활권 단위의 사회경제적 지위 특성, 공원녹지 서비스 수준 등을 복합적으로 고려할 필요가 있음을 시사한다. 본 연구는 통신사 시그널 데이터 분석, GIS 분석, 통계분석 등 다각적인 분석 방법론을 활용해 포스트 코로나 시대에 대응한 생활권 공원녹지 정책 수립의 근거를 마련했다는 학술적, 정책적 의의를 갖는다.

대규모 동적 O/D 생성을 위한 추정 방법론 연구: 첨두 출근통행을 기준으로 (A Methodology for Estimating Large Scale Dynamic O/D of Commuter Working Trip)

  • 한혁;홍기만;김태균;황준문;홍영석;조중래
    • 대한교통학회지
    • /
    • 제36권3호
    • /
    • pp.203-215
    • /
    • 2018
  • 본 연구는 통행자의 통행패턴이 도착지의 토지이용패턴에 따라 변화하는 특징을 반영하여 대규모 동적 O/D를 구축하는 방법을 제안하였다. 기존 동적 O/D 추정 방법 관련 연구들을 살펴보면 자료수집의 어려움으로 소규모 지역에 국한하여 적용 가능하거나, 고속도로망 혹은 대중교통망 등 특정 교통망에 제한하여 O/D를 구축하는 등 한계가 존재한다. 이에 본 연구에서는 빅데이터 시대에 발맞추어 쉽게 수집, 이용이 가능한 교통 관련 자료들을 기반으로 분석 지역의 범위 제약 없이 동적 O/D를 추정하는 기법을 제시하였다. 군집 분석(Clustering Analysis) 기법을 이용하여 군집별 도착시간 기준 통행분포 비율로 출발시간 통행분포 비율을 산정하고 첨두 출발시간 분포함수를 추정하였다. 추정된 분포함수를 조사자료에 적용하여 비교 검증을 진행해본 결과 통계적으로 유의하게 나타났다.

공간정보기반의 행정경계 정비를 위한 기초연구 (A Fundamental Study on the Maintenance of Administrative Boundaries based on Spatial Information)

  • 윤지예;박홍기;최윤수;남대현
    • Spatial Information Research
    • /
    • 제20권1호
    • /
    • pp.47-57
    • /
    • 2012
  • 행정경계는 지리적 지역적 범위를 표현하는 행정업무의 기반정보이다. 스마트세상이 도래한 요즈음 산업체의 다목적 활용 및 국민의 생활편의 측면에서 그 중요성이 증대되고 있으나 현재 행정구역체계의 골격인 지적공부에 정비된 경계선 간 중첩 혹은 이격문제가 내재되어 있어 정비가 시급한 상황이다. 그러나 국가가 일정한 방법 및 절차의 공시 없이 행정경계를 일괄 정비 등록할 경우, 각 지자체 및 관할부서 간의 갈등을 야기할 우려가 있다. 따라서 행정경계 갈등의 사전 예방과 원활한 정비를 위해서는 합리적인 행정경계 정비방안이 우선 마련되어야 한다. 본 연구에서는 실제적 정비업무 시 활용이 가능하도록 행정경계 정비방안과 정비절차를 제시하였다. 이를 위하여 행정경계의 개념과 특성, 연혁과 현황 고찰 및 현황에 내재된 문제점을 파악한 후 현장답사를 수행하였으며, 현장결과를 기반으로 시사점을 도출하였다. 이후, 합리적으로 행정경계를 확인 정비할 수 있도록 다양한 공간정보자료의 활용, 이해관계자의 참여, 인접 구(區)간 행정경계 정비안을 제시하였다. 이로써, 현행 행정경계 정보의 불일치성을 해소하고, 합리적 행정경계의 정비가 가능할 것으로 사료된다. 또한, 향후 지적 재조사사업에 있어서 본 정비 방안의 활용이 가능할 것으로 판단된다.