• 제목/요약/키워드: 빅 데이터 분석

검색결과 2,883건 처리시간 0.038초

스마트콘텐츠 현황분석을 통한 기본요소 추출 (Study on Basic Elements for Smart Content through the Market Status-quo)

  • 김경선;박주용;김이연
    • 한국과학예술포럼
    • /
    • 제21권
    • /
    • pp.31-43
    • /
    • 2015
  • ICT(Information and Communications Technologies : 정보통신기술)는 창조경제의 핵심이 되는 기술중 하나로 기존산업과 기업의 인프라를 연결하는 매개로 사용되어 기존 상품과 서비스를 고도화하고, 새로운 상품과 서비스를 만들어내고 있다. 이와 더불어 빅데이터, 모바일, 웨어러블 등 새로운 디바이스 부문까지 주목을 받으며 신시장 개척에 귀추가 주목되고 있다. 더 나아가 IoT(Internet of Things :사물인터넷)는 인간과 인간, 인간과 사물, 사물과 사물을 연결하며 ICT기반의 사회를 더욱 곤고히 만들어 주는 역할을 하고 있다. 이는 제조업 중심의 하드웨어 개발이 소프트웨어의 개발과 함께 동시다발적으로 융합되어야 한다는 의미로 볼 수 있다. 하드웨어와 소프트웨어의 융합에서 꼭 필요한 것이 OS인데, 선두주자 구글과 애플을 필두로 관련 기업에서는 소프트웨어의 중요성을 인지하고 소프트웨어 개발에 집중 착수하였다. 이에 현 보고서(한국산업기술평가관리원: 디자인전문기술개발사업) 진행을 위해 소프트웨어 시장현황을 조사한 결과, 소프트웨어 플랫폼을 기반으로 한 구글의 안드로이드(Android)와 애플의 iOS가 전 세계시장을 장악하고 있었으며, 후발주자는 새로운 패러다임을 제시하기 위해 Web기반 OS, 유사 OS 등 을 출시하여 다양한 경로에서 시장진입을 시도하고 있다. 이러한 사회의 변화는 OS를 기본으로 누구나 개발자가 될 수 있는 스마트콘텐츠 활용에 대한 연구 필요성이 대두되었으며 범용적으로 활용할 수 있는 스마트콘텐츠에 대한 정의가 필요하며 빠른 시장변화에 대처할 수 있는 시장분석이 필요하다. 이에 본 연구에서는 문헌조사 및 스마트분류체계에 따른 앱마켓(App Market)분석, 현 콘텐츠시장 트랜드 분석을 실시하였고 스마트콘텐츠의 범용적 정의와 앱마켓에서 나타난 애플리케이션의 현황과 콘텐츠 시장현황을 비교하여 공통요소 5가지의 흐름을 파악하였다. 분석을 통하여 스마트콘텐츠 시장은 독립적이지만 서로의 연결고리를 가진 형태로 하나의 유기체와 같은 형태로 발전할 것이라 예상하였으며 기존의 기술적 관점, 문화적 관점, 비즈니스적 관점, 소비자 관점에 사회적 관점을 포함한 다시점 관점에서의 분류체계와 개발이 이루어 져야 한다.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.

웹/모바일-어플리케이션 접속 지표와 TCS 교통량의 상관관계 연구 (Exploring the Temporal Relationship Between Traffic Information Web/Mobile Application Access and Actual Traffic Volume on Expressways)

  • 류인곤;이재영;최기주;김정화;안순욱
    • 대한교통학회지
    • /
    • 제34권1호
    • /
    • pp.1-14
    • /
    • 2016
  • 최근 스마트폰의 빠른 보급으로 누구나 언제 어디서든 자유로운 네트워크 접속이 가능해졌다. 이는 통행 전은 물론 통행 중 교통정보 검색이 매우 편리해졌음을 의미한다. 고속도로 교통정보 탐색 행태의 기반이 되는 상관성 분석을 위하여, 웹과 모바일-앱의 접속 지표에 대한 정상성 여부를 검증하고, TCS 교통량과의 상관관계를 실증적으로 분석하는 것이 본 연구의 목적이다. 그 결과 첫째, 시간대별 웹/모바일-앱의 접속 지표에 대한 ADF-검정, PP-검정 결과, 로그변환이나 차분변환 없이도 시계열의 정상성 조건을 만족하는 것으로 나타났다. 둘째, 고속도로 진출입 교통량과의 피어슨 상관계수를 검토한 결과, 웹/모바일-앱의 모든 접속 지표는 뚜렷한 양적 상관관계를 보였다. 단, 트럭의 TCS 진입 교통량은 상관관계가 거의 없는 것으로 나타났다. 셋째, 시계열 변수 사이에 존재하는 발생시간의 시차 관계(동행성, 선행성, 후행성)를 규명하기 위해 교차분석을 수행한 결과, 모바일 이용자는 모든 웹 접속 지표보다 선행하고 있었으며, 모바일 실행횟수는 모든 웹 접속 지표와 동행함을 발견하였다. 넷째, 고속도로의 진입 교통량에 선행하는 웹/모바일-앱 접속 지표는 존재하지 않았으며, 웹 페이지뷰/방문자/신규방문자/재방문자, 모바일 실행횟수는 오히려 고속도로 진입 총 교통량과 비교시 1시간의 후행 시차에서 상관관계가 가장 높게 나타났다. 향후 분석의 공간적 범위와 시간적 범위를 세분화하고 교통정보 이용자의 위치정보를 활용할 수 있다면, 경로 전환 시점/비율과 같은 개별 통행행태까지도 예측할 수 있게 될 것으로 판단된다.

대마난류의 유동 특성과 PDO의 관계 분석 (Analysis of the Relationship between the Flow Characteristics of the Tsushima Warm Current and Pacific Decadal Oscillation)

  • 서호산;정용현;김동선
    • 해양환경안전학회지
    • /
    • 제28권6호
    • /
    • pp.882-889
    • /
    • 2022
  • 본 연구에서는 대마난류(Tsushima Warm Current, TWC)의 유동 변화에 영향을 주는 요소를 파악하기 위하여 TWC의 수송량과 태평양 순년진동(Pacific Decadal Oscillation, PDO) 및 엘니뇨 남방진동(El Niño - Southern Oscillation, ENSO)의 상호 관계 분석을 실시하였다. 25년(1993~2018년) 동안의 TWC의 월별 수송량을 계산해보면 하계에 가장 크고 동계에 가장 작게 나타나는 계절변동 주기가 뚜렷하다. TWC 수송량과 PDO 및 ENSO의 한 척도인 Oceanic Niño Index(ONI) 각각의 주기성 파악을 위한 power spectrum 분석결과, TWC 수송량은 1년 주기에서 peak를 보이지만 PDO 및 ONI는 뚜렷한 주기가 나타나지 않았다. 또한, TWC 수송량과 PDO 및 ONI의 상호 관계 파악을 위해 coherence 추정 방법을 이용하여 분석하였다. PDO 및 ONI의 coherence는 3년 이상의 장주기 변동에서 상호 기여도가 높으나 1년 이내의 단주기 변동에서는 상호 기여도가 낮다. 그러나 TWC 수송량과 PDO 두 요소 간 0.8~1.2년 주기에서 coherence 값은 0.7로 상호 기여도가 높다. 한편 서수도를 통과하는 TWC 수송량과 PDO는 I기간(1993~2002년)과 III기간(2010~2018년)에 역상관 관계성을 가진다. TWC 최대 수송량 (2.2 Sv 이상)이 높게 나타나는 시기에 PDO 지수가 -1.0 이하의 음의 값, 2.2 Sv 이하로 작은 시기에 PDO 지수가 양의 값을 나타낸다. 따라서 장기적인 PDO 지수 자료를 이용하면 TWC 수송량 변동 및 동해 연안역의 수온변화를 예측 또한 가능할 것으로 판단된다.

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.

산업별 지속가능경영 전략 고찰: ESG 보고서와 뉴스 기사를 중심으로 (A Study on Industry-specific Sustainability Strategy: Analyzing ESG Reports and News Articles)

  • 김원희;권영옥
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.287-316
    • /
    • 2023
  • 최근 전 세계적으로 기업의 환경(Environmental)·사회(Social)·지배구조(Governance)의 비재무적 요소를 고려한 지속가능경영이 필수적으로 요구되면서, 각 기업들은 이에 대응할 수 있는 전략적 방향 수립이 중요해지고 있다. 특히 기업이 속한 산업별로 상이한 ESG 이슈에 대한 이해를 바탕으로 산업과 개별 기업의 특성을 반영한 전략을 개발하고 추진할 수 있어야 할 것이다. 이에 본 연구에서는 금융, 제조, IT 분야별로 나누어 주요 국내 기업들의 ESG 보고서와 관련 뉴스 기사를 이용하여 산업별 ESG 동향과 활동을 비교 분석하였다. 키워드 빈도분석과 토픽 모델링을 활용한 분석 결과, 국내 ESG 선도 기업들의 지속가능경영 활동에서의 산업별 차이를 도출 할 수 있다. 금융 분야에서는 '고객 중심 경영'과 '기후 변화 대응', 제조 분야에서는 '지속가능한 공급망 관리'와 '탄소중립', IT 분야에서는 '기술혁신'과 '디지털 책임'이 강조되었다. ESG 요소별 우선 순위가 높은 활동의 예를 들면, 환경 측면에서는 '에너지 절감과 친환경 활동', 사회 측면에서는 '사회공헌과 상생', 지배구조 측면에서는 '이사회 독립성 강화와 리스크 관리' 등으로 나타났다. 더 나아가 산업별 각 ESG 요소의 핵심 이슈 뿐 아니라 ESG 보고서와 뉴스 기사의 내용 유사성 및 차별점도 확인하였다. 연구의 결과는 산업별 동향을 고려한 ESG 경영 전략 및 정책의 방향성을 제시하고 있으며 이는 산업별 ESG 평가체계 수립에도 도움이 될 것으로 기대한다.

국내 서해안 파랑 관측자료를 이용한 대표주기 산정 및 최적 확률밀도함수 추정 (Estimation of Representative Wave Period and Optimal Probability Density Function Using Wave Observed Data around Korean Western Coast)

  • 이욱재;조홍연;박진호;고동휘
    • 한국해안·해양공학회논문집
    • /
    • 제35권6호
    • /
    • pp.146-154
    • /
    • 2023
  • 본 연구에서는 서해안 해상기상타워 2기에서 관측된 수면변동자료를 이용하여 해양특성을 구분하는 주요 인자인 첨두주기 Tp와 평균주기 T02와 Tm-1, 0를 산정하고 이상자료의 비율, 상관관계 분석 및 최적 확률밀도함수를 추정하였다. 산정된 대표주기 중 첨두주기의 경우, 이상 자료의 비율은 각각의 지점에서 5.73 %, 0.67 %로 나타났으며, T02는 4.35%, 0.01%, Tm-1, 0는 2.82%, 0.03%로 나타났다. 한편, T02와 Tp 사이의 관계를 분석한 결과 각 지점별로 0.53, 0.63의 관계로 산정됐으며, Tm-1, 0와 Tp의 관계는 각각 1.15, 1.32로 나타났다. T02와 Tm-1, 0는 서로 1.18, 1.22의 관계를 보이고 있었다. 산정된 대표주기의 최적 확률밀도함수를 추정한 결과, Tp는 각각의 지점에서 'Lognormal', 'Normal' 분포를 따르고 있었으며, T02는 'Gamma', 'Normal' 분포, Tm-1, 0는 각각 'Log-normal', 'Normal' 분포가 우세한 것으로 나타났다. 이러한 결과는 서해안을 대상으로 수행되는 파랑 분석에 기초자료로 사용될 수 있을 것으로 판단된다.

대학 내 조경전공 교육과정에 있어 새로운 컴퓨터 미디어 수업의 필요와 개선방향 (The Need and Improvement Direction of New Computer Media Classes in Landscape Architectural Education in University)

  • 나성진
    • 한국조경학회지
    • /
    • 제49권1호
    • /
    • pp.54-69
    • /
    • 2021
  • 2020년 문명사회의 전반적 생활 방식은 종이와 같은 소모성 아날로그 미디어에서 데이터 공유에 기반한 디지털 미디어로, 유선에 기반한 미디어에서 무선의 언택트 미디어로 뚜렷한 변화를 보인다. 본 연구는 이러한 사회 변화 양상을 바탕으로 조경학과 교육과정에서 컴퓨터 미디어의 교육과 활용이 시대의 변화에 적합하게 운용되고 있는지를 고찰하고, 4차 산업혁명 시대의 조경 교육을 위한 새로운 컴퓨터 수업의 방향을 제시하고자 한다. 조경은 도시를 연구 및 설계 대상으로 하는 분야로 사회 변화와 긴밀하게 연결되어 있다. 하지만 실리콘밸리를 기반으로 IT 혁명이 시작되고, 인공지능, 빅데이터, 자율주행차, 클라우드 네트워크, 사물인터넷 등 4차 산업혁명의 디지털 인프라가 현대 사회를 기술적으로, 사회적으로, 경제적으로 변화시키고 있는 데에 반해, 조경 교육이 그러한 변화를 적극적으로 수용하며 가시적인 차이를 만들고 있다고 보기에는 분명한 근거가 부족하다. 따라서 본 연구는 조경 교육에서 컴퓨터 테크놀로지와 뉴 미디어의 활용 현황을 돌아보고, 새로운 시대에 적합한 교육과정의 대안적 방향에 대해 논의했다. 우선 현대 조경 및 건축 전반의 컴퓨테이셔널 디자인의 동향에 대해 살펴 논의의 근거를 마련했다. 그리고 이를 바탕으로 국내외 조경학과 교육과정에서 컴퓨터 미디어 수업의 변화 양상과 현황을 선행 연구와 교과과정을 바탕으로 분석했다. 그 결과, 국외 조경학과의 경우 1994년의 연구와 2020년의 현황 사이에 컴퓨터 관련 과목의 수가 눈에 띄게 증가하고, 그 종류가 다양해진 반면, 국내 조경학과의 경우 일부 교과목이 변경된 것 외에 별다른 변화를 확인할 수 없었다. 이는 국내 조경 교육과정이 디지털 시대의 변화에 소극적으로 대처하고 있음을 시사한다. 마지막으로 이러한 논의를 바탕으로 4차 산업혁명 시대의 조경학과가 컴퓨터 미디어와 관련해 지향해야 할 새로운 교육과정에 대한 여러 실천적 대안을 검토했다.

유통 중인 유기재배과채류와 관행재배과채류의 무기성분 및 기능성 성분 비교분석 (Comparative Analysis of Functional Components of Organic and Conventional Cultivated Fruit Vegetables Commercially Distributed in Korea)

  • 이민우;박재은;장은진;손홍주;박현철;홍창오;이상범;심창기;고병구;김근기
    • 생명과학회지
    • /
    • 제27권10호
    • /
    • pp.1176-1184
    • /
    • 2017
  • 소비자 구매 단계의 유기재배 청양고추, 토마토, 딸기의 기능성 성분과 무기 성분을 관행재배 농산물과 비교하였다. Total phenol 함량은 유기재배 청양고추와 토마토가 관행재배 보다 각각 14%, 30% 높은 함량을 나타냈고, 딸기는 관행재배에서 13% 높게 나타났다. Total flavonoid 함량 또한 청양고추와 토마토가 관행재배보다 각각 11%와 29% 높게 나타났고, 딸기는 관행재배에서 2배 높게 나타났다. Vitamin C는 유기재배에서 높게 나타났으나 유의적이지는 않았다. ${\beta}-carotene$은 유기재배 토마토가 22% 높은 함량을 나타냈고, 고추와 딸기는 관행에서 각각 15%와 29% 높게 나타났다. 청양고추의 capsaicin과 토마토의 lycopene 함량은 재배환경에 따른 차이가 나지 않았으며, 딸기의 anthocyanin은 관행재배에서 높게 나타났다. 무기성분 분석결과 청양고추의 Total N, P, K는 재배환경에 큰 차이가 나타나지 않았고, 토마토는 관행재배에서 22~28% 높게 나타났다. 딸기의 K, Ca, Mg, P 함량은 관행재배에서 16~29% 높게 나타났다. 소비자 구매 단계의 유기재배 과채류와 관행재배 과채류의 일반성분과 무기성분 및 기능성성분 함량을 비교 분석한 결과, 성분에 따라서는 함량이 높게 나타났으나 개체간 변화가 크게 나타났다. 재배법에 따른 기능성 성분 등의 함량 비교는 생산지와 품종을 나누어 수년간 조사하여 빅데이터를 구축할 필요가 있을 것이다.

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.