• 제목/요약/키워드: 시계열 주제분석

검색결과 57건 처리시간 0.023초

온라인 공개 국제학술지 기반 국내·외 기록관리학 연구동향 분석 - 지리적 시간적 비교 - (Domestic and Overseas Research Trends Analysis of Archives and Records Management based on Online Public International Journals)

  • 김성환;오효정
    • 한국문헌정보학회지
    • /
    • 제52권2호
    • /
    • pp.165-189
    • /
    • 2018
  • 본 연구의 목표는 국내 외 기록관리학 동향을 비교 분석함으로써 각 나라별 연구 주제의 동향과 그 차이를 파악하는데 있다. 기존 수행된 기록관리학 분야에서 연구동향 분석의 한계점을 극복하기 위해 그 범위를 국제적으로 확대하여 적합한 8종의 국제 학술지를 선정하고, 2000년부터 2017년까지 게재된 논문의 저자정보를 통해 국가별 기록관리학 연구논문 게재 지수를 지리적으로 시각화 하였다. 또한 시계열 기반의 내용분석을 통해 기록관리학 분야의 국제적 연구동향의 흐름을 파악하였다. 나아가 국내 연구동향과의 연계분석을 위해 국내 기록관리학 관련 학술지 6종을 선정하여 그 결과를 비교하였다. 이를 바탕으로 국내 외 기록관리학 연구동향의 거시적 흐름과 나라별 차이를 규명하고 나아가 앞으로의 학문적 방향을 예측하고 발전 방향을 제시하고자 한다.

비정형, 정형 데이터의 이미지 학습을 활용한 시장예측 (MPIL: Market prediction through image learning of unstructured and structured data)

  • 이윤선;이주홍;최범기;송재원
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.16-21
    • /
    • 2021
  • 금융 시계열 분석은 현대 사회의 경제적, 사회적으로 매우 중요한 역할을 하며 세계 발전에 영향을 미치는 중요한 과제지만 많은 잡음(noise)과 불확실성 등의 어려움으로 인해 금융 시계열 분석 예측은 어려운 연구 주제이다. 본 논문에서는 비정형 데이터와 정형 데이터를 함께 이미지로 변환하여 시장을 예측 하는 방법(MPIL)을 제안한다. 시장 예측을 위해 n일 기간의 비정형 데이터인 SNS, 뉴스 데이터를 감정분석하고 정형 데이터인 시장 데이터를 GADF 알고리즘으로 이미지 변환하고 이미지 학습을 통해 n+1일의 가격을 예측하는 초단기 시장을 예측한다. MPIL은 평균 정확도 56%로 기존 시장예측에 사용되던 감정분석을 활용하여 LSTM으로 시장을 예측하는 모델 평균 정확도 50%보다 높은 정확도를 보였다.

웹로그 분석을 위한 데이터 웨어하우스 시스템 구축 (Building Data Warehouse System for Weblog Analysis)

  • 이주일;백경민;신주한;이원석
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2010년도 춘계학술대회
    • /
    • pp.291-295
    • /
    • 2010
  • 최근 급격한 하드웨어 기술과 데이터베이스 시스템의 발전은 우리 주변에서 발생하는 다양한 분야의 데이터를 자동으로 수집하는 것을 가능하게 하였다. 흔히 데이터 스트림(data stream)이라고 언급되는 끊임없이 생산되는 대용량의 데이터를 효율적으로 처리하여 유용한 정보를 얻어내는 기술은 이미 많은 응용 분야에서 광범위하게 연구되고 있다. 인터넷은 이러한 데이터 스트림을 양산해 내는 주요 원천 중의 하나이다. 인터넷 비즈니스의 활성화와 더불어 웹로그 데이터 스트림은 마케팅, 전략 수립, 고객관리 등 여러 부분에 광범위하게 활용되기 시작했으며, 보다 정확하고 효율적인 분석에 대한 요구사항도 점점 늘어나고 있다. 데이터 웨어하우스(Data Warehouse)는 수집된 데이터를 주제 기반으로 통합하여 시계열 형태로 적재하는 저장소서 유용한 분석이나 의사결정에 많이 사용되어 왔다. 데이터웨어하우스는 데이터를 요약하고 통합 및 정제하는 기능을 제공하여 대용량의 데이터 처리에 적합하고 데이터의 품질을 향상시키기 때문에 데이터 마이닝 분야에서 전처리 과정으로도 많이 이용되어 왔다. 본 논문에서는 웹로그 데이터 스트림에 대한 데이터 웨어하우스를 구축하여 보다 고품질의 유용한 정보를 효율적으로 얻어내는 시스템을 제안한다.

  • PDF

온라인 공간의 정치 양극화는 심화될 것인가?: 선거 기사 댓글에 대한 경험적 분석 (Is Political Polarization Reinforced in the Online World?: Empirical Findings of Comments about News Articles)

  • 엄기홍;김대식
    • 정보화정책
    • /
    • 제28권4호
    • /
    • pp.19-35
    • /
    • 2021
  • 본 연구의 목적은 온라인 공간의 속성을 규명하고, 이러한 속성이 민주주의 운영에 미칠 영향을 경험적으로 분석하는 데 있다. 본 연구는 2021년 4월 7일 치러진 서울시장 및 부산시장 보궐선거에 관한 언론 기사와 댓글을 수집하여 온라인 공간의 속성과 정치 양극화를 경험적으로 분석하고 있다. 구체적으로 본 연구는 토픽모델링을 활용하여 보궐선거에 나타난 언론 보도의 다양성을 측정하였으며, 감성분석을 활용하여 기사 댓글에 비친 온라인 여론을 측정하였다. 이후 언론이 가장 주목한 보도가 온라인 여론에 영향을 미치는 여부를 단절적 시계열 분석을 통하여 분석하였다. 이러한 시도는 온라인 여론의 견고성을 검증하는 시도로써 정치 양극화의 수준을 측정하는 지표로 사용된다. 분석 결과를 보면, 첫째 언론은 보궐선거 지역과 후보에 따라 선거 관심도와 주제가 달랐다. 둘째, 언론 보도의 다양성에도 불구하고, 기사 댓글에 나타난 온라인 여론은 높은 부정 여론, 낮은 긍정 여론이 지속적으로 나타났다. 특히 선거일에 즈음할수록 양극화의 수준은 더욱 분명했다. 셋째, 단절적 시계열 분석 결과를 보면, 선거 관심도에 따라 정치 양극화의 변화 가능성이 차별적인 것으로 나타났다. 향후 온라인 공간을 통한 정치참여가 거부할 수 없는 흐름이란 점을 고려할 때, 본 연구는 온라인 공간에서 재현되는 정치 양극화 해소를 위한 방안 마련이 시급하다고 제언하고 있다.

텔레비전 뉴스 영상의 구조적 요소와 주제연관성 시계열 분석 (Time Analysis of Structural Element and Theme Association of Television News Imagery)

  • 박덕춘
    • 한국콘텐츠학회논문지
    • /
    • 제11권7호
    • /
    • pp.100-109
    • /
    • 2011
  • 본 논문은 텔레비전 뉴스에 있어서 '현장성'과 '사실성'의 지표가 될 수 있는 뉴스 영상의 구조적 요소와 주제연관성이 시대적 배경에 따라 어떤 차이가 있는지 그리고 그 함의가 무엇인지 살펴본 내용연구이다. 기존의 텔레비전 뉴스에 관한 여러 연구들은 대부분 동시대의 뉴스를 대상으로 한 횡적 연구에 집중하여 시대적 변화를 반영하는 종적 연구에는 상대적으로 소홀한 감이 없지 않았다. 따라서 본 연구에서는 1987년부터, 2007년까지 MBC뉴스데스크에서 방송된 뉴스를 대상으로, 5년 간격으로 체계적 무선표집방법을 통해 추출한 총 729개 아이템의 11,945개의 샷을 분석하였다. 본 연구를 통해서 1987년과 2007년의 텔레비전 뉴스 영상에는1992년과 2002년에 비해 '현장성'과 '사실성'을 충실히 반영한 '사운드바이트'와 '사건화면', 그리고 주제와의 연관성이 높은 '직접연관' 화면의 비중이 높게 나타났으나, 1997년에는 이들 요소의 비중이 상대적으로 낮게 나타나고, '현장성'과 '사실성' 측면에서 취약한 '로케이션 화면', '구성화면' '자료화면', 그리고 '간접연관'과 '축어적 연관' 화면의 비중이 크게 나타남으로써, 현실기반의 뉴스 보도가 충실히 이루어지지 못하였음을 알 수 있었다.

토픽 모델링을 이용한 해방기 아동상 연구 - 「어린이신문」을 중심으로 - (A Study on Children's Images during the Liberation Period Using Topic Modeling: With a focus on The Children's News)

  • 장석은;이혜은
    • 한국비블리아학회지
    • /
    • 제33권3호
    • /
    • pp.157-178
    • /
    • 2022
  • 본 연구는 해방기에 간행된 아동신문인 「어린이신문」에 나타난 아동상을 탐색하는 데 목적이 있다. 이를 위해 현전하지 않는 제34호를 제외하고, 1945년 12월 1일의 창간호부터 1947년 12월 13일의 제86호를 대상으로 빈도 분석, 토픽 모델링, 시계열 분석을 수행하였다. 빈도 분석 결과 나라, 학교, 가정과 연관이 있는 키워드가 자주 나타났고, 토픽 모델링을 통해서는 '애국심을 가진 아동상', '과학적 소양을 지닌 아동상', '예술적 소양을 지닌 아동상', '사회적 존재로서의 아동상'이 도출되었다. 시계열 분석 결과 「어린이신문」이 발간된 해방 초기에는 애국 관련 토픽의 비중이 높았으나 과학, 예술과 같은 주제의 비율이 점차 높아지는 것을 볼 때, 아동상이 다양화되었다는 것을 확인할 수 있었다.

문헌정보학 분야의 지적구조 및 연구 동향 변화에 대한 시계열 분석: 2003년부터 2017년까지 (Time Series Analysis of Intellectual Structure and Research Trend Changes in the Field of Library and Information Science: 2003 to 2017)

  • 최형욱;최예진;남소연
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.89-114
    • /
    • 2018
  • 학문 분야의 연구 동향 변화에 대한 연구는 해당 분야의 세부 연구주제와 구조에 대한 파악뿐만 아니라 시간 흐름에 따른 변화 모습을 관찰할 수 있는 방법이다. 이에 본 연구에서는 국내 문헌정보학 분야의 연구 동향을 살펴보기 위하여 2003년부터 2017년까지 한국학술지인용색인(KCI)에 등재된 문헌정보학 분야 학술지 중 인용지수가 가장 높은 3종에 개제된 논문의 한국어 저자키워드를 대상으로 동시출현단어 분석을 수행하였다. 시계열 분석을 위해 15년의 연구 기간을 5년 단위로 누적하여 2003년~2007년, 2003년~2012년, 2003년~2017년으로 구분하였고, 기간별로 출현빈도 10회 이상의 저자키워드를 선정하여 분석하고 이를 시각화하였다. 분석 결과, 2003년~2007년 기간의 지적구조는 총 25개의 키워드로 구성된 8개의 영역이 확인되었으며, 2003년~2012년 기간의 지적구조에서는 총 76개의 키워드로 구성된 3영역 17 군집이 확인되었다. 또한, 2003년~2017년 기간의 지적구조는 총 132개의 키워드로 구성된 6영역 32군집으로 나타났다. 누적 기간별 종합 분석 결과, 한국의 문헌정보학 분야는 지난 15년간 기간별로 새로운 키워드가 포괄적으로 추가되었으며, 세부 주제 역시 세분화 되어 점차 세분화되고 확장되고 있음을 확인하였다.

우리나라 Palmer 가뭄지수와 기상인자와의 Multi-Scale 분석 (Multi-Scale Analysis Between Palmer Drought Index in Korea and Global Climate Indices)

  • 권현한;문영일;안재현;오태석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1465-1469
    • /
    • 2006
  • 수문순환 과정은 기상현상과 밀접한 관련을 가지고 서로 연관되어 있다. 이러한 연관성을 규명하여 수자원관리에 위험도를 감소시키려는 노력은 많은 분야에서 이루어지고 있으며, 주요 연구 주제가 되고 있다. 이러한 기상현상 중에서 가뭄은 여러 가지 요소가 복합되어 발생되는 것으로 알려지고 있으나 이를 설명하기에는 여전히 부족한 면이 존재한다. 가뭄을 발생시키는 몇 가지 가능한 원인으로는 E1 Nino-Southern Oscillation(ENSO)현상으로 잘 알려져 있는 비정상적인 해수면 온도의 변화나 기후 시스템의 비선형적 거동을 들 수 있다. 특히, 기후 시스템은 대개 경년 변화(inter-annual variability) 및 10년 이상의 주기(decadal variability) 특성을 가지고 있으며 가뭄 또한 경년변화의 주기 특성을 나타내고 있는 것으로 알려지고 있다. 이러한 관점에서 수문시계열을 특정 주파수(frequency)에서 고립시킨 후, 분석이 가능한 분해방법(decomposition method)을 통해 보다 해석적으로 접근하는 것이 가능하다. 이를 위해 본 연구에서는 Wavelet Transform분석을 도입하였으며 통계적으로 유의한 성분을 시계열로부터 추출하여 가뭄과 기상인자와의 변동성 분석을 실시하였다.

  • PDF

텍스트 마이닝을 이용한 매체별 에볼라 주제 분석 - 바이오 분야 연구논문과 뉴스 텍스트 데이터를 이용하여 - (Text Mining Driven Content Analysis of Ebola on News Media and Scientific Publications)

  • 안주영;안규빈;송민
    • 한국문헌정보학회지
    • /
    • 제50권2호
    • /
    • pp.289-307
    • /
    • 2016
  • 에볼라 바이러스(Ebola virus disease)와 같은 전염병들은 사회적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되기도 한다. 이에 따라 국내외로 전염병과 관련된 텍스트 마이닝 연구가 활발하게 진행되고 있으나, 텍스트 마이닝 기법을 사용하여 상이한 특성을 가진 매체 간 주제를 분석한 연구는 아직까지 진행되지 않고 있다. 따라서 본 연구에서는 전염병 중 하나인 에볼라를 키워드로 하여 사회적 특성을 지닌 뉴스 기사와 바이오 분야의 전문적 특성을 지닌 연구 논문 간의 주제 분석을 진행하였다. 텍스트 분석에는 매체별 문헌 데이터로부터 다양한 토픽들을 추출하기 위해 토픽모델링 기법을 적용하였고, 매체 간의 구체적인 내용 분석을 위해 중요 개체를 선정하고 이를 중심으로 동시출현 단어 네트워크 분석을 수행하였다. 또한 각 매체별로 등장하는 주제를 시각적으로 표현하기 위해 토픽맵을 구축하였다. 분석 결과, 두 매체에서 다루는 주제의 차이점과 공통점을 발견할 수 있었으며 동시 출현 주제의 시계열 분석을 통해 매체 간 특성의 차이를 찾을 수 있었다. 본 연구를 통해 상이한 특성을 지닌 매체들의 주제와 개체들을 함께 제시하고, 매체 간의 공통점과 차이점을 보여줌으로써 매체별 정보 생산자들이 연구 및 현상 분석을 진행하는 데 있어 관점의 다양성을 제공할 수 있을 것이다.

이분산 시계열모형을 이용한 국내주식자료의 군집분석 (Clustering Korean Stock Return Data Based on GARCH Model)

  • 박만식;김나영;김희영
    • Communications for Statistical Applications and Methods
    • /
    • 제15권6호
    • /
    • pp.925-937
    • /
    • 2008
  • 본 논문에서는 주식시장에서 거래되는 다수의 주식거래종목들을 몇 개의 그룹으로 군집화하는 주제를 연구한다. 시간에 관계없이 분산이 일정한 ARMA모형과 다르게, 주가, 환율 등의 금융시계열자료에서는 조건부 이분산성을 따르게 된다. 또한, 많은 사람들이 금융시계열자료에서 관심을 갖는 것은 바로 이 변동성이다. 그러므로, 이 연구에서는 조건부 이분산성을 모형화하기에 적합하다고 알려진 일반화 조건부 이분산성 자기회귀모형에 초점을 맞춘다. 먼저 두 개의 주식종목들 사이에 변동성(volatility)의 유사성 그리고 구조의 유사성을 재는 거리를 정의하고, 모의실험을 수행한다. 실증자료로 최근 3년 동안 관찰된 국내 11개 주가의 수익률을 변동성과 구조에 따라 군집화한다.