• 제목/요약/키워드: intelligent platform

검색결과 583건 처리시간 0.031초

미세먼지 예측 성능 개선을 위한 시공간 트랜스포머 모델의 적용 (Application of spatiotemporal transformer model to improve prediction performance of particulate matter concentration)

  • 김영광;김복주;안성만
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.329-352
    • /
    • 2022
  • 미세먼지는 폐나 혈관에 침투해 각종 심장 질환이나 폐암 등의 호흡기 질환을 일으키는 것으로 보고되고 있다. 지하철은 일 평균 천만 명이 이용하는 교통수단으로, 깨끗하고 쾌적한 환경조성이 중요하나 지하터널을 통과하는 지하철의 운행 특성과 터널에 갇힌 미세먼지가 열차 풍으로 인해 지하역사로 이동하는 등의 문제로 지하역사의 미세먼지 오염도는 높은 것으로 나타나고 있다. 환경부와 서울시는 지하역사 공기질 개선대책을 수립하여 다양한 미세먼지 저감 노력을 기울이고 있다. 스마트 공기질 관리 시스템은 공기질 데이터 수집 및 미세먼지 농도를 예측하여 공기질을 관리하는 시스템으로 미세먼지 농도 예측 모델이 중요한 구성 요소이다. 그동안 시계열 데이터 예측에 관한 다양한 연구가 진행되어왔지만, 지하철 역사의 미세먼지 농도 예측과 관련해서는 통계나 순환신경망 기반의 딥러닝 모델 연구에 국한되어 있다. 이에 본 연구에서는 시공간 트랜스포머를 포함한 4개의 트랜스포머 기반 모델을 제안한다. 서울시 지하철 역사의 대합실을 대상으로 한 시간 후의 미세먼지 농도 예측실험을 수행한 결과, 트랜스포머 기반 모델들의 성능이 기존의 ARIMA, LSTM, Seq2Seq 모델들에 비해 우수한 성능을 나타냄을 확인하였다. 트랜스포머 기반 모델 중에서는 시공간 트랜스포머의 성능이 가장 우수하였다. 데이터 기반의 예측을 통하여 운영되는 스마트 공기질 관리 시스템은 미세먼지 예측의 정확도가 향상될수록 더욱더 효과적이고 에너지 효율적으로 운영될 수 있다. 본 연구 결과는 스마트 공기질 관리 시스템의 효율적 운영에 기여할 수 있을 것으로 기대된다.

공공 정보지원 인프라 활용한 제조 중소기업의 특징과 성과에 관한 연구 (The Characteristics and Performances of Manufacturing SMEs that Utilize Public Information Support Infrastructure)

  • 김근환;권태훈;전승표
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.1-33
    • /
    • 2019
  • 제조 중소기업들은 지속적인 성장과 생존을 위해 새로운 제품 개발에 필요한 많은 정보가 필요할 뿐만 아니라 자원의 한계를 극복하기 위한 네트워킹(networking)을 추구하지만, 규모의 한계로 인해 한계점에 봉착하게 된다. 초연결성으로 인해 비즈니스 환경의 복잡성과 불확실성이 더욱 높아지는 새로운 시대에 중소기업은 신속한 정보 확보와 네트워킹 문제를 해결이 더욱 절실해지고 있다. 이러한 문제를 해결하기 위해 공공기관인 정부출연(연)구기관(이하 '출연(연)')은 중소기업의 정보 비대칭성 문제를 해결해야하는 중요한 임무와 역할을 맞이하고 있다. 본 연구에서는 비즈니스 인텔리젼스의 경쟁 지능화(competitive intelligence) 기능과 외부 네트워크 활성화를 위한 서비스 인프라(service infrastructure)의 기능을 포함한 공공 정보지원 인프라를 통한 간접지원의 성과를 확산하고자 하는 목적으로 출연(연)이 중소기업의 혁신역량 제고를 위해 제공하는 공공 정보지원 인프라를 활용하는 중소기업의 차별적 특징을 파악하고, 인프라가 기업의 성과에 어떻게 기여하는 가를 규명하고자 하였다. 이를 위해 첫째, 출연(연)이 제공한 정보지원 인프라를 활용하는 제조 중소기업은 다른 중소기업과 어떤 차별적인 특정이 있는가? 라는 연구 질의를 도출하였다. 추가적으로 단순히 선택적 편의 여부를 판단하는 것을 넘어서 출연(연) 정보지원 인프라를 활용한 제조 중소기업의 특징을 복수 집단의 특징과 비교하는 연구를 진행하였다. 둘째, 출연(연)이 제공하는 정보지원 인프라를 활용한 제조 중소기업의 외부 네트워킹 역량이 제품 경쟁력에 어떻게 기여했는가? 라는 연구 질의이다. 본 연구에서 공공 정보지원 인프라에 의해서 강화된 외부 네트워킹 역량이 어떻게 제품 경쟁력에 영향을 미쳤는지 정밀하게 분석하기 위해 복수의 변수에 대한 매개 및 조절 효과 분석을 수행하였다. 연구 모형을 도출하기하기 위해 첫째, 외부 네트워킹이 기술혁신성과에 영향력에 대한 평가를 수행하였다. 일반적으로 기업들은 외부 네트워킹(networking) 전략을 통해 혁신에 필요한 가치 있는 정보를 획득할 수 있기 때문에 기술혁신성과를 높일 수 있다. 정보 획득은 중소 제조기업 경영자의 혁신에 대한 인식을 강화할 뿐만아니라, 의사결정을 효율적으로 하여 경쟁력을 강화시킬 수 있게 된다. 대기업에 비해 인력과 자금의 규모 한계를 극복하기 위해 중소기업은 외부 조직과의 협력관계를 보다 적극적으로 추구한다. 둘째, 기술사업화 역량이 기술혁신성과에 미치는 관계에 대한 평가를 수행하였다. 기술사업화는 생산과 마케팅을 통합하여 새로운 기술을 만드는 역량을 말한다. 우수한 생산 역량을 보유한 기업은 소비자의 수요를 가격, 품질, 신기능 측면에서 신속하게 충족시킬 수 있어 시장내 경쟁우위를 창출하고, 그 결과로 높은 재무적 혁신적 성과를 가져온다고 본다. 혁신적인 기업은 생산 역량과 마케팅 역량에서 일반 기업보다 높은 성과를 나타내는데, 기술혁신성과의 대표 지표로 제품 경쟁력을 지목하고 있다. 마지막으로 기업의 규모가 작을수록 새로운 혁신 정보를 확보할 수 있는 자체 정보지원 인프라가 없는 경향이 있다. 중소기업용 정보인프라는 기업의 제품 또는 서비스 역량을 강화하기 위한 전략에 필요한 중요한 정보를 확보할 수 있어야 하며, 데이터에 대한 해석 기능이 있어야 하고, 기업의 성장과 발전을 위한 다양한 주제(대기업, 공급자, 소비자 등)와의 협력 전략을 수립을 도울 수 있는 기능이 요구된다. 종합하면, 연구모형은 외부 네트워킹 역량(독립변수)이 기술혁신성과인 제품 경쟁력(종속변수)에 영향을 주는 기본 모형에 기술사업화 역량을 매개요인으로 적용하였고, 이들의 관계에 기업의 내부역량(연구원 집중도, 매출액, 업력)이 영향을 줄 수 있기 때문에 기업의 내부역량과 관련된 변수들을 통제하였다. 또한 KISTI가 제공한 공공 정보지원 인프라 활용한 기업별 역량 차이를 분석하기 위해, 정보지원 인프라 활용(효율성)과 관련된 KISTI 외부 기술사업화 전문가(멘토링) 정보지원 횟수의 조절 변수로 고려하였다. 본 연구에서 활용한 데이터 원천은 2차 정보인 '제8차 중소기업 기술통계조사' 자료와 1차 정보인 KISTI의 직접 설문 자료다. '제8차 중소기업 기술통계조사' 는 중소기업청과 중소기업중앙회에서 공동으로 매년 실시되고 있으며, 설문 조사의 모집단은 종사자수 5인 이상 300인 미만인 제조업 및 제조업 외 기업 중에서 기술개발을 수행하고 있는 중소기업 43,204개사이다. 이 중에서 2014년 12월 31일 현재 기준으로 기술개발을 수행하고 있는 3,300개 중소기업을 표본추출하여 방문조사를 실시하여 수집한 자료이다. 본 연구에서 KISTI의 정보지원 인프라를 통해 지원받은 290개의 KISTI 패밀리 기업(ASTI)을 대상으로 2017년에 전자 메일을 통해 자료를 수집하였다. 송부된 290개의 설문지 중 222개의 기업에서 회신을 보내왔으며 그 중에서 설문 내용이 유효한 설문 조사는 149건으로 활용율은 51.3%였다. 분석 결과에 대한 살펴보면 다음과 같다. 규모면에서는 공공 정보지원 인프라 활용 제조 중소기업(ASTI 설문 집단)과 R&D 중소기업(KBIZ 설문 집단)의 성향은 통계적으로 유의미하게 차이가 있었지만, 보다 많은 변수를 종합적으로 보면 크게 다르지 않은 집단이라고 판단했다. 공공 정보지원 인프라를 활용하는 제조 중소기업은 이미 출연(연)과 협업이 가능한 집단을 대표하는 성향 보이는 것으로 나타났다. 외부 네트워킹 역량 강화가 제품 경쟁력 제고에 기여하는데 있어서 기술사업화 역량(마케팅 및 생산 역량)이 가지는 매개 효과의 가능성을 탐색하기 위해서 먼저 통제 변수는 고려하지 않고, Baron과 Kenny(1986)의 매개 효과 분석을 수행했다. 분석결과 외부 네트워크 역량 강화 효과가 제품 경쟁력을 강화시키는 것으로 보였지만, 실제는 기술사업화 역량의 제고를 통해 제품 경쟁력을 강화시키는 것으로 나타났다. 공공 정보지원 인프라 활용의 효과성을 판단하기 위한 멘토링 정보지원 횟수의 조절효과 분석을 위해 3단계의 위계적 회귀분석을 수행하였다. 분석 결과 외부 네트워킹 역량과 멘토링 정보지원 횟수의 상호작용항이 혁신성과(제품 경쟁력)에 유의한 영향을 미쳤을 뿐 아니라, 모델의 설명력도 증가하여, 멘토링 정보지원 횟수의 조절 효과가 검증되었다. 마지막으로 앞서 확인된 복수 매개효과와 조절효과가 동시에 나타날 수 있는 가능성을 판단하기 위해서 매개된 조절효과를 검토했다. 분석결과 외부 네트워킹 역량이 높아지면 제품 경쟁력 제고에 양의 영향을 주지만, 조절 변수인 멘토링 지원 횟수가 높아질수록 그 영향은 오히려 약화되었다. 그리고 외부 네트워킹 역량이 높아지면 사업화 역량(마케팅과 생산)이 높아져서 제품 경쟁력이 높아지며, 조절변수인 멘토링 지원 횟수가 높아지면 독립변수 외부 네트워킹 역량이 매개변수 생산 역량에 미치는 역량이 작아졌다. 종합하면, 외부 네트워킹 역량의 제고는 제품 경쟁력을 높이는데 기여하는데, 직접적 기여하지는 않지만 마케팅과 생산 역량을 높여 간접적으로 기여한다(완전 매개 효과). 또한 이 과정에서 멘토링의 정보적 지원 횟수는 외부 네트워킹 역량 제고가 생산 역량을 제고하는 매개효과에 영향을 준다(순수 조절 효과). 그러나 멘토링 정보 지원 횟수는 마케팅 역량 제고와 제품경쟁력에 별다른 조절 효과를 보이진 않는 것으로 나타났다. 연구를 통한 시사점은 다음과 같다. KISTI의 정보지원 인프라는 서비스 활용 마케팅이 이미 잘 진행되고 있다는 결론을 이끌 수도 있지만, 반면에 시장의 정보 불균형을 해소하는 공공적 기능보다는(열위 기업 지원) 성과가 잘 도출될 수 있는 집단을 지원해서(의도적 선택적 편의) 성과가 잘 나타나도록 관리하고 있다는 결론에 이를 수 있다. 연구 결과를 통해서 우리는 공공 정보지원 인프라가 어떻게 제품경쟁력 제고에 기여하는지 확인했는데, 여기서 우리는 다음과 같은 몇 가지 정책적 시사점을 도출할 수 있다. 첫째, 정보지원 인프라는 분석된 정보뿐만아니라 이 정보를 제공하는 기관(또는 전문가)과 지속적인 교류나 이런 기관을 찾는 역량을 높이는 기능이 있어야 한다. 둘째, 공공 정보지원 (온라인) 인프라의 활용이 효과적이라면 병행적인 오프라인 지원인 정보 멘토링이 지속적으로 제공될 필요는 없으며, 오히려 멘토링과 같은 오프라인 병행 지원은 성과 제고보다는 이상징후 감시에 적절한 장치로 활용되어야 한다. 셋째, 셋째, 공공 정보지원 인프라를 통한 네트워킹 역량 제고와 이를 통한 제품경쟁력 제고 효과는 특정 중소기업에서 나타나기 보다는 대부분 형태의 기업에서 나타나기 때문에, 중소기업이 활용 능력을 제고할 노력이 요구된다.

가상현실 웨어러블 기기의 구매 촉진을 위한 태도 자신감과 사용자 저항 태도: 가상현실 헤드기어를 중심으로 (Attitude Confidence and User Resistance for Purchasing Wearable Devices on Virtual Reality: Based on Virtual Reality Headgears)

  • 손봉진;박다슬;최재원
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.165-183
    • /
    • 2016
  • 스마트폰을 넘어 차세대 IT 비즈니스의 주목할 만한 후보군으로 가상현실이 이슈가 되고 있다. 가상현실은 컴퓨터와 VR헤드셋을 통해 구현한 입체적인 가상공간을 제공함으로써 사용자의 시각을 완전히 장악하고, 청각, 촉각 등 오감과의 상호작용 및 음성, 동작인식 등을 통해 가상공간을 마치 현실처럼 느끼게 한다는 점에서 향후 주목할 만한 산업 분야로 떠오르고 있다. 많은 글로벌 대기업들이 가상현실과 관련한 사업에 투자를 하고 있으나 소비자의 관점에서 가상현실 관련 제품군은 아직 쉽게 접하거나 구매하기 어려운 제품군으로 인식된다. 그렇기 때문에 소비자의 태도 변화가 큰 변화가 발생되고 있지 않으며 Acception & Diffusion 모델의 초기단계에 지나지 않아 구매로 연결되지 않는 실정이다. 본 연구는 기존 선행연구의 관점을 바탕으로 가상현실 헤드기어 제품들의 판매 촉진을 위한 사용자 관점에서의 사용자 저항을 매개 변수로 저항을 감소시키고 사용 및 구매의도에 영향을 주는 선행요인들을 도출하고자 하였으며 사용자가 가지고 있는 태도에 대한 자신감에 영향을 주어 행동 의도까지 변화시키는 현상에 대한 분석을 하고자 하였다. 본 연구의 결과는 태도 자신감에 대한 사용 용이성과 사용 혁신성의 영향력을 확인할 수 있었다. 마찬가지로 사용자 혁신저항에 영향력을 주는 변수로는 가격, 심미적 외관, 즐거움, 콘텐츠 및 화질 관련 변수들을 도출하였다. 결과적으로 본 연구는 태도 자신감의 가상현실 혁신 수용에 대한 영향력을 제시하고 가격 이외 변수인 콘텐츠의 양과 저항감의 관계성을 바탕으로 관련 변수들을 제시하였다. 특히 초기 시장인 가상현실 제품의 특성에 따라 브랜드에 대한 선점효과의 필요성과 콘텐츠의 부족함 등이 실무적으로 해결해야 할 과제로서 확인되었다.

기업의 SNS 마케팅 활동이 이용자 행동에 미치는 영향: 페이스북 팬페이지 애널리틱스를 중심으로 (The Effect of Corporate SNS Marketing on User Behavior: Focusing on Facebook Fan Page Analytics)

  • 전형준;서봉군;박도형
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.75-95
    • /
    • 2020
  • 소셜네트워크서비스(SNS)의 성장과 함께 다양한 형태의 SNS가 등장했다. 상호작용성, 정보 교류, 엔터테인먼트 등 다양한 이용 동기를 바탕으로 SNS 이용자 또한 빠르게 증가하는 추세이다. 그중 페이스북은 대표하는 SNS 채널로서 기업에서도 페이스북 페이지를 활용해 홍보 채널로 활용하기 시작했다. 이를 위해 운영 초기, 기업은 팬 수 확보에 나섰고 그 결과 최근 기업 페이스북 팬 수는 많게는 수백만에 이를 정도로 늘어났다. 기업의 목표는 팬 수 확보를 넘어 콘텐츠를 통해 고객에게 기업 브랜드 이미지를 재고하고, 나아가 소통하는 수단으로 활용하고 있다. 이를 평가하는 주요 수치가 바로 본 연구의 종속변수에 해당하는 페이스북의 '좋아요', '댓글', '공유', '클릭 수' 등이다. 해당 수치 달성을 위해 콘텐츠 제작에 대한 고민이 선행되어야 하는데, 본 연구에서는 콘텐츠 제작 고려 사항을 3가지로 나눠 독립변수를 구성하였다. 콘텐츠 소재, 콘텐츠 구조, 메시지 스타일 등이 페이스북의 이용자 행동에 미치는 영향을 회귀분석을 이용해 분석하였다. 종속변수의 경우, 콘텐츠상에 모든 이용자의 행동 '전체 클릭 수'로 설정하였다. 본 연구에서는 각 독립 변수를 기존 연구 문헌을 통해 정의하고, 종속변수에 미치는 영향을 분석하였는데, '전체 클릭 수'의 경우, '자사연관', '실생활 관여도', '격식 x 관여도' 등의 변수가 유의미한 영향을 갖는 것으로 나타났다. 연구 결과를 통해, 콘텐츠 목적에 따른 최적화된 콘텐츠 전략을 제시함으로써, 기업 페이스북 운영자와 콘텐츠 제작자의 운영, 제작 전략에 기여할 수 있을 것으로 보인다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

소셜 뉴스를 위한 시간 종속적인 메타데이터 기반의 컨텍스트 공유 프레임워크 (Context Sharing Framework Based on Time Dependent Metadata for Social News Service)

  • 가명현;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.39-53
    • /
    • 2013
  • 인터넷의 발달과 SNS의 등장으로 정보흐름의 방식이 크게 바뀌었다. 이러한 변화에 따라 소셜 미디어가 급부상하고 있으며 소셜 미디어와 비디오 콘텐츠가 융합된 소셜 TV, 소셜 뉴스의 중요성이 강조되고 있다. 이러한 환경 속에서 사용자들은 단순히 콘텐츠를 탐색만 하는 것이 아니라 같은 콘텐츠를 이용하고 있는 친구들이나 지인들과 콘텐츠에 대한 정보나 경험들을 공유하고 더 나아가 새로운 콘텐츠를 만들어내기도 한다. 하지만 기존의 소셜 뉴스에서는 이러한 사용자들의 특성을 반영해 주지 못하고 있다. 특히 이용자들의 참여성만을 고려하고 있어서 서비스간의 차별화가 어렵고 뉴스 콘텐츠에 대한 정보나 경험 공유 시 컨텍스트 공유가 어렵다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 뉴스를 내용별로 분할하고 분할된 뉴스에서 추출된 시간 종속적인 메타데이터를 제공하는 프레임워크를 제안한다. 제안하는 프레임워크에서는 스토리 분할 방법을 이용하여 뉴스 대본을 내용별로 분할한다. 또한 뉴스 전체내용을 대표하는 태그, 분할된 뉴스를 나타내는 서브 태그, 분할된 뉴스가 비디오에서 시작하는 위치 즉, 시간 종속적인 메타데이터를 제공한다. 소셜 뉴스 이용자들에게 시간 종속적인 메타데이터를 제공한다면 이용자들은 전체의 뉴스 내용 중에 자신이 원하는 부분만을 탐색 할 수 있으며 이 부분에 대한 견해를 남길 수 있다. 그리고 뉴스의 전달이나 의견 공유 시 메타데이터를 함께 전달함으로써 전달하고자 하는 내용에 바로 접근이 가능하며 프레임워크의 성능은 추출된 서브 태그가 뉴스의 실제 내용을 얼마나 잘 나타내 주느냐에 따라 결정된다. 그리고 서브 태그는 스토리 분할의 정확성과 서브 태그를 추출하는 방법에 따라 다르게 추출된다. 이 점을 고려하여 의미적 유사도 기반의 스토리 분할 방법을 프레임워크에 적용하였고 벤치마크 알고리즘과 성능 비교 실험을 수행하였으며 분할된 뉴스에서 추출된 서브 태그들과 실제 뉴스의 내용을 비교하여 서브 태그들의 정확도를 분석하였다. 결과적으로 의미적 유사도를 고려한 스토리 분할 방법이 더 우수한 성능을 보였으며 추출된 서브 태그들도 컨텍스트와 관련된 단어들이 추출 되었다.

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.

국가 감염병 공동R&D전략 수립을 위한 분류체계 및 정보서비스에 대한 연구: 해외 코로나바이러스 R&D과제의 분류모델을 중심으로 (The Classification System and Information Service for Establishing a National Collaborative R&D Strategy in Infectious Diseases: Focusing on the Classification Model for Overseas Coronavirus R&D Projects)

  • 이도연;이재성;전승표;김근환
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.127-147
    • /
    • 2020
  • 세계는 신형 코로나바이러스 감염증(COVID-19)으로 수 많은 인명 피해와 경제적 손실을 기록하고 있는 상황이다. 우리나라 정부는 연구개발(Research & Development)을 통해 국가 감염병 위기를 극복하려는 전략을 수립하고 실행하기 위한 투자방향을 수립하였다. 기존 기술분류나 과학기술 표준분류에 따른 통계를 활용하면 특정 R&D 분야의 특이점 및 변화를 발견하기 어렵다는 한계가 존재해왔다. 최근 우리나라 감염병 연구개발 과제를 대상으로 수요자의 목적에 맞게 분류체계를 수립하고 연구비 비교 분석을 통해 투자가 요구되는 연구 분야를 제시하는 연구들이 진행되었다. 하지만 현재 국가 보건 안보와 신성장 산업육성이라는 목표를 달성하기 위한 실행방안으로 요구되고 있는 전염병 연구분야의 국가간 협력전략 수립에 필요한 정보를 체계적으로 제공하고 있지 못한 상황이다. 따라서 국가 공동 연구개발 전략 수립을 위한 분류체계와 분류모델기반의 정보서비스에 대한 연구가 요구되고 있다. 우선 감염병관련 NTIS 과제데이터를 기반으로 정성분석을 통해 7개의 분류체계를 도출하였다. 스코퍼스(Scopus) 데이터와 양방향 RNN모델을 사용하여, 분류체계 모델을 학습시켰다. 최종적인 모델의 분류 성능은 90%이상의 높은 정확도와 강건성을 확보하였다. 실증연구를 위해 주요 국가의 코로나바이러스 연구개발 과제를 대상으로 전염병 분류체계를 적용하였다. 주요 국가의 감염병(코로나바이러스) 연구개발 과제를 분류체계별로 분석한 결과, 세계적으로 유행하는 바이러스의 예상치 못한 창궐이 확산되는 속도에 비해 백신과 치료제 개발이 제대로 이뤄지지 않는 원인의 배경을 간접적으로 확인할 수 있었다. 국가별 비교분석을 통해 미국과 일본은 상대적으로 모든 영역에 골고루 연구개발 투자를 하고 있는 것으로 나타난 반면, 유럽은 상대적으로 특정 연구분야에 많은 투자를 하는 집중화 전략을 취하는 것으로 나타났다. 동시에 주요 국가의 코로나 바이러스 주요 연구조직에 대한 정보를 분류체계별로 제공하여 국제 공동R&D 전략의 기초정보를 제공하였다. 본 연구 결과를 통해 세 가지 정책적 의미를 도출할 수 있다. 첫째, 데이터기반 과학기술정책 관점에서 수요자 관심분야에 대한 국가 R&D사업의 정보를 글로벌 기준으로 문서를 분류하는 방안을 제시하였다. 둘째, 감염병관련 국가 R&D사업 영역에 대한 정보분석 서비스 기획의 기반을 마련하였다. 마지막으로 국가 감염병 R&D 분류체계 수립을 통해 분류 체계의 궁극적 목표인 산업, 기업, 정책 정보를 제공할 수 있는 기반을 마련한 것이다.

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.

스마트교육을 위한 오픈 디지털교과서 (Open Digital Textbook for Smart Education)

  • 구영일;박충식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.177-189
    • /
    • 2013
  • 스마트교육에서 디지털교과서의 역할은 학습자와 대면하는 교육미디어로써 그 중요성은 재론의 여지없다. 이러한 디지털교과서는 학습자의 편의와 더불어 교수자, 콘텐츠 제작자, 유통업자를 위하여 표준화되어야 활성화되고 산업화될 수 있다. 본 연구에서는 다음과 같은 3가지 목표를 지향하는 디지털교과서 표준화 방안을 모색한다. (1) 디지털교과서는 온-오프 수업을 모두 지원하는 혼합학습 매체의 역할을 해야 하며, 특별한 전용뷰어 없이 표준을 준수하는 모든 EPUB 뷰어에서 실행가능 해야 하며, 기존의 이러닝 학습 콘텐츠와 학습관리시스템를 활용할 수 있도록 하며, 디지털 교과서를 사용하는 학습자의 정보를 추적 관리할 수 있는 트랙킹기능이 있으면서도, 오프라인 동안의 정보를 축적하여 서버와 통신할 수 있는 기능도 필요하다. 디지털교과서의 표준으로서 EPUB을 고려하는 이유는 디지털교과서가 책의 형태를 가져야 하는데 이를 위해서 따로 표준을 정할 필요가 없으며, EPUB 표준을 채택함으로써 풍부한 콘텐츠, 유통구조, 산업기반을 활용할 수 있기 때문이다. (2) 디지털교과서는 오픈소스를 적극 활용하여 저비용으로 현재 사용가능한 서비스를 구성하여 표준과 더불어 실제 실행 가능한 프로그램으로 제시되어야 하며, 관련 학습 콘텐츠가 오픈마켓의 형태로 운영될 수 있어야 한다. (3) 디지털교과서는 학습자에게 적절한 학습 피드백을 제공하기 위하여 모든 학습활동 정보를 축적하고 관리될 수 있는 인프라를 표준에 따라 구축하여 교육 빅데이터 처리의 기반을 제공하여야 한다. 이북 표준인 EPUB 3.0을 기반으로 하는 오픈 디지털교과서는 (1) 학습활동 정보를 기록하고 (2) 이 학습활동 지원을 위한 서버와 통신하여야 한다. 현재 표준으로 정해져 있지 않은 이북의 기록과 통신 기능을 EPUB 3.0의 JavaScript로 구현하여 현재 EPUB 3.0 뷰어에서도 활용하면서 이를 차세대 이북 표준 또는 교육을 위한 이북 표준(EPUB 3.0 for education)으로 제안하여 향후 제정된 표준 이북 뷰어에서는 JavaScript없이도 처리되도록 하는 전략이 필요하다. 향후 연구는 제안한 오픈 디지털교과서 표준에 의한 오픈소스 프로그램을 개발하고, 개발된 오픈 디지털교과서의 학습활동정보를 활용한 새로운 교육서비스 방안(교육 빅데이터 활용방안 포함)을 제시하는 것이다.