• 제목/요약/키워드: Big-Data Platform

검색결과 503건 처리시간 0.028초

집단지성을 이용한 한글 감성어 사전 구축 (Building a Korean Sentiment Lexicon Using Collective Intelligence)

  • 안정국;김희웅
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.49-67
    • /
    • 2015
  • 최근 다양한 분야에서 빅데이터의 활용과 분석에 대한 중요성이 대두됨에 따라, 뉴스기사와 댓글과 같은 비정형 데이터의 자연어 처리 기술에 기반한 감성 분석에 대한 관심이 높아지고 있다. 하지만, 한국어는 영어와는 달리 자연어 처리가 어려운 교착어로써 정보화나 정보시스템에의 활용이 미흡한 실정이다. 이에 본 연구는 감성 분석에 활용이 가능한 감성어 사전을 집단지성으로 구축하였고, 누구나 연구와 실무에 사용하도록 API서비스 플랫폼을 개방하였다(www.openhangul.com). 집단지성의 활용을 위해 국내 최대 대학생 소셜네트워크 사이트에서 대학생들을 대상으로 단어마다 긍정, 중립, 부정에 대한 투표를 진행하였다. 그리고 집단지성의 효율성을 높이기 위해 감성을 '정의'가 아닌 '분류'하는 방식인 폭소노미의 '사람들에 의한 분류법'이라는 개념을 적용하였다. 총 517,178(+)의 국어사전 단어 중 불용어 형태를 제외한 후 감성 표현이 가능한 명사, 형용사, 동사, 부사를 우선 순위로 하여, 현재까지 총 35,000(+)번의 단어에 대한 투표를 진행하였다. 본 연구의 감성어 사전은 집단지성의 참여자가 누적됨에 따라 신뢰도가 높아지도록 설계하여, 시간을 축으로 사람들이 단어에 대해 인지하는 감성의 변화도 섬세하게 반영하는 장점이 있다. 따라서 본 연구는 앞으로도 감성어 사전 구축을 위한 투표를 계속 진행할 예정이며, 현재 제공하고 있는 감성어 사전, 기본형 추출, 카테고리 추출 외에도 다양한 자연어 처리에 응용이 가능한 API들도 제공할 계획이다. 기존의 연구들이 감성 분석이나 감성어 사전의 구축과 활용에 대한 방안을 제안하는 것에만 한정되어 있는 것과는 달리, 본 연구는 집단지성을 실제로 활용하여 연구와 실무에 활용이 가능한 자원을 구축하여 개방하여 공유한다는 차별성을 가지고 있다. 더 나아가, 집단지성과 폭소노미의 특성을 결합하여 한글 감성어 사전을 구축한 새로운 시도가 향후 한글 자연어 처리의 발전에 있어 다양한 분야들의 융합적인 연구와 실무적인 참여를 이끌어 개방적 협업의 새로운 방향과 시사점을 제시 할 수 있을 것이라 기대한다.

R 프로그래밍 수용 결정 요인에 대한 탐색 연구 (An Exploratory Study on Determinants Affecting R Programming Acceptance)

  • ;남수현
    • 경영과정보연구
    • /
    • 제37권1호
    • /
    • pp.139-154
    • /
    • 2018
  • R 프로그래밍 시스템은 인터넷을 통해 개방적이고 무료로 제공이 된다. R 환경은 헌신적이고 독자적인 사용자 그룹이 제공하는 다양한 함수가 포함되는 라이브러리에 의해 그 기능이 지속적으로 풍부해지고 다양해지고 있다. R의 사용은 조직에서의 빅데이터 분석이 점차 도입되면서 다양한 데이터 형태의 데이터 조작과 데이터 분석처리가 요구되면서 점차 채택되기 시작하였다. 그러나 R 수용에 대한 연구는 아직까지 존재하지 않고 있다. 본 연구는 교육환경의 사용자가 R을 수용하는데 미치는 인지변수를 식별하고, 그들간의 관계를 규명하고자 한다. 기존의 기술수용모형에 주관적 규범과 소프트웨어 역량을 추가한 확장된 R 수용모델을 제안하고, 경로분석을 통하여 가설을 검정하였다. 사용의도에 정의 영향을 미치는 변수는 주관적 규범, 지각된 편리성, 지각된 유용성으로 밝혀졌고, 지각된 유용성은 주관적 규범, 소프트웨어 역량, 그리고 지각된 편리성으로부터 영향을 받는 것으로 나타났다. 본 연구가 이전 연구와의 주요 차이점은 대상 시스템이 독립적인 시스템이 아니고, 또한 시스템은 정적이고 개발이 확정된 상태가 아닌 진화하고 오픈소스 시스템을 대상으로 했다는 것이다. 또한 R 환경은 플랫폼으로서, 다양한 통계분석, 빅데이터분석, 그리고 시각화가 가능한 시스템이다. 우리는 TAM(Technology Acceptance Model)을 적용하여 R플랫폼에 대한 사용자의 수용에 영향을 주는 변수를 식별하고 인과관계를 처음으로 시도하였다. 또 다른 기여도는 기존의 TAM모형에 주관적 규범과 소프트웨어 역량 개념을 추가한 확장된 모형을 식별한 것이다. 본 연구결과는 통계나 빅데이터 분석 패키지 도입 계획이 있는 대학이나 기업체에 시사점을 제공할 수 있을 것이다. 그러나 분석에 사용된 표본의 수가 적고, 표본이 모집단을 대표할 수 있다는 근거가 약해 제안된 모델의 신뢰성 및 타당성이 상대적으로 미흡하다고 할 수 있을 것이다. 따라서, 향후 연구에서는 확정적 연구를 위해서는 이와 같은 문제점에 대한 보완이 필요하다고 판단된다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

미래도시 전망 분석 (An Analysis on the Expert Opinions of Future City Scenarios)

  • 조성수;백효진;한정훈;이상호
    • 지역연구
    • /
    • 제35권3호
    • /
    • pp.59-76
    • /
    • 2019
  • 본 연구의 목적은 미래도시의 모습을 시나리오로 만들고, 델파이 분석을 통해 미래도시 변화의 시기와 실현 가능성을 분석하는 것이다. 미래도시 시나리오는 빅데이터 분석과 환경스캐닝 기법, 문헌연구를 통해 도시구조, 토지 이용, 교통 및 인프라, 도시개발로 도출되었다. 델파이는 우리나라와 미국, 영국, 호주, 일본, 중국, 인도 등 6개국 24명의 전문가를 통해 진행되었다. 델파이 구조는 시나리오의 실현 가능성을 리커트 5점 척도로 전망할 수 있도록 구성하였으며, 실현 시기를 근미래(10년 이하), 중미래(10~20년), 먼미래(20년 이상)로 설정하였다. 연구의 분석결과는 다음과 같다. 첫째, 도시구조는 단기적으로 수위 및 광역 대도시(Global and Mega-City)를 중심으로 집중되며, 중장기적으로 지방 중소도시는 쇠퇴할 것으로 전망되었다. 둘째, 토지 이용은 근미래에 수직적, 수평적으로 혼합될 것이며, 공유 공간이 증가될 것으로 예측되었다. 셋째, 교통 및 인프라는 ICT 기반의 통합 플랫폼을 통한 도시관리가 진행되며, 스마트 기술을 통해 공공 및 개인(민간) 교통이 활성화될 것으로 분석되었다. 넷째, 도시개발은 교통 결절지(TOD) 중심의 개발이 활성화될 것이며, 에너지 및 환경 분야에 중점을 둘 것으로 전망되었다.

국가기록원 웹사이트 유입경로와 이용자 검색어 분석 (Analysis of Users' Inflow Route and Search Terms of the Korea National Archives' Web Site)

  • 진주영;이해영
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 이용자 정보이용환경이 웹으로 변화하면서, 기록관리기관들도 종전보다 더 많은 서비스를 웹을 통해 제공하고 있다. 이 연구는 국가기록원 웹사이트를 이용하는 이용자의 최근 유입경로와 10년 반 동안 매달 상위 100개의 검색어 데이터를 분석하고 그에 맞는 기록정보서비스방안을 제시한다. 분석 결과 유입경로는 크게 포털 사이트별 접속, 국가별 접속, 유사기관 별 접속 및 모바일 접속으로 분류할 수 있었다. 이용자들의 검색어를 분석한 결과 이용자들이 10년 반 동안 가장 많이 검색한 검색어는 '토지조사부'였으며, 꾸준한 관심을 갖고 검색한 검색어 또한 '토지조사부'였다. 그 외에 정부 기관에서 생산한 문서 또는 관보에 대한 관심도 높음을 확인하였다. 그리고 이용자들이 가장 많이 검색한 검색어와 꾸준히 등장한 검색어를 파악한 결과, 검색어들을 크게 토지, 일제강점기, 6.25 전쟁과 남북관계, 기록관리 및 이용으로 묶어볼 수 있었다. 분석결과를 토대로 포털 사이트 및 모바일 등을 활용한 국가기록원 웹사이트의 연계성 강화와 검색 서비스의 고도화 방안을 제안하였다. 이 연구는 이렇게 웹로그나 이용자 검색어 등을 분석하면 기록관리기관 이용자들에게 제공하는 서비스를 고도화할 수 있는 의미 있는 결과를 얻을 수 있음을 확인하였다.

국내 O2O 서비스 이슈 진단 및 산업활성화 정책 방향 제안 (Service Issues and Policy Directions for Promoting the O2O Industry in Korea)

  • 김동수;김관호;최동욱;정재윤
    • 한국전자거래학회지
    • /
    • 제21권4호
    • /
    • pp.137-150
    • /
    • 2016
  • 우버, 에어비앤비, 카카오택시 등 오프라인과 온라인을 연결하여 새로운 가치를 창출하는 다양한 유형의 O2O(Online to Offline) 서비스가 국내외에서 등장하고 있다. 온라인의 편리함과 오프라인의 현장성을 결합하는 O2O 서비스는 모바일, 사물인터넷, 핀테크, 빅데이터 등 ICT 기술 발전에 힘입어 관련 시장 규모도 급속도로 성장하고 있다. 본 연구에서는 국내 O2O 서비스 사례 및 현황을 살펴보고, 국내 O2O 서비스 및 산업 활성화와 관련된 이슈들을 분석하였다. 구체적으로는 O2O 산업과 관련한 법제도 규제 현황, 기존 오프라인 사업자와의 이해관계 충돌 문제, O2O 서비스 지원 기술 인프라 현황, O2O 서비스 부작용 또는 역기능 등의 쟁점을 정리하였다. 이러한 현황 및 이슈 분석에 기초하여, 최종적으로 O2O 산업 활성화 및 발전을 위한 종합적인 정책 방향을 제시하였다. 본 연구에서 제안한 이러한 정책방향이 정부 정책에 반영되어 미국, 중국 등 O2O 산업 선도국가와의 격차를 해소하고, 국내 O2O 산업의 경쟁력 강화에 기여하기를 기대된다.

동영상 기반 자동 발화 심층 분석(SUDA) 어플리케이션 개발 (Development of the video-based smart utterance deep analyser (SUDA) application)

  • 이수복;곽효정;윤재민;신동춘;심현섭
    • 말소리와 음성과학
    • /
    • 제12권2호
    • /
    • pp.63-72
    • /
    • 2020
  • 본 연구는 동영상을 기반으로 일상생활에서 녹화한 아동 및 성인의 발화를 자동으로 분석해주는 SUDA(smart utterance deep analyser) 하이브리드 앱 개발에 관한 것이다. 특히, 아동과 부모가 원하는 시간 및 장소에서 상호작용하는 장면을 촬영하여 업로드할 수 있고 시간의 흐름에 따라 데이터를 계속 축적하여 이를 관찰하고 분석할 수 있도록 도울 수 있다. SUDA는 안드로이드폰, 아이폰, 태플릿 PC 기반에서 구동되며, 대용량의 동영상을 녹화 및 업로드할 수 있고, 사용자의 목적(일반인, 전문가, 관리자)에 따라 차별화된 기능을 제공할 수 있다. 전문가 모드에서는 자동화된 시스템과 협업하여 대상자의 발화를 말·언어적인 측면(비유창성, 형태소수, 음절수, 단어수, 말속도, 반응시간 등)에서 세부적으로 분석할 수 있다. 즉, SDUA 시스템이 대상자의 발화를 반자동으로 전사 및 분석하면, 언어치료사가 이를 검토하고, 보완하여 의사소통장애 진단과 중재 시 활용할 수 있다. 일반인(부모)의 경우, 전문가가 분석한 결과를 그래프 형태로 제공 받아 모니터링 할 수 있고, 관리자는 발화 분석, 영상삭제 등 전체 시스템을 관리할 수 있다. 본 시스템은 발화 분석의 반자동화로 치료사와 연구자의 부담을 줄여주고, 부모가 자녀의 발화를 기반으로 하여 말·언어발달에 대한 정보를 쉽고 다양하게 제공 받을 수 있다는 점에서 임상적 의의가 있다. 또한, 한국형 말더듬아동 진단 및 중재에 적용할 수 있는 종단데이터를 구축하고, 말더듬 회복 예측 요인들을 찾는 기초자료로 활용하고자 한다.

메타버스 작업공간의 개인적 효과에 영향 및 메타버스 플랫폼의 조절효과에 대한 연구: 수정된 ESP 이론 관점으로 (Factors Affecting Individual Effectiveness in Metaverse Workplaces and Moderating Effect of Metaverse Platforms: A Modified ESP Theory Perspective)

  • 정주연;권오병
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.207-228
    • /
    • 2023
  • 코로나 이후 기업들이 온라인 플랫폼에서 협업 또는 회의하는 방식이 일상화되고 있으며, 독자적인 온라인 실시간 시스템을 개발하여 원격 근무에 적극적으로 활용하기도 한다. 또한 회의 및 홍보를 위해 메타버스를 도입하려는 시도가 코로나 이후에도 지속적으로 이루어지고 있다. 이때문에 메타버스 환경에서 아바타 사용자 정의, 확장된 가상 환경, 지난 가상 경험 등이 참여자 만족도에 미치는 영향을 연구하는 연구가 진행 중이지만, 메타버스를 전용 작업 공간으로 활용하는 것에 대한 효과성 연구는 여전히 필요한 상황이다. 특히 업무 수행을 목적으로 하는 작업형 메타버스의 성과에 영향을 미치는 요소에 관한 연구는 아직 부족하다. 따라서 본 연구의 목적은 메타버스 작업 공간에서 개인 성과에 영향을 미치는 요소를 분석하고 결과에서 함의를 도출하는 것이다. 이를 위해 본 연구는 이론적 기반으로 Embodied Social Presence(ESP) 이론을 채택하고, 비몰입적 메타버스 작업 공간에 특화된 수정모형을 사용한다. 모형 및 가설 검증을 위해 비몰입적 메타버스 작업장에 참여한 참가자들과의 인터뷰 이후에 Gather Town 및 IFland와 같은 비몰입적 메타버스 작업장에서 참여자들을 대상으로 설문조사를 수행하였다. 그 결과 작업 참여 및 업무 참여에 미치는 영향이 메타버스 플랫폼에 따라 조절효과를 나타낸다는 것을 확인했다.

K-Beauty 구전효과가 온라인 매출액에 미치는 영향: 중국 SINA Weibo와 Meipai 중심으로 (Word-of-Mouth Effect for Online Sales of K-Beauty Products: Centered on China SINA Weibo and Meipai)

  • 류미나;임규건
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.197-218
    • /
    • 2019
  • 중국 화장품 전체 교역중 약 67% 정도가 전자상거래로 이루어지고 있는데 특히 한국 화장품인 K-Beauty 제품의 인기가 높다. 기존 연구에 의하면 화장품 같은 소비재의 경우 소비자의 80%는 제품 구매 전 제품정보를 인터넷으로 검색하며 구전정보에 영향을 받는다. 대부분의 중국 소비자들은 화장품과 관련된 정보를 주요 SNS에 다른 소비자들이 올린 댓글을 통해 획득하며 최근에는 뷰티 관련 동영상 채널 정보를 이용하기도 한다. 기존의 온라인 구전 관련 연구는 대부분 Facebook, Twitter, 블로그 등의 매체 자체가 중심이었다. 본 연구에서는 온라인 구전정보의 전달 형태와 정보의 형태를 고려하여 정보유형을 동영상과 사진 및 텍스트로 나누어 연구하고자 한다. 중국의 SNS대표 플랫폼인 SINA Weibo와 동영상 플랫폼 Meipai의 비정형 데이터를 분석하고 온라인 구전정보를 양과 방향성으로 나누어 K-Beauty브랜드 매출액에 미치는 영향을 분석하고자 한다. Meipai에서는 총 약 33만개의 데이터를 수집하였고 SINA Weibo에서는 총 약 11만개의 데이터를 수집하여 화장품의 기본 속성도 고려하여 분석하였다. 본 연구의 의의는 온라인 매출은 K-Beauty화장품에 대해서도 구전에 영향을 받는다는 것을 기본적으로 입증함과 동시에 특히 정보 유형에 대한 구분을 시도 했다는 것이다. 두가지 매체 모두 기존 연구와 같이 양이 매출에 영향을 미치고 있으나 매체풍부성으로 인해 텍스트보다 동영상이 정보를 더 주고 영향이 크다는 것을 입증하였다. 또한, 정보 방향성 측면에서는 색조화장품의 경우 부정 댓글의 영향이 크게 나타났다. 실무적으로는 화장품 판매 전략 및 광고 전략에 기초 및 색조 화장품을 구분하여 중국 K-Beauty화장품 매출증대를 위한 마케팅전략을 구사하는데 도움이 될 것으로 기대된다.

스마트교육을 위한 오픈 디지털교과서 (Open Digital Textbook for Smart Education)

  • 구영일;박충식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.177-189
    • /
    • 2013
  • 스마트교육에서 디지털교과서의 역할은 학습자와 대면하는 교육미디어로써 그 중요성은 재론의 여지없다. 이러한 디지털교과서는 학습자의 편의와 더불어 교수자, 콘텐츠 제작자, 유통업자를 위하여 표준화되어야 활성화되고 산업화될 수 있다. 본 연구에서는 다음과 같은 3가지 목표를 지향하는 디지털교과서 표준화 방안을 모색한다. (1) 디지털교과서는 온-오프 수업을 모두 지원하는 혼합학습 매체의 역할을 해야 하며, 특별한 전용뷰어 없이 표준을 준수하는 모든 EPUB 뷰어에서 실행가능 해야 하며, 기존의 이러닝 학습 콘텐츠와 학습관리시스템를 활용할 수 있도록 하며, 디지털 교과서를 사용하는 학습자의 정보를 추적 관리할 수 있는 트랙킹기능이 있으면서도, 오프라인 동안의 정보를 축적하여 서버와 통신할 수 있는 기능도 필요하다. 디지털교과서의 표준으로서 EPUB을 고려하는 이유는 디지털교과서가 책의 형태를 가져야 하는데 이를 위해서 따로 표준을 정할 필요가 없으며, EPUB 표준을 채택함으로써 풍부한 콘텐츠, 유통구조, 산업기반을 활용할 수 있기 때문이다. (2) 디지털교과서는 오픈소스를 적극 활용하여 저비용으로 현재 사용가능한 서비스를 구성하여 표준과 더불어 실제 실행 가능한 프로그램으로 제시되어야 하며, 관련 학습 콘텐츠가 오픈마켓의 형태로 운영될 수 있어야 한다. (3) 디지털교과서는 학습자에게 적절한 학습 피드백을 제공하기 위하여 모든 학습활동 정보를 축적하고 관리될 수 있는 인프라를 표준에 따라 구축하여 교육 빅데이터 처리의 기반을 제공하여야 한다. 이북 표준인 EPUB 3.0을 기반으로 하는 오픈 디지털교과서는 (1) 학습활동 정보를 기록하고 (2) 이 학습활동 지원을 위한 서버와 통신하여야 한다. 현재 표준으로 정해져 있지 않은 이북의 기록과 통신 기능을 EPUB 3.0의 JavaScript로 구현하여 현재 EPUB 3.0 뷰어에서도 활용하면서 이를 차세대 이북 표준 또는 교육을 위한 이북 표준(EPUB 3.0 for education)으로 제안하여 향후 제정된 표준 이북 뷰어에서는 JavaScript없이도 처리되도록 하는 전략이 필요하다. 향후 연구는 제안한 오픈 디지털교과서 표준에 의한 오픈소스 프로그램을 개발하고, 개발된 오픈 디지털교과서의 학습활동정보를 활용한 새로운 교육서비스 방안(교육 빅데이터 활용방안 포함)을 제시하는 것이다.