• 제목/요약/키워드: 집합관계 모델

검색결과 146건 처리시간 0.024초

CNN 보조 손실을 이용한 차원 기반 감성 분석 (Target-Aspect-Sentiment Joint Detection with CNN Auxiliary Loss for Aspect-Based Sentiment Analysis)

  • 전민진;황지원;김종우
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.1-22
    • /
    • 2021
  • 텍스트를 바탕으로 한 차원 기반 감성 분석(Aspect-Based Sentiment Analysis)은 다양한 산업에서 유용성을 주목을 받고 있다. 기존의 차원 기반 감성 분석에서는 타깃(Target) 혹은 차원(Aspect)만을 고려하여 감성을 분석하는 연구가 대다수였다. 그러나 동일한 타깃 혹은 차원이더라도 감성이 나뉘는 경우, 또는 타깃이 없지만 감성은 존재하는 경우 분석 결과가 정확하지 않다는 한계가 존재한다. 이러한 문제를 해결하기 위한 방법으로 차원과 타깃을 모두 고려한 감성 분석(Target-Aspect-Sentiment Detection, 이하 TASD) 모델이 제안되었다. 그럼에도 불구하고, TASD 기존 모델의 경우 구(Phrase) 간의 관계인 지역적인 문맥을 잘 포착하지 못하고 초기 학습 속도가 느리다는 문제가 있었다. 본 연구는 TASD 분야 내 기존 모델의 한계를 보완하여 분석 성능을 높이고자 하였다. 이러한 연구 목적을 달성하기 위해 기존 모델에 합성곱(Convolution Neural Network) 계층을 더하여 차원-감성 분류 시 보조 손실(Auxiliary loss)을 추가로 사용하였다. 즉, 학습 시에는 합성곱 계층을 통해 지역적인 문맥을 좀 더 잘 포착하도록 하였으며, 학습 후에는 기존 방식대로 차원-감성 분석을 하도록 모델을 설계하였다. 본 모델의 성능을 평가하기 위해 공개 데이터 집합인 SemEval-2015, SemEval-2016을 사용하였으며, 기존 모델 대비 F1 점수가 최대 55% 증가했다. 특히 기존 모델보다 배치(Batch), 에폭(Epoch)이 적을 때 효과적으로 학습한다는 것을 확인할 수 있었다. 본 연구에서 제시된 모델로 더욱 더 세밀한 차원 기반 감성 분석이 가능하다는 점에서, 기업에서 상품 개발 및 마케팅 전략 수립 등에 다양하게 활용할 수 있으며 소비자의 효율적인 구매 의사결정을 도와줄 수 있을 것으로 보인다.

헬스케어 특허의 IPC 코드 기반 사회 연결망 분석(SNA)을 이용한 기술 융복합 분석 (Technology Convergence Analysis by IPC Code-Based Social Network Analysis of Healthcare Patents)

  • 심재륜
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.308-314
    • /
    • 2022
  • 본 연구는 국내에 출원된 헬스케어 특허의 기술 융복합 분석에 관한 것으로 사회 연결망 분석(Social Network Analysis)을 이용하여 핵심 기술간 관계를 시각화하였다. 헬스케어 특허의 서브클래스 수준에서 복합 IPC 코드를 가지는 특허는 1,155건(49.4%)으로 조사되었고, 이를 대상으로 사회 연결망 분석을 실시한 결과 연결 중심성이 가장 큰 IPC 코드는 A61B, G16H, G06Q 순이고, 매개 중심성이 가장 큰 IPC 코드는 A61B, G16H, G06Q 순이다. 또한 헬스케어 특허는 두 개의 큰 기술 집합(Cluster)으로 구성되어 있다는 것을 확인할 수 있었다. Cluster-1은 A61B와 G16H 및 G06Q를 중심으로 헬스케어 인포매틱스 관련 기술을 이용한 진단, 수술 등 관련 비즈니스 모델에 해당하고, Cluster-2는 H04L과 H04W 및 H04B로 구성된 디지털 통신 기반의 헬스케어 사물인터넷 기술이다. 헬스케어 특허의 기술 융복합 핵심 쌍은 Cluster-1에서 [G16H-A61B]와 [G16H-G06Q] 이고, Cluster-2에서는 [H04L-H04W] 이다. 본 연구는 헬스케어 특허의 기술 개발 동향과 앞으로의 특허 출원에 기여할 수 있다.

교육학 분야에서 CiteSpace에 기초한 구성주의 연구 동향 탐색 (A Dynamic exploration of Constructivism Research based on Citespace Software in the Filed of Education)

  • 장위신;송선희
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.576-584
    • /
    • 2022
  • 구성주의는 인지심리학의 중요한 한 갈래로 현재 교육학 분야와 심리학 분야에 모두 커다란 영향을 미치고 있다. 본 연구는 CiteSpace 시각화 소프트웨어를 분석 도구로 사용하여 최근 35년간 교육분야에서 구성주의에 관한 연구문헌에 대한 지식지도 분석을 하였다. 이를 위하여 'WOS(web of science)' 데이터베이스를 기초로 국외문헌분석을 위하여 'WOS 핵심 데이터베이스'의 문헌들을 사용하였고, 국내문헌분석을 위하여 'KCI(Korean Journal Database)데이터베이스'의 문헌들을 분석하였다. 분석 방향은 발표연도, 연구가 이루어진 국가(지역), 연구자, 기관 또는 대학별 협력관계 분석, 주제어 분석이었다. 연구를 통해 얻은 결론은 세 가지이다. 첫째, 구성주의라는 주제에 관한 연구는 1986년부터 지금까지 이어지고 있으며 현재는 안정적인 발전단계이다. 둘째, 구성주의라는 주제로 연구가 많이 이루어진 국가는 미국, 캐나다, 영국, 호주, 네덜란드 순이다. 연구의 주요 기관과 연구자도 주로 이들 국가에 분포돼 있다. 셋째, 현재 구성주의 연구들의 주제어는 'instructional strategies(교수전략)' 집합에 집중되어 있으며, 과학기술의 발전이 개인 학습에 영향을 미치고 있다. 향후 교수전략은 구성주의 연구의 중점내용이 될 것이며, 교수공학의 발달로 새로운 교수모델 개발과 관련된 연구가 이루어질 필요가 있다.

온라인 토론 커뮤니티에서의 익명성과 개인 및 집단 정체성, 토론의 질 간의 영향 연구 (The Relationship between Anonymity, Personal and Group Identities, and Discussion Quality in Online Discussion Communities)

  • 이애리
    • 경영정보학연구
    • /
    • 제21권3호
    • /
    • pp.63-86
    • /
    • 2019
  • 정보통신기술(ICT) 사용이 사회생활 깊숙이 융화됨에 따라, 온라인 커뮤니티와 같은 새로운 유형의 사회집단형태가 출현하였다. 온라인 커뮤니티는 시공간을 초월한 많은 사람들이 함께 참여하고 공헌함으로써 집합적 지식이 생성되고 분배될 수 있도록 한다. 대게 온라인 커뮤니티에서는 익명성을 제공하는데, 익명성은 여러 가지 사회적 제약을 가지고 있는 사람들의 적극적인 사회적 참여를 가능케 하여 다양한 의사표현과 보다 많은 이들의 참여 활동 증가 등의 긍정적인 역할을 할 수 있다. 그러나 익명성은 개인의 실제 정체성을 파악할 수 없는 상태를 제공하므로, 이를 악용하여 심각한 사회적 병리현상을 초래하기도 한다. 이에 따라 최근 익명성이 제공되는 온라인 커뮤니티에서 사람들의 행위에 근본적으로 영향을 주는 것은 무엇이며, 사람들의 행위가 어떻게 통제되는가에 대한 연구의 필요성이 증가하고 있다. 본 연구는 익명성 환경에서 인간의 행위를 통제하는 주요 요인으로 사람의 정체성에 주목하고, 정체성에 대한 이론을 종합적으로 검토하여 연구 모델을 설정하였다. 본 연구에서는 자아를 형성하는 다양한 측면인 사회적 집단 정체성과 개인 정체성(공적 자아의식, 사적 자아의식)을 전체적으로 살펴봄으로써 익명성이 보장된 온라인 환경에서 인간의 행위 통제에 영향을 주는 요인과 그 결과를 온라인 토론 커뮤니티를 중심으로 분석하였다. 특히 건전한 온라인 커뮤니티 토론 운영을 위해서는, 참여 멤버들이 커뮤니티에서 형성된 집단 규범을 준수하고, 적극적으로 참여하도록 동기가 부여되어, 결과적으로 양질의 토론의 장이 펼쳐질 수 있도록 하는 것이 매우 중요하다. 이에 대해 본 연구는 사회적/기술적 익명성과 다양한 정체성 측면, 내적 참여 동기부여 정도, 집단 규범 준수, 그리고 온라인 토론의 질이 어떠한 인과관계가 있는지 실증적으로 검증하였다. 또한 익명성 수준별, 커뮤니티의 토론 주제별, 남녀별, 연령대별, 커뮤니티 가입기간별 그룹 간 차이점을 분석하였다. 본 연구를 통해, 물리적인 대면 조직이 아닌 가상의 온라인 커뮤니티 상에서 사람들의 행동 통제에 대한 영향 요인과 결과적 현상을 분석함으로써, 온라인 커뮤니티 운영 전략과 양질의 인터넷 토론 문화 정립에 관한 이론적, 실무적 시사점을 제시할 수 있다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.