• 제목/요약/키워드: set-up model

검색결과 1,597건 처리시간 0.029초

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

지역 기록화를 위한 도큐멘테이션 전략의 적용 (Directions of Implementing Documentation Strategies for Local Regions)

  • 설문원
    • 기록학연구
    • /
    • 제26호
    • /
    • pp.103-149
    • /
    • 2010
  • 자치시대에 지방의 기록관리는 지역의 고유한 특성을 반영하여 독립적으로 추진할 필요가 있다. 그러나 아직 제대로 된 지방영구기록물관리기관이 한 곳도 설립되어 있지 않은 상황에서 다각적이고 적극적인 해결책을 모색할 필요가 있는데 지방기록관리의 방향을 '시설' 중심에서 '기록'과 '전문적 관리(사람)' 중심으로 바꾸는 것이 하나의 대안이다. 특히 중앙의 기록관리 프로세스라는 보편성에 매몰되었던 개별 지역의 다양성과 역동성을 찾기 위해서는 새로운 지역 기록화 전략을 적극 탐구할 필요가 있다. 도큐멘테이션 전략은 특정 지역, 주제, 사건 등에 관한 적절한 정보를 기록 생산자, 보존 기록관, 기록 이용자의 상호 협력을 통해 선별하여 수집하는 방법론으로서 80년대에 미국을 중심으로 제안되고 다양한 분야에서 다양한 방식으로 실험되어온바 있다. 이 연구에서는 도큐멘테이션 전략이 지역 기록화를 위한 방법론으로 어떤 의미를 갖는지 살펴보고 우리의 지역 환경에 적용하기 위해서 고려해야할 점과 추진 방향을 모색해보고자 하였다. 서구에서 개발된 도큐멘테이션 전략이 현 상황에서 우리에게 주는 시사점은 다음과 같다. 첫째, 아카이브즈 및 아키비스트의 능동적 역할을 추구하며 특히 지역사회에서 기록전문직의 가치를 인식시키는 데에 기여할 수 있다. 이 전략은 지방기록관리기관들은 행정사를 넘어서 지역사를 포괄적으로 기록화 하는 주체가 될 것을 촉구한다. 이에 따라 지방의 기록전문직들은 공공기록을 수동적으로 이관 받는 데에서 그치는 것이 아니라 능동적으로 지역의 기록을 수집하고 이를 서비스하기 위해 노력해야 한다. 둘째, 지역 내 기록 수집기관들의 협력을 통해 단일 조직의 기능 재현에서 폭넓은 사회적 재현을 성취할 수 있다는 점이다. 서구에서 이러한 협력 모델은 과도한 업무 부담으로 실패한 경우가 많았지만 디지털 환경은 새로운 가능성을 보여주고 있다. 지역 내에 존재하는 다양한 기록 생산 및 소장기관들과 협력을 통해 지역의 지식역량은 물론 지역정보서비스의 수준을 높일 수 있을 것이다. 셋째, 도큐멘테이션 전략은 다양한 집단들과의 연대를 추구한다. 이 전략은 도큐멘테이션 주제와 관련된 집단이나 공동체로부터 열정과 에너지, 전문지식을 가져올 수 있는 장점을 가지며, 도큐멘테이션 전략은 기억을 남기고자 하는 주체들이 실천적 기록문화운동을 추진하는 하나의 방법론을 제공할 수 있을 것이다. 이 연구에서는 우리의 지역 현실에 적합한 기록화 방향을 다음과 같이 제안하였다. 첫째, 선택적이고 집중적인 기록화를 지향한다. 지역에 관한 모든 영역에 관한 포괄적 기록화를 추진하기 보다는 지역의 로컬리티를 가장 잘 반영하는 영역과 대상을 선정하여 기록화를 추진한다. 지역을 구성하는 다양한 요소들인 사람, 사회 문화, 조직과 제도, 건조(建造) 환경, 공간 등이 상호작용하면서 만들어지고 변화하는 실체인 로컬리티를 규명하기 위해서는 전문가 집단과 지역민의 의견을 반영하는 구조가 필요하다. 둘째, 분산 보존과 통합적 재현을 지향한다. 기록화 주관기관은 다양한 기록 소장기관들과 소장자들을 연결하는 협력체계를 구축하여 분산 소장된 기록들을 통합적으로 검색할 수 있도록 한다. 즉, 한 지역의 역사 기록을 집중 보존할 기관을 정하기보다는 연계를 통한 기록화를 추진하는 것이 현실적일 것이다. 이를 위한 도구로서 지역 게이트웨이 구축을 제안하였다. 셋째, 열린 구조의 디지털 기록화를 지향한다. 지역 기록화는 맥락 재구성을 바탕으로 기록을 수집하는 방법론을 적용하게 되므로 선별된 기록에는 이미 수집자나 맥락 해석자의 의도가 반영되어 있다. 특히 맥락 분석에 의거하여 스토리를 구성하고 이에 따라 기록을 수집하거나 연계할 경우, 자의적이고 주관적인 선별이라는 비판을 받기 쉽다. 이러한 문제를 보완하기 위해 기록 맥락의 해석과 기록화 영역의 선정 등의 과정에 지역 내 다양한 집단의 의견이 반영될 수 있도록 해야 할 것이며, 디지털 네트워크를 통해 여러 집단 및 개인의 참여가 쉽게 이루어질 수 있도록 보장해야 한다. 넷째, 지역 내 협력기관들의 영역별 기록화 수준을 정한다. 기록화에 참여하는 기관들이 디지털 기록화에 맞는 역할을 분담 받아야 하고, 각 기관은 협력적 기록화에 참여함으로써 자관 이용자들에게는 더 나은 포괄적인 기록 서비스를 제공할 수 있을 것이다. 이를 위해 도서관의 디지털 장서개발에 활용하는 컨스펙터스 모형을 응용하여 디지털 기록화 방법론을 새롭게 설계할 것을 제안하였다.

국제프랜차이징 연구요소 및 연구방향 (Research Framework for International Franchising)

  • 김주영;임영균;심재덕
    • 마케팅과학연구
    • /
    • 제18권4호
    • /
    • pp.61-118
    • /
    • 2008
  • 본 연구는 국내외 프랜차이즈의 해외진출에 대한 연구들을 바탕으로 국제프랜차이징연구의 전체적인 연구체계를 세워보고, 연구체계를 형성하고 있는 연구요인들을 확인하여 각 연구요소별로 이루어지는 연구주제와 내용을 살펴보고, 앞으로의 연구주제들을 제안하고자 한다. 주요한 연구요소들은 국제프랜차이징의 동기 및 환경 요소과 진출의사결정, 국제프랜차이징의 진입양식 및 발전전략, 국제프랜차이징의 운영전략 및 국제프랜차이징의 성과이다. 이외에도 국제프랜차이징 연구에 적용할 수 있는 대리인이론, 자원기반이론, 거래비용이론, 조직학습이론 및 해외진출이론들을 설명하였다. 또한 국제프랜차이징연구에서 보다 중점적으로 개발해야 할 질적, 양적 방법론을 소개하였으며, 마지막으로 국내연구의 동향을 정리하여 추후의 연구방향을 종합적으로 정리하였다.

  • PDF

일본의 중견기업에 관한 연구 : 현황과 특징, 정책을 중심으로 (A Study on Medium-Sized Enterprises of Japan)

  • 강철구;김현성;김현철
    • 중소기업연구
    • /
    • 제32권2호
    • /
    • pp.209-223
    • /
    • 2010
  • 본고에서는 일본 중견기업의 위상, 특징, 관련 정책을 검토함으로써 우리나라에서의 중견기업 정책의 방향을 모색하고자 한다. 일본의 경쟁우위업종인 기계, 전자부품업의 출하와 고용비중은 여타 업종보다 높아, 그 저변에 두터운 중견기업이 존재하고 있음을 알 수 있다. 일본의 중견기업 육성정책은 연구개발과 환경대책을 위한 기업간 제휴 유도라는 측면에서 간접적으로 지원하고 있다. 우리나라도 특정 정책사업에 있어서 기업간 협력 유도를 통하여 중견기업을 육성할 수 있을 것이다.

지각된 품질요인이 고객충성도에 미치는 영향: PB와 NB간의 차이분석 (The Effects of Perceived Quality Factors on the Customer Loyalty: Focused on the Analysis of Difference between PB and NB)

  • 예종석;전소연
    • 한국유통학회지:유통연구
    • /
    • 제15권2호
    • /
    • pp.1-34
    • /
    • 2010
  • 소비자의 구매 행위가 합리적이고 실용적인 방향으로 변화하는데 힘입어 할인점업계는 급속한 외형적인 성장과 함께 경쟁도 치열하다. 따라서 업계는 그 해결책으로 차별화와 수익성을 동시에 실현 시킬 수 있는 유통업체 브랜드(PB: Private Brand) 개발에 사활을 걸고 있다. 또한 치열한 경쟁 환경 하에서 생존하기 위해서는 고객만족을 넘어서 고객충성도를 높이는 것이 효과적인 방법임이 밝혀짐에 따라 PB가 고객충성도를 제고시키기 위한 전략적인 도구로 사용되고 있다. PB 이용 고객의 충성도를 높이려면 우선 고객집단의 특성을 파악해서 소비자가 지각하는 품질수준을 우선적으로 맞춰줘야 고객만족과 고객신뢰를 얻을 수 있고 결과적으로 고객충성도로 유도할 수 있다. 이에 본 연구는 지각된 품질에 영향을 미치는 선행요인과 고객충성도에 영향을 미치는 변수들 간의 관계에 대한 체계적인 분석결과를 제시하기 위해 선행연구에서 검증된 인과관계를 기반으로 연구모형과 연구가설을 설정했고, 주요 연구결과는 다음과 같다. 기업명성, 브랜드명성, 제품경험, 브랜드친숙도가 높을수록 지각된 품질이 높아지고, 지각된 품질이 높을수록 고객만족, 고객신뢰, 고객충성도가 높아지며, 고객만족과 고객신뢰가 높을수록 고객충성도가 높아지는 것으로 조사되었다. 또한 기업명성이 지각된 품질에 미치는 영향력은 PB가 NB보다 높게 나타난 반면 브랜드명성과 브랜드친숙도가 지각된 품질에 미치는 영향력은 NB가 PB보다 높게 나타났다. 이러한 실증분석 결과는 지각된 품질에 영향을 미치는 선행요인과 결과요인에 대한 보다 명확한 이해를 바탕으로 실무자가 마케팅 활동을 하는데 유용하게 활용할 수 있을 것이다.

  • PDF

온라인 서비스 품질이 고객만족 및 충성의도에 미치는 영향 -항공권 예약.발권 웹사이트를 중심으로- (The Effects of Online Service Quality on Consumer Satisfaction and Loyalty Intention -About Booking and Issuing Air Tickets on Website-)

  • 박종기;고도은;이승창
    • 한국유통학회지:유통연구
    • /
    • 제15권3호
    • /
    • pp.71-110
    • /
    • 2010
  • 본 연구에서는 항공권 예약 발권 웹사이트의 서비스 품질을 측정 뿐만 아니라 서비스 회복도 측정하고자 하였다. 또한 서비스 품질과 서비스 회복이 고객만족 및 충성의도에 미치는 영향관계를 실증하고자 하였다. 온라인 서비스 품질과 온라인 서비스 회복의 측정을 위해 Parasuraman, Zeithaml, & Malhotra(2005)가 개발한 E-S-QUAL과 E-RecS-QUAL을 사용했으며, 했다. E-S-QUAL은 온라인 서비스 품질을 측정하는 도구로써, 효율성, 시스템 이용가능성, 이행성, 프라이버시의 4개 차원 22개 항목으로 구성된다. E-RecS-QUAL은 온라인 서비스 회복을 측정하는 도구로써, 반응, 보상, 접촉의 3개 차원 11개 항목으로 구성된다. 실증분석을 위한 설문조사는 항공사나 여행사의 웹사이트를 통해 국내 외 항공권을 구입해 본 경험이 있는 소비자를 대상으로 실시하였는데, 총 400부가 회수되었고, 이 중 342부를 최종분석에 사용하였다. 실증분석을 위해 AMOS 7.0과 SPSS 15.0을 사용하였다. 먼저, SPSS 15.0을 사용하여, 요인점수를 이용한 회귀분석으로 가설검증을 한 결과, <가설 I-1, 2, 3, 4, II-1, 2, 3, III-1, IV-1>이 전부 채택되었다. 온라인 서비스 품질과 온라인 서비스 회복의 각 차원은 모두 전반적인 서비스 품질에 유의한 영향을 보였고, 전반적인 서비스 품질은 고객만족에 유의한 영향을 미쳤다. 마지막으로 고객만족 역시 충성의도에 유의한 영향을 미치는 것으로 확인되었다. 한편 AMOS 7.0을 사용하여 모형 분석을 하였는데, 모형의 적합도는 가설검증을 하기에 합당한 수치가 나왔다. 이를 토대로 가설검증을 한 결과, <가설 I-1, 3, II-1, 3, III-1, IV-1>은 채택되었고, <가설 I-2, 4, II-2>는 기각되었다. 이 결과는 Parasuraman et al.(2005)이 주장한 것처럼 E-S-QUAL을 나타내는 데는 요인점수를 이용한 회귀분석이 더 적합하다는 것을 보여주는 것이라고 판단된다. 이를 토대로 본 연구의 시사점을 정리하였다.

  • PDF