• 제목/요약/키워드: SNS social media

검색결과 369건 처리시간 0.034초

온라인 거래의 증가가 지역 소매 상권에 미치는 영향에 관한 연구 (A study about the effects of online commerce on the local retail commercial area)

  • 이강배
    • 경제분석
    • /
    • 제25권2호
    • /
    • pp.54-95
    • /
    • 2019
  • 본 연구는 온라인 거래량의 증가가 지역 상권에 미치는 영향에 대하여 양적 질적 분석을 하는데 그 목적이 있다. 본 연구의 실증분석은 2002년부터 2016년까지 15년간의 '전국사업체조사'와 '온라인 쇼핑 동향조사' 및 '지역소득조사' 결과와 한국은행의 거시경제 지표 중 '지역별 경제성장률', '소비자물가 등락률', '종가기준 연평균 원달러 환율 등락률' 데이터 등에 기초하여 진행되었다. 본 연구의 결과에 따르면, 온라인 거래금액의 증가가 소매업종 점포수의 감소에 영향을 주고 있으며 업종별로 구분하면 기타 가정용품 소매업, 음·식료품 및 담배소매업, 문화, 오락 및 여가용품 소매업 그리고 종합소매업 순으로 감소의 정도가 큰 것으로 나타났다. 그러나 종합소매업에 포함된 대형종합소매업과 체인화 편의점은 온라인 거래액이 증가함에도 점포수가 증가하는 것으로 나타났다. 기타 가정용품 등 업종의 점포수 감소한 주요 이유는 매장의 규모가 작은 경우 온라인 거래 대비 제품 품질 직접 비교 및 구매 경험 만족도 등 관점에서 차별성 및 효율성이 떨어지기 때문인 것으로 판단되었다. 온라인 거래액이 증가할 때 점포수가 증가한 소매업종은 체인화 편의점, 기타 상품 전문 소매업 모형, 섬유, 의복, 신발 및 가죽제품 소매업, 그리고 대형종합소매업의 순으로 나타났다. 또한 온라인 거래 증가에 따라 음식점 점포수가 가장 크게 증가하였는데 이는 온라인 거래의 증가 및 인터넷 사용자의 증가에 따라 배달앱 등이 활성화되고 블로그 및 SNS 등을 통한 맛 집 소개 및 사용 후기 전파 등이 증가하여 온라인 거래의 긍정적 영향이 작용한 것 때문으로 판단되었다. 따라서 오프라인 기업들이 온라인 대비 차별성과 경쟁력을 유지하기 위해서는 일정 규모 이상의 매장에서 소비자들이 직접 비교하고 착용하고 경험하는 등의 서비스를 제공할 수 있어야 할 것으로 여겨진다. 임대료는 온라인 거래가 증가함에도 상승하였는데 이는 1층 중대형매장의 임대료를 분석한 것에 기인한다. 즉, 온라인 거래가 증가하여도 사용자 경험을 제공하는 차별화된 매장 수요는 증가하기 때문으로 판단되었다. 이러한 연구 결과는 변화와 위기에 대응하는 지역 중소 소매업체들의 사업전략 조정이 필요함을 시사하며 이에 대한 중앙 또는 지방정부 차원의 지원노력이 필요함을 시사한다.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

재난안전 실무자의 스마트 재난관리 준비도에 영향을 미치는 요인에 관한 실증 연구 - 스마트 기술을 활용한 재난관리 민간참여 중심으로 - (Factors Affecting South Korean Disaster Officials' Readiness to Facilitate Public Participation in Disaster Management Using Smart Technologies)

  • 류현숙;김학경
    • 시큐리티연구
    • /
    • 제62호
    • /
    • pp.35-63
    • /
    • 2020
  • 최근 대형복합 재난 및 테러 등 발생으로 국가위기 및 재난관리의 중요성이 한층 증가되고 있으며, 재난 및 안전사고 강도와 빈도가 높아짐에 따라 정부의 재난 대응과 복구능력만으로는 한계가 있다는 인식이 확산되기 시작했다. 즉, 범사회적 재난안전 관리의 역량 강화 및 복원력 제고를 위해서는 국가 위주의 재난안전 관리가 아닌, 민간영역과·지역사회와의 협력적 체계를 구축이 필수적이라는 것이다. 특히, 최근 스마트 정보통신기술을 이용한 재난 및 안전사고 대응 사례들을 볼 때, 새로운 스마트 모바일 기기를 활용한 민간의 참여확대가 현실적으로 가능해졌음을 알 수 있다. 실제 국가 재난 및 안전 관리 체계를 효율적으로 구축하기 위해서는 스마트 정보통신기술의 접목이 필수적이며, 특히 최근 스마트앱 사회연결망서비스(SNS) 등의 등장 및 이용 영향으로 기존 '명령과 통제' 방식의 재난 및 안전관리에도 변화가 요구되기 시작했다. 해외에서의 스마트 기술 기반 시민참여 사례로는 지난 2010년 아이티 대지진 당시 재난복구에 시민과 민간기업의 자발적 참여를 이끈 크라우드 소싱 플랫폼 우샤히디(Ushahidi) 사례, 2011년 3월 일본 대지진과 지진해일 발생 시 트위터, 페이스북 등과 같은 SNS 등을 통한 생사확인 등의 위기소통 사례, 2011년 5월 미국 조플린 토네이도 발생 시 페이스북 사이트를 통한 시민주도 실종자 찾기 및 생사확인 그리고 긴급구조와 지원 사례 등이 있다. 국내에서는 2010년 부산해운대 오피스텔 화재 발생 시 시민의 동영상 촬영 및 뉴스 제공, 2012년 대풍 볼라벤 북상시 SNS를 통한 시민주도 정보 공유 및 확산, 2014년 세월호 참사 당시 카톡 등 SNS를 통한 생사확인 및 구조현황 공유 등 다양한 스마트 기기와 소셜 미디어를 활용한 민간참여 확대가 재난 및 안전관리에 가져오는 시너지 효과를 볼 수 있었다. 이러한 맥락에서 본 연구는 스마트 기기를 활용한 민간참여에 대해 한국정부 재난안전 실무자가 느끼는 인식 및 기존 재난 및 안전관리에 스마트 민간참여를 수용할 수 있는 준비도(readiness)를 실증 조사해 분석하고자 한다. 스마트 민간참여 확대에 대비한 정부 재난관리 조직과 실무자의 준비 수준을 종합적으로 분석하기 위해 본 연구는 SMART 모델(System, Motivation, Ability, Response, Technology)을 제시한다. SMART 모델에 따라 재난안전 실무자의 법제도(System), 동기(Motivation), Ability(역량), 반응(Response), 및 기술(Technology) 등 5개 영역별 준비 수준을 측정, 분석해 향후 정책적 함의를 도출하고자 하였다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.

국내 소비자의 기능성화장품 구매행태 및 선복화 활용 기능성화장품 상품화를 위한 연구 (consumers' purchasing behavior of functional cosmetics and Inula based functional cosmetics merchandising research)

  • 한도경;이현준;이은희;백현동;신동규;박대섭;황혜선;홍완수
    • 한국산학기술학회논문지
    • /
    • 제17권8호
    • /
    • pp.236-250
    • /
    • 2016
  • 본 연구는 수도권에 거주하는 일반 소비자를 대상으로 기능성화장품 구매행태를 파악하여 선복화 활용 주름 미백개선 신제품 개발 시 경쟁력 확보를 위한 기초자료로 활용하고자 하였다. 연구결과, 소비자는 주름개선 기능성화장품의 종류 중 세럼을 주로 선호했으며, 1~3개월에 한 번 구매하는 비율이 높았다. 용량은 10~30 ml 미만을 주로 선호했고, 구매비용은 3~5만원 미만을 주로 지출하였다. 미백개선 기능성화장품 역시 세럼을 선호했고, 용량은 30~50 ml 미만을 선호했으며, 구매비용은 3~5만원 미만을 주로 지출하였다. 기능성화장품 형태는 단품을 선호했고 선호도가 높은 주요 구매 장소는 '화장품전문점' 이었고, 선호도가 높은 주요 정보원은 '가족 친구 지인의 추천 및 경험담', 'TV 광고' 등 이었다. 선복화 활용 기능성화장품 세럼 개발시 구매의도 4개 항목 모두 제품 비용이 5만원 이상으로 나타났으며, 가격 지불의사에서도 현재 가격에서 추가로 10~30%까지 지불 할 수 있는 것으로 나타났다. 따라서 화장품 관련 기업 및 산업체는 기능성화장품 관련 신제품 개발 시 소비자의 구매시 요구도를 적용하는 방안과 신제품 판매 활성화를 위해 질 높은 서비스를 제공하는 전문화된 장소 확보 및 직접체험, 다양한 대중매체 활용 SNS 블로그를 통한 구전 효과를 높이고, 천연미백 및 주름개선, 보습효과 등이 검증된 선복화를 활용한 제품을 개발하면 건강과 미용에 관심이 많은 소비자들에게 충분히 어필(appeal)할 수 있을 것으로 사료되었다.

사회적 네트워크 구조특성과 제품구전의 확산: 사회문화적 접근 (Structural Properties of Social Network and Diffusion of Product WOM: A Sociocultural Approach)

  • 윤성준;한희은
    • 한국유통학회지:유통연구
    • /
    • 제16권1호
    • /
    • pp.141-177
    • /
    • 2011
  • 기존의 확산관련 연구들은 대부분이 구전 커뮤니케이션의 효용성에 치중하여 개인단위의 변수를 사용하는 경향이 많았다 (Iacobucci 1996; Midgley 외 1992). 반면 구전의 선행 변수로써 네트워크의 구조적 특성을 소비자의 집단문화적 성향에 기초하여 조사한 연구는 찾아보기 어렵다. 본 연구는 이같은 연구배경 하에서 네트워크의 구조적 특성과 소비자의 구전간의 관계를 연관시켜 비교문화적으로 접근하려고 하였다. 본 연구에서 추구하는 주요 목적은 한국과 중국 소비자를 대상으로 사회적 네트워크 형태에 따른 구전효과를 규명하려는 것이며, 네트워크와 구전 효과와의 관계에 영향을 미치는 조절변수로써 문화적 가치관의 역할을 검증하려고 하였다. 구체적인 연구목적은 다음과 같다. 첫째, 사회적 네트워크 관련 이론들을 바탕으로 한국과 중국 소비자들을 대상으로 네트워크의 구조적 특성들 (예: 유대강도, 중심성, 범위)이 구전의 효과 (구전 의향 및 구전 정보의 질)에 어떠한 영향을 미치는지를 규명한다. 둘째, 사회적 네트워크 특성이 구전효과에 미치는 영향에 있어서 문화적 가치 (불확실성 회피 성향, 개인주의성향)가 조절 역할을 하는지를 규명한다. 셋째, 사회적 네트워크 특성과 구전효과의 선행변수로써 소비자 개인의 혁신 성향의 역할을 규명한다. 분석 결과, 한국과 중국 소비자들은 공통적으로 네트워크 유대강도와 중심성은 구전의향에 유의한 영향을 보였으나 네트워크 범위는 두집단 모두 유의하게 나타나지 않았다. 반면, 한, 중 소비자 공통적으로 불확실성회피 성향은 네트워크범위와 상호작용을 함으로써 구전의향에 조절역할을 하는 것으로 나타났다. 마지막으로 소비자의 혁신성향은 한중 두 소비자 집단에서 공통적으로 네트워크 특성 (중심성)과 구전효과(구전정보의 질) 에 유의하게 긍정적 영향을 미치는 것으로 나타났다. 한중 양국의 네트워크 특성을 비교한 결과 한국이 중국보다 유대강도, 중심성, 범위에서 모두 유의하게 더 높은 점수를 보였으며, 불확실성회피 성향 또한 한국 소비자가 중국보다 유의하게 높은 것으로 나타났다.

  • PDF

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.