• 제목/요약/키워드: 텍스트 마이닝

검색결과 1,136건 처리시간 0.025초

동적 토픽 모델링과 감성 분석을 활용한 전동킥보드에 대한 사회적 동향 분석 (Analysis of Social Trends for Electric Scooters Using Dynamic Topic Modeling and Sentiment Analysis)

  • 김경옥;신예랑
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권1호
    • /
    • pp.19-30
    • /
    • 2023
  • 마이크로 모빌리티 중 하나인 전동킥보드의 이용은 세계적으로 급격히 성장하고 있는 추세이다. 국내에서는 2018년 서울에서 서비스를 시작한 킥고잉을 비롯하여 서울을 포함한 일부 대도시에서 공유킥보드 서비스를 제공하는 업체가 생기면서 전동킥보드의 이용이 크게 증가했다. 하지만, 전동킥보드의 이용은 여전히 주차, 안전에 대한 문제로 인해 논란의 대상이 되고 있다. 이동수단에 대한 인식은 사용자들이 어떤 이동수단을 선택할지에도 영향을 끼치므로 전동킥보드 이용 및 공유킥보드 서비스 활성화를 위해서는 관련 이슈와 그에 대한 대중의 인식을 파악할 필요가 있다. 이에 본 연구에서는 전동킥보드 관련 이슈에 대한 사회적 동향을 파악하는 것을 목표로 시간에 따른 이슈의 변동성을 고려해 동적 토픽 모델링과 감성 분석을 활용하여 2014년에서 2020년까지의 전동킥보드 관련 뉴스 기사를 분석하였다. 토픽 모델링을 통해 마이크로 모빌리티 기술, 공유킥보드 서비스, 킥보드 관련 규제 관련 토픽을 도출하였으며, 공유킥보드 서비스 증가와 함께 안전에 대한 이슈가 크게 불거지면서 킥보드에 대한 규제 관련 토픽의 비중이 최근 들어 크게 증가함을 확인했다. 그뿐만 아니라 감성 분석을 통해 킥보드 관련 뉴스에 주로 등장하는 긍정어는 신속, 즐기다, 손쉽다, 편리 등이 있고 부정어는 위협, 불법, 침해 등으로 나타나 킥보드나 공유킥보드 서비스의 편의성에는 만족하지만, 마이크로 모빌리티 서비스에서 안전, 주차 등의 문제는 여전히 해결해야하는 이슈임을 알 수 있었다. 결론적으로, 본 연구를 통해 전동킥보드에 대한 이슈와 그에 대한 관심과 사회적 감성의 변화를 확인하고 어떤 이슈에 대한 대응이 필요한지 파악할 수 있었다. 이 연구의 분석의 틀은 향후 다양한 사회 현안에 대한 사회적 동향을 파악하고 그에 대한 대응 방안을 마련하는데 활용할 수 있을 것으로 기대된다.

소셜미디어에 나타난 풍력발전시설의 경관 인식 연구 (A Study on the Landscape Cognition of Wind Power Plant in Social Media)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.69-79
    • /
    • 2022
  • 본 연구는 최근 신재생에너지원으로 관광, 여행 등의 목적을 가지며 관광자원의 역할을 할 수 있는 풍력발전시설의 경관 인식을 파악하였다. 이에 지역별로 방문객이 경험한 풍력발전시설의 경관과 관련된 소셜미디어 데이터를 분석하였다. 분석 결과, 풍력발전시설의 경관을 인식할 때 연구대상지에서 공통적으로 풍력발전시설의 규모, 조망점과 풍력발전시설 간의 거리, 조망점에서 풍력발전시설을 볼 때 시각적 개방성, 풍력발전시설이 위치하고 있는 지형에 따라 달라지는 것을 알 수 있다. 또한, 풍력발전시설의 선호는 풍력발전시설의 형태와 주변경관을 파악할 수 있는 장소인 평지나 바다에 설치되어 있는 곳을 더 좋은 경관이라고 인식하고 있다. 특이한 점으로 경관에 대한 부정적인 키워드는 강원도 태백 가덕산, 태백 매봉산, 태기산과 경상도 경주 풍력발전시설에서 나타났다. 부정적인 키워드는 풍력발전시설을 가까이 조망했을 때 조망각이 높아 느껴지는 압도적인 크기와 산의 능선이 함께 보이는 경관에서 심리적 위압감을 느끼고 있음을 알 수 있다. 반면, 평지나 바다가 보이는 경관의 풍력발전시설에서는 긍정적인 경관 형용사가 도출되어 방문객은 경관의 스카이라인이 산 능선과 겹쳐서 보이거나 너무 가까이에서 풍력발전시설을 바라볼 때보다 평지나 바다에서 경관의 시각량이 충분히 확보될 때 그 장소를 대표할 만한 상징적인 요소라고 인식하고 있음을 알 수 있다. 본 연구는 풍력발전시설을 경험한 방문객의 의견을 토대로 경관 인식을 분석하였다. 그러나 풍력발전시설은 설치되는 권역별로 경관특성이 다르고, 시점, 관찰자 등 변수가 많아 연구결과를 일반화시키기 어려운 한계가 있다. 최근 풍력발전시설 조성 시 발생하는 경관훼손이 주요 이슈가 되고 있고, 국내에는 풍력발전시설의 경관을 평가할 수 있는 방법이 미흡하다. 이에 풍력발전시설의 경관을 평가할 시 풍력발전시설의 규모, 풍력발전시설이 설치된 지역 고유의 자연적 특성, 풍력발전시설과 조망점과의 거리가 중요한 구성요소로 나타난 것은 주목할 사항이라 판단된다. 또한, 풍력시설은 보전해야 할 자연환경에 설치되는 시설로 추후 경관적 관점에서 풍력발전시설과 주변 환경을 바라보는 경관의 연구가 필요하다.

산업별 지속가능경영 전략 고찰: ESG 보고서와 뉴스 기사를 중심으로 (A Study on Industry-specific Sustainability Strategy: Analyzing ESG Reports and News Articles)

  • 김원희;권영옥
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.287-316
    • /
    • 2023
  • 최근 전 세계적으로 기업의 환경(Environmental)·사회(Social)·지배구조(Governance)의 비재무적 요소를 고려한 지속가능경영이 필수적으로 요구되면서, 각 기업들은 이에 대응할 수 있는 전략적 방향 수립이 중요해지고 있다. 특히 기업이 속한 산업별로 상이한 ESG 이슈에 대한 이해를 바탕으로 산업과 개별 기업의 특성을 반영한 전략을 개발하고 추진할 수 있어야 할 것이다. 이에 본 연구에서는 금융, 제조, IT 분야별로 나누어 주요 국내 기업들의 ESG 보고서와 관련 뉴스 기사를 이용하여 산업별 ESG 동향과 활동을 비교 분석하였다. 키워드 빈도분석과 토픽 모델링을 활용한 분석 결과, 국내 ESG 선도 기업들의 지속가능경영 활동에서의 산업별 차이를 도출 할 수 있다. 금융 분야에서는 '고객 중심 경영'과 '기후 변화 대응', 제조 분야에서는 '지속가능한 공급망 관리'와 '탄소중립', IT 분야에서는 '기술혁신'과 '디지털 책임'이 강조되었다. ESG 요소별 우선 순위가 높은 활동의 예를 들면, 환경 측면에서는 '에너지 절감과 친환경 활동', 사회 측면에서는 '사회공헌과 상생', 지배구조 측면에서는 '이사회 독립성 강화와 리스크 관리' 등으로 나타났다. 더 나아가 산업별 각 ESG 요소의 핵심 이슈 뿐 아니라 ESG 보고서와 뉴스 기사의 내용 유사성 및 차별점도 확인하였다. 연구의 결과는 산업별 동향을 고려한 ESG 경영 전략 및 정책의 방향성을 제시하고 있으며 이는 산업별 ESG 평가체계 수립에도 도움이 될 것으로 기대한다.

빅데이터환경에서 텍스트마이닝 기법을 활용한 한국의 석면 트렌드 (1918년~2027년) (Asbestos Trend in Korea from 1918 to 2027 Using Text Mining Techniques in a Big Data Environment)

  • 노열;정현이;박병노;김채원;김유미;서민아;신행수;김현욱;성예지
    • 자원환경지질
    • /
    • 제56권4호
    • /
    • pp.457-473
    • /
    • 2023
  • 석면은 악성중피종과 폐암 등 치명적인 질병을 유발하기 때문에 국내에서 2009년부터 그 사용이 전반적으로 금지되었다. 그러나 국내에서 지난 수십년 간 석면이 생산 및 수입되어 다양한 산업에서 사용되어 왔기 때문에 우리 주변에는 여전히 석면함유물질이 많이 존재하고 있어 안전한 관리가 절실하다. 이 연구는 지난 32년(1991년 ~ 2022년)동안의 빅데이터를 바탕으로 석면관련 주요키워드를 이용하여 석면관련 트렌드 변화를 살펴보고자 한다. 또한 국내 과거(1990년 이전)의 석면의 생산, 수입, 사용 실태와 더불어 현재(2023년~2027년)의 석면관련 정책 동향을 살펴보고자 하였다. 1991~2000년에는 국내 석면의 생산과 수입 그리고 이용으로 인하여 석면에 대한 발암성이 부각되는 시기로 연구, 근로자, 발암물질, 환경등과 관련된 키워드가 주를 이루었다. 2001~2010년에는 석면의 발암성과 관련하여 미국, 일본 등에서 소송이 시작되었던 시기로 폐암, 소송, 발암물질, 노출, 기업 등의 키워드가 주를 이루었다. 2011~2020년에는 국내에서도 석면문제의 심각성을 인지하는 키워드인 발암물질, 야구장, 학교, 슬레이트, 건축물, 폐석면광산 등이 지속적으로 상위권 키워드로 검색되었다. 2021년부터는 주로 검색되는 키워드는 학교, 슬레이트, 건축물 등과 조경석, 환경영향평가, 아파트, 시멘트 등의 키워드가 나타났다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.