• 제목/요약/키워드: 텍스트 출현 빈도

검색결과 102건 처리시간 0.022초

텍스트 마이닝을 활용한 저출산 정책과 대중인식 비교 (Comparative Analysis of Low Fertility Policy and the Public Perceptions using Text-Mining Methodology)

  • 배기련;문현정;이재일;박미나;박아름
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.29-42
    • /
    • 2021
  • 한국의 저출산 심화에 따라 본 연구는 정부의 저출산 대응정책과 그에 대한 대중인식을 비교하여 근본적인 차이점을 밝히고자 했다. 이를 위해 네 차례의 '저출산·고령사회 기본계획'과 제3·4차 기본계획 발표 직후 2주간의 뉴스 댓글을 분석대상으로 선정하여, 빈도분석, 동시출현단어 분석, 구조적 등위성 분석을 실시하였다. 정책문서 빈도분석결과 제1·2차 시기는 직접적인 보육지원이, 제3·4차 시기부터는 사회구조적인 접근이 눈에 띄었다. 동시출현단어 분석에서는 정책과 댓글 모두 '육아'에서 일과 가정의 양립을 지향하였다. '결혼'과 '출산'의 경우 댓글은 연속성, 정책은 단절성이 두드러지며 특히 주거와 고용문제에서 큰 차이가 있었다. 댓글의 구조적 등위성 분석 결과에서는 대중들의 자녀 양육환경에 대한 관심, 정책 실효성에 대한 문제의식을 확인할 수 있었다. 본 연구는 빅데이터를 활용해 대중들의 인식을 확인하였다는 점에서 의의를 가지므로, 이에 근거한 정책 개선 등 향후 저출산 대응이 나아가야 할 방향을 수립하는 데 도움을 줄 수 있을 것이다.

모바일 결제 서비스에 대한 미래신호 예측 - 중국시장을 대상으로 - (Exploring Future Signals for Mobile Payment Services - A Case of Chinese Market -)

  • 현빈;백승익
    • 서비스연구
    • /
    • 제13권1호
    • /
    • pp.96-107
    • /
    • 2023
  • 본 연구에서는 모바일 결제 서비스 이용률이 세계에서 가장 높은 중국 이용자들을 대상으로 어떤 이슈에 관심이 있는지를 미래신호 예측 방법론을 이용하여 예측하여 보았다. 이를 위하여 중국의 SNS 사이트로부터 모바일 결제와 연관된 텍스트 데이터를 수집한 후, 문장에서 추출한 키워드들을 키워드 등장 지도 (KEM: Keyword Emergence Map)와 키워드 이슈 지도 (KIM: Keyword Issue Map)를 이용하여 강신호, 약신호, 잠재신호, 그리고 강하지만 증가율이 낮은 신호로 분류하였다. 한 걸음 더 나아가서 본 연구에서는 4가지 종류의 신호를 구체적으로 이해하기 위해서 각 신호와 연관된 텍스트를 추가적으로 정성적인 분석을 실시하였다. 그 결과, 현재 뿐만 아니라 본 연구 기간 동안 키워드 출현 빈도가 빠르게 성장하고 있는 강신호에는 버스, 지하철, 가계부와 같이 중국인들의 일상생활과 관련된 키워드가 많이 포함되어 있음을 발견하였고, 현재에는 자주 등장하지만 강신호와는 달리 증가율이 낮은 신호에는 홍바오 (현금결제), 은행카드와 같이 현금 결제를 대체할 수 있는 다양한 서비스가 언급되었음을 발견하였다. 다른 신호에 비하여 출현 빈도가 저조한 약신호와 잠재신호에는 서비스 규정 변화나 이벤트와 연관된 키워드들이 포함되었다. 본 연구 결과를 통하여 모바일 결제 서비스는 중국 이용자들에게 편리함을 제공하는 것을 넘어서 그들의 일상생활을 크게 변화시켰음을 알 수 있었다. 그리고 신용카드 결제가 보편화되지 않은 중국에서 모바일 결제 서비스는 현금결제를 완전히 대체할 수 있는 서비스로 성장할 가능성이 높음을 알 수 있었다.

트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구 (Topic-Network based Topic Shift Detection on Twitter)

  • 진설아;허고은;정유경;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.285-302
    • /
    • 2013
  • 본 연구는 높은 접근성과 간결성으로 인해 방대한 양의 텍스트를 생산하는 트위터 데이터를 분석하여 토픽의 변화 시점 및 패턴을 파악하였다. 먼저 특정 상품명에 관한 키워드를 추출한 후, 동시출현단어분석(Co-word Analysis)을 이용하여 노드와 에지를 통해 토픽과 관련 키워드를 직관적으로 파악 가능한 네트워크로 표현하였다. 이후 네트워크 분석 결과를 검증하기 위해 출현빈도 기반의 시계열 분석과 LDA 토픽 모델링을 실시하였다. 또한 트위터 상의 토픽 변화와 언론 기사 검색결과를 비교한 결과, 트위터는 언론 뉴스에 즉각적으로 반응하며 부정적 이슈를 빠르게 확산시키는 것을 확인하였다. 이를 통해 기업은 대중의 부정적 의견을 신속하게 파악하고 이에 대한 즉각적인 의사결정 및 대응을 위한 도구로 본 연구방법을 활용할 수 있을 것으로 기대된다.

텍스트마이닝 기법을 이용한 한국 사회의 혐오 양상 분석 (Analyzing the Phenomena of Hate in Korea by Text Mining Techniques)

  • 김혜진
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.431-453
    • /
    • 2022
  • 혐오는 타인에 대한 배타성이 집단적으로 표출된 것으로, 잘못된 대중적 인식을 통하여 양산되고 재생산된다. 이 연구는 우리사회에서 언급되고 있는 '혐오' 양상을 거시적으로 탐색하고자 1990년부터 2020년까지 발행된 뉴스데이터 17,867건을 대상으로 텍스트마이닝 기법을 활용하여 키워드 네트워크와 군집 분석을 수행하였다. 그리고 단어를 추출하기 전에 먼저 기사를 문장으로 분리하는 전처리 과정을 거쳐 '혐오', '편견', '차별'이라는 단어를 포함하고 있는 문장 총 52,520개를 추출하여 분석에 활용함으로써 '혐오'라는 단어와 인접한 단어들로 구성된 키워드 네트워크를 구축하였다. 수집한 뉴스데이터의 단어 동시출현빈도 분석 결과, 우리 사회에서 혐오와 관련되어 가장 빈번하게 등장하는 대상은 여성, 인종, 성소수자 등이며, 관련된 이슈는 이들 집단과 관련된 법과 범죄 등이었다. 키워드 네트워크 군집 분석 결과, 성별(41.4%), 소수자(28.7%), 인종·민족(15.1%), 선택적·이해관계적(8.5%), 정치·이념(5.7%), 환경·생존적(0.3%) 혐오 등 총 6개의 혐오 군집들이 발견되었다. 논의에서는 군집 분석 결과 구체적으로 드러나지 않은 혐오의 표적(대상)을 모두 추출하여 분석하였다.

소셜미디어 빅데이터의 개체명 인식을 활용한 옥외 힐링 장소 인식 분석 (Outdoor Healing Places Perception Analysis Using Named Entity Recognition of Social Media Big Data)

  • 성정한;이경진
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.90-102
    • /
    • 2022
  • 최근 힐링에 대한 관심이 증가함에 따라 힐링을 콘셉트로 하는 옥외 공간이 조성되고 있다. 보다 전문적이고 심층적인 옥외 힐링 장소 계획·설계·디자인을 위해 88,155건의 블로그 게시글 텍스트 데이터를 개체명 인식하여 텍스트 마이닝을 진행했다. 옥외 힐링 장소의 인식과 특징을 파악을 위해 출현 빈도 분석과 응집 분석을 진행하였다. 선행연구 고찰을 통해 힐링 장소의 6가지 요소를 도출하였으며, 시간과 인원을 추가한 총 8가지 요소를 통해 인식과 특성을 살펴보았다. 분석 결과 사람들은 힐링 장소를 방문하는 데 있어 장소적요소, 시간적요소, 사회적요소, 활동요소를 인원, 식물, 색상·형태, 심리적 요소보다 중요하게 생각하였다. 상위 출현 키워드를 통해 여러 가지 인식과 특성을 파악할 수 있었다. 응집 분석 결과를 통해 장소적요소, 시간적요소, 사회적요소의 키워드들이 응집되어 나타나 주로 어떤 장소, 어떤 시간대, 누구와 함께 방문하는지 구체적으로 살펴볼 수 있었다. 연구를 통해 실제 사람들이 작성한 인식 데이터를 대량 분석하여 힐링 장소의 인식과 특성을 도출하였으며, 계획과 마케팅적으로 활용할 수 있는 구체적인 요소가 나타남을 확인했다.

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.

우리나라 구곡시가에서 나타난 조경 식물종의 상징적 의미 (The Meaning of Plant Species in Korean Gugok Poems(九曲詩歌))

  • 오창송;박상욱
    • 한국전통조경학회지
    • /
    • 제38권2호
    • /
    • pp.77-94
    • /
    • 2020
  • 구곡시가는 구곡원림을 연구하는 중요한 소재이다. 특히 시가에서 출현하는 경물은 그 장소성과 원림의식을 표출하는 중요한 소재이다. 그러나 자연에 대한 인식 태도나 미적 형상화 과정을 탐구할 수 있는 식물 소재에 대하여 다수학문들은 소극적이다. 따라서 본 연구는 구곡원림문화의 연구 소재를 확장하기 위해 구곡시가에 출현한 식물에 관한 다양한 상징적 의미를 발굴하고 그 맥락을 밝히고자 한다. 연구의 목적을 수행하기 위해 나는 총 18구곡처 25개의 관련 시가를 수집하였고 총 20종의 식물을 발견하였다. 본 연구는 구곡 시가와 그 해설문을 R-program을 사용하여 수목의 의미를 도출하였고 상호텍스트성에 의한 수목의 의미를 고찰하였다. 연구결과, 20종의 식물은 신선계, 청빈, 향수, 군자의 품격, 진락, 절개, 강학, 태평성대의 상징적 의미를 내포하였다. 다수의 종은 '신선계'에 상징성을 집중하였고 다음으로 '군자의 품격'에 대한 싱징 빈도가 높았다. 복사나무, 느티나무, 떡갈나무 등을 제외한 다수의 수종이 다중적 의미를 갖추고 있었다. 그 중 소나무와 연꽃이 상징적 의미의 폭이 넓었고 주변 경관의 특성에 따라 의미도 달랐다. 일반적으로 구곡문화는 자연경관을 대상으로 하지만 용산, 퇴계, 덕산, 주산구곡은 인위적인 배식 및 정원 행위를 통해 상징적 의미를 강화 또는 재생산하는 특징을 보여주었다. 우리 구곡시가는 무릉도원을 상징하는 복사나무의 한계를 극복하기 위해 단풍나무와 갈대를 대체 수종으로 활용하였다. 이상의 맥락에 따라, 구곡시가에 출현하는 수목은 전통적인 의미를 고집하기보다는 해당 구곡의 경물, 행위 그리고 의도에 따라 그 상징적 의미를 다르게 표출하였다.

텍스트 마이닝 기법을 이용한 환경 분야의 ICT 활용 연구 동향 분석 (A Study on Environmental research Trends by Information and Communications Technologies using Text-mining Technology)

  • 박보영;오관영;이정호;윤정호;이승국;이명진
    • 대한원격탐사학회지
    • /
    • 제33권2호
    • /
    • pp.189-199
    • /
    • 2017
  • 본 연구는 텍스트 마이닝 기법을 활용하여 환경 분야에서 ICT의 활용 연구동향을 정량적으로 분석하였다. 이를 위해 환경 분야 키워드 38개, ICT 관련 키워드 16개를 바탕으로 국가과학기술정보센터(NDSL)에서 최근 20년(1996년-2015년)의 논문 359편을 수집하였다. 해당 논문을 대상으로 환경 분야 및 ICT 관련 자연어를 처리하여 말뭉치(Corpus)단위로 분류체계를 재구성하였다. 전술된 분류체계의 키워드를 바탕으로 텍스트 마이닝 분석 기법인 빈도 분석, 키워드 분석, 키워드 간 연관규칙을 확인하였다. 그 결과 '환경 일반' 및 '기후' 분야의 키워드 출현 빈도가 전체의 77 %, ICT는 '공공융합서비스' 및 '산업융합서비스'가 약 30 %의 비율을 차지하였다. 시계열 분석을 통해 환경 분야에서의 ICT 활용 연구는 최근 5년(2011년-2015년)사이에 급증하여 과거(1996년-2010년)과 비교하여 약 2배 이상 관련 연구가 증가된 것으로 나타났다. 키워드 간 연관 규칙을 생성하여 환경 분야를 기준으로 나타내었을 때, '환경 일반'은 16개, '기후'는 '14'개의 ICT 기반 기술을 주로 활용하고 있는 것으로 확인하였다.

텍스트 마이닝을 활용한 온라인 교육에 대한 소비자 인식 변화 분석: COVID-19 전후를 중심으로 (A Study on Consumer perception changes of online education before and after COVID-19 using text mining)

  • 손민성;임미자;박경환
    • 디지털융복합연구
    • /
    • 제19권1호
    • /
    • pp.29-43
    • /
    • 2021
  • COVID-19 이후 국내는 물론, 전 세계적으로 온라인 교육은 절대적으로 필요하며 대체 불가한 교육 형태가 되었다. 온라인 교육이 급부상 하면서 교육 형태에 대해 사람들이 가지는 인식은 어떠한지, 만약 변화가 있다면 어떻게 변화했는지는 매우 궁금증을 자아내는 질문이다. 본 연구는 온라인 교육에 대한 소비자 인식의 변화 추이를 빅데이터를 활용하여 조사하였다. 이를 위해 코로나 이전(2019년 11월-12월), 코로나 촉발 이후(2020년 1월-2월), 온라인 개강직후(2020년 3월-4월), 온라인 교육을 일정 정도 경험한 이후(2020년 5월-6월)의 4개의 구간으로 구분하고, 텍스트 마이닝 즉, 키워드 빈도분석, 워드클라우드 분석, 네트워크 분석, 감성 분석을 수행하였다. 시기별로 온라인 교육 관련 키워드의 출현빈도는 코로나 이전에는 학점은행제, 평생교육, 블로그 등에서 코로나 이후 학교 개강이 시작되면서 온라인 개학, 비대면 교육, 실시간, 콘텐츠 제작, 유튜브 등으로 변화하였다. 감성분석 결과, 코로나 사태 이전에는 공지안내, 정보교류 등의 중립글이 대부분이었으나, 코로나 발생을 계기로 온라인 교육에 대한 사람들의 인식과 평가에 대한 긍정 및 부정의 의견이 논의되기 시작하였다. 또한 미래 온라인 교육시장의 확산과 전망 등 방향성에 대해서도 관심이 증대되었다. 온라인 교육은 발전가능성이 높은 만큼 앞으로 개선해야 할 부분들이 많겠으나, 교육 정책입안자, 현장에서 일하는 교육자들에게 온라인 교육 품질 개선 및 향후 나아갈 방향 수립에 도움을 줄 수 있을 것이다.

빅데이터 분석 기법을 활용한 도서관발전종합계획 동향 분석 연구 (Analysis Study on Trends of Library Development Plan by Using Big Data Analysis)

  • 김동석;노영희
    • 한국비블리아학회지
    • /
    • 제29권2호
    • /
    • pp.85-108
    • /
    • 2018
  • 본 연구에서는 도서관발전종합계획에 대한 언론보도를 빅데이터 분석 기법을 활용하여 시기별 동향과 시사점을 도출하고자 하였다. 이를 위해 국내 주요 포털 사이트를 통해 2009년부터 2017년까지 관련 데이터를 수집하였다. 수집된 데이터는 텍스트 마이닝 과정을 통해 정제된 단어를 도출하였고 이를 바탕으로 빈도분석 및 중심성 분석, 구조적 등위성 분석 등을 수행하였다. 분석 결과 제1 2차 도서관발전종합계획이 시행되는 동안 도서관 정책의 흐름이 외연적 성장에서 도서관 운영의 내실화 고도화의 흐름으로 변화하고 있었으며, 도서관 시설 확충과 같은 특정 정책에 국한되어 언론보도가 이루어짐을 확인할 수 있었다. 이러한 연구 결과는 도서관발전종합계획으로 대변되는 도서관 정책을 어떤 관점에서 인식하고 이해하고 있는지 확인하는데 유용한 자료로 사용될 수 있으며, 향후 도서관발전종합계획의 비전을 모색하는데 활용되기를 바란다.