• 제목/요약/키워드: 동시단어 분석

검색결과 188건 처리시간 0.022초

저출산 원인 확인을 위한 데이터 분석연구 (Data Analysis Research to Analyze the Cause of Low Birth Rate)

  • 이정원;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.496-498
    • /
    • 2021
  • 우리나라는 1980년 이전 높은 출산율을 기반으로 총인구는 지속적으로 증가하여 왔으며, 1980년대 중반 이후 출산율은 급격하게 떨어지면서 인구대체 수준 이하까지 떨어지게 되었다. 지역 내 저출산의 원인은 자발적 거부라기보다는 지역 사회 구조적인 원인을 다각적으로 파악하여 원인을 찾아내는 것이 필요하다. 여러 지역 중 출산율이 매우 낮은 예산 지역을 기준으로 지역 인터넷 뉴스 및 산모들이 많이 참여하는 지역 대표 카페 데이터를 수집하였다. 인구감소, 저출산, 육아 복지 등에 관하여 이슈화 되었던 동시출현단어의 빈도를 분석하여 출산 저해 원인을 분석하였다.

  • PDF

네이버 뉴스 댓글을 활용한 '비혼출산'에 대한 감성분석 (Sentiment Analysis on 'Non-maritalism Childbirth' Using Naver News Comments)

  • 허세영;김초원;정안용;이새봄
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.74-85
    • /
    • 2022
  • 한국 사회에서 결혼가치관의 변화, 비혼 만연 현상과 더불어 비혼출산이라는 새로운 가족 구성의 형태가 나타났고, 출생률 감소 문제와 결부되면서 사회적 논의가 이루어지고 있다. 이에 본 연구는 비혼출산에 대한 사람들의 감성과 인식을 알아보기 위해 방송인의 비혼출산 사실이 알려진 2020년 11월 16일부터 최근 2021년 8월 16일까지 비혼출산에 관한 뉴스기사 댓글을 이용해 감성분석을 수행하였다. 연구 결과, 방송인의 비혼출산 사실이 알려진 사회이슈기에는 긍정적인 댓글이 다수인 반면, 정부여당이 정책적 검토를 시작한 정책의제기부터 정책결정기까지는 부정적인 댓글이 다수였다. 단어 동시출현빈도에 기반한 네트워크를 살펴본 결과, 댓글에는 전통적 가족규범 측면, 정책적 측면, 개인적 측면의 인식이 나타났다. 본 연구는 비혼출산 이슈가 정책의 제화 이후 정책결정과정 동안 부정적 인식이 만연하였다는 점을 밝혀냈으며, 비혼출산에 대한 사회적 논의의 초석이 되었다는 점에서 의의가 있다.

의료민영화 논의에 따른 이슈용어의 연결 중심성 분석 (Analysis of Connection Centrality Degree of Hot Terminologies According to the Discourses of Privatization of Health Care)

  • 김유호
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.207-214
    • /
    • 2012
  • 본 연구는 의료서비스의 질적 향상을 가져옴과 동시에 의료소외지역을 만들 수도 있는 의료민영화에 대해서 찬성과 반대 논리를 살펴보고, 아울러 최근 3년 동안 주요 일간지에 게재된 의료민영화 및 영리병원에 관한 신문 사설을 중심으로 내용분석의 일종인 언어네트워크 분석을 통해 핵심 키워드를 찾아내고, 핵심 키워드 간의 연결 중심성 분석을 통해 논란의 핵심이 무엇인지를 밝혀 보고자 하였다. 결론적으로, 연결중심성 분석 결과 "의료", "병원", "민영화", "의료민영화", "영리병원", "정부"가 가장 중심에 위치하고 있었다. 이는 의료민영화 또는 영리병원에 관한 최근 3년 동안의 주요일간지에 게재된 사설을 중심으로 하였기 때문에, 의료, 병원, 민영화, 의료민영화, 영리병원 등의 키워드가 중심에 위치하고 있는 것은 당연한 결과이다. 다음으로, 중요한 중심 키워드(단어)는 "국민", "건강", "건강보험"이다. 이는 의료민영화를 단순히 의료시장에 대한 개방으로만 보지 않고, 최근 3년 동안의 사설들은 국민의 건강과 건강보험과 관련된 중요한 이슈로 보고 있다는 것을 의미한다고 볼 수 있다. 또한, 그 다음으로 중요한 중심성이 높은 단어로는 "반대"와 "허용"이다. 이를 통해 볼 때, 최근 3년 동안의 사설을 내용 분석해 본 결과, 의료민영화에 반대하는 쪽과 허용하자는 쪽이 팽팽하다는 것을 연결중심성 분석 결과에서도 알 수 있다. 한편, 중심성 분석결과에서 주목할 만한 결과는 "미국", "한미", "FTA" 등의 키워드도 어느 정도 중심성이 나타나고 있다는 것이다. 이는 의료민영화를 미국과의 한미 FTA와 관련하여 사설에서 기술하고 있다는 것을 나타내주는 대목이다.

키워드 분석을 활용한 한·중 모바일 결제 서비스에 대한 소비자 반응 탐색적 분석 -카카오페이와 알리페이를 중심으로- (Exploratory Analysis of Consumer Responses to Korea-China Mobile Payment Service using Keyword Analysis -Focus on Kakao Pay and Alipay-)

  • 가정;윤동화;안진현
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.514-523
    • /
    • 2021
  • 최근 모바일 간편 결제 서비스의 확산은 사람들의 삶에 점점 더 많은 영향을 미치고 있다. 중국과 한국의 모바일 간편 결제 서비스에 대한 연구 증가를 통해 향후 모바일 간편 결제 서비스의 지속적인 발전이 매우 중요함을 알 수 있다. 본 논문은 소셜미디어 상에서 소비자의 카카오페이와 알리페이에 대한 반응의 차이를 알아보기 위해 카카오페이와 알리페이가 언급된 네이버 블로그 글을 수집하고 텍스트마이닝 기법을 활용해 키워드 분석을 했다. 품사별 키워드 빈도수 분석을 하였고 한 문장에 동시에 언급되는 공기어 빈도수 분석을 했다. 특히, 카카오페이와 알리페이를 언급한 글에서 공통적으로 언급된 단어를 추출하고 그에 대해 같이 언급된 단어들을 분석함으로써 같은 주제에 대해 어떤 다른 반응을 보이는지를 살펴봤다. 분석 결과 카카오페이의 신뢰성에 대한 소비자들의 우려가 존재했고 알리페이의 혜택에 대한 소비자들의 반응이 부정적이었다. 이러한 분석 결과를 토대로, 모바일 결제 서비스가 경쟁력을 갖추기 위해서는 다양한 부가 서비스를 추가하거나 보안 문제를 해결하는 노력을 할 필요가 있다는 점을 도출할 수 있다.

과학계량학적 정보분석을 통한 LED 및 광분야 유망기술 탐색에 관한 연구 (A Study on the Emerging Technology Detection in the Field of LED Using Scientometrics)

  • 장시영;이병철;김윤배
    • 한국산학기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.1213-1222
    • /
    • 2011
  • 본 연구는 과학계량학(scientometrics)을 활용하여 LED 및 광분야의 유망기술을 탐색하였다. 우선 Web of Science의 SCIE 논문 및 미국특허청(USTPO) 특허를 수집하여 키워드를 추출하였다. 추출된 키워드를 클렌징 과정을 통해 표준화하고, 동시단어 분석을 사용하여 LED 및 광분야의 논문과 특허 서지사항에 나타나는 정보간의 연합강도(association strength)를 측정함으로써 기술의 패턴 및 경향을 밝혀내었다. 그리고 LED 및 광분야의 역동적인 변화를 추적하기 위하여 전략적 다이어그램을 도출하였다. 이를 통해 LED 및 광분야의 미래 유망연구영역 및 기술도출의 객관적인 방법으로서 과학계량학의 가능성을 보여준다.

문헌정보학의 지식 구조에 관한 연구 (A Study on Intellectual Structure of Library and Information Science in Korea)

  • 유영준
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.277-297
    • /
    • 2003
  • 이 연구는 색인어가 특정 주제 영역의 지식 구조를 표현할 수 있다는 것을 전제로 한다. 여기에서는 문헌정보학 관련 학술지인 정보관리학회지, 한국도서관정보학회지, 한국문헌정보학회지 등에 수록된 논문을 대상으로 국회도서관이 배정한 색인어를 클러스터링하여 문헌정보학의 지식 구조를 파악하였다. 그 과정에서, 색인어간의 연관도 및 동시 출현 빈도를 이용하여 색인어 군집을 생성하였고, 초출색인어와 시기 구분에 의한 시계열 분석을 수행함으로써 문헌정보학의 발전 과정과 그 동향을 밝혔다. 또한 색인어 군집에 의해 도출된 지식 구조와 기존의 전통적인 분류체계의 지식 구조를 비교하여 두 지식 구조간의 차이를 분석하였다.

문헌동시인용 분석을 통한 한국학 지식구조 파악: 주체 인식과 타자 인식의 차이 (Detection of Knowledge Structure of Korean Studies Using Document Co-citation Analysis: the Difference between Self-perception and Others' Perception)

  • 김혜진
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.179-200
    • /
    • 2020
  • 한국학의 연구 범위는 한국의 역사, 문학, 정치, 사회, 경제, 종교 등 한국과 관련된 모든 영역을 망라하고 있다. 본 연구는 문헌동시인용 분석과 텍스트마이닝 기법을 사용하여 한국학 지식구조를 정의하였다. 그리고 한국학을 다룬 주체에 따라 한국에서 논의된 한국 연구를 주체 인식 한국학, 한국 이외의 지역에서 논의된 한국 연구를 타자 인식 한국학으로 나누어 하위영역을 비교·분석하였다. 이를 위해서 SCOPUS 데이터베이스에서 'Korea' 또는 'Korean' 이라는 단어를 키워드로 포함하고 있는 인문·사회 분야 문헌 10,929건을 수집하였다. 분석결과 주체 인식 한국학의 지식구조에서는 총 20개의 하위영역이 발견되었고, 타자 인식 한국학의 지식구조에서는 총 14개의 하위영역이 발견되었다. 주체 인식의 한국학과 타자 인식의 한국학의 하위영역 구성에 있어서 차이점은 첫째, 주체 인식 한국학의 하위영역이 타자 인식 한국학의 하위영역보다 더 다양한 영역으로 세분되어 있다는 것, 둘째, 주체 인식 한국학은 마케팅/소비자와 서비스, 산업화, 다문화, 정신건강, 관광, 한국어, 환경과 도시 등이 주요 영역을 차지하고 있고, 타자 인식 한국학은 크게 한국 대내외의 상황, 한국 대중문화, 미국 이민자로서의 한국인, 한국어/한국어 습득이 주요 영역을 차지하고 있는 것으로 나타났다. 마지막으로 주체 인식과 타자 인식에서 공통적으로 보이는 영역은 정신건강, 관광, 한국어, 탈주민, 청소년 비행 등이었다.

초·중·고 교육분야의 인공지능(AI) 관련 해외 연구동향 분석 (Analysis of Overseas Research Trends Related to Artificial Intelligence (AI) in Elementary, Middle and High School Education)

  • 정영주;김혜진
    • 한국도서관정보학회지
    • /
    • 제52권3호
    • /
    • pp.313-334
    • /
    • 2021
  • 본 연구는 초·중·고 교육분야 인공지능과 관련된 해외 연구동향을 분석하기 위해 SCOPUS 데이터베이스를 대상으로 관련 문헌을 수집하였다. 수집된 문헌의 발행 기간은 1974년부터 2021년 3월까지이며, 학술지 논문이 154건, 컨퍼런스 논문은 571건으로 나타났다. 이들 논문에 포함된 저자 키워드 및 인덱스 키워드 4,521개의 단어들의 동시출현(co-occurrences) 분석기법을 바탕으로 연구 동향을 분석하였다. 분석결과 machine learning을 주축으로 big data, data mining, data science, deep learning이 최신 연구 동향으로 나타났고, 초·중·고등교육 간에는 차이가 있는 것으로 나타났다. 초등은 로봇 관련 연구가 많이 있었으며, 중등은 게임과 데이터 관련 연구가 많이 있었고, 고등은 다양하고 심도 있는 연구가 이루어졌음을 알 수 있었다. 마지막으로 결과분석에서 우리나라 교육부에서 2020년 9월 발표된 '인공지능 기초' 교육과정과 미국 AK4K12의 '5 Big Ideas'와 초·중·고 공통 상위 50단어와 매핑하여 우리나라 초·중·고 인공지능 교육에 시사점을 제시하였다.

소셜네트워크 빅데이터를 활용한 코로나 19에 따른 프로야구 관람문화조사 (Professional Baseball Viewing Culture Survey According to Corona 19 using Social Network Big Data)

  • 김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권6호
    • /
    • pp.139-150
    • /
    • 2020
  • 본 연구의 자료처리는 텍스톰(textom)과 소셜미디어의 단어를 중심으로 3가지 영역인 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중', '코로나 19와 프로스포츠'에 대해 웹 환경에서 데이터 수집과 정제작업을 실시한 후 일괄 처리하였으며, 이를 시각화하기 위해 Ucinet6프로그램을 활용하였다. 구체적으로 웹 환경의 수집은 네이버, 다음, 구글의 채널을 활용하였고, 추출된 단어들 중 전문가회의를 통해 30개의 단어로 요약 정리하여 최종 연구에 활용하였다. 30개의 추출된 단어를 매트릭스를 통해 시각화하였으며, 단어의 유사성과 공통성의 군집을 파악하기 위해 CONCOR분석을 실시하였다. 분석결과 코로나 19와 프로야구에 관련된 군집은 1개의 중심클러스터와 5개의 주변클러스터로 구성되었고 코로나 19여파에 따른 프로야구 개막과 관련된 내용을 주로 검색하고 있는 것으로 나타났다. 코로나 19와 프로야구 무관중에 관련된 군집은 1개의 중심 클러스터와 5개의 주변클러스터로 구성되었으며, 코로나 19에 따른 프로야구 경기와 관련된 프로야구 입장의 키워드를 주로 검색하고 있는 것으로 나타났다. 코로나 19와 프로스포츠에 관련된 군집은 1개의 중심클러스터와 5개의 주변클러스터로 구성되었으며, 코로나 19의 여파에 따른 프로스포츠 시작과 관련된 키워드를 주로 검색하고 있는 것으로 나타났다. 이를 종합해보면 포스트 코로나 시대의 프로야구는 많은 변화가 있을 것이라 예상된다. 특히 응원문화는 관중들이 원하는 정도의 만족감은 없겠지만 관중들이 누릴 수 있는 직접관람의 기회를 누리기 위해 야구장에서도 코로나 19를 극복하기 위한 하나의 일상으로의 행동강령이 잘 유지되어야 할 것이다. 관람문화 또한 라이브커머스, AR/VR, O4O(Online for Offline)등의 4차 산업혁명의 기술도입으로 현장감 있는 쌍방향 소통이 가능한 인터렉티브 소통의 디지털이 구현돼야 할 것이다. 포스트 코로나 시대는 프로스포츠에도 새로운 형태의 패러다임이 구축될 것이다. 랜선 응원, SNS를 활용한 응원, 실시간 동시시청, 라이브 채팅응원, 편파중계 등 다양한 형태의 응원문화가 새로운 창작 콘텐츠 형태로 진화할 것이며, 팬들의 욕구를 충족할 수 있는 새로운 형태의 패러다임이 구축돼야 하겠다.

규칙에 기반한 한국어 부분 구문분석기의 구현 (Implementing Korean Partial Parser based on Rules)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.389-396
    • /
    • 2003
  • 본 논문에서는 문법검사기나 기계번역과 같은 실제 응용 시스템을 위한 한국어 부분 구문분석의 처리 대상을 정의하고, 규칙에 기반한 한국어 부분 구문분석기의 구현에 대해서 논의한다. 부분 구문분석기는 기본적으로 여러 개의 형태소나 단어가 구문적으로 하나의 구조에 속한 경우 이를 하나의 덩어리로 묶어주는 역할을 수행하며, 동시에 부가적인 작업을 수행할 수 있다. 또한 부분 구문분석기는 다양한 형태로 표현된 부분 구조를 표준 형태소 구조로 바꾸어 줌으로써, 상위 모듈의 처리에서 그 결과를 용이하게 사용할 수 있도록 한다. 본 논문에서는 한국어 부분 구문분석을 위해서 수동으로 작성된 140여 개의 규칙을 이용하였으며, 각 규칙은 일반적인 규칙과 마찬가지로 조건부와 행위부로 구성되었다. 부분 구문분석의 효율성을 관찰하기 위해서 일반적인 구문분석과 부분 구문분석을 포함한 구문분석을 비교하였다. 실험을 통해서 전자가 후자에 비해 약 두 배의 레코드 수가 요구됨을 알 수 있었다.