• 제목/요약/키워드: opinion word

검색결과 102건 처리시간 0.023초

회선 신경망을 활용한 자모 단위 한국형 감성 분석 모델 개발 및 검증 (Development and Validation of the Letter-unit based Korean Sentimental Analysis Model Using Convolution Neural Network)

  • 성원경;안재영;이중정
    • 한국전자거래학회지
    • /
    • 제25권1호
    • /
    • pp.13-33
    • /
    • 2020
  • 본 연구는 자모 단위의 임베딩과 회선 신경망을 활용한 한국어 감성 분석 알고리즘을 제안한다. 감성 분석은 텍스트에서 나타난 사람의 태도, 의견, 성향과 같은 주관적인 데이터 분석을 위한 자연어 처리 기술이다. 최근 한국어 감성 분석을 위한 연구는 꾸준히 증가하고 있지만, 범용 감성 사전을 사용하지 못하고 각 분야에서 자체적인 감성 사전을 구축하여 사용하고 있다. 이와 같은 현상의 문제는 한국어 특성에 맞지 않게 형태소 분석을 수행한다는 것이다. 따라서 본 연구에서는 감성 분석 절차 중 형태소 분석을 배제하고 초성, 중성, 종성을 기반으로 음절 벡터를 생성하여 감성 분석을 하는 모델을 개발하였다. 그 결과 단어 학습 문제와 미등록 단어의 문제점을 최소화할 수 있었고 모델의 정확도는 88% 나타내었다. 해당 모델은 입력 데이터의 비 정형성에 대한 영향을 적게 받으며, 텍스트의 맥락에 따른 극성 분류가 가능하게 되었다. 한국어 특성을 고려하여 개발된 본 모델이 한국어 감성 분석을 수행하고자 하는 비전문가에게 보다 쉽게 이용될 수 있기를 기대한다.

사드 루머(THAAD rumor) 보도에 나타난 한국 언론의 정파성 네트워크 분석과 프레임 분석을 중심으로 (Korean Media Partisanship in the Report on THAAD Rumor Network and Frame Analysis)

  • 홍주현;손영준
    • 한국언론정보학보
    • /
    • 제84권
    • /
    • pp.152-188
    • /
    • 2017
  • 이 연구는 루머의 사회적 확산 과정에서 한국 언론이 어떤 역할을 하는지 네트워크 분석과 프레임 분석을 통해 밝혔다. 언론의 이념적 성향과 뉴스생산 과정의 차이에 따라 언론 매체를 구분하고, 매체별 보도를 비교했다. 이념적 성향에 따른 보도량의 차이는 나타나지 않았다. 보수 언론은 사드 루머를 불필요한 오해로 보고, 사드 유언비어가 사회적 갈등을 유발한다고 했다. 진보 언론은 황교안, 외부세력, 거짓말을 많이 언급했고 '괴담을 반대하는 외부세력이 있다'는 정부의 입장을 비판했다. 루머 프레임을 비교해 보면 보수언론은 루머의 확산 원인을 악의적 괴담이 확산되고 있다고 본 반면에, 진보 언론은 사드의 유해성을 입증하기보다는 정부와 보수 언론이 사드 괴담을 유포한 세력을 비판하는 것에 주목했다. 오프라인 매체와 비교해서 온라인 매체는 감정적 표현과 비논리적인 이야기 구성으로 선정적인 보도 경향이 강했다. 한국 언론은 사실 확인이나 과학적 검증보다는 각자의 정파적 성향에 따라 사드 루머 이슈를 보도했다. 보수 진보 매체는 사드 루머의 발생 원인과 반대 시위 주체, 전자파의 유해성 등에서 양극화된 프레임을 제시했다. 한국 언론의 정파적 보도는 우리 사회의 정치적 대치 관계를 더욱 심화시킬 것으로 판단된다. 이와 같은 결과는 한국 언론이 식견 있는 공중(informed public)을 확보하는 데 성공적이지 못하며 오히려 민주주의 질서 자체를 위협할 수 있다는 가능성을 제시한다.

  • PDF

트위터를 통한 루머의 확산 과정 연구: 한미 FTA 관련 루머의 자극성에 따른 의견 확산 추이와 이용자의 상호작용성을 중심으로 (The Diffusion of Rumor Via Twitter : The Diffusion Trend and the User Interactivity in the Korea-U.S. FTA Case)

  • 홍주현;윤해진
    • 한국언론정보학보
    • /
    • 제66권
    • /
    • pp.59-86
    • /
    • 2014
  • 이 연구는 소셜 네트워크 사이트를 통해 루머가 급속하게 확산될 뿐만 아니라 정책 결정과정에까지 영향을 미치는 현상에 주목하였다. 이에 거시적 관점에서 한미 FTA와 관련된 여론의 확산 추이를 살펴보고 미시적 관점에서 이용자 간에 상호작용성이 얼마나 활발하게 나타나는지 분석하였다. 이 연구는 루머의 자극성을 루머의 확산에 영향을 미치는 요인으로 보았다. 한미 FTA 관련 루머 중 트위터 검색 엔진을 통해 연관 검색어로 나타난 맹장수술 괴담, 약값 폭등, 건강보험 붕괴를 중심으로 루머의 자극성과 자극성에 따른 확산 추이, 상호작용성을 분석하였다. 루머의 자극성을 사실적 측면과 표현적 측면으로 구분해 분석한 결과, 사실적 측면의 자극성은 맹장 수술 괴담이, 표현적 측면의 자극성은 약값 폭등이 가장 컸다. 루머의 자극성에 따른 여론의 확산 유형을 분석한 결과, 맹장 수술 괴담의 경우 '폭발적 소멸형 파동'이, 약값 폭등의 경우 '잠재적 소멸형 파동'이, 건강 보험 붕괴의 경우 '반복적 파동'이 형성되었다. 루머의 자극성과 상호작용의 관계를 상관관계 분석한 결과, 맹장 수술 괴담의 경우 약한 정도의 상관관계가, 건강 보험의 경우 높은 정도의 상관관계가 나타났다. 건강 보험 붕괴의 자극성이 맹장 수술 괴담의 자극성보다 낮았지만, 건강 보험의 경우 이용자들이 체감하는 이슈 관여도가 높아 논의가 더 활발하게 이루어진 것으로 생각된다. 이 연구를 통해 한미 FTA 체결과 관련하여 트위터가 부정적인 메시지가 확산되는 통로의 역할을 한 것으로 판단된다. 향후 정부는 소셜네트워크사이트를 통한 루머의 확산 과정을 파악하고, 이에 대한 대책을 마련해야 할 것이다.

  • PDF

"유문사친(儒門事親)"의 '한법(汗法)'에 관한 연구 (A Study of Diaphoretic Therapy[汗法] in "Yumunsachin(儒門事親)")

  • 김기욱;박현국;정경호
    • 대한한의학원전학회지
    • /
    • 제21권1호
    • /
    • pp.1-11
    • /
    • 2008
  • Jangjahwa(張子和) was influenced by "Hwangjenaegyeong(黃帝內經)" and Yuhagan(劉河間)'s theory, and other classics. Also, his clinical experience was helpful to theorize his thought. Thus, he improved medical theory by combining previous medical theory and his own experience. The essence of his thought is the importance of pathogenic Gi[邪氣] as the cause of disease and is Sambeop(三法) of Hantoha(汗吐下) as the methodology for removing pathogenic Gi[邪氣] away. He regarded pathogenic Gi as the cause of disease, and eliminated pathogenic Gi for the remedy. Namely, Sambeop(三法) of Hantoha(汗吐下) was selected as the best efficient method for driving pathogenic Gi away. Sambeop of Jangjahwa(張子和) have different meaning from previous one. Traditionally, Diaphoretic Therapy[汗法] was regarded as therapy for exogenous disease[外感病], and its effect was regarded as Balhanhaepyo(發汗解表). Emetic therapy[吐法] was throwing up Dameumsuksik(痰飮宿食) of stomach and above diaphragm. Purgation therapy[下法] means Tongbyeon(通便), Hajeok(下積), Sasil(瀉實), Chuksu(逐水) were regarded as therapy for Yangmyeongsiljeung(陽明實證) of Sanghan(傷寒). He submitted a new extensive concept of Sambeop adding traditional one, and expanded the application range of Sambeop. All methods, can cause circulation of Gihyeol(氣血) by opening the 'Hyeonbu(玄府)', like Moxibution therapy[灸薰], Steaming[蒸], Washing[洗],Heat therapy[慰], Cauterization[烙], Acupuncture therapy[鍼刺], Stone needling, Physical and breathing exercise[導引], Massage[按摩] were regarded as Diaphoretic Therapy[汗法]. Especially, he thought that Diaphoretic Therapy and venesection[瀉血] have same medical implication. If we examine the process of pushing out pathogenic Gi[邪氣] by means of Sambeop(三法), we can find the intermediation, that is circulation of Gihyeol(氣血). Its meaning is implied in the word of 'opening Hyeonbu(玄府)'. He thought that the circulation of Gihyeol(氣血) is the key to control health. Gihyeol(氣血) was circulated well under the physiological balance, but it was not circulated well under the invasion of pathogenic Gi[邪氣]. In other words, pathogenic Gi is the immediate cause of bad circulation of Gihyeol(氣血) and disease. Naturally, the doctor must remove pathogenic Gi that cause bad circulation for healing by means of Sambeop(三法). In my opinion, because the ultimate goal of Jangjahwa(張子和) was circulation of Gihyeol(氣血) by removing pathogenic Gi[邪氣], the concept of Sarnbeop(三法) could be expanded.

  • PDF

소셜 빅데이터 기반 2016리우올림픽 축구 관련 이슈 및 인물에 대한 연관단어 분석 (Social Big Data-based Co-occurrence Analysis of the Main Person's Characteristics and the Issues in the 2016 Rio Olympics Men's Soccer Games)

  • 박성건;이수원;황영찬
    • 한국체육학회지인문사회과학편
    • /
    • 제56권2호
    • /
    • pp.303-320
    • /
    • 2017
  • 본 연구의 목적은 소셜 빅데이터를 기반으로 리우올림픽 축구 관련 이슈 및 인물에 대한 대중들의 주요 관심사를 알아보는 것이다. 본 연구를 위해 수집된 데이터는 2016 리우올림픽 한국축구 경기와 관련된 웹 뉴스 및 댓글이다. 경기별 주요 이슈 및 대중들의 관심사를 알아보기 위해 연관단어 분석을 실시하고, NodeXL을 이용하여 시각화하였다. 연구 결과, 대중들에게 높은 관심을 받은 경기는 피지와의 경기, 한국축구대표팀 관련 인물은 손흥민, 해설위원은 이영표, 캐스터는 조우종으로 나타났다. 리우올림픽에 출전한 한국축구대표팀에 대한 대중들의 생각은 일부 부정적인 평가가 나타났지만, 대체로 긍정적인 것으로 평가할 수 있다. 해설위원 및 캐스터에 대한 대중들의 관심은 경기결과 및 예측, 설명에 대한 재치, 해설위원 및 캐스터의 호흡, 즐거움 요소(예능)로 나타났다. 결론적으로, 스포츠빅이벤트에 대한 대중들의 관심을 높일 수 있는 방안은 다양한 스포츠 분석 콘텐츠 제공, 전문성과 예능감 등을 겸비한 방송해설자 선정이 될 수 있다.

주관적 평가법을 이용한 초등학교 저학년 교실의 청취환경 조사 (Investigation of the listening environment for lower grade students in elementary school using subjective tests)

  • 박찬재;한찬훈
    • 한국음향학회지
    • /
    • 제40권3호
    • /
    • pp.201-212
    • /
    • 2021
  • 본 연구는 만 9세 이하 아동과 같은 청력 비완전자에게 적합한 교실의 음향성능 기준을 제시하기 위한 사전연구로써 수행되었다. 이를 위해 초등학교 저학년 교실의 청취환경 특성을 분석하기 위하여 청주시 소재 초등학교 2곳에서 총 264명의 학생을 대상으로 설문조사 및 음성명료도 평가와 같은 주관적 평가를 진행했다. 설문조사 결과 학생들이 수업 내용 이해에 가장 도움이 되는 정보형식은 교사의 음성이라고 응답했다. 또한 현재 교사의 음성에 대해 음량은 '보통' 수준이며 명료도에는 높은 만족도를 보이고 있었다. 교실의 음향성능에 대해서도 소음의 경우 '보통'이며 잔향감은 '매우 짧다'는 의견이 가장 많아서 청취환경에 대한 전반적인 만족도가 높은 편인 것으로 파악되었다. 또한 초등학교 저학년 학생들을 위해 선별된 시험용 단어목록을 이용해 음성명료도 평가를 수행한 결과 만 8세 아동의 경우 음원으로부터의 종축거리가 음성인지에 영향을 미치는 요인임을 유추해볼 수 있었다.

텍스트마이닝을 활용한 해양스포츠에 대한 언론 보도기사 분석: 요트, 조정, 카누를 중심으로 (Text Mining Analysis of Media Coverage of Maritime Sports: Perceptions of Yachting, Rowing, and Canoeing)

  • 김지현;김보경
    • 해양환경안전학회지
    • /
    • 제29권6호
    • /
    • pp.609-619
    • /
    • 2023
  • 본 연구는 국내 해양스포츠의 사회적 인식이 어떻게 형성되었는지를 알아보고자 수행되었다. 이를 위해 해양스포츠의 대표적 종목인 요트, 조정, 카누와 관련된 최근 10년간 국내 언론 보도기사의 키워드 및 토픽을 활용하여 빅데이터 분석 방법 중 텍스트 마이닝 분석을 실시하였으며, 도출된 결과는 다음과 같다. 첫째, TF 분석과 워드 클라우드 분석 결과 해양, 대회, 체험, 관광, 세계, 요트, 카누, 레저, 참여등이 상위 키워드로 나타났다. 둘째, 의미연결망 분석 결과 요트는 해양, 산업, 대회, 레저, 관광, 보트, 시설, 사업 등과 상관관계가 나타났고, 조정은 대회, 충주 등과, 카누는 해양, 대회, 체험, 레저, 관광 등과 상관관계가 나타났다. 셋째, 토픽모델링 분석 결과 요트, 조정, 카누가 엘리트 체육과 해양레저스포츠로서 인식이 형성된 것을 알 수 있었으나 시간의 변화에 따라 사회전반적인 쟁점과 의견의 흐름 및 사회적 변화는 미미한 것으로 나타났다. 이상의 결과를 종합하면 요트와 카누는 엘리트 체육이라는 인식에서 해양레저스포츠로 점차 인식이 형성되어 해양레저산업에 중요한 요소로 활용되고 있다는 것을 알 수 있었으며, 조정은 엘리트 체육 중심의 사회적 인식이 크게 변하지 않아 해양레저스포츠로서 대중화가 아직은 미미한 것으로 사료된다.

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (2) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (2))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권2호
    • /
    • pp.99-114
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 자소서에 서술된 학생들의 다양한 교내외 활동, 대학 지원 동기, 학업계획 및 향후 영농·영어계획 등의 텍스트 데이터를 대상으로 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 텍스트 마이닝 결과에서 문항 3의 동아리 활동을 비롯한 다양한 활동 사례와 그 과정에서 배우고 느낀 점에 대한 키워드는 '친구' 빈도가 압도적으로 높았으며, '생각', '시간', '의견', '활동', '사람', '학교', '선생님', '학생', '동아리' 등의 키워드 순으로 많이 사용되었다. 문항 4의 대학 지원동기 및 졸업 후 진로계획에 대한 서술 데이터에는 '생각', '농업', '한농대', '농장', '지식', '공부', '사람', '관심', '전문', '아버지' 등의 키워드 빈도가 높게 나타났으며, 이 가운데 '아버지', '한농대', '전문', '농장' 등의 키워드는 다른 질문에 비하여 상위에 나타나는 특징을 보였다. 연관규칙 분석 결과에서 키워드 간 규칙의 발생 빈도이자 중요성을 나타내는 지지도는 문항 3에서 {친구} <=> {생각}, 문항 4에서 {생각} <=> {한국농수산대학} 규칙에서 가장 높게 나타났다. 두 단어 사이 연관성을 나타내는 신뢰도는 문항 3에서 {선생님} => {친구}, 문항 4에서 {농업, 한국농수산대학} => {생각}에서 높게 나타났다. 두 단어 간 밀접성을 나타내는 향상도는 문항 3에서 {친구} <=> {선생님}, 문항 4에서 {지식} <=> {전문}에서 높게 나타났다. 즉 두 단어는 우연히 함께 사용되지 않고 한 단어가 나타나면 뒤에 반드시 나머지 단어가 사용되었다는 것을 의미한다. 또한 키워드 간의 매개체 역할의 분석, 즉 키워드들 사이에 최단 경로를 파악하는 관계 중심성 분석과 연결 edge 수를 평가하는 연결 중심성 분석에서 문항 3은 '친구', '생각', '학교', '시간' 및 '사람', 문항 4는 '생각', '한국농수산대학', '지식' 및 '지원' 등의 키워드의 중심성이 매우 높은 결과를 나타냈다.

잠재 토픽 기반의 제품 평판 마이닝 (Latent topics-based product reputation mining)

  • 박상민;온병원
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.39-70
    • /
    • 2017
  • 최근 여론조사 분야에서 데이터에 기반을 둔 분석 기법이 널리 활용되고 있다. 기업에서는 최근 출시된 제품에 대한 선호도를 조사하기 위해 기존의 설문조사나 전문가의 의견을 단순 취합하는 것이 아니라, 온라인상에 존재하는 다양한 종류의 데이터를 수집하고 분석하여 제품에 대한 대중의 기호를 정확히 파악할 수 있는 방안을 필요로 한다. 기존의 주요 방안에서는 먼저 해당 분야에 대한 감성사전을 구축한다. 전문가들은 수집된 텍스트 문서들로부터 빈도가 높은 단어들을 정리하여 긍정, 부정, 중립을 판단한다. 특정 제품의 선호를 판별하기 위해, 제품에 대한 사용 후기 글을 수집하여 문장을 추출하고, 감성사전을 이용하여 문장들의 긍정, 부정, 중립을 판단하여 최종적으로 긍정과 부정인 문장의 개수를 통해 제품에 대한 선호도를 측정한다. 그리고 제품에 대한 긍 부정 내용을 자동으로 요약하여 제공한다. 이것은 문장들의 감성점수를 산출하여, 긍정과 부정점수가 높은 문장들을 추출한다. 본 연구에서는 일반 대중이 생산한 문서 속에 숨겨져 있는 토픽을 추출하여 주어진 제품의 선호도를 조사하고, 토픽의 긍 부정 내용을 요약하여 보여주는 제품 평판 마이닝 알고리즘을 제안한다. 기존 방식과 다르게, 토픽을 활용하여 쉽고 빠르게 감성사전을 구축할 수 있으며 추출된 토픽을 정제하여 제품의 선호도와 요약 결과의 정확도를 높인다. 실험을 통해, K5, SM5, 아반떼 등의 국내에서 생산된 자동차의 수많은 후기 글들을 수집하였고, 실험 자동차의 긍 부정 비율, 긍 부정 내용 요약, 통계 검정을 실시하여 제안방안의 효용성을 입증하였다.

집단지성을 이용한 한글 감성어 사전 구축 (Building a Korean Sentiment Lexicon Using Collective Intelligence)

  • 안정국;김희웅
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.49-67
    • /
    • 2015
  • 최근 다양한 분야에서 빅데이터의 활용과 분석에 대한 중요성이 대두됨에 따라, 뉴스기사와 댓글과 같은 비정형 데이터의 자연어 처리 기술에 기반한 감성 분석에 대한 관심이 높아지고 있다. 하지만, 한국어는 영어와는 달리 자연어 처리가 어려운 교착어로써 정보화나 정보시스템에의 활용이 미흡한 실정이다. 이에 본 연구는 감성 분석에 활용이 가능한 감성어 사전을 집단지성으로 구축하였고, 누구나 연구와 실무에 사용하도록 API서비스 플랫폼을 개방하였다(www.openhangul.com). 집단지성의 활용을 위해 국내 최대 대학생 소셜네트워크 사이트에서 대학생들을 대상으로 단어마다 긍정, 중립, 부정에 대한 투표를 진행하였다. 그리고 집단지성의 효율성을 높이기 위해 감성을 '정의'가 아닌 '분류'하는 방식인 폭소노미의 '사람들에 의한 분류법'이라는 개념을 적용하였다. 총 517,178(+)의 국어사전 단어 중 불용어 형태를 제외한 후 감성 표현이 가능한 명사, 형용사, 동사, 부사를 우선 순위로 하여, 현재까지 총 35,000(+)번의 단어에 대한 투표를 진행하였다. 본 연구의 감성어 사전은 집단지성의 참여자가 누적됨에 따라 신뢰도가 높아지도록 설계하여, 시간을 축으로 사람들이 단어에 대해 인지하는 감성의 변화도 섬세하게 반영하는 장점이 있다. 따라서 본 연구는 앞으로도 감성어 사전 구축을 위한 투표를 계속 진행할 예정이며, 현재 제공하고 있는 감성어 사전, 기본형 추출, 카테고리 추출 외에도 다양한 자연어 처리에 응용이 가능한 API들도 제공할 계획이다. 기존의 연구들이 감성 분석이나 감성어 사전의 구축과 활용에 대한 방안을 제안하는 것에만 한정되어 있는 것과는 달리, 본 연구는 집단지성을 실제로 활용하여 연구와 실무에 활용이 가능한 자원을 구축하여 개방하여 공유한다는 차별성을 가지고 있다. 더 나아가, 집단지성과 폭소노미의 특성을 결합하여 한글 감성어 사전을 구축한 새로운 시도가 향후 한글 자연어 처리의 발전에 있어 다양한 분야들의 융합적인 연구와 실무적인 참여를 이끌어 개방적 협업의 새로운 방향과 시사점을 제시 할 수 있을 것이라 기대한다.