• 제목/요약/키워드: 온라인 문서

검색결과 215건 처리시간 0.027초

딥러닝 기반 소셜미디어 한글 텍스트 우울 경향 분석 (A Deep Learning-based Depression Trend Analysis of Korean on Social Media)

  • 박서정;이수빈;김우정;송민
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.91-117
    • /
    • 2022
  • 국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

생명보험사의 서비스품질이 보험상품 재구매의도에 미치는 영향에 관한 연구 (A Study of the Effect of Service Quality Factors Affecting Repurchase Intention in Life Insurance Services)

  • 박균성;하규수
    • 벤처창업연구
    • /
    • 제11권4호
    • /
    • pp.227-236
    • /
    • 2016
  • 최근 금융환경의 변화로 보험회사간의 경쟁이 더욱 치열해 지고 있다. 이에 본 연구는 생명보험사의 서비스 품질을 핵심서비스, 관계서비스, 부가서비스로 구분하고 재구매의도에 미치는 영향과 이때 고객만족은 매개역할을 하는지를 규명하였다. 연구대상은 생명보험 가입고객을 대상으로 온라인설문서를 활용하여 받은 215부를 최종 유효표본으로 선정하였다. 분석은 SPSS 18.0을 활용하였고, 그 결과 첫째, 핵심서비스 중 유지서비스, 관계서비스 중 보험판매원, 그리고 부가서비스가 재구매의도에 정적인 영향을 미치는 것으로 나타났다. 둘째, 고객만족은 재구매의도간의 영향관계에서 유지서비스와 보험판매원은 완전매개효과, 부가서비스는 부분매개효과가 확인되었다. 본 연구결과는 생명보험사 고객의 선택행동을 이해하고 경영환경에서의 다양한 전략을 도출하는데 유용한 기초자료로 근거한다는 점에서 산업적 학문적 의의를 둘 수 있을 것이다.

  • PDF

전통 인쇄텍스트와 하이퍼텍스트 독해력 비교 (The Contrast between Traditional Printed Text and Hypertext Reading Comprehension)

  • 홍성룡
    • 디지털콘텐츠학회 논문지
    • /
    • 제10권4호
    • /
    • pp.537-542
    • /
    • 2009
  • 인쇄텍스트의 여러 제약들이 혁신적인 컴퓨터 기술의 발달로 인해 해결 방법이 제시되고 있다. 하이퍼텍스트는 온라인에서 발견되어 지는 전자 텍스트로서 비선형적 방법으로 정의되어 질수 있다. 전통적인 인쇄텍스트와는 대조적으로 전자방식의 쓰기는 약간의 변형이 필요한 새로운 기술에 의존하고 있다. 그러나 불행하게도 아직도 많은 연구들이 지식의 축적을 위한 목적으로 하이퍼텍스트 형태로 문서들을 해독할 때 독자가 가지고 있는 경험들을 필요로 하고 있다. 이 분야에 대해 지금까지 여러 연구들이 있어왔지만 독해를 위한 항법과 그 대책에 관한 방법을 제시하고 있지는 않는 것 같다. 본 논문은 독해력을 위한 전통 인쇄텍스트와 하이퍼텍스트간의 차이를 실험을 통해 밝히고자 한다. 실험 대상자들이 하이퍼텍스트와 인쇄텍스트를 해독할 때 가지는 경험을 근거하여 볼 때 텍스트의 형태는 독자의 독해력 기억에 매우 중요한 관계를 가지고 있다는 것을 밝히고자 한다.

  • PDF

학회 웹사이트의 토픽 정보추출을 이용한 주제에 따른 학회 자동분류 기법 (Academic Conference Categorization According to Subjects Using Topical Information Extraction from Conference Websites)

  • 이수경;김관호
    • 한국전자거래학회지
    • /
    • 제22권2호
    • /
    • pp.61-77
    • /
    • 2017
  • 최근 온라인상에 게시된 학회정보가 급증함으로써 주제에 따른 학회정보의 자동분류는 연구자들에게 효율적인 관련 학회 탐색을 가능하게 한다. 그러나 대부분의 학회 목록 제공 서비스에서는 학회명칭, 날짜, 위치, URL 등의 정보만 제공하기 때문에 학회 주제를 파악할 수 있는 정보는 학회명칭에 국한된다. 따라서 본 연구에서는 URL을 통한 학회 웹사이트의 토픽정보를 추출함으로써 학회정보량의 부족문제를 해결하고, 동시에 양질의 정보로 학습의 성능을 향상시키는 기법을 제안한다. 구체적으로는 웹사이트 URL을 통해 수집한 HTML 문서로부터 주요 콘텐츠를 추출하고, 학회명칭과 유사한 토픽 키워드 정보를 선정하여 추가 가중치를 부여한다. 실 데이터를 활용한 실험 결과, 제안된 방법인 추가적인 웹 콘텐츠 정보의 사용은 주제에 따른 학회 분류의 성능을 성공적으로 향상시킬 수 있음을 확인하였다. 추후 연구에서는 웹 사이트의 구조를 고려한 토픽 정보추출을 통해 분류의 정확성을 더욱 향상시킬 계획이다.

딥러닝 모델을 활용한 실시간 인쇄물 문자 탐지 시스템 (Real-time Printed Text Detection System using Deep Learning Model)

  • 최예준;김송원;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.523-530
    • /
    • 2024
  • 웹페이지나 디지털 문서 등과 같은 온라인에서는 사용자가 검색하고 싶은 특정 단어나 특정 문구를 실시간으로 검색하는 기능이 있다. 인쇄된 도서나 참고서 등과 같은 인쇄물에는 실시간으로 특정 단어나 특정 문구를 찾는 기능이 없어 어려움을 겪는 경우가 많다. 본 논문에서는 텍스트를 탐지(Detection)하는 딥러닝 모델과 텍스트를 인식(Recognition)하는 OCR을 활용한 실시간 문자 탐지 시스템의 개발내용에 관해 기술한다. 본 연구에서는 EAST 모델을 사용하여 텍스트를 탐지하는 방법, 탐지한 텍스트를 EasyOCR을 사용하여 인식하는 방법, 인식한 텍스트를 사용자가 검색하고 싶은 특정 단어나 특정 문구를 비교하여 bounding box로 나타내는 방법을 제안한다. 이 시스템을 통해 사용자는 도서나 참고서 등과 같은 인쇄물에서 실시간으로 검색하고 싶은 특정 단어나 특정 문구를 찾아 필요한 정보를 쉽고 빠르게 찾는 것에 효과적일 것을 기대한다.

소셜 네트워크 사이트의 웹 접근성 평가 (Web Accessibility Evaluation of Social Network Sites)

  • 한혁수;김초이
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.481-488
    • /
    • 2009
  • 웹 2.0이 등장하면서 나타난 개념인 SNS(Social Network Service 또는 Social Network Sites)는 오프라인에서 만 존재하던 사회적 관계망을 온라인에서 구축한 친목기반 인맥 형성 서비스이다. 페이스북(Facebook), 마이스페이스(Myspace), 트위터(Twiter)등과 같은 외국 SNS와 싸이월드(Cyworld), 미투데이(Me2Day)등과 같은 국내 SNS는 지속적인 인기를 누리며, 인터넷 환경의 주요한 응용 분야로 자리 잡고 있다. 이러한 SNS는 모든 사용자들이 타인과 협력하고 정보를 공유하는 것을 목적으로 하고 있기 때문에, 웹을 사용하는데 어려움을 가지고 있는 노인과 장애인들이 사용하기에 적절한 인터페이스를 제공하고 있는지 웹 접근성을 평가할 필요가 있다. 웹 접근성은 인지적, 신체적 특징에 상관없이 모든 사람에게 동등한 웹 기회를 제공하고 있는가를 나타내는 지표이다. 만약, SNS가 웹 접근성이 낮아 노인과 장애인이 사용하지 못한다면, 노인, 장애인과 일반사용자의 정보격차는 점점 늘어나서 사회적 문제가 될 것이다. 이에 본 논문에서는 웹 접근성 평가 도구인 KADO-WAH 2.0과 웹 접근성 표준 문서인 WCAG(Web Contents Accessibility Guideline) 2.0을 기반으로 SNS인 페이스북과 싸이월드의 웹 접근성을 평가하여, 웹 접근성 준수 현황을 파악하고, 개선방향을 제시하고자 한다.

  • PDF

전자정부 G2B 시스템 도입에 따른 탄소저감효과 분석을 위한 모델 및 방법론 개발 (Development of a Model and Methodology for the Analysis of the $CO_2$ Emissions Reduction Effect through the Introduction of the G2B Systems in e-government : ECRE Approach)

  • 임규건;이대철;임미화;문종인
    • 한국전자거래학회지
    • /
    • 제15권3호
    • /
    • pp.163-181
    • /
    • 2010
  • 최근 온난화 현상에 따른 범세계적 위기가 초래됨에 따라 선진국을 중심으로 교토의정서가 체결되었으며, 이를 계기로 온실가스 규제가 본격화되기 시작하였다. 또한 교토의정서의 교토유연성체계라는 시장메커니즘이 도입되어 온실가스 배출에 대한 소유권이 설정되고, 수급에 따라 배출권 가격이 형성되는 등 새로운 무형의 자원을 거래하는 탄소시장이 등장하게 되었다. 학계에서는 탄소배출효과를 측정하는 방법론과 이를 탄소배출권의 경제적 비용으로 전환하고자 하는 연구들이 태동하기 시작하였다. 본 연구에서는 전자정부 정보화사업 중 하나인 G2B 시스템을 통해 전통적인 조달업무 프로세스가 온라인화 됨에 따라 저감되는 탄소 배출저감효과 즉, e-transformation화에 따른 탄소저감효과를 측정하는 ECRE(Evaluation of $CO_2$ Reduction in E-transformation)모델과 절차를 제시하고자 한다. ECRE 모델은 세계 기후협의체(IPCC)의 방법론을 근간으로 하여 크게 '이동 수단에 따른 탄소저감효과', '종이 문서 절감에 따른 탄소저감효과' 2가지의 탄소배출량을 측정하고 이를 탄소배출권의 경제적 비용으로 환산한다. 또한 본 연구에서는 탄소저감효과를 효과적으로 측정하기 위하여 5단계와 10개의 세부절차로 구성된 절차를 제시하였다. 본 연구에서 제시한 ECRE 모델과 절차를 이용하여 정부기관은 물론 온실가스 규제를 받게 되는 에너지 환경기업 등에서 정보화사업을 통한 탄소감축 실적의 추정 및 추가적인 정보화사업 추진으로 기대되는 탄소저감효과를 사전에 시뮬레이션해 볼 수 있는 도구로서 활용이 기대된다.

텍스트마이닝을 통한 고용허가제 트렌드 분석과 정책 제안 : 텍스트마이닝과 소셜네트워크 분석을 중심으로 (A Trend Analysis and Policy proposal for the Work Permit System through Text Mining: Focusing on Text Mining and Social Network analysis)

  • 하재빈;이도은
    • 융합정보논문지
    • /
    • 제11권9호
    • /
    • pp.17-27
    • /
    • 2021
  • 본 연구에서는 고용허가제에 대한 이슈와 국민적 인식을 확인하고 정책을 제언하기 위해 소셜데이터를 기반으로 한 텍스트마이닝 기법을 활용하고자 하였다. 이를 위해 2020년 1월부터 2020년 12월까지 1년 동안 온라인상에서 '고용허가제'가 언급되는 6,217개의 문서의 텍스트 1,453,272개를 텍스톰(Textom)을 통해 수집하여 텍스트마이닝과 소셜네트워크 분석을 수행하였다. 데이터 상위 키워드 빈도, TF-IDF(Term Frequency - Inverse Document Frequency) 분석, 연결중심성 분석으로 언급량이 많은 키워드 100개를 도출하였으며, 일자리 문제, 정책과정의 중요성, 산업관점의 경쟁력, 외국인근로자 생활 개선을 주요한 키워드로 구성하였다. 또한, 의미연결망 분석을 통해 '고용정책'과 같은 주요인식과 '국제협력', '노동자 인권', '법률', '외국인 채용', '기업 경쟁력', '이주민 문화', '외국인력 관리'와 같은 주변인식을 파악하였다. 끝으로 고용허가제에 관한 정책 수립과 관련 연구를 진행하는데 있어서 고려해야 할 요소를 제안하였다.

Mecab-ko 형태소 분석을 이용한 한국체육학회지 연구동향 분석 (The Research Trend Analysis of the Korean Journal of Physical Education using Mecab-ko Morphology Analyzer)

  • 박성건;김완섭;이대택
    • 한국체육학회지인문사회과학편
    • /
    • 제56권6호
    • /
    • pp.595-605
    • /
    • 2017
  • 본 연구의 목적은 Mecab-ko 형태소 분석을 기반으로 한국체육학회 연구자들이 선호하는 연구 분야가 무엇이며, 인문사회과학과 자연과학 분야 간 연구자들의 관심사에 차이점이 있는지 그리고 이유는 무엇인지 텍스트 분석을 통해 알아보는 것이다. 본 연구를 위해 수집된 데이터는 2002년 3월~2017년 3월까지 한국체육학회지 온라인에 게재된 5,014편의 논문이다. 본 연구에서는 수집된 문서에서 키워드를 추출하기 위해 Mecab-ko 형태소 분석기를 사용하였다. 연구 결과, 한국체육학회지에 게재되는 논문 수는 감소하고 있는 것으로 나타났다. 연구자들이 선호하는 연구 분야는 여가, 생활체육 및 건강이 경기력 향상보다 상대적으로 높게 나타났으며, 관심이 높은 연구 대상은 여성, 중년, 노인으로 나타났다. 인문사회과학 분야 연구자들은 전통적 연구 분야와 사회적 관심사에 모두 관심을 보인 반면에, 자연과학 분야 연구자들은 전통적 연구를 보다 깊게 연구하는 것에 관심이 높은 것으로 나타났다. 결론적으로, 스포츠 분야 융합 연구 활성화를 구현하기 위해서는 연구의 깊이와 폭에 중점을 두어야 하는 학문 분야가 무엇인지, 새로운 학문 분류 체계 및 정립이 필요하다.

잠재 토픽 기반의 제품 평판 마이닝 (Latent topics-based product reputation mining)

  • 박상민;온병원
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.39-70
    • /
    • 2017
  • 최근 여론조사 분야에서 데이터에 기반을 둔 분석 기법이 널리 활용되고 있다. 기업에서는 최근 출시된 제품에 대한 선호도를 조사하기 위해 기존의 설문조사나 전문가의 의견을 단순 취합하는 것이 아니라, 온라인상에 존재하는 다양한 종류의 데이터를 수집하고 분석하여 제품에 대한 대중의 기호를 정확히 파악할 수 있는 방안을 필요로 한다. 기존의 주요 방안에서는 먼저 해당 분야에 대한 감성사전을 구축한다. 전문가들은 수집된 텍스트 문서들로부터 빈도가 높은 단어들을 정리하여 긍정, 부정, 중립을 판단한다. 특정 제품의 선호를 판별하기 위해, 제품에 대한 사용 후기 글을 수집하여 문장을 추출하고, 감성사전을 이용하여 문장들의 긍정, 부정, 중립을 판단하여 최종적으로 긍정과 부정인 문장의 개수를 통해 제품에 대한 선호도를 측정한다. 그리고 제품에 대한 긍 부정 내용을 자동으로 요약하여 제공한다. 이것은 문장들의 감성점수를 산출하여, 긍정과 부정점수가 높은 문장들을 추출한다. 본 연구에서는 일반 대중이 생산한 문서 속에 숨겨져 있는 토픽을 추출하여 주어진 제품의 선호도를 조사하고, 토픽의 긍 부정 내용을 요약하여 보여주는 제품 평판 마이닝 알고리즘을 제안한다. 기존 방식과 다르게, 토픽을 활용하여 쉽고 빠르게 감성사전을 구축할 수 있으며 추출된 토픽을 정제하여 제품의 선호도와 요약 결과의 정확도를 높인다. 실험을 통해, K5, SM5, 아반떼 등의 국내에서 생산된 자동차의 수많은 후기 글들을 수집하였고, 실험 자동차의 긍 부정 비율, 긍 부정 내용 요약, 통계 검정을 실시하여 제안방안의 효용성을 입증하였다.