• 제목/요약/키워드: 텍스트 시각화

검색결과 233건 처리시간 0.023초

고객 리뷰를 통한 모바일 앱 서비스 포지셔닝 분석: 비대면 진료 앱을 중심으로 (Customer Voices in Telehealth: Constructing Positioning Maps from App Reviews)

  • 김민재;이홍주
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.69-90
    • /
    • 2023
  • 본 연구의 목적은 최근 확산되고 있는 국내 비대면 의료 서비스 애플리케이션의 서비스 속성과 소비자 반응을 정확히 평가하고 각 서비스간 차별성을 시각화하기 위한 방안을 모색하는 것이다. 이를 위해 국내에서 서비스 중인 주요 6개 비대면 진료 애플리케이션의 구글 플레이스토어 사용자 리뷰 데이터 총 2만 건을 수집하였다. 수집된 데이터에 대해 문장 단위로 분리한 후, BERTopic 모델링 기법을 적용하여 각 문장이 속한 서비스 속성에 대한 토픽을 도출하였다. 다음으로 미세조정된 KoBERT 모델을 통해 각 문장의 토픽에 대한 감성 점수를 예측하였다. 분석 결과, 사용자 리뷰로부터 애플리케이션 속성과 진료 속성 두 가지 범주 아래에서 각각 5개와 3개의 서비스 특성 토픽이 발견되었다. 애플리케이션 속성으로는 '예약 시스템', '사용 용이성', '재고 확인', '디자인', '안정성' 등이, 진료 속성으로는 '원격 의료적 속성', '편의성', '배송' 등이 도출되었다. 각 애플리케이션은 이러한 속성들에 대해 다른 수준의 감성 점수를 보였다. 주성분분석을 통해 속성별 감성 점수를 축약하여 2차원 공간 상의 포지셔닝 맵을 생성하였다. 결과적으로 본 연구는 비대면 진료 애플리케이션 사용자 리뷰 텍스트를 바탕으로 실증적 통계 방법과 텍스트 마이닝 기술을 접목하여 서비스 속성 도출, 감성 분석, 제품 포지셔닝 이라는 일련의 체계를 제시하고 있다. 이는 비대면 진료 애플리케이션의 서비스 품질과 소비자 반응을 객관적으로 진단할 수 있는 효과적인 방안이 될 것으로 기대된다.

독자의 내러티브 이해를 반영한 창작 지원 시스템 설계 (Designing a Writing Support System Based on Narrative Comprehension of Readers)

  • 권호창;권혁태;윤완철
    • 한국HCI학회논문지
    • /
    • 제9권2호
    • /
    • pp.23-31
    • /
    • 2014
  • 작가의 내러티브 창작을 지원하는 다양한 소프트웨어들은 일반적으로 작가가 생산하고 필요로 하는 정보의 관리와 상업적 성공을 거둔 내러티브 텍스트에 대한 분석에 주목한다. 이러한 관점에서는 내러티브 창작 과정에서의 독자의 적극적 역할이 간과된다. 작가는 독자의 반응이나 기대를 예상하여, 이를 충족시키거나 배반하면서 내러티브를 구성한다. 사건 전개에 따른 독자의 이해 상황을 파악하고 이를 적절히 조절하는 작가의 활동은 내러티브 전체의 미학적 완성도와 연관되어 있다. 본 논문에서는 서사학의 내러티브 구조 모델과 인지과학의 '사건 색인 상황모델'을 이론적 근거로, 독자의 이해와 관련된 내러티브의 다차원적 특성을 시각적으로 확인하고 조절할 수 있는 창작 지원 시스템 설계를 제안한다. 먼저 사건을 기본 단위로 하여 그 속성을 설정하고 내러티브의 두 시간축에 유기적으로 배열할 수 있는 프레임워크를 설계하고, 이를 실제 영화의 내러티브에 적용하여 전체 구조를 분석하였다. 다음으로, 독자의 이해에 영향을 미치는 상황 모델 차원들의 연속성을 시각화하는 방안과 정보처리 요구량으로써 인지적 복잡도를 분석하는 방안을 제시하고, 사례 영화에 대해 시각화한 결과를 내러티브의 특성과 작가 지원 관점에서 논의하였다.

비정형 데이터 마이닝을 활용한 한국농수산대학 재학생의 학교생활 감성 분석(1) (An Analysis of School Life Sensibility of Students at Korea National College of Agriculture and Fisheries Using Unstructured Data Mining(1))

  • 주진수;이소영;김종숙;송천영;신용광;박노복
    • 현장농수산연구지
    • /
    • 제21권1호
    • /
    • pp.99-114
    • /
    • 2019
  • 본 논문은 빅 데이터 분석기법을 이용하여 한국농수산대학 학생들의 대학생활 요소에 대한 선호도를 연구하기 위하여 비정형 데이터 분석기법으로서 감성 분석(opinion mining) 기법과 텍스트 마이닝 기법을 활용하였다. 분석도구로는 RStudio를 이용하였으며, 긍정과 부정의 감성을 분류하고 선호도를 평가하기 위한 긍정어 사전과 부정어 사전을 새롭게 작성하여 프로그래밍하였다. 비정형 텍스트에 대한 분석 결과는 도표와 워드 클라우드를 이용한 시각화 자료로 나타내어 정보를 추출하였다. 학교생활 요소로는 '나의 현재', '10년 후 모습', '교우관계', '한농제(대학 축제)', '후생관(식사)', '청학관(기숙사)', '한농대', '장기현장실습' 등 학생들에게 밀접한 8가지 주제를 대상으로 하였다. 분석 결과 한농대 학생들은 '후생관 식사'과 ' 교우관계'의 주제에 대해서 85% 이상의 긍정적 감성을 나타냈으나 '장기현장실습'과 '청학관(기숙사)'에 대해서는 긍정적 감성이 60%를 넘지 않는 만족도를 갖는 것으로 나타났다. 그리고 '나의 현재', '10년 후 모습', '한농제(대학 축제)' 및 'KNCAF' 등의 주제에 대해서는 69.3~74.2% 정도의 긍정적 감성을 나타냈다. 남녀 학생별 차이를 보면 '나의 현재', '10년 후 모습', '교우관계', '청학과(기숙사)' 및 '장기현장실습' 주제에서는 남학생의 긍정적 감성이 높게 나타났으며, '한농제(대학 축제)', '후생관' 및 '한농대' 주제에서는 여학생의 긍정적 감성이 높게 나타났다. 전공별 특징을 살펴보면 학생들은 '현재'나 '10년 후'의 자신의 모습에 대하여 71% 이상 긍정적 자신감을 지니고 있는 것으로 나타났다. 특히 축산계열 학생들의 긍정적 감성이 높게 나타났으며, 화훼학과 학생들은 다른 전공의 학생들에 비하여 긍정적 감성이 낮게 나타나 자신감이 부족한 결과를 보였다. '교우관계'에 대해서는 화훼학과를 제외하고 80% 이상의 긍정적 감성을 나타냈으며, 중소가축학과 학생들은 93%를 초과하는 적극적인 교우관계를 맺고 있는 것으로 나타났다. 대학 축제인 '한농제'에 대하여 전체 학생들의 긍정적 감성은 약 70% 정도이나 과수학과와 수산양식학과 학생들의 호감도는 60% 미만으로 축제에 대한 부정적 이미지가 높게 나타났다. '후생관 식사'에 대한 전체 학생들의 긍정적 감성은 85%를 넘어 매우 높은 만족도를 나타냈으나 수산양식학과 학생(남학생)들의 만족도는 매우 낮게 나타났다. 모든 학생들이 공동생활을 하는 '청학관'에 대한 학생들의 호감도는 59.5%로 낮게 나타났으며, 과수학과와 수산양식학과 학생들의 만족도는 약 42% 미만으로 더욱 부정적인 감성을 나타냈다. 또한 자신들이 3년간 학업을 재학한 한농대에 대해서는 74% 이상이 긍정적인 평가를 하는 것으로 나타났다. 특히 학생들의 호감도가 가장 낮게 나타난 장기현장실습에 대한 화훼학과, 채소학과, 중소가축학과 학생들의 호감도는 50%를 넘지 않는 매우 부정적 감성을 나타냈다. 빅 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하기 위하여 텍스트 마이닝 기법으로 구조화되지 않은 텍스트에서 주요 단어를 긍정어와 부정어로 나누어 추출하고 그 단어들의 word cloud를 작성하여 학생들의 감성을 시각화하였다. 한농대는 학생들에게 지금보다 더욱 긍정적인 감성을 가지고 밝고 환한 말, 힘이 되고 용기를 주는 말, 사람을 기쁘게 하는 말을 많이 할 수 있도록 여건을 제공함으로써 학생들은 삶의 활기가 넘치고 성공적인 인생을 살아가는 행복을 만들 수 있으리라 여겨진다.

문(文)과 화(畵)의 절합 -만문만화(漫文漫畵)를 중심으로 (Articulation of Characteristics and Image - Focused on the Manmun-Manwha)

  • 서은영
    • 대중서사연구
    • /
    • 제27권2호
    • /
    • pp.179-214
    • /
    • 2021
  • 이 연구의 목적은 식민지 조선에서 만문만화가 수용·형성된 배경에 관한 '재고(再考)'다. 만문만화의 등장을 일본의 식민지 언론 탄압이라는 정치적 산물로만 해석한 기존의 논의에 의문을 제기하고, 안석영의 행보와 대중문화 유입이라는 식민지 조선의 상황을 고려해 또 다른 가능성을 엿본다. 이 과정에서 '만문만화' 용어의 등장이 1927년 안석영이 아니라 『신여성』 1925년 1월호의 '은(銀)파리'임을 밝히고, 글의 성격을 분석한다. 또한 안석영의 도쿄 유학과 귀국 이후의 행보를 통해 그가 만문만화에 관심을 가지게 된 배경과 의미를 추적한다. 만문만화가에게 "필치와 필법"을 강조했던 것으로부터 '문학성을 갖춘 만화', '글을 쓸 줄 아는 능력을 갖춘 만화가'의 탄생은 문자 위주의 텍스트에서 이미지텍스트로 재편되는 1920-30년대의 문화장을 만문만화라는 독특한 양식의 출현으로 보여준다. 이 연구는 '만문만화'라는 용어가 처음 등장했던 시기를 바로 잡고, 독자 확보라는 저널리즘의 재편과 대중화 전략으로 문(文)과 화(畵)의 절합으로 나타났던 시대적 상황을 고려하여 만화(漫畵)와, 만문(漫文), 만화(漫話)와 같은 잡문과의 연관성 속에서 만문만화(漫文漫畵)의 수용을 다각적으로 살펴보고 있다. 이처럼 만문만화와 만문만화 내에서의 문(文)과 화(畵)의 형식 실험은 단순히 만화장 내에서뿐만 아니라 근대 매체의 이미지 텍스트로의 재편이라는 식민지 문화장을 구성하는 한 징후로써 포착할 수 있다.

API 통계 기반의 워드 클라우드를 이용한 악성코드 분석 기법 (Malware Analysis Mechanism using the Word Cloud based on API Statistics)

  • 유성태;오수현
    • 한국산학기술학회논문지
    • /
    • 제16권10호
    • /
    • pp.7211-7218
    • /
    • 2015
  • 악성코드는 하루 평균 수만 건 이상이 발생하고 있으며, 신종 악성코드의 수는 해마다 큰 폭으로 증가하고 있다. 악성코드를 탐지하는 방법은 시그니쳐 기반, API 흐름, 문자열 등을 이용한 다양한 기법이 존재하지만 대부분의 탐지 기법들은 악성코드를 우회하는 공격 기법으로 인해 신종 악성코드를 탐지하는데 한계가 있다. 따라서 신종 악성코드를 효율적으로 탐지하기 위한 연구가 많이 진행되고 있다. 그중 시각화 기법을 통한 연구가 최근 활발하게 이루어지고 있으며, 악성코드를 직관적으로 파악할 수 있으므로 대량의 악성코드를 효율적으로 탐지하고 분석할 수 있다는 장점이 있다. 본 논문에서는 악성코드와 정상파일에서 Native API 함수를 추출하고 해당 Native API가 악성코드에서 발생하는 확률에 따라서 F-measure 실험을 통해 가중치의 합을 결정하고, 최종적으로 가중치를 이용하여 워드 클라우드에서 텍스트의 크기로 표현되는 기법을 제안한다. 그리고 실험을 통해 악성코드와 정상파일에서 사용하는 Native API의 가중치에 따라서 악성코드를 판단할 수 있음을 보인다. 제안하는 방식은 워드 클라우드를 이용하여 Native API를 시각적으로 표현함으로써 파일의 악성 유무를 판단하고, 직관적으로 악성코드의 행위를 분석할 수 있다는 장점이 있다.

부산지역 교통관련 기사를 이용한 비정형 빅데이터의 정형화와 시각적 해석 (Structuring of unstructured big data and visual interpretation)

  • 이경준;노윤환;윤상경;조영석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1431-1438
    • /
    • 2014
  • 2013년 1월 1일부터 2013년 12월 31일까지의 부산지역지인 국제신문과 부산일보의 기사들 중 제목에 '부산'과 '교통'을 동시에 포함한 2889건의 기사 내용의 관계 또는 관련 있는 데이터에 내재되어 있는 의미 있는 패턴을 찾아내고자한다. 데이터마이닝 (datamining)의 일부인 텍스트마이닝(textmining)의 기법을 이용하여 사회네트워크분석 (SNA; social network analysis)을 실시하였다. 비정형 데이터의 정형화를 위해 빅데이터의 저장, 처리 및 분석을 위해 자바 기반의 오픈소스 프레임워크인 하둡 생태계 (Hadoop ecosystem)의 HDFS와 맵리듀스 (MapReduce)를 Linux (Ubuntu-12.04LTS) 환경에서 이용하였고, 기존의 R패키지에서 제공되는 사회 네트워크 분석보다 효율적인 시각화를 위해 각 노드 및 선에 비율에 따른 가중치를 주어 색상과 굵기로 해석할 수 있도록 새로운 알고리즘을 구현하였다.

영상콘텐츠분야의 정권별 의미연결망 연구 (A Study on the Semantic Network Structure of the Regime in the Image Contents)

  • 황고은;문신정
    • 한국비블리아학회지
    • /
    • 제28권3호
    • /
    • pp.217-240
    • /
    • 2017
  • 이 연구는 영상콘텐츠분야 연구의 의제설정 경향을 분석하여, 정권별 정책과 연결되는 의미화 과정을 제시했다. 이를 위해 문화산업의 도입시점인 <문민정부(1993년)>부터 <박근혜정부(2016년)>까지의 영상콘텐츠 석박사학위논문 총 2,624편의 초록에서 43,991개의 단어를 추출하고 의미연결망 분석을 실시하였다. 분석방법은 R프로그램의 다양한 패키지를 활용하였으며, 이를 통해, 텍스트 분석과 시각화를 도출하였다. 연구 결과는, 첫째, 영상콘텐츠분야 연구는 출현빈도별, 정권순서별로 '영상', '미디어', '콘텐츠'의 순위와 순서로 진화되었다. 둘째, 정권별로는 3단계 연구흐름을 볼 수 있다. <문민정부>는 '교육'과 '표현', <국민의정부>와 <참여정부>에서는 '미디어', <이명박정부>와 <박근혜정부>에서는 '콘텐츠'관련 연구들이 중심이 되었다. 셋째, 연구대상 기간 또는 정권별 기간 내내 지속적으로 꾸준하게 진행되는 연구주제는 '방송', '디지털', '기술', '제작' 등이며, 향후에도 계속 진행될 것으로 보인다. 마지막으로 각 정권마다 새롭게 등장한 연구대상이 있었다. <문민정부>는 '콤팩트디스크기억장치(CD-ROM)', <국민의정부>는 '워터마크', '고화질', '3D', '가상현실', <참여정부>는 '플랫폼', <이명박정부>는 '모바일', '애플리케이션', <박근혜정부>는 '스마트'이며, '콤팩트디스크기억장치'와 '워터마크' 등은 단기에 소멸되었다. 연구의 의제설정과 산업화 과정에서 트렌드와 미래예측이 필요하다고 보여 진다.

빅데이터 기법을 활용한 직업훈련 요구분석 (Analysis of Vocational Training Needs Using Big Data Technique)

  • 성보경;유연우
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.21-26
    • /
    • 2018
  • 본 연구는 고용노동부가 운영하는 직업훈련 통합전산망인 'HRD-NET(http://hrd.go.kr)'을 통해 구직자가 필요로 하는 직업훈련 정보 등이 원활하게 제공되고 있는지를 확인하기 위해 질문게시판을 빅데이터 기법에 가장 최적화된 'R'프로그램을 이용해서 추출하였다. 따라서, 이를 통해 직업훈련제도의 유효성, 적절성, 시각화, 빈도 분석, 연관분석 등을 실시하였으며, 연구결과는 다음과 같다. 첫째, 직업훈련 카드발급 및 동영상 시청, 공인인증서 문제, 등록오류 이 발견되었으며, 둘째, 내일배움카드에 대한 노동관서에서의 관리 및 처리절차가 복잡하고 까다로워 제도개선이 필요한 것으로 나타났다. 또한, 교육훈련의 수강에 있어 훈련직종 및 과정, 훈련기관에 따라서 차등화 된 훈련비 시스템과 환급구조가 애로요인으로 작용하는 것으로 분석되었다. 본 논문 기초로 하여 향후 고용노동부의 훈련시스템 뿐만 아니라 정부부처의 다양한 훈련 전산망시스템에 대한 전반적인 빅데이터 분석을 통한 개선점 등을 연구하고자 한다.

빅데이터를 활용한 편의점 간편식에 대한 의미 분석 (A study on the User Experience at Unmanned Checkout Counter Using Big Data Analysis)

  • 김애숙;류기환;정주희;김희영
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.375-380
    • /
    • 2022
  • 본 연구는 빅데이터를 활용하여 편의점 간편식에 대한 소비자들의 인식과 의미를 알아보기 위한 목적이 있다. 이 연구를 위하여 네이버(NAVER)와 다음(Daum)에서 뉴스, 지식인, 블로그, 카페, 지식인(팁), 웹 문서를 대상으로 분석하였고 자료 검색을 위한 키워드로는 '편의점 간편식'을 사용하였다. 자료 분석 기간은 2019년 1월1일부터 2021년 12월 31일까지 3년으로 선정하였다. 자료수집 및 분석을 위해서는 텍스톰(TEXTOM)을 사용하여 빈도 및 매트릭스 데이터를 추출하였고 UCINET 6 프로그램의 NetDraw 기능을 이용해 네트워크 분석과 시각화 분석을 실시하였다. 그 결과 편의점 간편식을 소비자들의 선택속성에 따라 건강성, 다양성, 간편성, 경제성으로 군집화 하였다. 직접 조리한 음식에 뒤떨어지지 않고 한 끼 식사로 그 종류가 다양하며, 적절한 가격, 할인 쿠폰, 이벤트 등 편의점 간편식에 대한 소비자들의 의미와 선택속성을 바탕으로 간편성과 편의성을 추구하는 변화된 생활방식에 맞는 새로운 간편식 메뉴 개발에 기초 자료가 되기를 기대한다.

빅데이터를 활용한 코로나 19 이전과 이후 외식산업의 변화에 관한 연구 (A Study on the Changes of the Restaurant Industry Before and After COVID-19 Using BigData)

  • 안윤주
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.787-793
    • /
    • 2022
  • 코로나19 이후 사회적 거리두기와 비대면 서비스, 홈코노미족의 등장과 더불어 방문 외식이 비대면 외식으로 빠르게 대체되고 있다. 본 연구의 목적은 코로나19 창궐 이후 변화하는 외식산업의 트렌드에 맞춰 생활방역 중심의 안전한 외식문화 환경 조성 방안을 발굴하고 음식문화 개선 사업의 방향성 정립 및 사업의 효과성 제고를 도모함이 연구의 목적이다. 본 연구는 코로나 이전인 2018년 01월 01일부터 2019년 10월 31일, 코로나 이후인 2020년 01월 01일부터 2021년 12월 31일까지 TEXTOM을 활용하여 검색빈도 수집 및 정제, TF-IDF분석 수행 및 Ucinet6 프로그램을 활용, NetDraw를 활용한 시각화를 구현, 핵심 키워드의 노드 간 연결망을 파악하였다. 마지막으로 Concor분석을 통해 이들 간의 군집화를 수행하였다. 연구 결과, 코로나19의 이전과 이후 검색 빈도를 확인해 보면 코로나 팬데믹이 외식산업의 변화에 크게 영향을 끼치는 것을 알 수 있다.