• 제목/요약/키워드: 핵심 단어 시각화

검색결과 16건 처리시간 0.018초

로컬 특징 기반 글로벌 이미지를 사용한 CNN 기반의 악성코드 분류 방법 (Convolutional Neural Network-based Malware Classification Method utilizing Local Feature-based Global Image)

  • 장세준;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.222-223
    • /
    • 2020
  • 최근 악성코드로 인한 피해가 증가하고 있다. 악성코드는 악성코드가 속한 종류에 따라서 대응하는 방법도 다르기 때문에 악성코드를 종류별로 분류하는 연구도 중요하다. 기존에는 악성코드 시각화 과정을 통해서 생성된 악성코드의 글로벌 이미지를 사용해 악성코드를 각 종류별로 분류한다. 글로벌 이미지를 악성코드로부터 추출한 바이너리 정보를 사용해서 생성한다. 하지만, 글로벌 이미지만을 사용해서 악성코드를 각 종류별로 분류하는 경우 악성코드의 종류별로 중요한 특징을 고려하기 않기 때문에 분류 정확도가 떨어진다. 본 논문에서는 악성코드의 글로벌 이미지에 악성코드의 종류별 특징을 나타내기 위한 로컬 특징 기반 글로벌 이미지를 사용한 악성코드 분류 방법을 제안한다. 첫 번째, 악성 코드로부터 바이너리를 추출하고 추출된 바이너리를 사용해서 글로벌 이미지를 생성한다. 두 번째, 악성 코드로부터 로컬 특징을 추출하고 악성코드의 종류별 핵심 로컬 특징을 단어-역문서 빈도(Term Frequency Inverse Document Frequency, TFIDF) 알고리즘을 사용해 선택한다. 세 번째, 생성된 글로벌 이미지에 악성코드의 패밀리별 핵심 특징을 픽셀화해서 적용한다. 네 번째, 생성된 로컬 특징 기반 글로벌 이미지를 사용해서 컨볼루션 모델을 학습하고, 학습된 컨볼루션 모델을 사용해서 악성코드를 각 종류별로 분류한다.

동시출현단어 분석에 기반한 메타데이터 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Metadata Research by Using Co-word Analysis)

  • 최예진;정연경
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.63-83
    • /
    • 2016
  • 다양한 매체와 유형으로 생산되는 정보자원에 대한 이용이 높아짐에 따라, 정보자원을 기술하기 위한 정보조직의 도구로서 메타데이터에 대한 중요성이 높아지고 있다. 본 연구에서는 메타데이터 분야의 연구 영역을 파악할 수 있도록 동시출현단어 분석을 사용하여 메타데이터 분야의 지적 구조를 규명하고자 하였다. 이를 위하여 1998년 1월 1일부터 2016년 7월 8일까지 Web of Science 핵심컬렉션에 등재된 저널에 게재된 문헌을 대상으로 'metadata'라는 질의어로 Topic 검색을 수행하여, 총 727건의 논문에 대한 서지정보를 수집하였다. 이 중 저자 키워드를 가진 410건의 논문의 저자 키워드로 수집하고, 전처리 과정을 거쳐 저자 키워드 총 1,137개를 추출하여 최종적으로 빈도수 6회 이상의 키워드 37개를 분석대상으로 선정하였다. 이후 메타데이터 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 2개 영역 9개 군집을 도출하였으며, 메타데이터 분야 키워드들의 지적 관계를 시각화하고, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 6개의 군집을 다차원축적지도상에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 메타데이터 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 향후 메타데이터 관련 교육과 연구의 방향성 모색에 유용하게 사용될 수 있을 것이다.

한국과 중국의 메타버스에 관한 사회적 인식의 비교연구: 빅데이터 분석의 활용 (A Comparative Study on the Social Awareness of Metaverse in Korea and China: Using Big Data Analysis )

  • 김기연
    • 인터넷정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.71-86
    • /
    • 2023
  • 본 연구의 목적은 빅데이터 분석을 활용하여 메타버스에 관한 한국과 중국 사회의 공중 인식 특성에 관한 차이를 탐색적으로 비교하는 것이다. COVID-19 팬데믹의 영향, 기술적 발전, Z세대 및 알파 세대와 같은 새로운 소비자 기반 확대 등의 환경적 영향으로 메타버스에 관한 국제 사회의 관심이 집중되면서 관련 학술연구도 2021년부터 본격화되고 있다. 특히, 한국과 중국은 메타버스 산업을 선도하는 주요 국가로 급부상했다. 메타버스에 관한 빅데이터 언급량이 급증한 시점에서 양국에서 발생한 빅데이터를 활용하여 사회 인식의 차별성을 발견하는 것은 시의성 있는 연구문제이다. 분석기법은 텍스트마이닝 분석으로 정제 데이터의 단어빈도, N-gram, TF-IDF 분석을 수행하여 핵심 단어의 중요도를 파악하고, 시맨틱 네트워크의 밀도 및 중심성 분석을 통해 단어 간의 연결 강도와 의미적 연관성을 살펴보고자 한다. 데이터 분석은 Python 3.9 아나콘다 데이터 사이언스 플랫폼 3과 Textom 6 버전을 활용하였고, 시맨틱 네트워크 분석과 구조적 등위성(CONCOR) 분석을 위해 UCINET 6.759 프로그램으로 시각화 분석을 수행하였다. 분석 결과, 데이터를 유사성이 있는 단어 그룹으로서 각 4개씩의 블록을 도출하였다. 이 블록들은 메타버스에 관한 양국의 사회적 인식 유형을 각각 반영하는 관점들로 이해할 수 있다. 메타버스에 관한 연구들은 증가하고 있으나, 아직 비교문화 관점에서 국가나 다문화 간 비교연구 접근의 연구는 거의 수행되지 않았다. 이 시점에서 본 연구는 선행연구로서 후속 연구들에 이론적 근거와 의미 있는 인사이트를 제공할 수 있을 것으로 기대한다.

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.

컨벤션 관광 목적지 브랜드 슬로건 분석 - 국제 컨벤션 도시를 중심으로 - (Analysis of Convention Tourism Destination Brand Slogans: Focusing on International Convention Cities)

  • 이혜련;반서연;윤유식
    • 한국과학예술포럼
    • /
    • 제26권
    • /
    • pp.339-351
    • /
    • 2016
  • 본 연구의 목적은 전 세계의 주요 국제 컨벤션 도시를 중심으로 컨벤션 관광 목적지 브랜드 슬로건을 분석하는 것이다. 자료 수집은 2013년 10개 이상의 국제회의를 개최한 190개 도시의 공식 관광 웹사이트를 통해 이루어졌다. 이중에서 확인된 106개 목적지 브랜드 슬로건의 언어적 표현과 시각적 표현에 대한 내용분석을 실시하였다. 분석 결과, 슬로건의 구조면에서 단어형과 구형이 다수로 간결성을 추구하고 있으며, 스펙트럼 유형에 있어서는 지역 특성과 혜택을 드러내지 못하는 보편형 슬로건이 절반을 차지하였으며, 핵심 용어에 있어서는 'visit, city'를 가장 많이 사용하였다. 한편, 시각적 관점에서 슬로건의 글자체는 명시성이 있는 타이포그래피가 약 70%였으며, 슬로건의 60%가 인문과 자연자원을 이미지화 대상으로 선정하여 차별적 이미지 구축을 도모하는 것으로 나타났다. 또한 본 연구결과에 대한 전문가 회의를 통해 향후 효과적인 컨벤션 관광 목적지 브랜드 슬로건 개발에 대한 시사점을 도출하였다.

신문기사에 나타난 장애인스포츠에 대한 인식 -의미연결망을 활용한 빅데이터 분석- (Perceptions of Disabled Sports in Newspapers Using Semantic Networks Analysis)

  • 한민규;김원경;윤지운
    • 재활복지
    • /
    • 제20권4호
    • /
    • pp.157-175
    • /
    • 2016
  • 본 연구의 목적은 텍스트 빅데이터 분석의 일종인 의미연결망을 활용하여 신문기사에서 나타나는 장애인스포츠에 대한 인식을 알아보는 것이 목적이다. 이 목적을 위하여 '장애인스포츠'를 검색어로 네이버 포탈을 이용하여 21개 언론사 745건의 기사를 수집하였으며 Krkwic 소프트웨어 프로그램을 사용하여 자료정제와 공출현 빈도를 산출하였다. 장애인스포츠에 대한 인식은 Netminer 4.0을 활용하여 연결중앙성, 매개중앙성, 위세중앙성을 지표로 분석하였다. 의미연결망 분석을 통하여 얻은 결과는 다음과 같다. 첫째, 신문기사에서 나타난 장애인스포츠를 규정하는 핵심단어는 감동, 도전, 축제, 꿈, 희망이다. 그리고 장애인스포츠의 인식을 나타내는 핵심단어는 장애유형에 따라 차이가 있다. 둘째, 장애인스포츠에 대한 인식을 장애유형별로 구분하여 분석한 결과 크게 경기력관련 인식과 감성관련 인식으로 구분할 수 있다. 구체적으로 지체장애 스포츠 대상의 경기력관련 인식은 패럴림픽, 로봇, 감동 등이며 감성관련 인식은 행복, 희망 등이다. 지적장애 스포츠 대상의 경기력관련 인식은 패럴림픽, 스페셜올림픽, 축제 등이고 감성관련 인식은 사랑, 감동 등이다. 시각장애 스포츠 대상의 경기력관련 인식은 메달, 달리기 등이며 감성관련 인식은 희망, 나눔 등이다. 결론적으로 신문기사에서 나타나는 장애인스포츠에 대한 인식은 패럴림픽, 스페셜올림픽 등의 장애인스포츠 경기대회는 장애인들의 도전과 꿈을 이룰 수 있는 축제의 장이며 경기를 통해 일반대중들에게 감동을 선사한다고 의미화 할 수 있다.