• 제목/요약/키워드: Text-search

검색결과 546건 처리시간 0.027초

취업준비생 토픽 분석을 통한 취업난 원인의 재탐색 (Revisiting the cause of unemployment problem in Korea's labor market: The job seeker's interests-based topic analysis)

  • 김정수;이석준
    • 경영과정보연구
    • /
    • 제35권1호
    • /
    • pp.85-116
    • /
    • 2016
  • 본 연구는 개인-환경 부합 관점에서 취업시장변화에 따른 취업준비생의 관심사를 토대로 의사결정과정에 영향을 미치는 취업난의 원인을 탐색적으로 고찰하였다. 이를 위해, 최근 3개년(2013~2015) 간 취업 관련 커뮤니티 내 이용자 게시글(소셜미디어)을 웹 크롤링을 통해 수집하고, 텍스트 마이닝 기법 중 토픽 분석을 통해 취업준비생의 주요 관심사 유형 및 심리적 반응 변화추이를 분석하였다. 분석결과, 취업준비생의 주요 관심사가 '희망직업(세계)에 대한 인식, 취업사전준비활동, 노동시장에 대한 인식, 취업 스트레스'의 네 가지 유형으로 나타나는 것을 발견하였다. 구체적으로 이들은 직업가치나 미래 진로에 대한 탐색보다 희망직업과 관련하여 금전적 보상이나 직장근무형태(근무 및 생활환경)에 관해 관심을 두고 있어 불확실한 환경에 직면하면서 특정 언어적 사용(예: 비속어, 은어)을 토대로 불안정한 심리적 상태를 표현하는 것으로 나타났다. 또한 현재 취업준비생들은 취업 성공을 위한 전략적 선택차원에서 주로 스펙준비에 치중하고 있어 취업불안에 따른 스트레스를 받는 것으로 나타났다. 이러한 결과를 토대로 현재 취업난은 총체적으로 개인과 사회 조직의 가치추구 부재에 기인한다고 볼 수 있다. 결국 개인은 자신의 직업 가치관을 확립하지 못한 상황에서 일부 기업들은 인적자원의 중요성에 대해 자각하지 못하며, 사회적으로는 직업위세란 장애요인이 복합적으로 작용하여 나타난 문제라고 볼 수 있다. 따라서 취업난이란 특정 상황과 현상의 원인을 다각적으로 이해하고 다수의 취업준비생 관심사를 도출하기 위한 토픽분석과 이들의 다양한 반응의 의미를 언어 심리적 이론을 토대로 해석하는 접근방법의 필요성을 제기한다.

  • PDF

인공지능(AI) 스피커에 대한 사회구성 차원의 발달과정 연구: 제품과 시기별 공진화 과정을 중심으로 (A study of Artificial Intelligence (AI) Speaker's Development Process in Terms of Social Constructivism: Focused on the Products and Periodic Co-revolution Process)

  • 차현주;권상희
    • 인터넷정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.109-135
    • /
    • 2021
  • 본 연구는 전통뉴스 보도에 나타난 인공지능(AI)스피커 뉴스 텍스트 분석을 통해 인공지능(AI) 스피커 발달과정을 분류하고 시기별 제품별 특성을 파악하였다. 또한 AI 스피커 사업자 제품별 뉴스 보도와 시기별 뉴스 보도간의 상관관계를 분석하였다. 분석에 사용된 이론적 배경은 뉴스의 프레임과 토픽프레임이다. 분석방법으로는 LDA 방식을 활용한 토픽모델링(Topic Modeling)과 의미연결망분석이 사용되었으며, 추가로 'UCINET'중 QAP분석을 적용하였다. 연구방법은 내용분석 방법으로 2014년부터 2019년까지 AI 스피커 관련 2,710건의 뉴스를 1차로 수집하였고, 2차적으로 Nodexl 알고리즘을 이용하여 토픽프레임을 분석하였다. 분석 결과 첫째, AI 스피커 사업자 유형별 토픽 프레임의 경향은 4개 사업자(통신사업자, 온라인 플랫폼, OS 사업자, IT디바이스 생산업자) 특성에 따라 다르게 나타났다. 구체적으로, 온라인 플랫폼 사업자(구글, 네이버, 아마존, 카카오)와 관련한 프레임은 AI 스피커를 '검색 또는 입력 디바이스'로 사용하는 프레임의 비중이 높았다. 반면 통신 사업자(SKT, KT)는 모회사의 주력 사업인 IPTV, 통신 사업의 '보조 디바이스' 관련한 프레임이 두드러지게 나타났다. 나아가 OS 사업자(MS, 애플)는 '제품의 의인화 및 음성 서비스' 프레임이 두드러지게 보였으며, IT 디바이스 생산업자(삼성)는 '사물인터넷(IoT) 종합지능시스템'과 관련한 프레임이 두드러지게 나타났다. 둘째, AI 스피커 시기별(연도별) 토픽 프레임의 경향은 1기(2014-2016년)에는 AI 기술 중심으로 발달하는 경향을 보였고, 2기(2017-2018년)에는 AI 기술과 이용자 간의 사회적 상호 작용과 관련되어 있었으며, 3기(2019년)에는 AI 기술 중심에서 이용자 중심으로 전환되는 경향을 나타냈다. QAP 분석 결과, AI 스피커 발달에서 사업자별과 시기별 뉴스 프레임이 미디어 담론의 결정요인에 의해 사회적으로 구성되는 것을 알 수 있었다. 본연구의 함의는 AI 스피커 진화는 사업자별, 발달시기별로 모회사 기업의 특성과 이용자 간의 상호작용으로 인한 공진화 과정이 나타냄을 발견할 수 있었다. 따라서 본 연구는 AI 스피커의 향후 전망을 예측하고 그에 따른 방향성을 제시하는 데 중요한 시사점을 제공한다.

빅데이터환경에서 텍스트마이닝 기법을 활용한 한국의 석면 트렌드 (1918년~2027년) (Asbestos Trend in Korea from 1918 to 2027 Using Text Mining Techniques in a Big Data Environment)

  • 노열;정현이;박병노;김채원;김유미;서민아;신행수;김현욱;성예지
    • 자원환경지질
    • /
    • 제56권4호
    • /
    • pp.457-473
    • /
    • 2023
  • 석면은 악성중피종과 폐암 등 치명적인 질병을 유발하기 때문에 국내에서 2009년부터 그 사용이 전반적으로 금지되었다. 그러나 국내에서 지난 수십년 간 석면이 생산 및 수입되어 다양한 산업에서 사용되어 왔기 때문에 우리 주변에는 여전히 석면함유물질이 많이 존재하고 있어 안전한 관리가 절실하다. 이 연구는 지난 32년(1991년 ~ 2022년)동안의 빅데이터를 바탕으로 석면관련 주요키워드를 이용하여 석면관련 트렌드 변화를 살펴보고자 한다. 또한 국내 과거(1990년 이전)의 석면의 생산, 수입, 사용 실태와 더불어 현재(2023년~2027년)의 석면관련 정책 동향을 살펴보고자 하였다. 1991~2000년에는 국내 석면의 생산과 수입 그리고 이용으로 인하여 석면에 대한 발암성이 부각되는 시기로 연구, 근로자, 발암물질, 환경등과 관련된 키워드가 주를 이루었다. 2001~2010년에는 석면의 발암성과 관련하여 미국, 일본 등에서 소송이 시작되었던 시기로 폐암, 소송, 발암물질, 노출, 기업 등의 키워드가 주를 이루었다. 2011~2020년에는 국내에서도 석면문제의 심각성을 인지하는 키워드인 발암물질, 야구장, 학교, 슬레이트, 건축물, 폐석면광산 등이 지속적으로 상위권 키워드로 검색되었다. 2021년부터는 주로 검색되는 키워드는 학교, 슬레이트, 건축물 등과 조경석, 환경영향평가, 아파트, 시멘트 등의 키워드가 나타났다.

Daum 웹툰 <바리공주>를 통해 본 고전 기반 웹툰 콘텐츠의 다층적 대화 양상 -서사구조와 댓글 분석을 중심으로 (About the Multi-layered Communication of Princess Pari on the Webtoon Platform of Daum -Focusing on Analysis of Narrative Structure and Comments)

  • 최기숙
    • 대중서사연구
    • /
    • 제25권3호
    • /
    • pp.303-345
    • /
    • 2019
  • 이 논문은 포탈사이트 Daum에 연재되고 있는 김나임 작가(글/그림)의 웹툰 <바리공주>를 대상으로, 콘텐츠의 서사 구조와 댓글 분석을 질적/양적 방법론을 병행해 수행함으로써, 바리공주 서사무가라는 고전을 기반으로 한 웹툰 콘텐츠의 창작과 수용에 매개된 다층적 대화 양상을 해명했다. 웹툰 <바리공주>는 단위 서사가 독립적, 다선적, 중층적으로 연결되는 옴니버스 구성을 취하되, 바리의 성장담과 로맨스를 통해 개별서사를 통합하는 서사적 장치를 활용했다. 이때 작가는 예고편을 통해 고전원작(서사무가)을 웹툰의 프리퀄에 해당하는 전사(前史)로 활용했고, 원작이 지닌 젠더 비대칭성과 가부장제의 문제에 서사적으로 응답하는 서사적 재구성을 시도했다. 이에 대해 수용자는 비평적/성찰적 차원의 댓글로 토의하는 대화적 공론장을 형성했다. 표집을 통한 통계 분석에 따르면, 댓글의 양상은 〔콘텐츠에 대한 감상과 비평 ≫ 감정 반응 ≫ 직관적 총평 ≫ 지식과 성찰 ≫ 댓글평〕의 순으로 나타났다. 웹툰 <바리공주>의 창작과 수용에는 고전과 현대, 콘텐츠와 수용자, 수용과 창작 차원의 다층적 대화 양상이 작동했다. 창작의 차원에서 작가는 신화적 상징의 간극을 메우는 장치를 활용했으며, 수용자의 차원에서는 댓글을 통해 전통/민속/문화에 대한 정보와 지식, 성찰을 공유하는 문화를 형성했다. 이는 웹툰을 매개로 한 고전과 현대의 대화에 해당한다. 수용자는 웹툰의 향유를 통해, 정보를 보완하고 공감대를 형성하며, 해석학적 조율을 시도하고, 논쟁을 통해 시각을 조율하는 과정을 보였다. 또한 댓글을 다는 태도, 시각, 입장에 대해 논평함으로써, 문학에서의 메타비평에 해당하는 행위 양태를 보였다. 수용자의 댓글은 웹툰의 창작에 피드백 정보로 작용함으로써, 창작과 수용 자체가 웹툰 콘텐츠 제작에 영향을 미치는 실천적 역량으로 작동했다. 이 글은 고전을 기반으로 한 웹툰 <바리공주>가 고전과 현대, 작가와 수용자, 연구자간의 다양한 대화성을 형성함으로써, 감각, 사유, 비평, 성찰에 이르는 '움직이며 역동하는' 콘텐츠로 재구성된다는 것을 구체적으로 해명하는 케이스 스터디로 수행되었다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.