• 제목/요약/키워드: 우드워드

검색결과 32건 처리시간 0.024초

카카오톡에서의 텍스트 데이터 마이닝 기반의 사용자별 적합 광고 키워드 도출 (Extracting User-Specific Advertising Keywords Based on Textual Data Mining from KakaoTalk)

  • 전예림;소다영 ;이지민 ;조은진;문지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.368-369
    • /
    • 2023
  • 대화 데이터 기반 광고 추천은 광고 마케팅에서 고객 맞춤형 광고 제공, 마케팅 효과 극대화 등을 위한 중요한 기술로 주목받고 있다. 본 논문에서는 모바일 인스턴스 메신저인 카카오톡 대화창에서 발생한 텍스트 데이터를 기반으로 대화 내용을 분석하여 대화 주제별 적절한 광고 키워드를 제안한다. 이를 위해 주제별 대화 내용을 미용, 식음료, 상거래로 세분하고 KoNLPy 의 Okt 를 이용하여 텍스트 전처리를 수행하고 키워드별로 빈도수를 뽑아 워드 클라우드를 제시한다. 또한, 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)을 기반으로 대화 주제를 세분화한 뒤 라벨링을 통해 주제별 대화 키워드를 분석한다. 실험 결과, 대화 주제를 온라인 쇼핑, 헤어, 뷰티 관리, 음식으로 나눌 수 있었으며, 토픽별 상위 키워드를 Word2Vec 을 통해 특정 단어와 유사한 키워드를 도출하여 적절한 광고 키워드를 제시할 수 있었다.

텍스트 마이닝을 이용한 현대 자동차 중국시장 소비자의 만족 및 불만족 요인 분석 연구: 다른 브랜드와의 비교 (Text Mining-Based Analysis of Hyundai Automobile Consumer Satisfaction and Dissatisfaction Factors in the Chinese Market: A Comparison with Other Brands)

  • 최염;남인용
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.539-549
    • /
    • 2024
  • 본 연구는 텍스트 마이닝 기법 중 빈도분석, 워드 클라우드와 LDA 토픽 모델링 등을 사용하여, 중국 시장에서 현대자동차를 중심으로 토요타, 폭스바겐, 뷰익, 지리 등의 자동차 브랜드와 비교하며 소비자 만족와 불만족의 키워드 및 토픽을 분석하였다. 연구 대상은 2021년식-2023년식의 다섯 브랜드의 준중형 차량으로, 이 차량들에 대한 소비자 만족과 불만족 리뷰를 수집하여 분석하였다. 분석 결과, 현대자동차 아반떼는 긴 축거를 포함한 다양한 만족 요인을 보여주었다. 그러나 아반떼에 대한 불만족 요인으로는 조종, 엔진 성능, 트렁크 공간, 샤시 및 서스펜션, 안전 구성, 음향 스피커의 수량 및 브랜드, 음악 회원, 격리대, 스크린반사, CarLife 및 지도 등이 지적되었다. 이러한 문제점들을 개선하면 현대자동차의 중국 시장에서의 경쟁력이 크게 향상될 것으로 보인다. 한편, 기존 연구들은 주로 문헌 연구와 설문조사에 초점을 맞추었으나, 이 방법들은 연구자가 설정한 변수에 한정된 소비자 인식만을 밝혀내는 데 그쳤다. 본 연구는 텍스트 마이닝을 통한 다양한 자동차 브랜드 간의 비교를 통해 시장 동향과 소비자 선호에 대한 더 깊은 이해를 도모할 수 있다. 또한, 현대자동차를 포함한 다른 브랜드들이 중국 시장에서의 마케팅 전략을 개선하는 데 유용한 정보를 제공한다.

빅데이터 기반 함정 시운전 종목명 분석 (Analysis of Sea Trial's Title for Naval Ships Based on Big Data)

  • 이형신;서형필;백용관;이상일
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.420-426
    • /
    • 2020
  • 본 연구에서는 효율적인 함정 시운전을 위하여 빅데이터 기법인 워드 클라우드를 활용하여 한미 해군의 시운전 목적과 주안점을 다각적으로 파악하여 다음과 같은 결과를 도출하였다. 첫째, 한미 해군 시운전 종목을 키워드 클렌징을 통해 추출된 단어를 비교한 결과 한국 해군은 시운전을 단일 장비에 대한 시험의 개념으로 수행하며, 미 해군은 시스템에 초점을 둔 통합 시운전을 진행한다는 것을 알 수 있었다. 둘째, 한미 해군 시운전 연관도 분석 결과 약 66.6%가 유사한 항목으로 분석되었으며, 그중 2종목 이상 중복된 종목이 112종목이었다. 한국 해군 시운전 종목 252종목 대비 44%가 중복된 종목으로 미 해군 시운전 종목으로 통합시 89종목(전체 35%)이 축소 가능하다고 분석되었다. 함정은 여러 장비가 동시 다발적으로 작동하는 복합 시스템이다. 현재 한국 해군 시운전과 같이 개별 장비의 기능, 성능 확인에 중점을 두고 수행하는 것은 시운전 대상이 지나치게 많아져 시운전 기간이 증가하게 된다. 또한, 그로 인한 일정 및 평가비용 증가로 필요한 예산이 필연적으로 증가한다. 향후 미 해군의 시운전과 같이 통합 시스템적인 평가를 통한 효율적이면서 정확한 시운전을 위하여 추가적인 연구가 필요하다고 판단된다.

Analysis of news bigdata on 'Gather Town' using the Bigkinds system

  • Choi, Sui
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.53-61
    • /
    • 2022
  • 4차 산업혁명 기술의 발전으로 가상과 현실의 경계가 모호한 디지털 환경 속에서 MZ세대와 메타버스가 가장 큰 주목을 받고 있다. 이러한 MZ세대에 부합되는 교수학습 방식으로 메타버스가 주목받고 있다. 본 연구에서는 에듀테크 관점에서 언론사 뉴스 분석을 통해 메타버스 플랫폼 중의 하나인 게더타운의 활성화 요인을 탐색해 보고자 하였다. 이를 위해 한국언론재단에서 제공하는 빅카인즈 시스템을 이용하여 빅데이터 관점에서 분석해 보았다. 그 결과 COVID-19 팬데믹 이후에 나타날 미래교육에서 '게더타운'의 활용도는 크게 증가할 것으로 예상된다. 둘째, 연관어와 워드크라우드 분석에서, '비대면'이나 '대학' 그리고 '신입생' 등 교육 관련 용어들의 가중치가 비교적 높게 나타났으며, '메타버스', '메타버스 플랫폼'을 포함하여, '코로나19'나 '아바타' 등의 용어도 중심적인 위치에 있는 것으로 나타났다. 셋째, 네트워크 분석에서 도출된 주요 용어로는 '코로나19, 아바타, 대학생, 진로, 유튜브' 가 포함되어 있는 것으로 나타났다. 이러한 여건 하에서, 본 연구 결과는 메타버스 플랫폼의 하나인 게더타운의 향후 교육 영역에서의 활용이 보다 활성화 되는데 크게 기여할 것으로 기대된다.

유서에 반영된 부정적 요인과 대안으로서의 웰에이징 요소 연구 (A study on the negative factors reflected in the will and the factors of well-aging as an alternative)

  • 박아르마;권온;안상윤;김광환
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.343-352
    • /
    • 2021
  • 본 연구는 유서에 반영된 부정적 요인과 대안으로서의 웰에이징 요소를 연구하는 것을 목적으로 한다. 조사기간 및 대상은 2008년~2020년에 언론에 공개된 유서 36건이다. 조사 결과 13세~34세의 청(소)년기 유서에서는 여러 측면의 부정적 요인이 발견되었다. 35세~49세 사이의 중년기 유서에서는 여성 작성자가 부재하는 특성이 발견되었다. 50세~64세 사이의 장년기 유서에서는 사회·경제적 측면의 부정적 요인이 두드러졌다. 65세 이상의 노년기 유서 작성자는 모두 여성이었고 그들의 글은 정신적 측면과 강하게 결부되었다. 결과적으로 본 연구에서 조사한 유서는 역설적으로 온전한 삶을 위한 제안서가 될 수 있다. 유서는 웰에이징의 가능성이 잠재되어 있는 기록이다. 유서의 출처로는 중앙일간지와 방송 및 지역 언론이다. 본 연구는 유서 작성 인원의 연령과 성별 그리고 유서에 반영된 부정적 요인의 세 가지 측면 곧 신체적 측면, 정신적 측면, 사회·경제적 측면을 방법론으로 활용하였다. 그리고 유서에 노출된 단어나 표현 등의 빈도를 분석하고 키워드를 워드 클라우드로 생성하였다.

텍스트마이닝을 활용한 노인 헬스케어 앱 사용 추이 및 동향 분석 (A Study on the Current Situation and Trend Analysis of The Elderly Healthcare Applications Using Big Data Analysis)

  • 변현;전상완;이은석
    • 한국융합학회논문지
    • /
    • 제13권5호
    • /
    • pp.313-325
    • /
    • 2022
  • 본 연구의 목적은 노인 헬스케어앱 시장의 변화 추이를 텍스트 마이닝 분석을 통해 살펴보고 노인 헬스케어앱 활성화를 위한 기초자료를 제시하고자 한다. 데이터 수집은 네이버, 다음, 블로그 웹, 까페를 대상으로 이루어졌으며, 연구방법은 빅데이터 분석 프로그램인 텍스톰(Textom)과 Ucinet6를 이용하여 텍스트마이닝, TF-IDF(Term frequency-inverse document frequency), 감성분석, 의미연결망분석을 실시하였다. 워드 클라우드를 실시한 결과 빈도 순으로 현장교육, 헬스케어, 전신재활운동기구, 서비스, 운동 등으로 나타났으며, TF-IDF 순위로는 현장교육, 헬스케어, 재활운동기구, 서비스, 건강 순으로 나타났다. 노인 스포츠 어플리케이션에 대한 감성분석을 실시한 결과 긍정비율로 81.3%, 부정비율이 18.7%로 나타났으며, 헬스케어앱 정보격차 해소, 융복합 헬스케어기술, 확산매체, 노인헬스케어앱 산업, 사회적 배경, 콘텐츠로 총 6개의 범주가 최종적으로 도출되었다. 결론적으로 노인 헬스케어앱이 노인들에게 수용 및 활용되기 위해 확산 인프라가 잘 갖추어져 있어야 하며, 융복합 기술의 적극적인 도입과 노인도 쉽게 사용할 수 있는 콘텐츠 개발을 통해 헬스케어 앱의 효과를 극대화하여야 한다.

공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구 특징 분석 (The Research Features Analysis of Leisure and Recreation based on Co-authors Network and Topic Model)

  • 박성건;박광원;강현욱
    • 한국체육학회지인문사회과학편
    • /
    • 제57권2호
    • /
    • pp.279-289
    • /
    • 2018
  • 본 연구의 목적은 워드 클라우드와 LDA 토픽 모델링을 이용하여 공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구의 특징을 분석하는 것이다. 웹 크롤러로 수집된 논문은 2008년 1월~2017년 3월 최근 10년 간 한국체육학회 홈페이지에 게재된 총 2,697편이며, 분석 대상은 여가레크리에이션 관련 문헌 369편이다. 분석 결과, 여가레크리에이션 분야 연구자들의 주요 관심사는 참가자와의 관계와 관련된 요인 분석, 다른 변인 간의 관계, 집단별 효과 차이 검증, 운동 참여, 스포츠 참여형태에 관한 연구로 나타났다. 연구자 네트워크에 링크된 수는 451개이며, 연구자들은 평균 1.52회의 관계를 맺고 있고, 연구자 간 평균 거리는 2.33로 나타났다. 대표저자의 연결정도 중심성에서 Lee. K. M., Hwang. S. H., Lee. C. S. 순으로 높게 나타났고, 근접 중심성은 Seo. K. B., Han. J. H., Kim. K. J. 순으로 나타났다. 마지막으로 매개 중심성은 Lee. C. W., Seo. K. B. 순으로 높게 나타나 여가레크리에이션과 관련된 학술 논문의 연구자들 사이를 연결해주는 역할을 가장 활발히 하는 것으로 나타났다. 향후 연구에서는 미래 여가 연구의 추이와 방향성에 관련하여 학자들 간의 논의가 필요하다.

한국농수산대학 재학생의 학교생활 감성 분석 및 영농의지에 관한 연구 (A Study on the Sensibility Analysis of School Life and the Will to Farming of Students at Korea National College of Agricultural and Fisheries)

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제21권2호
    • /
    • pp.103-114
    • /
    • 2019
  • 본 연구에서는 한농대에 재학 중인 3학년 학생을 대상으로 대학생활 선호도 및 졸업 후 영농의지를 파악하기 위하여 설문조사를 실시하였다. 연구 분석에는 구조화되지 않은 데이터의 분석 기법으로 오피니언 마이닝과 텍스트 마이닝 기법을 이용하였으며, 텍스트 마이닝의 결과는 워드 클라우드로 시각화하여 정보를 추출하였다. 또한 감성분석 결과를 이용하여 졸업 후 농사일을 하려는 학생들의 영농의지에 대한 통계적 분석을 하였다. 대학생활 호감도 조사는 대학 이미지, 자기 역량, 기숙사, 교육시스템, 미래 비전 등 5개 분야에 전체 10개 항목에 대하여 이루어졌다. 감성 분석을 위한 긍·부정 사전은 수집된 응답지에서 긍정과 부정의 감정을 분류하여 긍정어 사전과 부정어 사전을 각각 만들어 분석에 이용하였다. 분석 결과 10개 평가항목 가운데 대학 지원 당시의 '대학 이미지', 10년 후의 '자기 모습' 항목은 70% 이상, '자기 역량'과 '현재의 한농대' 항목은 60% 이상의 긍정적 감정을 나타냈다. 반면 '대학 기숙사' '교육과정' '장기현장실습' '한국 농업의 미래' 항목에 대해서는 긍정적 감성보다 부정적 감성이 높게 나타났다. 성별, 영농기반, 입학 동기에 따른 영농의지 차이의 교차 분석에서는 성별, 입학 동기에 따른 영농의지는 통계적으로 유의미한 결과가 나타났으나, 영농기반에서는 유의미하지 않은 결과가 나타났다. 또한 영농의지에 대한 이항 로지스틱 회귀분석에서는 통계적으로 유의미한 변수는 '입학 동기'로 파악되었으며, 본인의 의지로 입학한 학생일수록 영농의지가 형성될 확률이 높게 나타났다.

A Review of Tectonic, Sedinlentologic Framework and Petroleum Geology of the Cretaceous U. S. enlf Coast Sedimentary Sequence (백악기 미국 걸프만 퇴적층의 지구조적, 퇴적학적, 석유지질학적 고찰)

  • 정대교
    • 한국석유지질학회지
    • /
    • 제4권1_2호
    • /
    • pp.27-39
    • /
    • 1996
  • 백악기 당시 미국 걸프만 퇴적분지는 대륙연변부의 색(sag)형 퇴적분지로서의 진화과정을 거치고 있었다. 두꺼운 백악기의 쇄설성과 탄산염 퇴적층은 상승 교란작용을 받은 암염층을 덮고 있다. 당시 걸프만 퇴적분지의 염분도는 넓게 발달하고 있는 초조간대의 경석고 퇴적층의 분포로 보아 현생의 페르시아만 환경과 유사했던 것으로 추정된다. 하부 백악기의 주요 저류암 (reservoir)으로는 쇄설성 퇴적암층인 카튼밸리(Cotton Valley), 허스톤(Hosston), 트래비스픽(Travis Peak)층과 탄산염 퇴적암층인 슬리고(Sligo), 트리니티(Trinity) - 파인아일랜드(Pine Island), 피어살(Pearsall), 글랜로스(Glen Rose), 에드워드(Edwards), 조오지타운(Georgetown)/부다(Buda) 층이 있다. 이 시기 저류암층에 탄화수소를 공급했던 근원암(source rock)으로는 경사방향 하부(down-dip)에 위치하고 있는 셰일과 이회암층이 꼽히고, 덮개암(seal)은 대개 경사방향 상부(up-dip)에 위치하고 있는 계일과 치밀한 석회암층, 그리고 증발암으로 보인다. 하부 백악기 동안 전 걸프만 퇴적분지는 천해환경하에 있었는데, 남서부 지역은 백악기 말까지 계속 이어졌던 천해 탄산염 환경이,북쪽과 서쪽지역에서는 육성기원의 세립질 퇴적물이 주로 집적되는 환경이었다. 상부 백악기동안에는 걸프만 퇴적분지는 주요한 해수면 상승기와 연관되어 비교적 수심이 깊었던 환경하에 있었으며 이 때 형성된 주요 저류암층으로는 우드바인(Woodbine)/투스칼루사(Tuscaloosa) 사암층, 테일러(Taylor) 나바로(Navarro) 사암층과 오스틴(Austin) 백악 및 탄산염암층이 있다. 이 저류암층에 탄화수소를 공급했던 근원암층으로는 경사방향 하부의 셰일층이, 그리고 덮개암층은 경사방향 상부의 계일층이 그 역할을 담당했던 것으로 해석된다. 뗘악기 하부와 상부 퇴적층의 주요 트랩(trap)으로는 완만한 기둥형(pillow)으로부터 복잡한 다이아피어(diapir) 형태의 암염층 관련 배사구조와 하단 단층블록위에 놓여 있으며 롤오버(rollover) 배사구조를 갖는 성장단층이 있다. 투수 장애(permeability barrier), 상부 경사방향으로 첨멸하는 사암체(up-dip pinch-out sand body깥 침식부정합면(unconformity truncation)도. 걸프만 석유부존에 중요한 역할을 한 트랩들이다. 백악기의 주요한 저류암층들은 범세계 해수면곡선의 하강시기와 잘 일치하고 있는데 이는 백악기동안 형성된 걸프만의 퇴적층서가 범세계 해수면곡선을 전반적으로 잘 반영하고 있음을 의미한다. 즉 퇴적작용을 주로 지배하는 세 즌요 변수인 지구조적인 분지의 침강운동,퇴적물의 공급,해수면 변동오그÷중에서 해수면 변동요소가 이 시기동안 가장 중요한 역할을 했음을 의미한다.

  • PDF

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.