• 제목/요약/키워드: 텍스트 효과

검색결과 630건 처리시간 0.029초

소비자불매운동 참여 경험에 관한 연구: 텍스트마이닝 분석과 심층면접기법의 활용 (A Study on the Consumer Boycott Participation Experience: Using Text Mining Analysis and In-depth Interview)

  • 한준오;이욱;황혜선
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.88-106
    • /
    • 2022
  • 본 연구는 매스미디어와 소셜미디어 데이터의 텍스트마이닝 분석과 심층면접을 활용하여 소비자불매운동에 대한 사회적 담론을 확인하고 구체적인 소비자경험을 탐색하고자 하였다. 분석결과, 불매운동 관련 온라인 뉴스의 토픽은 불매운동 원인과 불매운동 과정에서 나타난 각 주체들의 대응, 불매운동 효과의 내용을 포괄하는 것으로 나타났다. 심층면접 결과, 참여자들은 자체적으로 정보를 탐색하고 검증을 하며 탈중심화된 불매운동 참여 경험을 가지는 것으로 나타났다. 불매운동 과정에서 대체재 부재, 불매기업의 마케팅 영향으로 인한 혼란스러운 경험과, 불매행동으로 자신의 생각을 표현하고 신념을 강화하는 긍정적 경험이 함께 나타났다.

카카오톡에서의 텍스트 데이터 마이닝 기반의 사용자별 적합 광고 키워드 도출 (Extracting User-Specific Advertising Keywords Based on Textual Data Mining from KakaoTalk)

  • 전예림;소다영 ;이지민 ;조은진;문지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.368-369
    • /
    • 2023
  • 대화 데이터 기반 광고 추천은 광고 마케팅에서 고객 맞춤형 광고 제공, 마케팅 효과 극대화 등을 위한 중요한 기술로 주목받고 있다. 본 논문에서는 모바일 인스턴스 메신저인 카카오톡 대화창에서 발생한 텍스트 데이터를 기반으로 대화 내용을 분석하여 대화 주제별 적절한 광고 키워드를 제안한다. 이를 위해 주제별 대화 내용을 미용, 식음료, 상거래로 세분하고 KoNLPy 의 Okt 를 이용하여 텍스트 전처리를 수행하고 키워드별로 빈도수를 뽑아 워드 클라우드를 제시한다. 또한, 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)을 기반으로 대화 주제를 세분화한 뒤 라벨링을 통해 주제별 대화 키워드를 분석한다. 실험 결과, 대화 주제를 온라인 쇼핑, 헤어, 뷰티 관리, 음식으로 나눌 수 있었으며, 토픽별 상위 키워드를 Word2Vec 을 통해 특정 단어와 유사한 키워드를 도출하여 적절한 광고 키워드를 제시할 수 있었다.

대규모 언어 모델 및 인컨텍스트 러닝을 활용한 수치 추론 데이터셋 증강 (Numerical Reasoning Dataset Augmentation Using Large Language Model and In-Context Learning)

  • 황예찬;임진수;이영준;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델의 인컨텍스트 러닝과 프롬프팅을 활용하여 수치 추론 태스크 데이터셋을 효과적으로 증강시킬 수 있는 방법론을 제안한다. 또한 모델로 하여금 수치 추론 데이터의 이해를 도울 수 있는 전처리와 요구사항을 만족하지 못하는 결과물을 필터링 하는 검증 단계를 추가하여 생성되는 데이터의 퀄리티를 보장하고자 하였다. 이렇게 얻어진 증강 절차를 거쳐 증강을 진행한 뒤 추론용 모델 학습을 통해 다른 증강 방법론보다 우리의 방법론으로 증강된 데이터셋으로 학습된 모델이 더 높은 성능을 낼 수 있음을 보였다. 실험 결과 우리의 증강 데이터로 학습된 모델은 원본 데이터로 학습된 모델보다 모든 지표에서 2%p 이상의 성능 향상을 보였으며 다양한 케이스를 통해 우리의 모델이 수치 추론 학습 데이터의 다양성을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

Multi-channel CNN 기반 온라인 리뷰 유용성 예측 모델 개발에 관한 연구 (A multi-channel CNN based online review helpfulness prediction model)

  • 이흠철;윤효림;이청용;김재경
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.171-189
    • /
    • 2022
  • 온라인 리뷰는 소비자의 구매 의사결정 과정에서 중요한 역할을 담당하고 있으므로 소비자에게 유용하고 신뢰성이 있는 리뷰를 제공하는 것이 중요하다. 기존의 온라인 리뷰 유용성 예측 관련 연구는 주로 온라인 리뷰의 텍스트와 평점 정보 간의 일관성을 바탕으로 리뷰 유용성을 예측하였다. 그러나 기존 연구는 평점 정보를 스칼라로 표현했기 때문에 표현 수용력이 제한적이거나 평점 정보와 리뷰 텍스트 정보와의 상호작용을 제한적으로 학습하는 한계가 존재한다. 본 연구에서는 기존 연구의 한계점을 보완하기 위해 리뷰 텍스트와 평점 정보 간의 상호작용을 효과적으로 학습할 수 있는 CNN-RHP(CNN based Review Helpfulness Prediction) 모델을 제안하였다. 먼저, 리뷰 텍스트의 의미론적 특성을 추출하기 위해 multi-channel CNN을 적용하였다. 다음으로, 평점 정보는 텍스트 특성과 동일한 차원을 나타내는 독립된 고차원 임베딩 특성 벡터로 변환하였다. 최종적으로 요소별(Element-wise) 연산을 통해 리뷰 텍스트와 평점 정보 간의 일관성을 학습하였다. 본 연구에서는 제안된 CNN-RHP 모델의 성능을 평가하기 위해 Amazom.com에서 수집된 온라인 소비자 리뷰를 사용하였다. 실험 결과, 본 연구에서 제안한 CNN-RHP 모델이 기존 연구에서 제안된 여러 모델과 비교했을 때 우수한 예측 성능을 나타내는 것을 확인하였다. 본 연구의 결과는 온라인 전자상거래 플랫폼에서 소비자들에게 리뷰 유용성 예측 서비스를 제공할 때 유의미한 시사점을 제공할 수 있다.

텍스트 구성요소 판별 기법과 자질을 이용한 문서 요약 시스템의 개발 및 평가 (Development and Evaluation of a Document Summarization System using Features and a Text Component Identification Method)

  • 장동현;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.678-689
    • /
    • 2000
  • 논 본문은 문서의 주요 내용을 나타내는 문장을 추출함으로써 요약문을 작성하는 자동 요약 기법에 대해 기술하고 있다. 개발한 시스템은 문서 집합으로부터 추출한 어휘적, 통계적 정보를 고려하여 요약 문장을 작성하는 모델이다. 시스템은 크게 두 부분, 학습과정과 요약과정으로 구성이 된다. 학습 과정은 수동으로 작성한 요약문장으로부터 다양한 통계적인 정보를 추출하는 단계이며, 요약 과정은 학습 과정에서 추출한 정보를 이용하여 각 문장이 요약문장에 포함될 가능성을 계산하는 과정이다. 본 연구는 크게 세 가지 의의를 갖는다. 첫째, 개발된 시스템은 각 문장을 텍스트 구성 요소의 하나로 분류하는 텍스트 구성 요소 판별 모델을 사용한다. 이 과정을 통해 요약 문장에 포함될 가능성이 없는 문장을 미리 제거하는 효과를 얻게 된다. 둘째, 개발한 시스템이 영어 기반의 시스템을 발전시킨 것이지만, 각각의 자질을 독립적으로 요약에 적용시켰으며, Dempster-Shafer 규칙을 사용해서 다양한 자질의 확률 값을 혼합함으로써 문장이 요약문에 포함될 최종 확률을 계산하게 된다. 셋째, 기존의 시스템에서 사용하지 않은 새로운 자질 (feature)을 사용하였으며, 실험을 통하여 각각의 자질이 요약 시스템의 성능에 미치는 효과를 알아보았다.

  • PDF

텍스트마이닝을 활용한 연구동향 분석: 소셜네트워크서비스를 중심으로 (Research Trends Investigation Using Text Mining Techniques: Focusing on Social Network Services)

  • 윤혜진;김창식;곽기영
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.513-519
    • /
    • 2018
  • 본 연구의 목적은 소셜네트워크서비스 주제에 관한 연구동향을 조사하는 것이다. 연구의 목적을 달성하기 위해서 웹오브사이언스 데이터베이스에서 제목에 'Social Network Service(SNS)'를 포함하는 1994년부터 2016년까지 출판된 논문 초록 308편을 분석 하였다. 본 연구에서는 텍스트마이닝 기법 중에서 최근 많이 적용되는 토픽모델링기법을 활용하였다. 토픽모델링 분석결과 20개의 토픽(신뢰, 지지, 만족 모델, 조직 지배구조, 모바일 시스템, 인터넷 마케팅, 대학생 효과, 의견 확산, 고객, 정보보호, 건강관리, 웹 협업, 방법, 학습 효과, 지식, 개인 이론, 아동 지지, 알고리즘, 미디어 참여, 문맥 시스템)이 도출되었다. 또한 시계열회귀분석 결과 모든 토픽은 상승 추세로 나타났다.

초등학교의 자료구조와 알고리즘 수업에서 알고리즘 시각화의 교육적 효과 (Pedagogical effectiveness of algorithm visualizations in teaching the data structures and algorithms in elementary schools)

  • 전석주
    • 정보교육학회논문지
    • /
    • 제16권2호
    • /
    • pp.255-263
    • /
    • 2012
  • 정보화 사회에서 우수한 S/ W 인력을 양성하기 위해 알고리즘의 조기 교육은 매우 중요하다. 그러나 초등학생에게 알고리즘을 교육하는 것은 큰 도전인데 왜냐하면 텍스트형태의 컴퓨터 알고리즘이 어떻게 동작하는 지를 어린 학생들이 이해하기가 매우 어렵기 때문이다. 애니메이션을 활용한 수업 통해 알고리즘 수업을 실시한다면 학생들이 좀 더 쉽게 알고리즘을 시각화 할 수 있을 것으로 기대된다. 본 연구에서는 초등학교에서 기초적인 자료구조와 알고리즘을 교육하는데 있어서 알고리즘 시각화의 교육적 효과를 평가하고자 한다. 이를 위해 '알고리즘 시각화 팩터'라는 새로운 측정도구를 정의하고 알고리즘 교육요소 즉, 스택, 큐, 버블정렬, 힙정렬, BFS, 및 DFS에 대해 텍스트 기반과 애니메니션 기반의 강의 자료를 각각 개발하였다. 다양한 학생 그룹에 대해 실험을 하고 평가를 하였다. 폭넓은 실험을 통해 애니메이션 기반의 강의 자료를 사용한 그룹의 평균 점수가 텍스트기반의 강의 자료를 사용한 그룹에 대해 22.2% 이상 더 높은 점수 결과를 보였다.

  • PDF

자유학기제 운영계획서에 대한 텍스트 빅데이터 분석 및 요약 (Text Big Data Analysis and Summary for Free Semester Operational Plan Document)

  • 이수안;박범준;김민규;신혜숙;김진호
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.135-146
    • /
    • 2019
  • 사회 각 분야에서 관련 주제에 대한 보다 직접적인 정보를 수집하고 분석하기 위하여 빅데이터 분석이 활발하게 활용되고 있다. 우리나라에서 사회적 관심과 파급 효과가 큰 교육 분야에서도 빅데이터 분석 기술을 활용하여 교육이나 정책의 효과를 파악하고 정책 수립에 활용하는 것에 관심이 높아지고 있다. 본 논문에서는 교육 분야에서 빅데이터 분석 기술을 활용하는 방안을 소개하고자 한다. 현재 핵심 교육정책 중의 하나인 자유학기제에 초점을 두고, 각 학교가 작성한 운영계획서에 대해 텍스트 분석과 시각화를 통하여 주요 관심 사항과 차이점에 대해 살펴보았다. 특히 서울과 강원도 지역의 중학교 자유학기제 운영계획서를 대상으로 지역적으로 주요 특성과 관심 사항이 서로 다르다는 것을 비교하였다. 본 연구는 빅데이터 분석 기술을 교육 분야의 필요와 요구에 따라 적용하고 활용하였다는 것에 큰 의의가 있다.

국내 전자정부 연구동향에 대한 정량적 분석: 텍스트 마이닝과 네트워크 분석 기법을 중심으로 (Quantitative Analysis of Research Trends in Korean E-Government Using Text Mining and Network Analysis Methods)

  • 이수인;신신애;강동석;김상현
    • 정보화정책
    • /
    • 제25권4호
    • /
    • pp.84-107
    • /
    • 2018
  • 기존에 수행된 국내 전자정부 동향연구는 정성적 연구방법에만 의존하는 약점을 지니고 있다. 이에 본 연구는 2018년 9월 현재 시점에서 1996~2017년까지의 데이터를 기반으로 정량적 분석을 수행하였다. 텍스트 마이닝을 통해 도출된 연구주제는 총 7가지였으며, 그중에서도 프레임워크와 공공정책 효과의 네트워크 중심성이 높은 것으로 식별되었다. 본 연구결과는 전자정부의 발전을 위해 필요한 학술적/정책적 시사점을 제공하였다. 시사점 중의 하나는 기존 연구가 주로 수행하던 방식인 정성적 분석방법 대신에 정량적 분석방법을 활용하여, 상대적으로 객관성 및 학문의 다양성 확보에 이바지한다는 점이다.

트윗 텍스트 마이닝 기법을 이용한 구제역의 감성분석 (Sentiment Analysis of Foot-and-Mouth Disease Using Tweet Text-Mining Technique)

  • 채희찬;이종욱;최윤아;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권11호
    • /
    • pp.419-426
    • /
    • 2018
  • 구제역으로 인하여 국내 축산업계 및 관련 산업분야는 매년 막대한 피해를 입고 있다. 구제역과 관련한 다양한 학술적 연구들이 현재 진행되고는 있으나, 구제역의 발병에 따른 사회적 파급효과에 관한 공학적 분석 연구는 매우 제한적이다. 본 연구에서는 구제역에 관한 일반 시민들의 감성적 반응을 텍스트 마이닝 방법론을 사용하여 분석하는 체계적인 방법론을 제안한다. 제안하는 시스템은 먼저, 트위터에 게시된 트윗 중 구제역과 관련된 데이터를 수집한 후, 딥러닝 기법을 사용하여 극성 분류 과정을 거친다. 둘째, 토픽 모델링의 대표적인 기법 중 하나인 LDA를 활용하여 트윗으로 부터 키워드들을 추출하고, 추출된 키워드들로부터 극성별 동시출현 키워드 네트워크를 구성한다. 셋째, 키워드 네트워크을 통해 구제역의 위기단계 구간별 사회적 파급효과를 분석한다. 사례 분석으로써, 2010년 7월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 일반 시민들의 감성적 변화를 분석하였다.