• 제목/요약/키워드: 유튜브 데이터

검색결과 83건 처리시간 0.027초

유튜브 메타정보를 이용한 자동 주제 분류 고찰 (Analysis of Automatic Topic Classification using Youtube Meta Information)

  • 김용우;전성배;정유철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.349-351
    • /
    • 2021
  • Youtube 동영상 업로드 시, 사용자가 직접 주제를 설정해야 하는 어려움이 있다. 본 연구에서는 사용자가 입력하는 제목과 설명정보를 이용하여 자동으로 주제를 분류하는 연구를 진행하였다. 이를 위해 한국어기반의 컨텐츠 중 고빈도의 8개 주제 카테고리를 선정하고, 이를 1.3만건의 학습데이터를 크롤링을 통해 구축하였다. 또한, 다양한 알고리즘들에 대한 최대성능을 확인하기 위해 대표적인 텍스트 분류 방법인 SVM과 LSTM기법 및 BERT 모델기반 미세적용(fine-tuning)을 시도하였다. 결과적으로 Bert-multiligual (base)를 fine-tuning한 실험에서 최대 94%의 정확도를 확인하였다. 하지만, Youtube 동영상 특성상 여러 주제를 가진 것들이 상당수 존재하기에, 실제 체감정확도는 더 높을 것으로 기대된다.

  • PDF

한국어 발화 문장에 대한 비언어 표현 정보를 자동으로 생성하는 모델 (A Model to Automatically Generate Non-verbal Expression Information for Korean Utterance Sentence)

  • 김재윤;장진예;김산;정민영;강현욱;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-94
    • /
    • 2023
  • 자연스러운 상호작용이 가능한 인공지능 에이전트를 개발하기 위해서는 언어적 표현뿐 아니라, 비언어적 표현 또한 고려되어야 한다. 본 논문에서는 한국어 발화문으로부터 비언어적 표현인 모션을 생성하는 연구를 소개한다. 유튜브 영상으로부터 데이터셋을 구축하고, Text to Motion의 기존 모델인 T2M-GPT와 이종 모달리티 데이터를 연계 학습한 VL-KE-T5의 언어 인코더를 활용하여 구현한 모델로 실험을 진행하였다. 실험 결과, 한국어 발화 텍스트에 대해 생성된 모션 표현은 FID 스코어 0.11의 성능으로 나타났으며, 한국어 발화 정보 기반 비언어 표현 정보 생성의 가능성을 보여주었다.

  • PDF

LINK 블록체인을 적용한 차량용 블랙박스 시스템 (Vehicle black box system with LINK blockchain)

  • 안규황;원태연;박상민;장경배;서화정
    • 한국정보통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.1018-1023
    • /
    • 2019
  • 2010년도를 기점으로 차량용 블랙박스는 많은 사람들에게 보급되었음에도 불구하고 차량 사고 현장 기록물이 존재 하지 않거나 가해자가 고의적으로 영상 데이터를 삭제할 경우 피해자가 속출한다. 블록체인의 가장 큰 장점은 데이터 분산 저장으로 데이터 수정 및 삭제가 불가능하다는 점이며, 가장 큰 단점은 민감한 데이터 역시 분산 저장 된다는 점이다. 본 논문은 해당 장점을 이용해 블랙박스에 블록체인을 도입하여 공유 된 영상 데이터로 사고를 입증하며, 블록체인과 private 서버를 연동하여 기존에 블록체인에 저장되는 민감 정보를 private 서버에 저장하여 블록체인의 단점인 개인정보유출 문제를 해결하고자 한다. 또한 LINK 블록체인과 private 서버를 연동하는 코드(깃허브)와 데모영상(유튜브)을 본 논문에 첨부하였다.

포스트 코로나 시대 성남시 도서관의 문화프로그램 운영 방안 연구 (A Study on the Operation Plans for Seongnam Public Library Programs in the Post-COVID-19 Era)

  • 송민선
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.177-186
    • /
    • 2022
  • 본 연구의 목적은 공공데이터 포털에 공개된 성남시 도서관 강좌정보 데이터를 토대로 코로나19 발생 이전과 이후 시점의 프로그램 개설 현황을 분석해 포스트 코로나에 대비한 프로그램 운영 방안을 제안하고자 하는 것이다. 이를 위해, 성남시에서 업로드한 파일의 중복 및 오류 데이터 정제 과정을 거쳐 정리한 1,317건의 데이터를 바탕으로 ①프로그램 주제 및 형태 구분, ②프로그램 대상 이용자 분포, ③프로그램 개설 형태(온라인/오프라인), ④프로그램 개설 시기 및 운영 일수, ⑤이용자들이 선호하는 프로그램의 특성에 대한 분석을 수행하였다. 분석 결과, 코로나19 이전에는 온라인 강좌가 개설된 바 없으나, 2020년 8월 이후부터 온라인 강좌가 본격적으로 개설되었다. 또한 2019년은 영유아 및 초등학생을 대상으로 한 체험활동 강좌가 많았으나 2020년은 성인과 초등학생을 대상으로 한 독서활동 강좌가 증가했다. 온라인 강좌 형태는 온라인 화상회의 프로그램을 이용한 실시간 강의, 유튜브 영상 시청 및 라이브 방송, 네이버 밴드 및 카페 활용 등으로 다양하게 나타났다.

대구·경북 행정통합에 대한 빅데이터 분석 (Big Data Analysis on Daegu-Gyeongbuk Administrative Integration)

  • 송화영;박한우
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.139-148
    • /
    • 2021
  • 이 연구는 온라인 데이터를 활용해 대구·경북 행정통합에 대한 태도와 반응을 살펴보았다. 구체적으로 온라인 기사와 유튜브 영상의 댓글을 통하여 알아보았다. 2020년 1월 1일부터 10월 18일까지 수집한 데이터는 대구경북행정통합공론화위원회 출범 이전과 이후로 나누어 분석했다. 그 결과 다음과 같은 내용을 확인했다. 첫째, 댓글 유형을 시기별로 비교했을 때 공론화위원회 이후 회의론자는 줄어들었고 신념주의자는 증가했다. 둘째, 행정통합에 대해 낙관적 태도를 보여주는 단어를 공론화위원회 출범 이후 확인했다. 셋째, 하위집단분석 결과 이전과 이후 모두 행정통합에 대한 구체적 절차나 방향을 언급하는 단어군이 보이지 않았다. 이는 아직까지 행정통합과 관련한 충분한 정보나 토론논제가 제공되지 않았음을 보여준다. 이 연구에서는 정책당국이 놓칠 수 있는 숨겨진 여론을 찾도록 도와주고, 필요시 즉각적 대응을 할 수 있도록 시사점을 제공하고자 한다.

온톨로지 및 순서 규칙 기반 대용량 스트리밍 미디어 이벤트 인지 (Ontology and Sequential Rule Based Streaming Media Event Recognition)

  • 소치승;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제43권4호
    • /
    • pp.470-479
    • /
    • 2016
  • UCC(User Created Contents) 형태의 다양한 영상 미디어 데이터가 증가함에 따라 의미 있는 서비스를 제공하기 위해 많은 분야에서 활발한 연구가 진행 중이다. 그 중 시맨틱 웹 기반의 미디어 분류에 대한 연구가 진행되고 있지만 기존의 미디어 온톨로지는 메타 정보를 이용하기 때문에 정보의 부재에 따른 한계점이 있다. 따라서 본 논문에서는 영상에서 인지되는 객체를 정하고 그 조합으로 구성된 서술 논리 기반의 온톨로지를 구축하고 영상의 장면에 따른 순서 기반의 규칙을 정의하여 이벤트 인지에 대한 기틀을 제안한다. 또한 증가하는 미디어 데이터에 대한 처리를 위해 분산 인-메모리 기반 프레임워크인 아파치 스파크 스트리밍을 이용하여, 영상 분류를 병렬로 처리하는 방법에 대해 설명한다. 유튜브에서 추출한 영상을 대상으로 대용량 미디어 온톨로지 데이터를 생성하고, 이를 이용하여 제시된 기법에 대한 성능 평가를 진행하여 타당성을 입증한다.

A study on the perception of 3D virtual fashion before and after COVID-19 using textmining

  • Cho, Hyun-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.111-119
    • /
    • 2022
  • 본 연구는 빅데이터 분석을 이용하여 코로나19 전후의 3D가상패션에 대한 인식의 변화를 알아보기 위하여 코로나19 발생 전인 2017년 1월1일부터 발생 이후인 2022년 10월30일까지 소셜미디어 네이버, 다음, 구글, 유튜브에서 추출한 3D 가상패션 관련 주요 단어들을 대상으로 텍스톰을 이용하여 빅데이터 자료를 수집하였다. 수집된 단어는 정제 과정을 거친 후 워드클라우드, 단어의 빈도, 연결중심성, 네트워크 시각화와 CONCOR 분석을 실시하였다. 3D 가상패션을 키워드로 32,461개의 단어를 추출하여 분석한 결과 패션, 가상, 기술의 출현빈도와 중심성이 가장 높게 나타났으며 디지털, 디자인, 의상, 활용, 제조의 출현빈도도 높게 나타났다. 이를 통해 3D 가상패션이 기술의 발달과 더불어 산업 전반에 활용되고 있음을 알 수 있었다. 특히 코로나19 이후 가장 부각되는 주요 단어는 메타버스와 3D 교육으로서 패션산업에서의 요구도가 높게 나타나고 있다.

영상정보를 활용한 소셜 미디어상에서의 가짜 뉴스 탐지: 유튜브를 중심으로 (Fake News Detection on Social Media using Video Information: Focused on YouTube)

  • 장윤호;최병구
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권2호
    • /
    • pp.87-108
    • /
    • 2023
  • Purpose The main purpose of this study is to improve fake news detection performance by using video information to overcome the limitations of extant text- and image-oriented studies that do not reflect the latest news consumption trend. Design/methodology/approach This study collected video clips and related information including news scripts, speakers' facial expression, and video metadata from YouTube to develop fake news detection model. Based on the collected data, seven combinations of related information (i.e. scripts, video metadata, facial expression, scripts and video metadata, scripts and facial expression, and scripts, video metadata, and facial expression) were used as an input for taining and evaluation. The input data was analyzed using six models such as support vector machine and deep neural network. The area under the curve(AUC) was used to evaluate the performance of classification model. Findings The results showed that the ACU and accuracy values of three features combination (scripts, video metadata, and facial expression) were the highest in logistic regression, naïve bayes, and deep neural network models. This result implied that the fake news detection could be improved by using video information(video metadata and facial expression). Sample size of this study was relatively small. The generalizablity of the results would be enhanced with a larger sample size.

통계적 수술 가격 분석을 통한 수술의 재평가 (Surgery Re-evaluation through Statistical Surgery Price Analysis)

  • 최경훈;박경민;이진우;허해동;문유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.415-416
    • /
    • 2023
  • 본 연구는 코로나로 인하여 외국인들도 한국을 방문율이 낮아지고 성형 수술 가격 및 부작용 등 부정적인 측면으로 인해 사람들이 성형 수술을 하기에 꺼리는 상황 속에서 성형 수술을 하는 사람들의 조건, 성형 수술을 하는 이유, 성형 수술 부위, 성형 수술의 부위별 가격을 분석하여 결과를 제시하였다. 성형 수술에 대해 부정적인 견해를 보이는 사람들에게 성형 수술에 대한 견해를 긍정적으로 바꾸고자 한다. 이외에도 한국의 성형 수술이 발전하기 위해서는 한국 외에도 외국의 다양한 수술과 연계 방안 탐색 필요성을 느꼈고 데이터셋, 사이트 외에도 유튜브를 통한 영상 정보를 지속적으로 업그레이드 시켜서 성형 수술의 접근성과 우수성을 알릴 수 있는 기회를 모색한다면 국내뿐만 아니라 세계적으로 한국의 성형 수술에 대해 많은 관심을 보일 것이라고 사료된다.

  • PDF

확장된 기술수용모형을 적용한 유튜브 크리에이터 특성과 채널 접근 요인이 사용자 지속 시청 의도에 미치는 영향 (The Impact of YouTube Creator Characteristics and Channel Access Factors on Users' Continuous Viewing Intentions: An Application of the Extended Technology Acceptance Model)

  • 조재희;박상혁;오승희
    • Journal of Information Technology Applications and Management
    • /
    • 제31권3호
    • /
    • pp.1-18
    • /
    • 2024
  • This study analyzed the impact of YouTube creator characteristics and channel access factors on the intention to continue watching content, noting that the development of the digital media environment has diversified media audiences' content preferences and access routes. Specifically, we analyzed the effects of YouTube creator trustworthiness, attractiveness, familiarity, and social influence, as well as the effects of recommendation services on perceived usefulness, perceived ease, and perceived enjoyment. The study found that creator credibility and recommendation service had a positive impact on the perceived usefulness of content, while intimacy and charm were important factors in increasing the easy of use and playfulness of content. These perceived usefulness, ease, and playfulness also had a strong positive impact on users' intention to continue watching the channel. This suggests that trust and intimate relationships with creators and appropriate content recommendations play an important role in increasing user satisfaction and channel persistence. The significance of this study's analysis of creator and channel access factors based on the extended technology acceptance model is that it shows the potential for extending and applying the existing technology acceptance model to the digital content environment.