• 제목/요약/키워드: YouTube data

검색결과 189건 처리시간 0.023초

KMSAV: Korean multi-speaker spontaneous audiovisual dataset

  • Kiyoung Park;Changhan Oh;Sunghee Dong
    • ETRI Journal
    • /
    • 제46권1호
    • /
    • pp.71-81
    • /
    • 2024
  • Recent advances in deep learning for speech and visual recognition have accelerated the development of multimodal speech recognition, yielding many innovative results. We introduce a Korean audiovisual speech recognition corpus. This dataset comprises approximately 150 h of manually transcribed and annotated audiovisual data supplemented with additional 2000 h of untranscribed videos collected from YouTube under the Creative Commons License. The dataset is intended to be freely accessible for unrestricted research purposes. Along with the corpus, we propose an open-source framework for automatic speech recognition (ASR) and audiovisual speech recognition (AVSR). We validate the effectiveness of the corpus with evaluations using state-of-the-art ASR and AVSR techniques, capitalizing on both pretrained models and fine-tuning processes. After fine-tuning, ASR and AVSR achieve character error rates of 11.1% and 18.9%, respectively. This error difference highlights the need for improvement in AVSR techniques. We expect that our corpus will be an instrumental resource to support improvements in AVSR.

텍스트 마이닝을 활용한 Youtube 광고에 대한 소비자 인식 분석 (A Study on Analysis of consumer perception of YouTube advertising using text mining)

  • 엄성원
    • 경영과정보연구
    • /
    • 제39권2호
    • /
    • pp.181-193
    • /
    • 2020
  • 본 연구는 최근에 이슈가 되고 있는 텍스트마이닝을 활용하여 소비자 인식을 분석한 연구이다. 이를 위해 삼성갤럭시 Youtube 광고에 대한 소비자 리뷰 분석을 통해 소비자들이 가지고 있는 삼성 갤럭시에 대한 인식을 분석하였다. 분석을 위해 Youtube 광고의 소비자 리뷰 1,819개를 추출하였다. 이를 데이터 전처리 과정을 거쳐 광고와 관련된 키워드를 명사, 형용사, 부사로 분류하여 추출하였다. 이후 빈도 분석 및 감성 분석을 실시하였으며 마지막으로 구조적 등위성 분석을 통한 군집화를 실시하였다. 본 연구 결과를 간략히 요약하면 다음과 같다. 첫 번째 가장 많이 언급된 단어는 갤럭시 노트(n=217), 좋음(n=135), 펜(n=40), 기능(n=29) 등으로 나타났다. 이는 소비자들이 광고를 통해 "갤럭시 노트", "좋음", "펜", "기능"은 삼성 핸드폰 제품에 대해 기능적인 면이 좋고, 노트 펜에 대해서 긍정적으로 높게 인식한다고 판단할 수 있다. 추가적으로 "삼성페이", "혁신", "디자인", "아이폰" 등에 대한 인식은 삼성 핸드폰에 대해 혁신적인 디자인과 삼성페이의 기능적인 면에서 상당히 좋은 평가를 하는 것을 알 수 있다. 두 번째, Youtube 광고에 대한 감성분석 결과이다. 감성 분석 결과 감성강도 비율이 긍정(75.95%)로 부정(24.05%)보다 높게 나타났다. 이는 소비자들이 삼성 갤럭시 모바일폰에 대해 긍정적으로 인식하고 있음을 의미한다. 감성 키워드 분석 결과 긍정키워드의 경우는 "좋다", "후하다", "혁신적", "최고다", "빠르다", "예쁘다" 등으로 나타났으며, 부정키워드의 경우는 "겁난다", "울고싶다", "불편", "아쉽다", "싫다" 등이 추출되었다. 본 연구이 시사점은 기존 광고에 대한 소비자 인식 연구를 살펴보면 대부분 정량적 분석 방법에 의한 연구가 대부분이었다. 본 연구에서는 광고에 대한 정량적 연구 방법에서 탈피하여 정성적 연구를 통해 소비자 인식분석을 시도하였다. 이는 향후 연구에도 많은 영향을 미칠 것으로 판단되며, 정성적 연구를 통해 소비자 인식 연구의 출발점이 될 것으로 확신한다.

Social media comparative analysis based on multidimensional scaling

  • Lee, Hanjun;Suh, Yongmoo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.665-676
    • /
    • 2014
  • As social media draws attention as a business tool, organizations, large or small, are trying to exploit social media in their business. However, lack of understanding the characteristics of each social media led them to develop a naive strategy for dealing with social media. Thus, this study aims to deepen the understanding by comparatively analyzing how social media users perceive (the image of) each social media. Facebook, Twitter, YouTube, Blogs, Communities and Cyworld were chosen for our study and data from 132 respondents were analyzed using multidimensional scaling technique. The results show that there are meaningful differences in users' perception of social media attributes, which are grouped into four; information feature, motivation, promotion tool, usability. It is also analyzed whether such differences can be found between male and female users. (Such differences are also analyzed in both male and female users' perceptions.) Further, we discuss some implications of the research results for both practitioners and researchers.

A Study on Open API of Securities and Investment Companies in Korea for Activating Big Data

  • Ryu, Gui Yeol
    • International journal of advanced smart convergence
    • /
    • 제8권2호
    • /
    • pp.102-108
    • /
    • 2019
  • Big data was associated with three key concepts, volume, variety, and velocity. Securities and investment services produce and store a large data of text/numbers. They have also the most data per company on the average in the US. Gartner found that the demand for big data in finance was 25%, which was the highest. Therefore securities and investment companies produce the largest data such as text/numbers, and have the highest demand. And insurance companies and credit card companies are using big data more actively than banking companies in Korea. Researches on the use of big data in securities and investment companies have been found to be insignificant. We surveyed 22 major securities and investment companies in Korea for activating big data. We can see they actively use AI for investment recommend. As for big data of securities and investment companies, we studied open API. Of the major 22 securities and investment companies, only six securities and investment companies are offering open APIs. The user OS is 100% Windows, and the language used is mainly VB, C#, MFC, and Excel provided by Windows. There is a difficulty in real-time analysis and decision making since developers cannot receive data directly using Hadoop, the big data platform. Development manuals are mainly provided on the Web, and only three companies provide as files. The development documentation for the file format is more convenient than web type. In order to activate big data in the securities and investment fields, we found that they should support Linux, and Java, Python, easy-to-view development manuals, videos such as YouTube.

SNS 마케팅을 위한 제품홍보영상 제작 연구 (Promotional Movie Production for the SNS Marketing)

  • 유왕윤
    • 한국콘텐츠학회논문지
    • /
    • 제13권11호
    • /
    • pp.579-586
    • /
    • 2013
  • SNS 마케팅에 최적화된 영상은 어떤 것인지 알아보기 위해 동일한 제품의 홍보영상을 각각 다른 Concept로 제작하였다. 제품의 디자인을 Teaser 형식으로 보여주는 'Feature Movie'와 패러디 기법으로 제품의 USP를 경쟁사와 직접 비교시킨 'Viral Movie'가 그것이다. 이 두 영상을 YouTube에 게재, 시청자 Feedback을 분석하였다. 그 결과 Viral 영상의 Views와 Shares가 모두 상대적으로 높게 나타났다. 이러한 분석결과를 통해 시청자들은 영상미에 비중을 둔 'Feature Movie'보다 패러디를 통해 재미를 강조한 'Viral Movie'에 더 많은 관심을 보였고 또 더 많이 공유하였다. 이와 같이 SNS 마케팅을 위한 Viral 영상은 제작물이 배포되는 시점의 이슈를 반영하고, Concept를 분명하게 드러내며, 시청자의 시선을 끌 수 있는 Impact가 필요함을 확인할 수 있었다.

문화콘텐츠 상품 확산의 시·공간적 특성 -싸이의 "강남스타일" 뮤직비디오를 중심으로- (Spacio-temporal Characteristics of Cultural Contents Diffusion: The Case of PSY's "Gangnam Style" Music Video)

  • 이금숙;김호성
    • 한국경제지리학회지
    • /
    • 제18권2호
    • /
    • pp.224-241
    • /
    • 2015
  • 본 연구의 목적은 문화콘텐츠 상품의 소비 및 확산에 나타나는 시공간적 특징을 밝히는 것이다. 이를 위하여 본 연구에서는 최근 전 세계적 인기를 누리며 확산되고 있는 싸이의 "강남스타일" 뮤직비디오의 확산과정을 분석한다. 특히 싸이의 "강남스타일"이 유튜브에 탑재된 이후 4~6개월간의 지역별 유튜브 조회 수와 트윗 자료 및 구글 검색 수를 바탕으로 이들이 확산되어 나가는 과정의 시공간적 특성을 파악 한다. 분석 결과 뮤직비디오와 같은 문화콘텐츠 상품의 경우 물리적인 공간 거리와 무관할 수 있는 온라인 매체를 통한 확산의 경우도 지역에 따라 전파되는 시점과 전개 과정이 상이함을 확인하였다. 특히 언어, 문화적 연관성 및 한류에 대한 호의성 및 배타성 등으로 정의될 수 있는 문화적 거리가 이러한 문화 상품의 확산에 영향을 미치는 것으로 판단된다.

  • PDF

인플루언서 속성 분석 기반 추천 시스템 (Influencer Attribute Analysis based Recommendation System)

  • 박정련;박지원;김민우;오하영
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1321-1329
    • /
    • 2019
  • 소셜 정보망의 발달로 마케팅의 방법도 다양하게 변화되고 있다. 기존의 유명인, 경제적 지원 기반의 성공적인 마케팅방법론과 달리, 최근 인플루언서 기반 유튜브 마케팅이 큰 대세를 이루고 있다. 본 논문 에서는 처음으로 유튜브 양적 정보 및 댓글분석 기반 다각도 질적 분석을 활용하여 54개 이상의 유튜브 채널에서 인플루언서 특징을 추출하고 대표적인 주제들을 모델링하여 개인 맞춤형 영상 만족도 극대화는 물론 기업체가 새로운 아이템을 마케팅 할 때 기존의 인플루언서 특징을 참고하여 새로운 아이템의 영상을 제작하고 배포함으로써 성공적인 홍보 효과를 누릴 수 있도록 보조 수단 제공을 목적으로 한다. 유튜브 채널 별 다양한 영상의 모든 댓글을 각 문서로 가정하고 TF-IDF 및 LDA알고리즘을 적용하여 성능 극대화 향상을 보였다.

K-Pop 보이 그룹의 패션디자인 및 스타일 연구 - 방탄소년단, 세븐틴의 음악 방송 프로그램 및 유튜브 영상을 중심으로 - (A Study on the Fashion Design and Style of K-Pop Boy Groups - Focusing on the Music Programs and YouTube Videos of BTS and Seventeen -)

  • 왕롄카이;김윤경;이경희
    • 한국의류산업학회지
    • /
    • 제23권6호
    • /
    • pp.726-743
    • /
    • 2021
  • This study tried to examine the fashion design and style of representative K-Pop boy groups BTS and SEVENTEEN appearing on music shows. The data collection was conducted on 4 music programs(Inkigayo, Music Bank, Show! Music Core, M COUNTDOWN) and YouTube(www.youtube.com) for each boy who worked for 5 years from January 2016 to December 2020. Result analysis utilized the stage scenes and music videos of the title songs of BTS and Seventeen. As for the fashion design and style characteristics of BTS, it was found that overall, the color, pattern, and decoration of the bottom were minimized, and the style was changed mainly by the top of the denim pants. As for Seventeen's fashion design and style characteristics, it was analyzed that plain simple slacks, bright and modest chromatic colors, and geometric and stylistic patterns with street retro sensibility were relatively emphasized, and natural and romantic images appeared a lot. As a result of examining the differences in fashion design and style characteristics between BTS and Seventeen, significant differences were found in color, tone, color scheme, material type, material combination, detail, trimming, pattern, accessories, and fashion image. Overall, it was found that both groups minimized the use of decorative elements such as patterns, details, and trimmings.

빅데이터 분석을 이용한 소셜 미디어의 부정적 구전 파급력에 관한 연구: 공급사슬 리스크 관점에서 (A Study on Negative Word-of-mouth Virality of Social Media Using Big Data Analysis: From the Supply Chain Risk's Perspective)

  • 정의범
    • 한국산업정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.163-176
    • /
    • 2022
  • 비즈니스 생태계의 불확실성이 증가함에 따라 공급사슬 내에서 야기는 되는 리스크의 종류도 매우 복잡하고 다양해 지고 있다. 특히 최근 정보통신기술의 발달로 기존 기업이 직면하던 전통적인 공급사슬 리스크 요인 이외에 새로운 리스크 요인을 고려할 필요가 있다. 대표적으로 소셜 미디어를 통한 부정적 구전을 예를 들 수 있다. 이에 본 연구는 대표적인 소셜 미디어인 유튜브(YouTube) 통해 제조 기업을 대상으로 부정적 구전의 파급력에 대해서 연구하였다. 보다 구체적으로는 부정적 구전의 제작자의 사회적 자본이 부정적 구전의 파급력에 어떤 영향을 주는 살펴보고, 그 과정에서 동영상의 부정적 감정이 어떤 역할을 하는지 연구하였다. 그 결과 부정적 구전 생성자의 사회적 자본은 부정적 구전의 규모와 속도에 영향을 주며, 나아가 동영상의 부정적 감정 단어는 동영상 제작자의 사회적 자본과 부정적 구전의 규모에 있어 조절효과를 보였다.

MEC 기반 비디오 캐시 시나리오를 위한 시계열 사용자 요청 패턴 데이터 세트 분석 (Analysis of time-series user request pattern dataset for MEC-based video caching scenario)

  • 왈리드 아크바르;아팍 모하마드;송왕철
    • KNOM Review
    • /
    • 제24권1호
    • /
    • pp.20-28
    • /
    • 2021
  • 소셜 미디어 애플리케이션 및 모바일 장치의 광범위한 사용으로 인해 데이터 트래픽이 지속해서 증가하고 있다. 소셜 미디어 애플리케이션은 끝없이 많은 양의 멀티미디어 트래픽, 특히 비디오 트래픽을 생성하고 있다. YouTube, Daily Motion 및 Netflix와 같은 많은 소셜 미디어 플랫폼이 생성하는 것이다. 이러한 플랫폼에서는 다른 비디오와 비교하여 몇 개의 인기 비디오가 여러 번 요청된다. 이러한 인기 있는 비디오는 지속적인 사용자 요구 사항을 충족하기 위해 사용자 주변에 캐시해야 한다. MEC는 일관된 사용자 요구와 사용자 근접 캐시를 위한 필수 패러다임으로 부상했다. 시간에 따라 사용자 요구 패턴이 어떻게 달라지는지를 이해하는 것이 과제이다. 본 논문은 공개 데이터셋인 MovieLens 20M, MovieLens 100K, The Movies Dataset 3개를 분석하여 시간에 따른 사용자 요청 패턴을 찾는다. 모든 데이터셋의 시간별, 일별, 월별 및 연간 추세를 확인할 수 있다. MEC 기반 비디오 캐시 시나리오에서 사용자 요청 패턴을 분석 및 생성함으로써, 많은 연구에서 사용될 수 있을 것이다.