• 제목/요약/키워드: subtitles

검색결과 67건 처리시간 0.021초

효과음 자막 생성을 위한 딥러닝 기반의 다중 사운드 분류 (A Multiclass Sound Classification Model based on Deep Learning for Subtitles Production of Sound Effect)

  • 정현영;김규미;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.397-400
    • /
    • 2020
  • 본 논문은 영화에 나오는 효과음을 자막으로 생성해주는 자동자막생성을 제안하며, 그의 첫 단계로써 다중 사운드 분류 모델을 제안하였다. 고양이, 강아지, 사람의 음성을 분류하기 위해 사운드 데이터의 특정벡터를 추출한 뒤, 4가지의 기계학습에 적용한 결과 최적모델로 딥러닝이 선정되었다. 전처리 과정 중 주성분 분석의 유무에 따라 정확도는 81.3%와 33.3%로 확연한 차이가 있었으며, 이는 복잡한 특징을 가지는 사운드를 분류하는데 있어 주성분 분석과 넓고 깊은 형태의 신경망이 보다 개선된 분류성과를 가져온 것으로 생각된다.

문서구조 추출기법을 이용한 엔지니어링 문서 텍스트 정보의 XML 변환 (Transformation of Text Contents of Engineering Documents into an XML Document by using a Technique of Document Structure Extraction)

  • 이상호;박준원;박상일;김봉근
    • 대한토목학회논문집
    • /
    • 제31권6D호
    • /
    • pp.849-856
    • /
    • 2011
  • 본 연구에서는 교량의 구조계산서와 같이 여러 종류의 머리기호를 사용하며 제목의 계층구조가 복잡한 형식을 띄는 엔지니어링 문서의 비구조화된 텍스트 정보를 제목의 계층 구조에 따른 준구조화된 XML 문서로 변환시키는 방법을 제시한다. 텍스트 정보로부터 제목의 계층구조를 자동으로 추출하기 위해 문서구조분석 방법의 하나인 문서구조추출 기법을 이용하는 방법을 개발하였으며, 특히 개조식 구문의 식별방법을 개발하여 구조계산서 문서 계층구조의 제목추출과정 및 계층구분의 전체 정확도를 향상시킬 수 있는 방법을 제시하였다. 제시된 방법에 따른 응용모듈을 개발하였으며, 총 40개의 교량 구조계산서를 대상으로 그 성능을 평가하였다. 먼저, 20개의 강거더 상부 구조계산서를 대상으로 선행 연구결과와 비교하여 본 연구에서 개발된 응용모듈의 정확성과 신뢰도가 향상됨을 보였다. 또한, 다른 구조형식에 대한 구조계산서 20개에 대하여 개발된 모듈의 적용성을 평가하였다. 그 결과 본 연구에서 제안한 방법에 의한 문서 계층구조 분석의 최종 정확도는 평균 99% 수준 이상을 나타내고, 표준편차는 1.52로 나타나 본 연구에서 제시된 방법이 다양한 형식의 머리기호를 사용하여 제목을 구분하는 여러 엔지니어링 문서에도 적용이 가능함을 보였다.

중국 인플루언서들의 K-pop 짧은 동영상 수용에 영향을 미치는 요인에 관한 연구 - 중국 '틱톡' 사용자를 중심으로 (A Study on the Factors Influencing the Acceptance of K-pop Short-form Video Created by Chinese Influencers - Focusing on Chinese TikTok Users)

  • 유전전;유세경
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.28-36
    • /
    • 2022
  • 본 연구는 짧은 동영상 플랫폼 틱톡에서 중국인 인플루언서들이 한국 K-pop 노래와 댄스를 어떠한 방식으로 재창작하며, 어떠한 변형요소들이 틱톡 수용자들의 반응 - '좋아요수', '댓글수', '공유수'에 영향을 미치는지를 살펴보기 위해 틱톡 K-pop 커버영상 284개를 K-pop 원곡과 비교하여 이미지와 언어 유사성, 수용자 참여 유도 정도, 중국어로 가사/자막 번역된 정도, 유료광고 노출 여부를 분석하였고 추가로 영상길이, 인플루언서 명성 요인을 분석하여 변형요인과 함께 수용자 반응에 미치는 영향력을 분석하였다. 분석결과, 상대적으로 수동적인 수용자 반응으로 판단되는 '좋아요수'에는 인플루언서의 명성만 유의한 영향을 보였지만, 보다 능동적인 반응으로 판단되는 '댓글수'와 '공유수'에는 재창작으로 활용한 변형요소들이 유의미한 영향을 미친 것으로 나타났다. 수용자는 인플루언서가 이미지 측면에서 가수와 닮지 않다고 인식될수록 댓글을 더 많이 달아주며, 중국어로 번역된 가사나 자막보다 한국어로 표현한 것이 댓글과 공유를 더 많이 만들어내었다. 본 연구는 짧은 동영상을 활용한 K-pop 콘텐츠의 해외 확산에 있어 로컬 인플루언서들에 의해 재창작되는 K-pop 콘텐츠의 특성에 따른 수용자 반응을 구체적으로 분석함으로서, K-pop 확산을 위한 인플루언서들의 역할의 필요성을 확인하였다는 데 의미가 있다.

TV 다큐멘터리에 표현된 조선시대 미용법 분석 -재매개성 이론을 중심으로- (The Research is about a TV Documentary on the Joseon Dynasty's Beauty Makeup -Focus is on the Re-mediation-)

  • 방기정
    • 패션비즈니스
    • /
    • 제19권5호
    • /
    • pp.48-62
    • /
    • 2015
  • The purpose of the study was to investigate how the Classification of the Joseon Dynasty's Beauty characteristics were expressed in a TV documentary focusing ona Re-mediation theory. The methods of study comprised of library research, Internet search, and using TV documentary program case studies. The work this Researcher makeup in the manufacture from the documentary in which the methods the Joseon. Dynasty expressed were selected. The literature, and preceding research, were referred to as a way to help organize the Joseon Dynasty's 'gi-saeng Hwang Jin-Hee', 'woman of royal family', and way of make-up of 'sadae-bu lady'. The TV documentary programs selected were 'MBC special' and '2 parts of channel A documentary special'. First, the improvisation of nature and simultaneity expressed in the Joseon Dynasty's usage of make-up is shown through the interview form reflecting the make-up tools and age direction of the scenes or expert. Second, the interactivity and reality are well seen through the row equivalent in which the model seems to directly use the dressing demonstration of the expert and cosmetics material. Third, the cultural expandability and unexpectedness show through the production of situations which are viewed from the explanation of the narration and letter subtitles and drama.

Designing a large recording script for open-domain English speech synthesis

  • Kim, Sunhee;Kim, Hojeong;Lee, Yooseop;Kim, Boryoung;Won, Yongkook;Kim, Bongwan
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.65-70
    • /
    • 2021
  • This paper proposes a method for designing a large recording script for open domain English speech synthesis. For read-aloud style text, 12 domains and 294 sub-domains were designed using text contained in five different news media publications. For conversational style text, 4 domains and 36 sub-domains were designed using movie subtitles. The final script consists of 43,013 sentences, 27,085 read-aloud style sentences, and 15,928 conversational style sentences, consisting of 549,683 tokens and 38,356 types. The completed script is analyzed using four criteria: word coverage (type coverage and token coverage), high-frequency vocabulary coverage, phonetic coverage (diphone coverage and triphone coverage), and readability. The type coverage of our script reaches 36.86% despite its low token coverage of 2.97%. The high-frequency vocabulary coverage of the script is 73.82%, and the diphone coverage and triphone coverage of the whole script is 86.70% and 38.92%, respectively. The average readability of whole sentences is 9.03. The results of analysis show that the proposed method is effective in producing a large recording script for English speech synthesis, demonstrating good coverage in terms of unique words, high-frequency vocabulary, phonetic units, and readability.

청각장애인의 이스포츠 중계방송 및 게임 스트리머 콘텐츠 시청 편의성 증대를 위한 자막 동기화 보정 연구 (A Study on subtitle synchronization calibration to enhance hearing-impaired persons' viewing convenience of e-sports contents or game streamer contents)

  • 신동환;김정수;김창원
    • 한국게임학회 논문지
    • /
    • 제19권1호
    • /
    • pp.73-84
    • /
    • 2019
  • 본 연구는 e-sports 중계 콘텐츠 및 게임 스트리머 콘텐츠에 대한 청각장애인들의 시청 편의성을 위해 제공되는 자막의 서비스의 품질을 높이는 방안을 제시하기 위한 연구이다. 일반적으로 방송 콘텐츠의 자막 파일은 속기사에 의해 방송 중에 수동 작성되므로 원본 콘텐츠 대비 3~5초의 자막표시 지연이 필연적이다. 이에, 본 연구에서는, 음성인식 기술을 활용한 동기화 자동 보정 시스템의 구성을 제안하였다. 또한 이 시스템을 활용한 콘텐츠 적용실험을 진행하였으며 최종 결과로 자막 데이터의 동기화 오차 시간을 1초 이내로 줄일 수 있음을 확인 하였다.

A Blocking Distribution Channels to Prevent Illegal Leakage in Supply Chain using Digital Forensic

  • HWANG, Jin-Hee
    • 유통과학연구
    • /
    • 제20권7호
    • /
    • pp.107-117
    • /
    • 2022
  • Purpose: The scope of forensic investigations serves to identify malicious activities, including leakage of crucial corporate information. The investigations also identify security lapses in available networks. The purpose of the present study is to explore how to block distribution channels to protect illegal leakage in supply chain through digital forensic method. Research design, data and methodology: The present study conducted the qualitative textual analysis and its data collection process entails five steps: identifying and collecting data, determining coding categories, coding the content, checking validity and reliability, and analyzing and presenting the results. This methodology is a significant research method due to its high quality of previous resources. Results: Applying previous literature analysis to the results of this study, the author figured out that there are four solutions as an evidences to block distribution channels, preventing illegal leakage regarding company information. The following subtitles show clear solutions: (1) Communicate with Stakeholders, (2) Preventing and addressing illegal leakage, (3) Victims of Data Breach, (4) Focusing Solely on Technical Teams. Conclusion: There are difficult scenarios that continue to introduce difficult questions surrounding engagement with digital evidence. Consequently, it is important to enhance data handling to provide answers for organizations that suffer due to illegal leakages of sensitive information.

Designing Online Public Education Contents in Korean Medicine Using the Rapid-Prototyping Instructional Systems Design Model

  • Jiseong Hong
    • 대한한의학회지
    • /
    • 제43권4호
    • /
    • pp.74-88
    • /
    • 2022
  • Objectives: The purpose of this study is to design Korean-themed online public education content in Korean medicine using rapid prototyping instructional systems design (RPISD). This study presents cases of developing and converting face-to-face general education programs designed to increase the interest in and understanding of Korean medicine for the public into online programs within a short timeframe. Methods: This qualitative study is design and development research, which used the RPISD model to analyze the available resources utilized in the rapid development of public educational content and propose systematization and optimization measures by analyzing the needs of clients, learners, and the environment. The <Treasured Mirror of Eastern Medicine(DUBG)Open Course> was developed according to the model procedure, which involved needs analysis, development of course materials and manuscript, and storyboard creation and its filming and editing. Usability tests were conducted at all stages, and the opinions of clients, instructors, experts, and instructional designers were accommodated and reflected at each stage. Results: Using the rapid prototyping model, <Treasured Mirror of Eastern Medicine(DUBG)Open Course> was organized into five classes of 20 minutes each. Each class was developed in Korean and included English, Chinese, and Japanese subtitles in addition to Korean under the cooperative instructional design among clients, subject-matter experts, instructional designer and learners. Conclusion: The cooperative instructional design of stakeholders is significant in developing Korean medicine public education content online through extensive interaction and feedback from stakeholders in the early stage of educational content development.

사용자 큐레이션을 위한 빅데이터 영상 분석 기법 비교 (Comparison of big data image analysis techniques for user curation)

  • 이현섭;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.563-565
    • /
    • 2021
  • 최근 증가하는 콘텐츠 제공 서비스의 가장 큰 특징은 콘텐츠의 시간의 흐름에 따른 콘텐츠 증가량이 매우 크다는 것이다. 이에 따라 사용자 큐레이션의 중요성이 같이 증가하고 있으며 이를 구현하기 위한 여러 가지 기법들이 사용되고 있다. 본 논문에서는 영상 추천을 위한 기법 중 음성데이터 및 자막을 활용한 분석 기법과 키프레임 추출 기반 영상 비교 기법을 실제 빅데이터 영상 콘텐츠를 대상으로 구현, 적용한 결과에 대하여 비교한다. 또한, 비교결과를 통해 각 분석 기법이 적용될 수 있는 영상 콘텐츠 환경에 대하여 제안한다.

  • PDF

도서관 모바일 애플리케이션 접근성 평가에 관한 연구 (Evaluation of the Accessibility of Library Mobile Applications)

  • 장보성;남영준
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.25-44
    • /
    • 2014
  • 본 연구에서는 안전행정부의 모바일 애플리케이션 접근성 지침을 기반으로 국내 도서관 모바일 애플리케이션의 접근성을 평가한 후, 평가결과를 도출하였다. 연구의 신뢰성을 높이고자 시각장애인과 비장애인이 교차로 접근성을 평가하였다. 연구결과 첫째, 대체 텍스트 제공은 21개 도서관(31%)만이 제공하고 있으며, 메인화면, 자료검색, 정보안내 등 모든 영역에서 대체 텍스트를 제공하는 도서관은 1개관뿐이다. 둘째, 국내 도서관 모바일 애플리케이션은 텍스트 위주의 콘텐츠가 대부분이며, 모바일 애플리케이션 지침에서 권고 또는 준수 기준으로 제시하는 자막, 수화 등의 제공, 깜박거림의 사용제한, 배경음 사용금지 등은 연관성이 떨어졌다. 셋째, 장애인 이용자가 도서관 모바일 애플리케이션을 이용하고자 할 때 필요한 대체 텍스트 제공, 초첨 이동, 운영체계 접근성 기능 지원, 누르기 동작 지원, 컨트롤 간 충분한 간격 유지, 알림 기능은 반드시 준수해야 한다. 넷째, 장애인들이 도서관 모바일 애플리케이션을 자유롭게 이용할 수 있도록 도서관 모바일 애플리케이션 접근성 기준 개발 등의 후속연구가 필요하다.