• 제목/요약/키워드: 인공지능 음악

검색결과 35건 처리시간 0.03초

1 인 미디어 창작자를 위한 딥러닝 기반 작곡 어플리케이션 (Music Composition Application with Deep Learning for content creators)

  • 김보경;윤소지;이승희;임예진;유견아;임성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1148-1151
    • /
    • 2021
  • 1 인 미디어 산업의 성장으로 다양한 콘텐츠 제작의 증가와 함께 영상의 분위기를 좌우하는 BGM 의 수요도 급증하고 있다. 그러나 무료 음원은 한정되어 있으며 이미 많은 영상에 쓰여 시청자에게 흔한 느낌을 준다. 특히 MCN 에 소속되지 않은 콘텐츠 크리에이터들은 개성 있고 영상에 어울리는 음원 확보에 어려움을 겪고 있다. 본 연구는 이러한 콘텐츠 제작 환경을 개선하기 위해 창작자가 직접 녹음하거나 악보를 스캔해 자신만의 음원을 제작할 수 있는 웹 애플리케이션 '플랫'을 제안한다. 본 연구를 통해 콘텐츠 크리에이터들은 독창적이고 풍성한 콘텐츠를 만들 수 있으며, 음악적 숙련도와 관계없이 쉽게 음원을 만들 수 있어 작곡에 대한 접근성이 좋아질 것으로 보인다. 또한, 딥러닝을 활용해 음악을 창작함으로써 인공지능 작곡 분야를 활성화하고 디지털 음악 시장의 새로운 분야를 개척하는 데 이바지할 것으로 기대한다.

영화 장르 메타데이터 생성을 위한 오디오 활용 방법에 대한 연구 (A Research on the Audio Utilization Method for Generating Movie Genre Metadata)

  • 용성중;박효경;유연휘;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.284-286
    • /
    • 2021
  • 지속적으로 인터넷 및 디지털의 발전으로 많은 양의 미디어 데이터를 저장하고 온라인을 통해 개인에게 맞춤형 서비스를 제공하는 플랫폼이 등장하고 있다. 이러한 서비스를 제공하는 업체들은 미디어의 소비를 촉진 시키기 위해 개인 취향에 맞는 영화를 추천한다. 각 업체에서는 사용자가 선호할 미디어 추천을 위해 다양한 알고리즘에 대해 많은 연구를 하고 있다. 영화는 액션, 멜로, 공포, 드라마 등으로 장르를 구분하고 있으며, 영화의 오디오(음악,효과,음성)는 영화를 구성하는 중요한 제작 요소로 자리잡고 있다. 본 연구에서는 영화예고편을 바탕으로 장르별 오디오를 추출하고, 장르별 오디오의 공통점을 확인 후 인공지능의 지도학습을 통해 영화 장르를 구별하고 추후 메타데이터 생성을 위한 활용방안을 제안하고자 한다.

  • PDF

추천 분야에서의 지식 그래프 기반 어텐션 네트워크 모델 성능 향상 기법 연구 (A Study on Augmentation Method for Improving the Performance of the Knowledge Graph Based Attention Network Model)

  • 김경태;민찬욱;김진우;안진현;전희국;임동혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.603-605
    • /
    • 2022
  • 추천시스템은 개개인의 성향에 따른 맞춤화 추천이 가능하기 때문에 음악, 영상, 뉴스 등 많은 분야에서 관심을 받고 있다. 일반적인 추천시스템 모델은 블랙박스 모델이기 때문에 추천 결과에 따른 원인 도출을 할 수 없다. 하지만 XAI 의 모델은 이러한 블랙박스 모델의 단점을 해결하고자 제안되었다. 그 중 KGAT 는 Attention Score 를 기반으로 추천 결과에 따른 원인을 알 수 있다. 이와 같은 AI, XAI 등의 딥 러닝 모델에서 각각의 활성화 함수는 상황에 따라 상이한 성능을 나타낸다. 이러한 이유로 인해 데이터에 맞는 활성화 함수를 적용해보는 다양한 시도가 필요하다. 따라서 본 논문은 XAI 추천시스템 모델인 KGAT 의 성능 개선을 위해 여러 활성화 함수를 적용해보고, 실험을 통해 수정한 모델의 성능이 개선됨을 보인다.

Raspberry Pi를 이용한 스마트 미러 개발 (Development of Smart Mirror System based on the Raspberry Pi)

  • 린즈밍;김철원
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.379-384
    • /
    • 2021
  • 사람들이 인공 지능 분야를 계속 연구하고 제안 한다. 그 때문에 상대적으로 성숙한 인공지능 기술이 일상생활에 더 많이 활용된다. 평소 어디서나 볼 수 있는 생활용품들이 지능화되기 시작하고 있다. 그러나 미러는 생활용품에서 가장 많이 쓰이는 용품 이다. 그 인공 지능 기술을 미러에 적용하는 데 가장 적합 하다. 이 논문의 연구 결과는 라즈베리 pi를 기반으로 설계된 스마트 미러가 날씨, 온도, 인사를 표시하고, 인간-미러 상호작용 기능을 가지고 있다. 본 논문 연구방법은 라즈베리 pi 3B +를 핵심 컨트롤러로 사용하고 Google 어시스턴트를 지능형 제어로 사용한다. 라즈베리 pi의 자체 WiFi를 통해 네트워크에 연결하면 미러가 자동으로 시간, 날씨 및 뉴스 정보 기능을 표시하고 업데이트 할 수 있다. 키워드를 사용하여 Google 어시스턴트를 깨운 다음 미러를 제어하여 음악을 재생하고 시간을 상기시키는 등의 작업을 할 수 있다. 스마트 미러 음성 상호 작용의 기능을 실현한다. 또한 이 연구에 사용 된 하드웨어는 모두 모듈식 어셈블리이고, 나중에 사용자가 직접 조립하는 것이 편리 하며. 저렴한 가격으로 시장 진흥에 적합하다.

음악 구성요소의 감정 구조 분석에 기반 한 시각화 연구 (Sound Visualization based on Emotional Analysis of Musical Parameters)

  • 김혜란;송은성
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.104-112
    • /
    • 2021
  • 본 연구에서는 음악의 속성인 구성 요소 데이터들과 심리학의 감정 차원 모델을 기반으로 감정분석을 하였고 그 결과를 조형예술에서의 시각화 규칙에 적용하였다. 음악 속성 데이터를 활용한 기존의 연구들에서는 사람들이 원하는 음악을 분류, 검색, 추천할 수 있도록 하는 보다 실용적인 목적을 가진 사례들이 많았다. 본 연구에서는 특히 음원 분석에 따른 음악의 감정분석을 기반으로 사운드 데이터가 예술작품 창작의 재료가 되어 심미적 표현에 활용될 수 있도록 하는 것에 집중하였다. 음악의 시각화 연구를 위해서는 예술이 가지는 중요한 속성인 감정표현을 가능하게 하는 방법이 필요하였고 이를 위해 잘 구조화된 음악의 기본 속성 분류 및 감정 정보의 분류 체계를 마련하였다. 그리고 조형요소의 형태, 색상, 애니메이션을 통해 음악 요소들에 대해 감정을 기반으로 세분화 된 입력 매개 변수들을 반영하여 시각화하는 작업을 수행하였다. 본 연구는 음악 시각화를 활용하는 작가들에게 기초 자료로 활용될 수 있을 것이다. 또한 감정분석에 기반 한 음악 구성요소와 시각화 매칭을 위한 분석 방법 및 작품 결과는 향후 인공지능 기반의 자동화 된 시각화 연구의 기반이 될 수 있을 것이다.

메타버스 대화의 몰입감 증진을 위한 대화 감정 기반 실시간 배경음악 시스템 구현 (Real-time Background Music System for Immersive Dialogue in Metaverse based on Dialogue Emotion)

  • 김기락;이상아;김나현;정문열
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권4호
    • /
    • pp.1-6
    • /
    • 2023
  • 메타버스 환경에서의 배경음악은 사용자의 몰입감을 증진시키기 위해 사용된다. 하지만 현재 대부분의 메타버스 환경에서는 사전에 매칭시킨 음원을 반복 재생하며, 이는 빠르게 변화하는 사용자의 상호작용 맥락에 어울리지 못해 사용자의 몰입감을 저해시키는 경향이 있다. 본 논문에서는 보다 몰입감 있는 메타버스 대화 경험을 구현하기 위해 1) 한국어 멀티모달 감정 데이터셋인 KEMDy20을 이용하여 발화로부터 감정을 추출하는 회귀 신경망을 구현하고 2) 음원에 arousal-valence 레벨이 태깅되어 있는 DEAM 데이터셋을 이용하여 발화 감정에 대응되는 음원을 선택하여 재생한 후 3) 아바타를 이용한 실시간 대화가 가능한 가상공간과 결합하여 몰입형 메타버스 환경에서 발화의 감정에 어울리는 배경음악을 실시간으로 재생하는 시스템을 구현하였다.

창작·예술 분야의 생성형 aI 활용 방법에 대한 연구 (A Study on the use of generative AI in creative and artistic fields)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

현악사중주 공연의 역사와 미래: 미디어와 인공지능을 활용한 융합 공연의 가능성에 대하여 (The History and Future of String Quartet Performances: Examining the Possibility of Convergent Performances Employing Media and Artificial Intelligence)

  • 박은지
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.697-706
    • /
    • 2023
  • 본 연구는 현악사중주의 역사를 살펴보고, 현대에 제시된 융합 공연을 분석하여 미래의 청중이 수용할만한 새로운 공연의 패러다임을 제안하는 것을 목표로 한다. 연구의 과정에서는 과거와 현대의 현악사중주가 어떻게 발전했는지를 면밀하게 살펴보고, 그 과정에서 나타난 청중의 변화에 관하여 분석한다. 더불어 현대 현악사중주의 기술 융합 공연 사례로부터 새로운 청중의 수요에 따른 오늘날의 클래식 공연산업이 어떠한 변화를 맞을 수 있을지를 모색한다. 연구의 결과로 현대의 현악사중주는 미디어와 AI 기술의 융합을 통한 새롭고 독창적인 방향의 공연이 필요하다는 결론을 내렸다.

글로벌 시장에서의 IoT 홈비서에 관한 동향 및 기술 변화에 대한 연구 (A Study on the Technical Trends of the IoT Home Assistant in Global Market)

  • 이진우;류재원;이준동;최재홍
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.109-110
    • /
    • 2017
  • 현재 국내외에 거실을 잡기위한 노력들이 전방위적으로 이뤄지고 있다. 거실에서 쉽게 쇼핑을 하고, 커튼이나 조명을 켜고, 음악을 듣고, 피자를 시켜 먹으며, 외부 약속을 위해 택시를 부르는, 글로벌 기업들의 '스마트 홈'의 기능으로 인공지능과 음성인식을 통한 산물이 되었다. 또한 이러한 데이터를 중심으로 빅데이터의 보고가 되어간다. 때문에 구글, 아마존, MS, 삼성과 우리나라의 SKT와 LG 등의 기업들이 이러한 기술기반으로 접근하는 현황을 파악하고, 기술에 대한 적정성을 제안할 필요가 있다.

  • PDF

STT 성능 향상을 위한 딥러닝 기반 발화 음성 분리학습 (Deep Learning-based Speech Voice Separation Training To Enhance STT Performance)

  • 김보경;양영준;황용해;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.851-853
    • /
    • 2022
  • 인공지능을 활용한 다양한 딥러닝 기술의 보급과 상용화로 오디오 음성 인식 분야에서도 음성 인식의 정확도를 높이기 위한 다양한 연구가 진행되고 있다. 최근 STT 를 위한 음성 인식 엔진은 딥러닝 기술을 기반으로 과거에 비해 높은 정확도를 보이고 있다. 하지만 예능 프로그램, 드라마, 스포츠 방송 등과 같이 비음성 신호와 음성 신호가 함께 녹음되는 오디오의 경우 음성 인식 정확도가 크게 낮아지는 문제가 발생한다. 이에 본 연구에서는 다양한 장르의 오디오를 음성과 음악을 분리하는 딥러닝 모델을 활용하여 음성 신호와 비음성 신호로 분리하는 방법을 제시하고, STT 결과를 분석하여 음성 인식의 정확도를 높이기 위한 연구 방향을 제시한다.

  • PDF