통합 검색 | Korea Science

Sketch Recognition Using LSTM with Attention Mechanism and Minimum Cost Flow Algorithm

Nguyen-Xuan, Bac;Lee, Guee-Sang
- International Journal of Contents
- /
- 제15권4호
- /
- pp.8-15
- /
- 2019
This paper presents a solution of the 'Quick, Draw! Doodle Recognition Challenge' hosted by Google. Doodles are drawings comprised of concrete representational meaning or abstract lines creatively expressed by individuals. In this challenge, a doodle is presented as a sequence of sketches. From the view of at the sketch level, to learn the pattern of strokes representing a doodle, we propose a sequential model stacked with multiple convolution layers and Long Short-Term Memory (LSTM) cells following the attention mechanism [15]. From the view at the image level, we use multiple models pre-trained on ImageNet to recognize the doodle. Finally, an ensemble and a post-processing method using the minimum cost flow algorithm are introduced to combine multiple models in achieving better results. In this challenge, our solutions garnered 11th place among 1,316 teams. Our performance was 0.95037 MAP@3, only 0.4% lower than the winner. It demonstrates that our method is very competitive. The source code for this competition is published at: https://github.com/ngxbac/Kaggle-QuickDraw.
https://doi.org/10.5392/IJoC.2019.15.4.008 인용 PDF KSCI HTML

Prediction of Doodle Images Using Neural Networks

Hae-Chan Lee;Kyu-Cheol Cho
- 한국컴퓨터정보학회논문지
- /
- 제28권5호
- /
- pp.29-38
- /
- 2023
낙서는 대부분 불규칙한 형태와 패턴을 갖추고 있기에, 인공지능이 불규칙한 낙서를 기계적으로 패턴을 인식하고 예측하기란 매우 어렵다. 만약 그려진 원이 완벽한 동그라미가 아니거나, 직선도 완전히 일직선이 아닐 경우, 인간은 별도의 학습 과정 없이도 낙서를 인식하고 예측할 수 있다. 이에 반해, 인공지능은 주어진 학습 데이터로 패턴을 학습해야만 낙서를 인식하고 예측한다. 본 논문은 국적, 문화, 왼손잡이 또는 오른손잡이 등 관계없이 다양한 사람들의 낙서 이미지 데이터셋을 활용한다. 그리고 두 가지의 신경망 학습을 거친 뒤, 어느 신경망이 더 높은 정확도를 제공하는지, 낙서 이미지 예측에 더 적합한지 대한 여부를 결정한다. 인공지능을 통한 낙서 이미지 예측을 하는 이유는 신경망을 활용함으로써, 인간의 표현과 의도에 대한 독특한 관점을 제공할 수 있기 때문이다. 가령, 인간이 그린 낙서에 대해 인공지능이 제공하는 다양한 이미지를 활용하여 예술적인 표현의 다양성을 촉진하고 창작 영역을 넓히는 데 기여할 것으로 기대한다.
https://doi.org/10.9708/jksci.2023.28.05.029 인용 PDF HTML

코로나19로 또래와 단절된 아동을 위한 인공지능 낙서 로봇 제안 (Proposal of AI-based Graffiti Robot for Children disconnected from Peers with COVID-19)

송주연;이강희
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
- /
- pp.29-31
- /
- 2020
본 논문에서는 코로나19 사태로 인한 팬데믹(pandemic) 현상으로 인해 또래와 단절된 아동들의 정서발달을 위해 인공지능 낙서 로봇인 Doodle Robot을 제안한다. Doodle Robot은 또래 형제가 없는 아동에게 함께 그림을 그릴 수 있는 그림친구로서 아동의 정서적 발달에 기여한다. YOLO 알고리즘을 사용하여 객체검출기능을 구현하였고 낙서 Data는 Quick! Draw Dataset에서 추출하였다.
PDF

유아용 서사 창작 어플리케이션의 스토리-리텔링 구조 분석 (Analysis of Story-Retelling Structure in Digital Storytelling Applications for Infants)

한혜원;류민수
- 한국콘텐츠학회논문지
- /
- 제13권5호
- /
- pp.146-158
- /
- 2013
본 연구는 태블릿 pc 기반 유아용 어플리케이션 중 이야기 창작을 주로 지원하는 콘텐츠의 스토리-리텔링 구조를 분석하는데 그 목적이 있다. 과거 단순히 콘텐츠의 수동적 소비자로 존재했던 유아도, 유아용 서사 창작 어플리케이션을 통해서, 소비한 이야기의 구조를 토대로 자신만의 이야기를 창조적으로 재구성 및 리텔링하는 생산자로 변화해가는 중이다. 기존과 달리 주체적으로 이야기 창작에 참여하고 그 결과물을 도출하는 과정을 통해서 유아는 이야기 텍스트의 의미 지평을 확장하는 유의미한 경험을 하게 된다. 이처럼 스토리-리텔링은 유아의 창의성과 표현력, 리터러시 능력을 배양하는 측면에 있어서 적합한 방법론이다. 이에 본 논문에서는 다양한 유아용 서사창작 어플리케이션을 양상별로 유형화하고, 그 중에서 각 유형을 대표할 만한 , , 를 통해서 스토리-리텔링의 구성요소 및 구성방식을 통합적 관점에서 조망한다. '창조적인 틈'을 제공하는 스토리-리텔링 어플리케이션은 유아로 하여금 스스로 빈 칸을 채우게 하고 그 과정을 통해서 상상력을 발휘하는 동시에 이야기의 법칙성을 깨닫게 한다는 점에서 교육적으로 유의미하며, 나아가 차세대 어플리케이션의 발전 방향을 제시한다.
https://doi.org/10.5392/JKCA.2013.13.05.146 인용 PDF KSCI

인공지능을 활용한 AI 예술 창작도구 사례 연구 (Case study of AI art generator using artificial intelligence)

정지윤
- 트랜스-
- /
- 제13권
- /
- pp.117-140
- /
- 2022
최근 인공지능 기술은 산업전반에 걸쳐서 활용되고 있다. 현재 예술 창작도구는 NFT 산업에서 사용되고 있으며, 이를 활용한 작품이 전시, 판매되기도 하였다. 미술 분야의 창작도구는 Gerated Photos, Google Deep Dream, Skech-RNN, Auto draw가 있으며, 음악분야의 인공지능 창작도구는 Beat Blender, Google Doodle Bach, AIVA, Duet, Neural Synth 등이 있다. 인공지능 예술 창작도구의 특징은 다음과 같다. 첫째, 예술분야 인공지능 창작도구는 기존의 작품 데이터를 바탕으로 새로운 작품을 창작하는 데에 활용되고 있다. 둘째, 창작 결과물을 빠르고 신속하게 도출하여 창작자에게 아이디어를 제공하거나, 창작 재료를 다양하게 구현해 볼 수 있다. 향후 인공지능 창작물은 인공지능 기술이 미술, 영상, 문학, 음악 등 콘텐츠 기획 및 제작에 많은 영향을 끼칠 것이다.
https://doi.org/10.23086/trans.2022.13.06 인용 PDF KSCI

네이버와 구글의 이벤트성 브랜드 경험 디자인에 관한 연구 (A Study on Naver and Google's Eventful Brand Experience Design)

정영경;김승인
- 디지털융복합연구
- /
- 제17권2호
- /
- pp.355-361
- /
- 2019
본 연구는 브랜드 경험 디자인에서 브랜드가 사용자에게 어떤 감정을 제공할 때 가장 긍정적으로 인식되는지 분석하여, 브랜드와 사용자의 감성 소통을 더욱 원활히 할 수 있도록 돕는 것이 목적이다. 본래 브랜드는 기념일의 정보를 전달하고자 하는 목적으로 그들의 로고를 주기적으로 변화시켰다. 최근에는 이러한 정보성뿐만 아니라 사용자와의 감정 소통에도 큰 의미를 두고 있다. 연구 방법으로는 국내에서 사용하는 대표 포털사이트 두 개 선정하여, 최근 이벤트성 로고의 사례를 기반으로 선호도조사와 심층 인터뷰를 진행하였다. 연구 결과에서, 이벤트성 로고가 사용자에게 다양한 감정적 동기를 제공했을 때 더 긍정적인 요소로 작용한다는 결과 값을 얻어낼 수 있었다. 향후 본 연구를 브랜드에서 더욱 다양한 감정을 도출해낼 수 있는 디자인적 접근을 한다면, 사용자로 하여금 더 높은 가치를 받을 수 있을 것으로 예상한다.
https://doi.org/10.14400/JDC.2019.17.2.355 인용 PDF KSCI HTML

말하는 닭의 발성 특성 분석 (Vocal Analysis of Talking Rooster)

견두헌;배명진
- 한국음향학회지
- /
- 제29권2호
- /
- pp.125-132
- /
- 2010
예로부터 사람의 말을 흉내 낼 수 있는 동물들은 특별한 대우를 받고 있다. 이러한 동물은 앵무새를 비롯한 매우 극소수에 해당하며, 닭이 사람의 목소리를 내는 경우는 지금까지 알려진 바가 없다. 본 논문에서는 최근 화제가 된 한국과 키르기스스탄의 말하는 닭의 발성 특성을 살펴보고, 발음 통계와 실제 음원을 분석하였다. 분석결과 닭이 실제로 사람과 대화를 하는 것은 아니지만, 닭의 날개를 잡을 경우 "안돼," "아니야" 등의 한글 발음을 하는 것으로 확인하였으며, 키르기스스탄의 닭 역시 사람과 매우 유사한 발음을 하는 것으로 확인되었다. 청음 설문조사 결과에서도 대부분의 사람이 닭이 말하는 단어를 인지하였으며, 닭이 내는 소리로 판단한사람은 없었다. 이처럼 닭이 사람의 발음을 할수 있는 이유는, 선천적인 발음기관과 발성시의 기질적 특정이 일반 닭과 현저히 다르며, 사람에게 붙잡힐 때 긴장에 따른 성대/발성 특성 변화때문으로 판단된다.
https://doi.org/10.7776/ASK.2010.29.2.125 인용 PDF KSCI

검색결과 7건 처리시간 0.019초

Sketch Recognition Using LSTM with Attention Mechanism and Minimum Cost Flow Algorithm

Prediction of Doodle Images Using Neural Networks

코로나19로 또래와 단절된 아동을 위한 인공지능 낙서 로봇 제안 (Proposal of AI-based Graffiti Robot for Children disconnected from Peers with COVID-19)

유아용 서사 창작 어플리케이션의 스토리-리텔링 구조 분석 (Analysis of Story-Retelling Structure in Digital Storytelling Applications for Infants)

인공지능을 활용한 AI 예술 창작도구 사례 연구 (Case study of AI art generator using artificial intelligence)

네이버와 구글의 이벤트성 브랜드 경험 디자인에 관한 연구 (A Study on Naver and Google's Eventful Brand Experience Design)

말하는 닭의 발성 특성 분석 (Vocal Analysis of Talking Rooster)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)