통합 검색 | Korea Science

소리 데이터 분류에 대한 데이터 증대 방법 연구 (A study on data augmentation methods for sound data classification)

장일식;박구만
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.1308-1310
- /
- 2022
소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.
PDF

RoBERTa 기반 데이터 증강을 통한 국내 학술 논문 분야 분류 연구 (Classification of Domestic Academic Papers Through RoBERTa-based Data Augmentation)

김성식;양진환;최혁순;문남미
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2023년도 추계학술발표대회
- /
- pp.1211-1212
- /
- 2023
현재 대부분의 국내 학술 데이터 베이스는 개별 학술지 논문의 주제를 파악하는 표준화된 정보를 거의 제공하지 않고 있다. 본 연구에서는 논문의 제목만을 활용하여 학술 논문의 분야를 자동으로 분류하는 방법을 제안한다. 이를 위해 한국어로 사전 훈련된 KLUE-RoBERTa 모델을 사용하며, Back Translation 과 Chat-GPT 를 활용한 데이터 증강을 통해 모델의 성능을 향상한다. 연구 결과, Back Translation 과 Chat-GPT 를 사용하여 증강한 모델이 원본 데이터를 학습한 모델보다 약 11%의 성능 향상을 보였다.
https://doi.org/10.3745/PKIPS.y2023m11a.1211 인용 PDF

Solid Object: Pictorial Image Code를 사용한 증강현실 기반 감각형 인터페이스 모델 (Solid Object: Augmented Reality-based Tangible Interface Model using Pictorial Image Code)

이세인;정철호;윤성영;한탁돈
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2008년도 춘계학술발표대회
- /
- pp.186-189
- /
- 2008
데스크탑 기반의 컴퓨팅 환경에서 모바일 기반 컴퓨팅 환경으로의 전환은 인터페이스의 변화를 필연적으로 요구한다. 이에 현재 모바일 기기들은 작은 사이즈의 기계에 많은 버튼을 부착하고 다양한 기능의 GUI를 제공하여 모바일 환경에서 데스크탑 수준의 인터페이스를 제공하려 하고 있다. 하지만 그 결과 버튼의 사이즈는 작아지고 GUI는 복잡해져 오히려 사용자의 불편함을 가중시키고 있다. 또한 제공되는 GUI는 공통적인 형식이 없고 사용자의 기호를 반영하지 못하며 부가적인 학습이 필요한 문제점이 있다. 본 논문에서는 이러한 문제를 해결하기 위한 방안으로 Solid Object 인터페이스 모델을 제안한다. 본 모델은 사용자가 직접 제작 가능하며 TUI(Tangible User Interface)의 특성을 활용하여 조작의 편의를 추구 하였으며, 증강현실(Augmented Reality) 기술을 이용하여 즉각적인 정보 피드백을 제공한다. 그리고 Pictorial Image Code로 증강현실과 TUI를 연결하고 사용자에게 직관적인 정보를 제공해준다.
https://doi.org/10.3745/PKIPS.y2008m05a.186 인용 PDF

증강현실을 활용한 소집단 학습에서 도구 사용 환경에 따른 담화 비교 (Comparison of Discourse by Environments for Using Tools in Small Group Learning with Augmented Reality)

신석진;김혜린;노태희;송나윤
- 한국과학교육학회지
- /
- 제43권2호
- /
- pp.181-190
- /
- 2023
이 연구에서는 증강현실을 활용한 소집단 학습에서 도구 사용 환경에 따른 담화를 참여 유형, 담화의 유형, 지식 형성 과정 측면에서 비교하였다. 고등학교 1학년 학생 24명을 6개 모둠으로 나눈 후, 마커 1개와 스마트 기기 1개를 공동으로 사용하는 도구 공유 환경과 마커와 스마트 기기를 개별로 사용하는 개별 도구 환경에 각각 배치하였다. 학생들은 모둠별로 물질의 규칙성과 결합 단원에서 다루는 개념을 주제로 증강현실 애플리케이션을 활용한 소집단 학습에 참여하였다. 모든 수업 과정은 모둠별로 녹음 및 녹화하였으며, 자발적으로 동의한 학생 6명을 대상으로 반구조화된 면담을 실시하였다. 연구결과, 도구 공유 환경은 일인 주도형의 비율이 높았으나, 개별 도구 환경은 부분 참여형 및 다수 참여형의 비율이 높았다. 개별 도구 환경은 도구 공유 환경보다 지식 공유와 지식 구성 담화의 비율이 유사하였고, 세부 담화 유형도 다양하였다. 도구 공유 환경에서는 일부 학생에 대해서만 의미 있는 지식 형성 과정이 나타났다. 반면 개별 도구 환경에서는 모둠원 대부분이 목표 개념에 대해 올바른 지식을 구성하며 의미 있는 지식 형성 과정이 이루어졌으며, 일부 모둠원에게 나타난 오개념은 소집단 토의를 통해 올바른 과학 개념으로 수정되었다.
https://doi.org/10.14697/jkase.2023.43.2.181 인용 PDF

마커인식 개선과 인체가 가려지는 문제해결을 위한 증강현실 솔루션 (An Augmented Reality Solution for Improving Marker Recognition and Solving Human Occlusion)

육승남;박종열;박진호
- 한국게임학회 논문지
- /
- 제20권2호
- /
- pp.183-192
- /
- 2020
컴퓨터 그래픽스 기술의 발달과 정보통신 기술의 발달로 증강현실 기술의 많은 발전이 이루어졌다. 하지만 가상의 공간과 실제의 공간이 매칭이 된 이미지를 보면 아직 현실감은 다소 떨어진다. 본 연구에서는 문제의 원인을 가상의 오브젝트가 실제 공간에서의 깊이 감을 고려하지 않고 형성되어 공간감을 파괴시키는 문제와 마커에 의존한 인식 기술의 한계성 두 가지로 설정하고 해결하였다. 공간감은 사람의 신체와 가상의 오브젝트 사이의 위계질서를 형성함으로써, 마커 기술의 한계성은 시간 지연과 카메라 움직임에 따라 마커의 위치를 역으로 추적하는 방식으로 문제를 해결하였다.
https://doi.org/10.7583/JKGS.2020.20.2.183 인용 PDF KSCI

모바일 기반 증강현실 기술을 활용한 창의인성교육 3D전래동화 콘텐츠 연구 (Research of 3D graphic nursery contents for humanity education developed by mobile AR technology)

박영숙;박대우
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2016년도 추계학술대회
- /
- pp.337-339
- /
- 2016
본 논문에서는 모바일 증강현실기술 기반을 활용한 창의인성교육을 위한 Digilog Book에 관한 연구이다. 지식기반사회의 핵심 콘텐츠 산업으로 주목받고 있는 시공간을 연결하는 SW기술 증강현실(Augmented Reality) 기술을 활용하여 흥미로운 전래동화를 외국어학습과 창의인성교육에 적용한다. 이를 위해 상호작용 AR게임(놀이)으로 재구성하였다. 재미있고 유익한 전래동화를 ICT기술을 접목한 융복한 콘텐츠로 재구성하여 경험하면서 첨단기술에 대한 호기심을 가지고 첨단기술기반 교육에 대한 거부감을 없애고 수용하며 생활주변에서 소프트웨어를 인식할 수 있는 기회를 가지게 한다.
PDF

AR다중마커 인식 기술을 활용한 문화재 지도 개발 연구 (A Study on Development of Cultural Assets Map Using AR Multi-Marker Recognition Technology)

김미리;송은지
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2019년도 춘계학술대회
- /
- pp.87-89
- /
- 2019
기존의 문화재 의무교육과정은 흥미와 가시성 측면의 부족함으로 인해 교육적인 효과를 기대하기 어려운 측면이 있다. 본 연구에서는 4차산업혁명 시대를 맞아 주목 받고 있는 증강현실의 다중마커 인식 기술을 기반으로 문화재 3차원 데이터를 활용한 응용콘텐츠 및 교구재를 제작하여 대중적으로 문화재를 즐기며 학습 할 수 있도록 하는 증강현실 어플리케이션을 제안한다. 다수의 마커를 인식 가능한 다중마커 기술의 콘텐츠의 경우 다양한 이벤트 추가와 연출력을 강화할 수 있다. 향후 제안하는 증강현실 앱은 문화재를 활용한 다양한 교육용 콘텐츠 제작기술 연구에 활용될 것이라 사료된다.
PDF

벡터 기반 데이터 증강과 인공신경망 기반 특징 전달을 이용한 효율적인 균열 데이터 수집 기법 (Efficient Collecting Scheme the Crack Data via Vector based Data Augmentation and Style Transfer with Artificial Neural Networks)

윤주영;김동희;김종현
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
- /
- pp.667-669
- /
- 2021
본 논문에서는 벡터 기반 데이터 증강 기법(Data augmentation)을 제안하여 학습 데이터를 구축한 뒤, 이를 합성곱 신경망(Convolutional Neural Networks, CNN)으로 실제 균열과 가까운 패턴을 표현할 수 있는 프레임워크를 제안한다. 건축물의 균열은 인명 피해를 가져오는 건물 붕괴와 낙하 사고를 비롯한 큰 사고의 원인이다. 이를 인공지능으로 해결하기 위해서는 대량의 데이터 확보가 필수적이다. 하지만, 실제 균열 이미지는 복잡한 패턴을 가지고 있을 뿐만 아니라, 위험한 상황에 노출되기 때문에 대량의 데이터를 확보하기 어렵다. 이러한 데이터베이스 구축의 문제점은 인위적으로 특정 부분에 변형을 주어 데이터양을 늘리는 탄성왜곡(Elastic distortion) 기법으로 해결할 수 있지만, 본 논문에서는 이보다 향상된 균열 패턴 결과를 CNN을 활용하여 보여준다. 탄성왜곡 기법보다 CNN을 이용했을 때, 실제 균열 패턴과 유사하게 추출된 결과를 얻을 수 있었고, 일반적으로 사용되는 픽셀 기반 데이터가 아닌 벡터 기반으로 데이터 증강을 설계함으로써 균열의 변화량 측면에서 우수함을 보였다. 본 논문에서는 적은 개수의 균열 데이터를 입력으로 사용했음에도 불구하고 균열의 방향 및 패턴을 다양하게 생성하여 쉽게 균열 데이터베이스를 구축할 수 있었다. 이는 장기적으로 구조물의 안정성 평가에 이바지하여 안전사고에 대한 불안감에서 벗어나 더욱 안전하고 쾌적한 주거 환경을 조성할 것으로 기대된다.
PDF

음성위조 탐지에 있어서 데이터 증강 기법의 성능에 관한 비교 연구 (Comparative study of data augmentation methods for fake audio detection)

박관열;곽일엽
- 응용통계연구
- /
- 제36권2호
- /
- pp.101-114
- /
- 2023
데이터 증강 기법은 학습용 데이터셋을 다양한 관점에서 볼 수 있게 해주어 모형의 과적합 문제를 해결하는데 효과적으로 사용되고 있다. 이미지 데이터 증강기법으로 회전, 잘라내기, 좌우대칭, 상하대칭등의 증강 기법 외에도 occlusion 기반 데이터 증강 방법인 Cutmix, Cutout 등이 제안되었다. 음성 데이터에 기반한 모형들에 있어서도, 1D 음성 신호를 2D 스펙트로그램으로 변환한 후, occlusion 기반 데이터 기반 증강기법의 사용이 가능하다. 특히, SpecAugment는 음성 스펙트로그램을 위해 제안된 occlusion 기반 증강 기법이다. 본 연구에서는 위조 음성 탐지 문제에 있어서 사용될 수 있는 데이터 증강기법에 대해 비교 연구해보고자 한다. Fake audio를 탐지하기 위해 개최된 ASVspoof2017과 ASVspoof2019 데이터를 사용하여 음성을 2D 스펙트로그램으로 변경시켜 occlusion 기반 데이터 증강 방식인 Cutout, Cutmix, SpecAugment를 적용한 데이터셋을 훈련 데이터로 하여 CNN 모형을 경량화시킨 LCNN 모형을 훈련시켰다. Cutout, Cutmix, SpecAugment 세 증강 기법 모두 대체적으로 모형의 성능을 향상시켰으나 방법에 따라 오히려 성능을 저하시키거나 성능에 변화가 없을 수도 있었다. ASVspoof2017 에서는 Cutmix, ASVspoof2019 LA 에서는 Mixup, ASVspoof2019 PA 에서는 SpecAugment 가 가장 좋은 성능을 보였다. 또, SpecAugment는 mask의 개수를 늘리는 것이 성능 향상에 도움이 된다. 결론적으로, 상황과 데이터에 따라 적합한 augmentation 기법이 다른 것으로 파악된다.
https://doi.org/10.5351/KJAS.2023.36.2.101 인용 PDF

증강현실(AR)을 활용한 디지로그 북 인터랙션디자인 연구 (아동 서적물 중심으로) (Digilog Book Interaction Design Using Augmented Reality(AR) (Focused on Children's Books))

정용원;주민경;김용호
- 디지털융복합연구
- /
- 제18권6호
- /
- pp.425-433
- /
- 2020
증강현실을 활용한 디지로그 북은 애플리케이션을 다운받은 후 모바일에 내장된 카메라를 Image Marker로 등록된 페이지에 비추면 증강현실이 구현되는 형태로서 콘텐츠 구현 방법에는 단편적 한계점을 나타내고 있다. 이에 본 연구에서는 증강현실 기술을 활용한 디지로그 북에 양방향 인터랙션이 가능한 팝업(Pop-up) 형태의 Multi-Tracking 방식을 제안하였다. 이를 통해 기존 책자형의 디지로그 북과 이번 연구에서 제안한 팝업(Pop-up)형태의 디지로그 북의 두 가지 프로토타입에 대한 증강현실 콘텐츠 구현에 따른 기술적 차별성에 대한 실험을 공인기관에 의뢰하여 검증하였고 시험성적서를 발급받았다. 연구에서 제안한 팝업(Pop-up)형태의 디지로그 북은 가상 이미지를 사용자의 행위(움직임)에 따른 인터랙션 콘텐츠 구현이 가능하여 책의 물리적인 변화자체가 가상콘텐츠에도 전달되는 양방향 인터랙티브 콘텐츠의 장점을 갖고 있으며, 이는 가상 이미지와 인쇄 그림책 간의 상호작용을 유도하고 학습자에게 흥미 유발 및 몰입감을 줄 수 있어 차별화된 디지로그 북의 인터랙션의 표현이 가능할 것으로 보여진다.
https://doi.org/10.14400/JDC.2020.18.6.425 인용 PDF KSCI

검색결과 347건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)