통합 검색 | Korea Science

합성곱 신경망을 이용한 아스팔트 콘크리트 도로포장 표면균열 검출 (Asphalt Concrete Pavement Surface Crack Detection using Convolutional Neural Network)

최윤수;김종호;조현철;이창준
- 한국구조물진단유지관리공학회 논문집
- /
- 제23권6호
- /
- pp.38-44
- /
- 2019
본 연구에서는 아스팔트 콘크리트 도로포장의 표면균열 검출을 위해 합성곱 신경망을 이용하였다. 합성곱 신경망의 학습에 사용되는 표면균열 이미지 데이터의 양에 따른 합성곱 신경망의 성능향상 정도를 평가하였다. 사용된 합성곱 신경망의 구조는 5개의 층으로 구성되어있으며, 3×3 크기의 convolution filter와 2×2 크기의 pooling kernel을 사용하였다. 합성곱 신경망의 학습을 위해서 도로노면 조사 장비를 통해 구축된 국내 도로포장 표면균열 이미지를 활용하였다. 표면균열 이미지 데이터를 학습한 합성곱 신경망 모델의 표면균열 검출 정확도, 정밀도, 재현율, 미검출율, 과검출율을 평가하였다. 가장 많은 양의 데이터를 학습한 합성곱 신경망 모델의 표면균열 검출 정확도, 정밀도, 재현율은 96.6% 이상, 미검출율, 과검출율은 3.4% 이하의 성능을 나타내었다.
https://doi.org/10.11112/jksmi.2019.23.6.38 인용 PDF KSCI

합성데이터를 이용한 비지도학습 기반 실시간 와류진동 탐지모델 (Unsupervised Vortex-induced Vibration Detection Using Data Synthesis)

이선호;김선중
- 한국전산구조공학회논문집
- /
- 제36권5호
- /
- pp.315-321
- /
- 2023
장대교량은 낮은 고유진동수와 감쇠비를 가지는 초유연구조물로 진동사용성 문제에 취약하다. 하지만 현재 국내 설계지침에서는 풍속이나 진폭에 대한 임계값을 기반으로 유해진동 발생 여부를 평가하고 있다. 본 연구에서는 장대교량에서 발생하는 유해진동을 보다 정교하게 식별하기 위하여 딥러닝 기반 신호분할 모델을 활용한 데이터 포인트 단위의 와류진동 식별 방법론을 제안한다. 특별히 포락선을 가지는 사인파를 활용하여 와류진동에 해당하는 데이터를 합성함으로써 모델 구축에 필수적인 와류진동 데이터 획득 및 라벨링 과정을 대체하였다. 이후 푸리에 싱크로스퀴즈드 변환를 적용하여 시간-주파수 특징을 추출하여 신경망의 인풋 데이터로 사용하였다. 합성데이터만을 이용하여 양방향 장단기 기억신경망(Bidirectional Long-Short-Term-Memory) 모델을 훈련하였고 이를 라벨 정보를 포함한 실제 사장교의 계측데이터를 이용하여 학습한 모델과 비교하여 모델의 실시간 와류진동 식별 성능을 검증하였다.
https://doi.org/10.7734/COSEIK.2023.36.5.315 인용 PDF

포만트 합성기용 반음절 세트의 구축에 관한 연구 (Implementation of Demisyllable database for formant synthesizer)

이정석
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
- /
- pp.81-84
- /
- 1992
포만트형 합성기에 사용될 반음절 데이터 베이스의 구성과 필요한 파라미터의 추출 과정에 대하여 논한다. 포만트 합성기는 많은 구동 파라미터를 필요로 하기 때문에 저장 장소를 절약하기 위해서 적절한 합성단위의 선택과 합성단위의 효율적인 표현이 필요하다. 본 연구에서는 포만트 합성기에 있어서 합성음의 음질에 큰 영향을 미치는 포만트궤적의 추출과 데이터베이스의 구성에 대하여 기술한다.
PDF

RGB 텍스쳐와 깊이 데이터를 이용한 가상 다시점 영상의 생성 및 그래픽스 합성 (Virtual Multiview Image Composition based on RGB Texture and Depth Data)

황원영;권준섭;김만배;최창열
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 추계학술발표대회
- /
- pp.93-96
- /
- 2006
2D 및 입체 영상 콘텐츠의 공급이 많아지면서 실감 콘텐츠에 대한 관심이 더욱 높아지고 있다. 실감 콘텐츠는 다시점 카메라로부터 획득한 다시점 비디오, 깊이 카메라에서 얻은 RGB 영상과 컴퓨터 그래픽스와 같은 synthetic data를 합성하여 보다 실감나게 제작된다. 다시점 카메라를 이용하면 다시점 비디오를 쉽게 획득할 수 있으나 제작비용이 많이 들고, 깊이 카메라를 사용하면 시스템 구성은 상대적으로 용이하나 시점 영상이 하나라는 단점이 있다. 본 논문에서는 깊이 카메라에서 얻은 RGB 텍스쳐 데이터와 깊이 데이터로부터 가상 다시점 영상을 생성하고, 생성된 영상에 컴퓨터 그래픽스를 합성하는 방법을 제안한다. 제안한 방법은 다시점 카메라 시스템을 사용하지 않고도 시점에 따른 가상 시점 화상을 용이하게 제작하여 그래픽 객체를 합성한다. 합성된 다시점 3D 모니터나 입체 모니터를 이용하여 3차원으로 실감나게 시청할 수 있다.
PDF

저해상도 영상 자료를 사용하는 얼굴 표정 인식을 위한 소규모 심층 합성곱 신경망 모델 설계 (A Design of Small Scale Deep CNN Model for Facial Expression Recognition using the Low Resolution Image Datasets)

살리모프 시로지딘;류재흥
- 한국전자통신학회논문지
- /
- 제16권1호
- /
- pp.75-80
- /
- 2021
인공 지능은 놀라운 혜택을 제공하는 우리 삶의 중요한 부분이 되고 있다. 이와 관련하여 얼굴 표정 인식은 최근 수십 년 동안 컴퓨터 비전 연구자들 사이에서 뜨거운 주제 중 하나였다. 저해상도 이미지의 작은 데이터 세트를 분류하려면 새로운 소규모 심층 합성곱 신경망 모델을 개발해야 한다. 이를 위해 소규모 데이터 세트에 적합한 방법을 제안한다. 이 모델은 기존 심층 합성곱 신경망 모델에 비해 총 학습 가능 가중치 측면에서 메모리의 일부만 사용하지만 FER2013 및 FERPlus 데이터 세트에서 매우 유사한 결과를 보여준다.
https://doi.org/10.13067/JKIECS.2021.16.1.75 인용 PDF KSCI

합성 텍스트 생성을 위한 ChatGPT 기반 의료 텍스트 증강 도구 개발 (Development of ChatGPT-based Medical Text Augmentation Tool for Synthetic Text Generation)

공진우;김기연;김유섭;오병두
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
- /
- pp.3-4
- /
- 2023
자연어처리는 수많은 정보가 수집된 전자의무기록의 비정형 데이터에서 유의미한 정보나 패턴 등을 추출해 의료진의 의사결정을 지원하고, 환자에게 더 나은 진단이나 치료 등을 지원할 수 있어 큰 잠재력을 가지고 있다. 그러나 전자의무기록은 개인정보와 같은 민감한 정보가 다수 포함되어 있어 접근하기 어렵고, 이로 인해 충분한 양의 데이터를 확보하기 어렵다. 따라서 본 논문에서는 신뢰할 수 있는 의료 합성 텍스트를 생성하기 위해 ChatGPT 기반 의료 텍스트 증강 도구를 개발하였다. 이는 사용자가 입력한 실제 의료 텍스트로 의료 합성 데이터를 생성한다. 이를 위해, 적합한 프롬프트와 의료 텍스트에 대한 전처리 방법을 탐색하였다. ChatGPT 기반 의료 텍스트 증강 도구는 입력 텍스트의 핵심 키워드를 잘 유지하였고, 사실에 기반한 의료 합성 텍스트를 생성할 수 있다는 것을 확인할 수 있었다.
PDF

세밀한 감정 음성 합성 시스템의 속도와 합성음의 음질 개선 연구 (A study on the improvement of generation speed and speech quality for a granularized emotional speech synthesis system)

엄세연;오상신;장인선;안충현;강홍구
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.453-455
- /
- 2020
본 논문은 시각 장애인을 위한 감정 음성 자막 서비스를 생성하는 종단 간(end-to-end) 감정 음성 합성 시스템(emotional text-to-speech synthesis system, TTS)의 음성 합성 속도를 높이면서도 합성음의 음질을 향상시키는 방법을 제안한다. 기존에 사용했던 전역 스타일 토큰(Global Style Token, GST)을 이용한 감정 음성 합성 방법은 다양한 감정을 표현할 수 있는 장점을 갖고 있으나, 합성음을 생성하는데 필요한 시간이 길고 학습할 데이터의 동적 영역을 효과적으로 처리하지 않으면 합성음에 클리핑(clipping) 현상이 발생하는 등 음질이 저하되는 양상을 보였다. 이를 보안하기 위해 본 논문에서는 새로운 데이터 전처리 과정을 도입하였고 기존의 보코더(vocoder)인 웨이브넷(WaveNet)을 웨이브알엔엔(WaveRNN)으로 대체하여 생성 속도와 음질 측면에서 개선됨을 보였다.
PDF

웨이블릿을 사용한 디지털 동영상의 AR 영상 합성 기법 (A Study of AR Image Synthesis Technology Using Wavelet Transform in Digital Video)

김혜경;김용균;오해석
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
- /
- pp.577-579
- /
- 2001
본 논문에서는 웨이블릿 변환 기법으로 키프레임을 분석하여 객체 영역을 추출함과 동시에 가상의 객체 영상을 현실감있게 합성하는 기술에 대하여 연구하였다. 가상의 객체 영상이나 실물체 영상을 비디오 영상내에 삽입하여 좀 더 현실감있는 새로운 동영상 비디오 데이터를 제작하는 데 초점을 맞추어 연구를 진행하였다. 웨이블릿 변환이 새로운 영상을 재구성하는데 커다란 기여를 하였으며 본 논문에서 제시한 AR 영상 합성 기법은 동영상 데이터를 합성하는데 사용자가 원하는 지점에 정확하게 영상의 특성정보를 충분히 잘 살린 새로운 방법의 시도였다. 또한, 영상의 캘리브 레이션 방법을 거치지 않고 비디오 영상의 회전행렬과 위치성분을 계산하여 매핑된 가상의 객체 영상을 영상 보간법을 적용하여 직접 가사의 객체 영상을 비디오 객체 영상을 비디오 영상열에 삽입한다. 제시한 영상 합성 기법은 가상의 객체 영상이 디지털 동영상내에 삽입되었을 때 가장 큰 문제점인 떨림 현상과 부조화 현상이 제거되었다.
PDF

고품질 내장형 음성합성 시스템을 위한 음성합성 DB구현 (The implementation of database for high quality Embedded Text-to-speech system)

권오일
- 대한전자공학회논문지SP
- /
- 제42권4호
- /
- pp.103-110
- /
- 2005
음성 데이터베이스는 TTS 시스템에서 가장 중요한 요소 중의 하나이다. 특히, 내장형 TTS 시스템에서는 서버형 TTS 시스템에서보다 좀 더 작은 데이터베이스를 필요로 한다. 이러한 이유로, 음성합성 데이터의 압축과 통계적 축소과정의 비중은 내장형 TTS 시스템에서 아주 중요한 항목이라고 말할 수 있다. 그러나 이러한 압축과 통계적 축소과정은 합성음질의 저하를 유발시킨다. 본 논문에서는 고품질 내장형 TTS 시스템에서의 데이터 구축방법을 제안하며, MOS 테스트를 통한 합성음질을 검증한다.
PDF KSCI

합성곱 신경망 네트워크 구조 변화에 따른 숫자 인식률 비교 (Comparison of Number Recognition Rates According to Changes in Convolutional Neural Structure)

이종찬;김영현;송특섭
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2022년도 추계학술대회
- /
- pp.397-399
- /
- 2022
딥러닝을 적용한 기술 중 숫자 인식으로 예를 들 수 있다. 숫자 인식을 통하여 여러 분야에서 활용이 되고 있다. 숫자 인식을 가능하게 한 알고리즘 중 합성곱 신경망이 있다. 합성곱 신경망은 다양한 데이터들을 인식하는 데 사용되고 있다. MNIST 숫자 데이터셋을 활용하여 합성곱 신경망 구현 과정 중 깊게 레이어층을 쌓을수록 성능향상을 기대해볼 수 있다. 본 논문에서는 합성곱 레이어를 추가함으로써 성능향상을 76.96%에서 98.87의 정확도가 산출되어 약 21.91%의 정확도가 향상됨을 확인하였다.
PDF

검색결과 1,367건 처리시간 0.034초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)