• 제목/요약/키워드: Multi-net

검색결과 688건 처리시간 0.04초

잔향 환경 음성인식을 위한 다중 해상도 DenseNet 기반 음향 모델 (Multi-resolution DenseNet based acoustic models for reverberant speech recognition)

  • 박순찬;정용원;김형순
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.33-38
    • /
    • 2018
  • Although deep neural network-based acoustic models have greatly improved the performance of automatic speech recognition (ASR), reverberation still degrades the performance of distant speech recognition in indoor environments. In this paper, we adopt the DenseNet, which has shown great performance results in image classification tasks, to improve the performance of reverberant speech recognition. The DenseNet enables the deep convolutional neural network (CNN) to be effectively trained by concatenating feature maps in each convolutional layer. In addition, we extend the concept of multi-resolution CNN to multi-resolution DenseNet for robust speech recognition in reverberant environments. We evaluate the performance of reverberant speech recognition on the single-channel ASR task in reverberant voice enhancement and recognition benchmark (REVERB) challenge 2014. According to the experimental results, the DenseNet-based acoustic models show better performance than do the conventional CNN-based ones, and the multi-resolution DenseNet provides additional performance improvement.

중첩 U-Net 기반 음성 향상을 위한 다중 레벨 Skip Connection (Multi-level Skip Connection for Nested U-Net-based Speech Enhancement)

  • 황서림;변준;허준영;차재빈;박영철
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.840-847
    • /
    • 2022
  • 심층 신경망(Deep Neural Network) 기반 음성 향상에서 입력 음성의 글로벌 정보와 로컬 정보를 활용하는 것은 모델의 성능과 밀접한 연관성을 갖는다. 최근에는 다중 스케일을 사용하여 입력 데이터의 글로벌 정보와 로컬 정보를 활용하는 중첩 U-Net 구조가 제안되었으며, 이러한 중첩 U-Net은 음성 향상 분야에도 적용되어 매우 우수한 성능을 보였다. 그러나 중첩 U-Net에서 사용되는 단일 skip connection은 중첩된 구조에 알맞게 변형되어야 할 필요성이 있다. 본 논문은 중첩 U-Net 기반 음성 향상 알고리즘의 성능을 최적화하기 위하여 다중 레벨 skip connection(multi-level skip connection, MLS)을 제안하였다. 실험 결과, 제안된 MLS는 기존의 skip connection과 비교하여 다양한 객관적 평가 지표에서 큰 성능 향상을 보이며 이를 통해 MLS가 중첩 U-Net 기반 음성 향상 알고리즘의 성능을 최적화시킬 수 있음을 확인하였다. 또한, 최종 제안 모델은 다른 심층 신경망 기반 음성 향상 모델과 비교하여서도 매우 우수한 성능을 보인다.

Multi-channel과 Densely Connected Convolution Networks을 이용한 한국어 감성분석 (Korean Sentiment Analysis using Multi-channel and Densely Connected Convolution Networks)

  • 윤민영;구민재;이병래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.447-450
    • /
    • 2019
  • 본 논문은 한국어 문장의 감성 분류를 위해 문장의 형태소, 음절, 자소를 입력으로 하는 합성곱층과 DenseNet 을 적용한 Text Multi-channel DenseNet 모델을 제안한다. 맞춤법 오류, 음소나 음절의 축약과 탈락, 은어나 비속어의 남용, 의태어 사용 등 문법적 규칙에 어긋나는 다양한 표현으로 인해 단어 기반 CNN 으로 추출 할 수 없는 특징들을 음절이나 자소에서 추출 할 수 있다. 한국어 감성분석에 형태소 기반 CNN 이 많이 쓰이고 있으나, 본 논문에서 제안한 Text Multi-channel DenseNet 모델은 형태소, 음절, 자소를 동시에 고려하고, DenseNet 에 정보를 밀집 전달하여 문장의 감성 분류의 정확도를 개선하였다. 네이버 영화 리뷰 데이터를 대상으로 실험한 결과 제안 모델은 85.96%의 정확도를 보여 Multi-channel CNN 에 비해 1.45% 더 정확하게 문장의 감성을 분류하였다.

Petri-Net을 이용한 효과적인 다중로봇 제어알고리즘의 구현 (Embodiment of Effective Multi-Robot Control Algorithm Using Petri-Net)

  • 선승원;국태용
    • 제어로봇시스템학회논문지
    • /
    • 제9권11호
    • /
    • pp.906-916
    • /
    • 2003
  • A multi-robot control algorithm using Petri-Net is proposed for 5vs5 robot soccer. The dynamic environment of robot soccer is modeled by defining the place and transition of each robot and converting it into Petri-Net diagram. Once all the places and transitions of robots are represented by the Petri-Net model, their actions can be chosen according to the roles of robots and position of the ball in soccer game, e.g., offensive, defensive and goalie robot. The proposed modeling method is implemented for soccer robot system. The efficiency and applicability of the proposed multiple-robot control algorithm using Petri-Net are demonstrated through 5vs5 Middle League SimuroSot soccer game.

MEDU-Net+: a novel improved U-Net based on multi-scale encoder-decoder for medical image segmentation

  • Zhenzhen Yang;Xue Sun;Yongpeng, Yang;Xinyi Wu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1706-1725
    • /
    • 2024
  • The unique U-shaped structure of U-Net network makes it achieve good performance in image segmentation. This network is a lightweight network with a small number of parameters for small image segmentation datasets. However, when the medical image to be segmented contains a lot of detailed information, the segmentation results cannot fully meet the actual requirements. In order to achieve higher accuracy of medical image segmentation, a novel improved U-Net network architecture called multi-scale encoder-decoder U-Net+ (MEDU-Net+) is proposed in this paper. We design the GoogLeNet for achieving more information at the encoder of the proposed MEDU-Net+, and present the multi-scale feature extraction for fusing semantic information of different scales in the encoder and decoder. Meanwhile, we also introduce the layer-by-layer skip connection to connect the information of each layer, so that there is no need to encode the last layer and return the information. The proposed MEDU-Net+ divides the unknown depth network into each part of deconvolution layer to replace the direct connection of the encoder and decoder in U-Net. In addition, a new combined loss function is proposed to extract more edge information by combining the advantages of the generalized dice and the focal loss functions. Finally, we validate our proposed MEDU-Net+ MEDU-Net+ and other classic medical image segmentation networks on three medical image datasets. The experimental results show that our proposed MEDU-Net+ has prominent superior performance compared with other medical image segmentation networks.

Multi-Tasking U-net 기반 파프리카 병해충 진단 (Multi-Tasking U-net Based Paprika Disease Diagnosis)

  • 김서정;김형석
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.16-22
    • /
    • 2020
  • 본 연구에서는 Multi-Tasking U-net를 사용하여 영역 세분화 작업(Segmentation) 과 분류 작업(Classification) 이 동시에 수행되게 함으로써 파프리카 병과 충 진단을 수행하였다. 시설 농장의 파프리카에는 병의 종류가 다양하지 않다. 이 연구에서는 비교적 발생빈도가 높은 흰가루병과 응애에 의한 피해, 정상 잎 3개의 클래스에 대해서만 진단 할 수 있도록 하였다. 이를 위한 중추 모델로는 U-net을 사용하였다. 또, 이 모델의 Encoder와 Decoder의 최종 단을 활용하여 분류 작업과 영역 세분화 작업이 각 각 수행되게하여, U-net의 Encoder가 분류작업과 영역 세분화 작업에 공유되도록 하였다. 학습 데이터로는 정상 잎 680장, 응애에 의한 피해 잎 450장, 흰가루병 370장을 사용하였다. 테스트 데이터로는 정상 잎 130장, 응애에 의한 피해 잎 100장, 흰가루병 90장을 사용하였고, 이를 통한 테스트 결과로는 89%의 인식률을 얻었다.

배경음악 분리를 위한 확장된 합성곱을 이용한 멀티 밴드 멀티 스케일 DenseNet (Multi-band multi-scale DenseNet with dilated convolution for background music separation)

  • 허운행;김혜미;권오욱
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.697-702
    • /
    • 2019
  • 방송 콘텐츠의 혼합 신호에서 배경음악 신호를 분리하는 확장된 합성곱을 이용한 멀티 밴드 멀티 스케일 DenseNet을 제안한다. 확장된 합성곱은 스펙트로그램의 다양한 스케일 문맥 정보를 학습하기 용이하도록 한다. 컴퓨터 모의실험 결과, 제안한 구조는 신호대잡음비(Signal to Noise Ratio, SNR) 0 dB, -10 dB의 환경에서 각각 0.15 dB, 0.27 dB의 신호대왜곡비(Signal to Distortion Ratio, SDR)를 개선하였다.

멀티에이전트 기반 가치넷 설계 (Multi-agent based value net design)

  • Kim, Taewoon
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.222-229
    • /
    • 2002
  • 기존의 공급망이 디지털화되고 고객과 공급자간의 파트너쉽과 정보흐름에 있어서 고성능의 네트웍을 형성하는 새로운 개념의 네트 퀀을 가치넷 (value net)으로 정의한다. 이러한 가치넷은 고객이 그 중심에 위치하며 연관되는 제조 사이트와 공급자에 이르는 정보의 배분을 원활하게 해 준다. 본 연구의 목적은 복잡한 공급사슬의 흐름과정에서 발생하는 의사결정과정을 자동화하고 효율화하기 위해서 멀티에이전트를 이용한 프레임 을 설계하고 구매업무와 관련된 영역에 대하여 본 시스템을 구현해 보고자 하는 것이다. 에이전트의 지능적 판단을 위해서는 BDI (Belief, Desire, Intension) 모델을 이용하였다. 본 연구의 결과는 B2B 및 e-Business에서 에이전트를 이용한 조달 및 획득과 관련된 업무에 적용이 될 수 있다.무에 적용이 될 수 있다.

  • PDF

.NET을 기반으로 한 화상 전송이 가능한 멀티 메신저의 구현 (Implementation of .NET-based Multi Messenger supporting Face to face chatting)

  • 김동규;박재욱;이성진;안성옥
    • 공학논문집
    • /
    • 제5권1호
    • /
    • pp.5-16
    • /
    • 2004
  • 컴퓨터 통신이 보조통신 수단에서 주 통신 수단으로 변하고 있는 지금 메신저는 그 선두에 서있다. 꿈이라 생각 했던 얼굴을 보면서 대화 한다는 것이 컴퓨터를 통해 이루어 졌다. 이 두 가지 기능을 합쳐 놓은 것이 멀티 메신저이다. 이 논문에서 구현된 멀티메신저는 기존의 메신저들과 경쟁력을 두기 위하여 각각 차세대 언어라 할 수 있는 .NET 와 강력한 MFC을 사용하였다. 또한 메신저 기능뿐 만이 아니라 화상 채팅 기능을 포함했다.

  • PDF

Analysis on the body size selectivity for multi-species of discarding juvenile fishes in the bottom trawl

  • KIM, Yonghae
    • 수산해양기술연구
    • /
    • 제55권3호
    • /
    • pp.181-189
    • /
    • 2019
  • Discarding juvenile fishes under girth 16 cm nearly equal to inner perimeter of codend mesh size collected by a cover net method in bottom trawl. The body size of the main five species (mackerel, horse mackerel, sea bream, melon seed and black throat seaperch) was measured for their body length, girth, weight, height and width and analyzed size selectivity. Frequency of penetrating fish as retention in a cover net was less than 40% of total number of juvenile discarding fish. The most of body length or girth of five species were significantly different between in the codend and in the cover net. The 50% selection girth in the cover net ranged 8-11 cm were smaller than those in the codend ranged 9-13 cm by the species respectively. The 50% selection body length was significantly related with the ratio of body height (H) by body width (W) both for in the codend or in the cover net while 50% selection girth was not significantly related with H/W. Furthermore 50% selection fish size by fish species between in the codend and in the cover net was not significantly different both in body length or girth. Therefore, the girth selectivity represented possibly as one unique value regarding fish body shape was considered as more useful method for multi-species catch in trawl.