네이버 AI플랫폼 CLOVA 그리고 초대규모 AI HyperCLOVA

Ha, Jeong-U;Park, Heung-Seok;Lee, Ba-Do;Hwang, Min-Je;

Korea Information Processing Society Review (정보처리학회지)

Volume 28 Issue 3
/
Pages.56-66
/
2021
/
1226-9182(pISSN)
/
2734-0376(eISSN)

Korea Information Processing Society (한국정보처리학회)

네이버 AI플랫폼 CLOVA 그리고 초대규모 AI HyperCLOVA

Ha, Jeong-U (NAVER AI Lab, NAVER CLOVA) ;
Park, Heung-Seok (NAVER CLOVA) ;
Lee, Ba-Do (NAVER CLOVA) ;
Hwang, Min-Je (NAVER CLOVA)

Published : 2021.09.30

PDF KSCI

Download PDF

⟨ Previous Next ⟩

Abstract

Keywords

References

Jeonghun Baek, Geewook Kim, Junyeop Lee, Sungrae Park, Dongyoon Han, Sangdoo Yun, Seong Joon Oh, Hwalsuk Lee. What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis. ICCV 2019.
Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, Hwalsuk Lee. Character Region Awareness for Text Detection. CVPR 2019.
Rishi Bommasani et al. On the Opportunities and Risks of Foundation Models. arXiv:2108.07258. 2021.
Tom Brown et al., "Language Models are Few-shot Learners." NeurIPS 2020.
Junbum Cha, Sanghyuk Chun, Gayoung Lee, Bado Lee, Seonghyeon Kim, Hwalsuk Lee. Few-shot Compositional Font Generation with Dual Memory. ECCV 2020.
Yunjey Choi, Minje Choi, Munyoung Kim, Jung-Woo Ha, Sunghun Kim, Jaegul Choo. "StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation." CVPR 2018.
Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova. "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding." NAACL 2019.
Jung-Woo Ha et al. ClovaCall: Korean Goal-Oriented Dialog Speech Corpus for Automatic Speech Recognition of Contact Centers. Interspeech 2020.
Byeongho Heo, Sanghyuk Chun, Seong Joon Oh, Dongyoon Han, Sangdoo Yun, Gyuwan Kim, Youngjung Uh, Jung-Woo Ha. "AdamP: Slowing Down the Slowdown for Momentum Optimizers on Scale-invariant Weights." ICLR 2021.
Min-Jae Hwang, Frank Soong, Eunwoo Song, Xi Wang, Hyeonjoo Kang, Hong-Goo Kang. "LP-WaveNet: Linear Prediction-based WaveNet Speech Synthesis." APSIPA 2020.
Min-Jae Hwang, Ryuichi Yamamoto, Eunwoo Song, Jae-Min Kim. "High-fidelity Parallel WaveGAN with Multi-band Harmonic-plus-Noise Model." Interspeech, 2021.
Hanjoo Kim, Minkyu Kim, Dongjoo Seo, Jinwoong Kim, Heungseok Park, Soeun Park, Hyunwoo Jo, KyungHyun Kim, Youngil Yang, Youngkwan Kim, Nako Sung, Jung-Woo Ha. "NSML: Meet the MLaaS platform with a real-world case study." arXiv:1810.09957. 2018.
Hwa-Yeon Kim, Jong-Hwan Kim, Jae-Min Kim. "NN-KoG2P: A Novel Graphemeto-Phoneme Model for Korean Language." ICASSP, 2021.
Boseop Kim et al. What Changes Can Large-scale Language Models Bring? Intensive Study on Billions-scale Korean Generative Pretrained Transformers. EMNLP 2021.
Jinwoong Kim, Minkyu Kim, Heungseok Park, Ernar Kusdavletov, Dongjun Lee, Adrian Kim, Ji-Hoon Kim, Jung-Woo Ha, Nako Sung. "CHOPT: Automated hyperparameter optimization framework for cloud-based machine learning platforms." arXiv:1810.03527. 2018.
Takuma Okamoto, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai. "Tacotron-based Acoustic Model using Phoneme Alignment for Practical Neural Text-to-Speecch Systems." ASRU 2019.
Aaron van den Oord, Sander Dieleman, Heiga Zen, Karen Simonyan, Oriol Vinyals, Alex Graves, Nal Kalchbrenner, Andrew Senior, Koray Kavukcuoglu. "WaveNet: A Generative Model for Raw Audio." 9th ISCA Speech Synthesis Workshop, 2016.
Heungseok Park, Jinwoong Kim, Minkyu Kim, Ji-Hoon Kim, Jaegul Choo, Jung-Woo Ha, Nako Sung. "VisualHyperTuner: Visual Analytics for User-driven Hyperparameter Tuning of Deep Neural Networks." Demo@SysML Conference. 2019.
Heungseok Park, Yoonsoo Nam, Ji-Hoon Kim, Jaegul Choo. "HyperTendril: Visual Analytics for User-Driven Hyperparameter Tuning of Deep Neural Networks." IEEE Trans. on Visualization and Computer Graphics 27(2). 2021.
Song Park, Sanghyuk Chun, Junbum Cha, Bado Lee, Hyunjung Shim. Multiple Heads are Better than One: Few-shot Font Generation with Multiple Localized Experts. AAAI 2021.
Sungjoon Park et al. KLUE: Korean Language Understanding Evaluation. arXiv:2105.09680. 2021.
Yi Ren, Chenxu Hu, Xu Tan, Tao Qin, Sheng Zhao, Zhou Zhao, Tie-Yan Liu. "FastSpeech 2: Fast and High-quality End-to-End Text to Speech." ICLR 2021.
Jonathan Shen, Ruoming Pang, Ron J. Weiss, Mike Schuster, Navdeep Jaitly, Zongheng Yang, Zhifeng Chen, Yu Zhang, Yuxuan Wang, RJ Skerry-Ryan, Rif A. Saurous, Yannis Agiomyrgiannakis, Yonghui Wu. "Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions." ICASSP 2018.
Eunwoo Song, Ryuichi Yamamoto, Min-Jae Hwang, Jin-Seob Kim, Ohsung Kwon, Jae-Min Kim. "Improved Parallel WaveGAN vocoder with Perceptually Weighted Spectrogram Loss." SLT 2021.
Nako Sung, Minkyu Kim, Hyunwoo Jo, Youngil Yang, Jingwoong Kim, Leonard Lausen, Youngkwan Kim, Gayoung Lee, Donghyun Kwak, Jung-Woo Ha, Sunghun Kim. "NSML: A machine learning platform that enables you to focus on your models." MLSYS WS@NIPS 2017.
Ryuichi Yamamoto, Eunwoo Song, Jae-Min Kim. "Parallel WaveGAN: A Fast Waveform Generation Model based on Generative Adversarial Networks with Multi-resolution Spectrogram." ICASSP, 2020.
Ryuichi Yamamoto, Eunwoo Song, Min-Jae Hwang, Jae-Min Kim. "Parallel Waveform Synthesis Based on Generative Adversarial Networks with Voicing-aware Conditional Discriminators." ICASSP 2021.
Sangdoo Yun, Dongyoon Han, Seong Joon Oh, Sanghyuk Chun, Junsuk Choe, Youngjoon Yoo. "CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features." ICCV 2019.
Hongyi Zhang, Moustapha Cisse, Yann N. Dauphin, David Lopez-Paz. mixup: Beyond Empirical Risk Minimization. ICLR 2018.
Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros. "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks." ICCV 2017.