• 제목/요약/키워드: Language convergence

검색결과 789건 처리시간 0.023초

문서 임베딩을 이용한 소셜 미디어 문장의 개체 연결 (Document Embedding for Entity Linking in Social Media)

  • 박영민;정소윤;이정엄;신동수;김선아;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-196
    • /
    • 2017
  • 기존의 단어 기반 접근법을 이용한 개체 연결은 단어의 변형, 신조어 등이 빈번하게 나타나는 비정형 문장에 대해서는 좋은 성능을 기대하기 어렵다. 본 논문에서는 문서 임베딩과 선형 변환을 이용하여 단어 기반 접근법의 단점을 해소하는 개체 연결을 제안한다. 문서 임베딩은 하나의 문서 전체를 벡터 공간에 표현하여 문서 간 의미적 유사도를 계산할 수 있다. 본 논문에서는 또한 비교적 정형 문장인 위키백과 문장과 비정형 문장인 소셜 미디어 문장 사이에 선형 변환을 수행하여 두 문형 사이의 표현 격차를 해소하였다. 제안하는 개체 연결 방법은 대표적인 소셜 미디어인 트위터 환경 문장에서 단어 기반 접근법과 비교하여 높은 성능 향상을 보였다.

  • PDF

Continual learning을 이용한 한국어 상호참조해결의 도메인 적응 (Domain adaptation of Korean coreference resolution using continual learning)

  • 최요한;조경빈;이창기;류지희;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.320-323
    • /
    • 2022
  • 상호참조해결은 문서에서 명사, 대명사, 명사구 등의 멘션 후보를 식별하고 동일한 개체를 의미하는 멘션들을 찾아 그룹화하는 태스크이다. 딥러닝 기반의 한국어 상호참조해결 연구들에서는 BERT를 이용하여 단어의 문맥 표현을 얻은 후 멘션 탐지와 상호참조해결을 동시에 수행하는 End-to-End 모델이 주로 연구가 되었으며, 최근에는 스팬 표현을 사용하지 않고 시작과 끝 표현식을 통해 상호참조해결을 빠르게 수행하는 Start-to-End 방식의 한국어 상호참조해결 모델이 연구되었다. 최근에 한국어 상호참조해결을 위해 구축된 ETRI 데이터셋은 WIKI, QA, CONVERSATION 등 다양한 도메인으로 이루어져 있으며, 신규 도메인의 데이터가 추가될 경우 신규 데이터가 추가된 전체 학습데이터로 모델을 다시 학습해야 하며, 이때 많은 시간이 걸리는 문제가 있다. 본 논문에서는 이러한 상호참조해결 모델의 도메인 적응에 Continual learning을 적용해 각기 다른 도메인의 데이터로 모델을 학습 시킬 때 이전에 학습했던 정보를 망각하는 Catastrophic forgetting 현상을 억제할 수 있음을 보인다. 또한, Continual learning의 성능 향상을 위해 2가지 Transfer Techniques을 함께 적용한 실험을 진행한다. 실험 결과, 본 논문에서 제안한 모델이 베이스라인 모델보다 개발 셋에서 3.6%p, 테스트 셋에서 2.1%p의 성능 향상을 보였다.

  • PDF

형태소 수준의 한국어 상호참조해결 (Korean Coreference Resolution at the Morpheme Level )

  • 조경빈;최요한;이창기;류지희;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.329-333
    • /
    • 2022
  • 상호참조해결은 주어진 문서에서 상호참조해결 대상이 되는 멘션(mention)을 식별하고, 동일한 개체(entity)를 의미하는 멘션들을 찾아 그룹화하는 자연어처리 태스크이다. 최근 상호참조해결에서는 BERT를 이용하여 단어의 문맥 표현을 얻은 후, 멘션 탐지와 상호참조해결을 동시에 진행하는 End-to-End 모델이 주로 연구가 되었다. 그러나 End-to-End 방식으로 모델을 수행하기 위해서는 모든 스팬을 잠재적인 멘션으로 간주해야 되기 때문에 많은 메모리가 필요하고 시간 복잡도가 상승하는 문제가 있다. 본 논문에서는 서브 토큰을 다시 단어 단위로 매핑하여 상호참조해결을 수행하는 워드 레벨 상호참조해결 모델을 한국어에 적용하며, 한국어 상호참조해결의 특징을 반영하기 위해 워드 레벨 상호참조해결 모델의 토큰 표현에 개체명 자질과 의존 구문 분석 자질을 추가하였다. 실험 결과, ETRI 질의응답 도메인 평가 셋에서 F1 69.55%로, 기존 End-to-End 방식의 상호참조해결 모델 대비 0.54% 성능 향상을 보이면서 메모리 사용량은 2.4배 좋아졌고, 속도는 1.82배 빨라졌다.

  • PDF

A Study of AI Impact on the Food Industry

  • Seong Soo CHA
    • 식품보건융합연구
    • /
    • 제9권4호
    • /
    • pp.19-23
    • /
    • 2023
  • The integration of ChatGPT, an AI-powered language model, is causing a profound transformation within the food industry, impacting various domains. It offers novel capabilities in recipe creation, personalized dining, menu development, food safety, customer service, and culinary education. ChatGPT's vast culinary dataset analysis aids chefs in pushing flavor boundaries through innovative ingredient combinations. Its personalization potential caters to dietary preferences and cultural nuances, democratizing culinary knowledge. It functions as a virtual mentor, empowering enthusiasts to experiment creatively. For personalized dining, ChatGPT's language understanding enables customer interaction, dish recommendations based on preferences. In menu development, data-driven insights identify culinary trends, guiding chefs in crafting menus aligned with evolving tastes. It suggests inventive ingredient pairings, fostering innovation and inclusivity. AI-driven data analysis contributes to quality control, ensuring consistent taste and texture. Food writing and marketing benefit from ChatGPT's content generation, adapting to diverse strategies and consumer preferences. AI-powered chatbots revolutionize customer service, improving ordering experiences, and post-purchase engagement. In culinary education, ChatGPT acts as a virtual mentor, guiding learners through techniques and history. In food safety, data analysis prevents contamination and ensures compliance. Overall, ChatGPT reshapes the industry by uniting AI's analytics with culinary expertise, enhancing innovation, inclusivity, and efficiency in gastronomy.

한국어 음성인식 후처리를 위한 주의집중 기반의 멀티모달 모델 (Attention based multimodal model for Korean speech recognition post-editing)

  • 정영석;오병두;허탁성;최정명;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-150
    • /
    • 2020
  • 최근 음성인식 분야에서 신경망 기반의 종단간 모델이 제안되고 있다. 해당 모델들은 음성을 직접 입력받아 전사된 문장을 생성한다. 음성을 직접 입력받는 모델의 특성상 데이터의 품질이 모델의 성능에 많은 영향을 준다. 본 논문에서는 이러한 종단간 모델의 문제점을 해결하고자 음성인식 결과를 후처리하기 위한 멀티모달 기반 모델을 제안한다. 제안 모델은 음성과 전사된 문장을 입력 받는다. 입력된 각각의 데이터는 Encoder를 통해 자질을 추출하고 주의집중 메커니즘을 통해 Decoder로 추출된 정보를 전달한다. Decoder에서는 전달받은 주의집중 메커니즘의 결과를 바탕으로 후처리된 토큰을 생성한다. 본 논문에서는 후처리 모델의 성능을 평가하기 위해 word error rate를 사용했으며, 실험결과 Google cloud speech to text모델에 비해 word error rate가 8% 감소한 것을 확인했다.

  • PDF

긴 문서를 위한 BERT 기반의 End-to-End 한국어 상호참조해결 (Korean End-to-End Coreference Resolution with BERT for Long Document)

  • 조경빈;정영준;이창기;류지희;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.259-263
    • /
    • 2021
  • 상호참조해결은 주어진 문서에서 상호참조해결 대상이 되는 멘션(mention)을 식별하고, 동일한 개체(entity)를 의미하는 멘션들을 찾아 그룹화하는 자연어처리 태스크이다. 최근 상호참조해결에서는 BERT를 이용하여 단어의 문맥 표현을 얻은 후, 멘션 탐지와 상호참조해결을 동시에 진행하는 end-to-end 모델이 주로 연구되었으나, 512 토큰 이상의 긴 문서를 처리하기 위해서는 512 토큰 이하로 문서를 분할하여 처리하기 때문에 길이가 긴 문서에 대해서는 상호참조해결 성능이 낮아지는 문제가 있다. 본 논문에서는 512 토큰 이상의 긴 문서를 위한 BERT 기반의 end-to-end 상호참조해결 모델을 제안한다. 본 모델은 긴 문서를 512 이하의 토큰으로 쪼개어 기존의 BERT에서 단어의 1차 문맥 표현을 얻은 후, 이들을 다시 연결하여 긴 문서의 Global Positional Encoding 또는 Embedding 값을 더한 후 Global BERT layer를 거쳐 단어의 최종 문맥 표현을 얻은 후, end-to-end 상호참조해결 모델을 적용한다. 실험 결과, 본 논문에서 제안한 모델이 기존 모델과 유사한 성능을 보이면서(테스트 셋에서 0.16% 성능 향상), GPU 메모리 사용량은 1.4배 감소하고 속도는 2.1배 향상되었다.

  • PDF

음절과 형태소 정보를 이용한 한국어 문장 띄어쓰기 교정 모델 (Korean sentence spacing correction model using syllable and morpheme information)

  • 최정명;오병두;허탁성;정영석;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.141-144
    • /
    • 2020
  • 한국어에서 문장의 가독성이나 맥락 파악을 위해 띄어쓰기는 매우 중요하다. 또한 자연 언어 처리를 할 때 띄어쓰기 오류가 있는 문장을 사용하면 문장의 구조가 달라지기 때문에 성능에 영향을 미칠 수 있다. 기존 연구에서는 N-gram 기반 통계적인 방법과 형태소 분석기를 이용하여 띄어쓰기 교정을 해왔다. 최근 들어 심층 신경망을 활용하는 많은 띄어쓰기 교정 연구가 진행되고 있다. 기존 심층 신경망을 이용한 연구에서는 문장을 음절 단위 또는 형태소 단위로 처리하여 교정 모델을 만들었다. 본 연구에서는 음절과 형태소 단위 모두 모델의 입력으로 사용하여 두 정보를 결합하여 띄어쓰기 교정 문제를 해결하고자 한다. 모델은 문장의 음절과 형태소 시퀀스에서 지역적 정보를 학습할 수 있는 Convolutional Neural Network와 순서정보를 정방향, 후방향으로 학습할 수 있는 Bidirectional Long Short-Term Memory 구조를 사용한다. 모델의 성능은 음절의 정확도와 어절의 정밀도, 어절의 재현율, 어절의 F1 score를 사용해 평가하였다. 제안한 모델의 성능 평가 결과 어절의 F1 score가 96.06%로 우수한 성능을 냈다.

  • PDF

모국어 오디오 콘텐츠 기반의 모바일 외국어 학습 플랫폼 개발 연구 (A Study on the Development of Mobile Foreign Language Learning Platform Based on Audio Contents of Mother Tongue)

  • 림빈;임영환;심근정;이요셉
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.487-495
    • /
    • 2021
  • 각자가 가진 모국어 능력을 활용한 외국어 오디오 콘텐츠 플랫폼 개발을 통해 보다 쉽고 재밌으며 또한 편리하게 외국어를 습득할 수 있도록 하는데 본 연구의 목적이 있다. 이를 위해 실생활에서 사용하는 모국어를 중심으로 오디오 콘텐츠를 거래할 수 있는 플랫폼을 제안한다. 일상생활에서 큰 노력을 들이지 않고 만들어낼 수 있는 콘텐츠들이 외국어 학습자들에게는 그 언어의 자연스러운 쓰임새를 배울 수 있는 소중한 콘텐츠로 사용되는 것이다. 현재 대다수의 외국어 학습 플랫폼은 콘텐츠 고갈과 낮은 콘텐츠의 실제성의 문제점을 안고 있다. 본 플랫폼을 통해 이러한 기존 단점들을 개선하여 학습자들에게는 외국어를 보다 현실적이고 효율적으로 배울 수 있는 기회를 부여함과 동시에 원어민들에게는 여유시간을 활용한 부가수익 창출 기회를 부여할 수 있을 것으로 기대한다.

국어 교과 융합 AI 교육 프로그램 개발 (Development of an AI Education Program Converging with Korean Language Subject)

  • 신진선;조미헌
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.289-294
    • /
    • 2021
  • 인공지능의 발달로 인해 전 세계적으로 4차 산업혁명의 물결이 일고 있다. 빅데이터, 사물인터넷 기반의 인공지능 기술로 모든 것이 하나로 융합되는 초연결 사회로 향하고 있다. 이에 따라 인공지능 시대의 교육 인재상으로 창의 융합형 인재 양성과 더불어서 감성적 창조 인재 양성을 추구하고 있다. 인간의 창의성 및 감성을 중심으로 인공지능과 협업하고 다양한 분야의 지식을 융합하여 새로운 것을 창조할 줄 알아야 한다. 이에 따라 본 연구는 인문학적 성향인 국어와 공학적 성향인 인공지능을 융합한 프로그램을 개발하여, 학생들이 인문학적 소양과 공학적 사고력을 융합해 창의적으로 문제를 해결하는 경험을 할 수 있도록 하였다. 교육 프로그램의 내용은 'AI와 함께하는 도서' 및 'AI와 함께하는 연극'과 같은 두 가지이었으며, 학생들이 인문학적 문제를 인공지능을 활용하여 해결하도록 하는 15차시 수업으로 구성하였다.

  • PDF

해외어학연수의 외국어 정확성 향상에 대한 효과 (The Effect of Overseas Language Training on the Development of Foreign Language Accuracy)

  • 차미양
    • 산업융합연구
    • /
    • 제18권4호
    • /
    • pp.93-99
    • /
    • 2020
  • 본 연구는 해외어학연수의 외국어 정확성 향상에 대한 효과를 조명하기 위해 한 학기 동안 해외대학에서 어학연수를 받은 27명의 한국 대학생들이 한 학기의 시간차를 두고 작성한 두 영작문 간의 차이와 오류들을 조사하고, 그러한 차이가 통계적으로 유의미한지를 검정하여 외국어 정확도 면에서의 변화를 분석하였다. 어학연수 이후에 영작문의 길이와 문장의 길이가 증가하였으나 전체 문장수는 감소하였다. 학생들은 더 많은 수의 단어를 더 복잡한 구조의 문장에서 사용하여 오류의 수도 증가하였다. 이를 볼 때, 어학연수 이후 학생들의 문장 생성능력이 향상되고 복잡한 형태의 문장들을 쓰려고 시도한 것을 알 수 있다. 본 연구의 결과는 한 학기 동안 해외어학연수를 받은 이후 대체로 학생들의 문장생성능력은 다소 증진하였지만, 문법적 요소들을 문장 속에서 정확하게 사용하는 문법적 정확성은 크게 향상하지 않은 것으로 나타났다. 이는 비록 해외 어학연수가 집중적으로 목표언어만 학습하여 언어입력을 확대할 수 있을 뿐만 아니라, 목표언어에 자연스럽게 노출될 수 있는 환경적 이점을 제공하긴 하지만, 한 학기라는 기간 안에 문법적으로 정확한 문장을 생성해내는 문법능력을 향상시키는 데는 크게 효과적이지 않았다는 것을 시사한다.