• 제목/요약/키워드: Neologisms

검색결과 14건 처리시간 0.016초

BERT 모델과 지식 그래프를 활용한 지능형 챗봇 (An Intelligent Chatbot Utilizing BERT Model and Knowledge Graph)

  • 유소엽;정옥란
    • 한국전자거래학회지
    • /
    • 제24권3호
    • /
    • pp.87-98
    • /
    • 2019
  • 인공지능이 활발하게 연구되면서 이미지, 영상, 자연어 처리와 같은 다양한 분야에 적용되고 있다. 특히 자연어 처리 분야는 사람이 말하고 쓰는 언어들을 컴퓨터가 이해할 수 있도록 하기 위한 연구들이 진행되고 있고 인공지능 기술에서 매우 중요한 영역 중 하나로 여겨진다. 자연어 처리에서 컴퓨터에게 사람의 상식을 이해할 수 있도록 학습시키고 사람의 상식을 기반으로 결과를 생성하도록 하는 것은 복잡하지만 중요한 기술이다. 단어들의 관계를 이용해 연결한 지식 그래프는 컴퓨터에게 쉽게 상식을 학습시킬 수 있다는 장점이 있다. 하지만 기존에 고안된 지식 그래프들은 특정 언어나 분야에만 집중해 구성되어 있거나 신조어 등에는 대응하지 못하는 한계점을 갖고 있다. 본 논문에서는 실시간으로 데이터를 수집 및 분석하여 자동으로 확장 가능한 지식 그래프를 구축하고, 이를 기반 데이터로 활용하는 챗봇 시스템을 제안하고자 한다. 특히 자동 확장 그래프에 BERT 기반의 관계 추출 모델을 적용시켜 성능을 향상시키고자 한다. 자동 확장 지식 그래프를 이용해 상식이 학습되어 있는 챗봇을 구축하여 지식 그래프의 활용 가능성과 성능을 검증한다.

한국어 신조어 교육의 가치와 자료 구축을 위한시론 (Research on the Value of Korean Neologism Education and the Method of Building Data)

  • 김덕신
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.371-377
    • /
    • 2022
  • 이 연구는 그간 학습 결과, 교육적 결과물, 객체를 우선시하느라 한국어 어휘 교육에서 다루지 못한 '과정'으로서 주목해야 할 대상과 학습자는 없는지 검토한 후, 신조어의 교육적 가치를 점검하고 이에 대한 자료구축 방안을 제안하는 데 목적을 두었다. '과정' 중에 빠진 사각지대 어휘로는 신조어를, 사각지대 단계의 학습자로는 외국인 학문목적 학습자를 들고, 학문 목적 학습자에게 신조어를 가르치기 위한 학습 자료로 사전을 만들기 위한 전초 작업으로 신조어 '단층적 목록' 만들기를 제안하였다. '단층적 목록'은 신조어를 시기별로 조어, 의미, 문화 등으로 나누어 자료로 구축하는 것이다. 이러한 연구는 그간 한국어 어휘교육에서 구축한 결과물에 '과정'으로 학습으로 할 어휘를 추가하여 한국어 어휘교육을 체계적으로 하는 데 도움을 줄 것이다.

음악의 분위기와 폭소노미 태그의 관계 분석 (Analysis of Association between Mood of Music and Folksonomy Tag)

  • 문창배;김현수;장영완;김병만
    • 감성과학
    • /
    • 제16권1호
    • /
    • pp.53-64
    • /
    • 2013
  • 폭소노미는 폭소노미에 사용되는 태그에 대하여 유사어, 태깅 레벨, 신조어등의 문제점들이 있다. 본 연구자들은 이러한 문제점들을 해결하기 위해 음악의 분위기 강도(Arousal과 Valence의 강도)를 음악의 내부 태그로 활용하는 방법을 사용하고자 한다. 즉, A(Arousal)값과 V(Valence)값을 이용하여 음악의 분위기를 수치적으로 표현하고, 분위기 태그도 AV값으로 대응시켜 검색하게 되면 태그가 일치하지 않더라도 유사한 AV 값을 갖는 음악이 검색되어 결과적으로 분위기가 유사한 음악들을 검색할 수 있게 된다. 본 논문에서는 이의 선행연구로 AV값과 폭소노미 태그와의 관계를 정의하는 매핑테이블을 제안하고, 태그와 AV값의 연관 관계를 분석하기 위해 유명한 음악 검색 사이트인 last.fm에서 수집한 테스트 데이터에 대해 ANOVA 검증을 하였다. 검증결과, A값과 V값에 모두에 대하여 제 1종 오류확률 P가 0.0으로 귀무가설을 기각하고 대립가설을 채택할 수 있었다. 결론적으로 폭소노미 태그에 따라 AV 값 분포가 다르다는 것을 검증 할 수 있었다.

  • PDF

대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용 (Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity)

  • 이정원;임일
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.267-286
    • /
    • 2023
  • 인공지능 스피커로 대표되는 대화형 에이전트는 사람-컴퓨터 간 대화형이기 때문에 대화 상황에서 오류가 발생하는 경우가 잦다. 에이전트 사용자의 발화 기록에서 인식오류는 사용자의 발화를 제대로 인식하지 못하는 미인식오류 유형과 발화를 인식하여 서비스를 제공하였으나 사용자가 의도한 바와 다르게 인식된 오인식오류 유형으로 나뉜다. 이 중 오인식오류의 경우, 서비스가 제공된 것으로 기록되기 때문에 이에 대한 오류 탐지가 별도로 필요하다. 본 연구에서는 텍스트 마이닝 기법 중에서도 단어와 문서를 벡터로 바꿔주는 단어 임베딩과 문서 임베딩을 이용하여 단순 사용된 단어 기반의 유사도 산출이 아닌 단어의 분리 방식을 다양하게 적용함으로써 연속 발화 쌍의 유사도를 기반으로 새로운 오인식오류 및 신조어 탐지 방법을 탐구하였다. 연구 방법으로는 실제 사용자 발화 기록을 활용하여 오인식오류의 패턴을 모델 학습 및 생성 시 적용하여 탐지 모델을 구현하였다. 그 결과, 오인식오류의 가장 큰 원인인 등록되지 않은 신조어 사용을 탐지할 수 있는 패턴 방식으로 다양한 단어 분리 방식 중 초성 추출 방식이 가장 좋은 결과를 보임을 확인하였다. 본 연구는 크게 두 개의 함의를 가진다. 첫째, 인식오류로 기록되지 않아 탐지가 어려운 오인식오류에 대하여 다양한 방식 별 비교를 통해 최적의 방식을 찾았다. 둘째, 이를 실제 신조어 탐지 적용이 필요한 대화형 에이전트나 음성 인식 서비스에 적용한다면 음성 인식 단계에서부터 발생하는 오류의 패턴도 구체화할 수 있으며, 오류로 분류되지 않더라도 사용자가 원하는 결과에 맞는 서비스가 제공될 수 있음을 보였다.