• 제목/요약/키워드: 채팅 모델

검색결과 55건 처리시간 0.024초

Long Short-Term Memory를 이용한 통합 대화 분석 (Integrated Dialogue Analysis using Long Short-Term Memory)

  • 김민경;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도 되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

멀티-세션 오픈 도메인 지식기반 대화 수집 툴 (Multi-Session Open Domain Knowledge-based dialog collection Tool)

  • 김태용;김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.491-496
    • /
    • 2022
  • 최근 멀티-세션 데이터로 장기간 페르소나와 대화 일관성을 유지하며 인터넷에서 대화와 관련된 지식을 활용하는 대화모델 연구가 활발히 진행되고 있다. 하지만 이를 위한 한국어 멀티-세션 오픈 도메인 지식 기반 대화 데이터는 공개되지 않아 한국어 대화모델 연구에 어려움이 있다. 따라서 본 논문에서는 한국어 멀티-세션 오픈 도메인 지식 기반 데이터의 필요성을 시사하고, 데이터 수집을 위한 툴을 제안한다. 제안하는 수집 툴은 양질의 데이터 수집을 위해 작업자들이 사용하기 편하도록 UI/UX를 구성하였으며, 대화 생성 시 텍스트뿐만 아니라 정보가 밀집된 테이블도 대화에 활용할 지식으로 참조할 수 있도록 구현하였다. 제안하는 수집 툴은 웹 랜덤채팅 시스템에 기반을 두어 작업자가 여러 다른 작업자와 같은 확률로 매칭되게 구현되었으며, 일정 확률로 기존 대화로부터 대화를 시작하도록 함으로써 멀티-세션 대화 수집이 가능하도록 하였다.

  • PDF

KoELECTRA를 활용한 챗봇 데이터의 혐오 표현 탐지 (Hate Speech Detection in Chatbot Data Using KoELECTRA)

  • 신민기;진효진;송현호;최정회;임현승;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.518-523
    • /
    • 2021
  • 챗봇과 같은 대화형 에이전트 사용이 증가하면서 채팅에서의 혐오 표현 사용도 더불어 증가하고 있다. 혐오 표현을 자동으로 탐지하려는 노력은 다양하게 시도되어 왔으나, 챗봇 데이터를 대상으로 한 혐오 표현 탐지 연구는 여전히 부족한 실정이다. 이 연구는 혐오 표현을 포함한 챗봇-사용자 대화 데이터 35만 개에 한국어 말뭉치로 학습된 KoELETRA 기반 혐오 탐지 모델을 적용하여, 챗봇-사람 데이터셋에서의 혐오 표현 탐지의 성능과 한계점을 검토하였다. KoELECTRA 혐오 표현 분류 모델은 챗봇 데이터셋에 대해 가중 평균 F1-score 0.66의 성능을 보였으며, 오탈자에 대한 취약성, 맥락 미반영으로 인한 편향 강화, 가용한 데이터의 정확도 문제가 주요한 한계로 포착되었다. 이 연구에서는 실험 결과에 기반해 성능 향상을 위한 방향성을 제시한다.

  • PDF

3차원 동작객체 추출기술에 관한 연구 (A Study on a technology of extraction of motion objects)

  • 오영진;박노국
    • 한국산업정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 연구는 automation generation 기술에 의해 케릭터 대행자(agent)를 만드는 방법에 관한 산학 공동연구이다. 본 연구는 크게 세가지 기술로 나누어진다. 먼저 인체의 모델을 생성해내는 부분, 자동으로 동작을 생성해내는 부분, 그리고 합성된 인간 대행자를 매핑하는 부분이다. 본 연구결과의 주된 응용분야는 사이버공간, 3D 게임, 에니메이션, 가상쇼핑, 온라인 채팅, 가상교육시스템, 보안 및 시뮬레이션 등 인간의 대행자가 활용될 수 있는 곳에 사용될 수 있다.

  • PDF

PDA용 음성명령기 개발 (The development of an application invocation using speech recognition on PDA)

  • 이상철;정영준
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2002년도 하계학술대회 및 세미나
    • /
    • pp.213-219
    • /
    • 2002
  • 본 논문은 상용 OS 인 windows CE 기반의 PDA에서 음성으로 각 응용 프로그램 을 실행하는 방법 및 구성을 제시한다. PDA는 기존 desktop PC 에 비해 사용자 입력수단이 많지 않고, 그 사용법조차 까다롭다. 예를 들어 SIP(Soft Input Panel)을 이용하여 채팅을 하거나 인터넷 웹 브라우저에 주소입력조차 쉽지 않다. 이에 KT의 자체 개발한 음성인식엔진을 이용하여 PDA내 응용프로그램 과 사용자입력 요구사항을 원활히 연결, 보다 편리한 사용자 입력인터페이스를 제공한다. KT의 음성인식엔진은 corpus 기반으로 HMM 모델을 이용, 사용자 음성을 인식하여 그 결과를 출력한다. 본 논문에서는 PDA에서의 이러한 음성인식엔진을 이용, 다수의 응용프로그램을 실행하고 제어하는 구성과 패턴을 제시한다.

  • PDF

컴퓨터 지원 협동 CAD시스템에 관한 연구 (A Study on Computer Supported Collaborative CAD System)

  • 윤보열;김응곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.235-238
    • /
    • 2000
  • 오늘날 컴퓨터와 통신 기술의 발달로 시간과 공간의 제약 없이 공유된 가상 공간에서 작업을 하는 컴퓨터 지원 협동 시스템이 등장하고 있다. 그러나 그래픽 분야와 CAD시스템은 하드웨어와 응용 소프트웨어에 크게 의존하고 있는 실정이다. 여기에서 제안하는 협동 CAD시스템은 인터넷 망을 통하여 웹 상에서 플랫폼에 구애받지 않고 협동작업이 이루어지도록 하였고, VRML과 Java3D API를 이용하여 쉽게 도형을 생성하고 편집하여 전송하거나 출력 저장할 수 있도록 하며, 채팅을 통해 인터액티브 한 작업이 가능하게 하고 있다. 이 시스템은 클라이언트/서버 구조로 클라이언트는 자바 애플릿을 통해 웹 상에서 접근하고 서버는 자바 애플리케이션으로 접속을 통제하는 접속관리자, 작업 그룹의 동기화를 유지하며 공유작업공간을 확보하는 작업관리자, 그리고 3차원 도형 객체를 생성해 내는 솔리드 모델러로 이루어져 있다.

  • PDF

딥러닝를 사용한 온라인 게임에서의 욕설 탐지 (Abusive Sentence Detection using Deep Learning in Online Game)

  • 박성희;김휘강;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.13-14
    • /
    • 2019
  • 욕설은 게임 내 가장 큰 불쾌 요소 중 하나이다. 지금까지 게임 사용자들의 욕설을 방지하기 위해서 금칙어를 기반으로 필터링 해왔으나, 한국어 특성상 단어를 변형하거나 중간에 숫자를 넣는 등 우회할 방법이 다양하기 때문에 효과적이지 않다. 따라서 본 논문에서는 실제 온라인 게임 'Archeage'에서 수집된 채팅 데이터를 기반으로 딥러닝 기법 중 하나인 콘볼루션 신경망을 사용하여 욕설을 탐지하는 모델을 구축하였다. 한글의 자음, 모음을 분리하여 실험하였을 때, 87%라는 정확도를 얻었다. 한 글자씩 분리한 경우, 조금 더 좋은 정확도를 얻었으나, 사전의 수가 자소를 분리한 경우보다 10배 이상 늘어난 것을 고려해보면 자소를 분리한 것이 더 효율적이다.

  • PDF

커뮤니케이션 플랫폼을 활용한 단말 기기 원격 제어 및 IoT 서비스 (Remote control of terminal devices and IoT services using communication platform)

  • 국동균;한성수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.110-112
    • /
    • 2022
  • 본 서비스는 4 차 산업 혁명의 근간에 있는 IoT 서비스가 개인 수준에서 확장되지 않고 있음에 기반하여 여러 IoT 서비스를 통합하여 관리할 수 있는 소프트웨어를 개발, 커뮤니케이션 플랫폼에 삽입하여 원격 제어 및 IoT 서비스를 더욱 편리하게 개인에게 제공하고자 제작된 서비스이다. 플랫폼 사용자가 특정 채팅방에 명령어를 보내면 외부 단말 기기에 대한 원격 제어와 다양한 IoT 서비스가 지원된다. 스마트폰 사용 시간과 가장 많이 사용하는 애플리케이션 통계를 토대로 연동할 커뮤니케이션 플랫폼을 선정하므로 접근성과 서비스 효용성에서 이점을 가지며, 확장성 있는 소프트웨어를 개발하므로 발전 가능성 있는 모델을 제시한다.

과도한 권한을 요구하는 안드로이드 앱 탐지 (Detection of Android Apps Requiring Excessive Permissions)

  • 배경륜;이연재;김의연;태규빈;김형종;이해영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제57차 동계학술대회논문집 26권1호
    • /
    • pp.79-80
    • /
    • 2018
  • 안드로이드 운영체제는 앱을 설치하거나 실행할 때 사용자가 해당 앱이 요청하는 권한들을 승인하도록 하고 있으나, 일반적인 사용자들은 이를 주의 깊게 확인하지 않고 승인하는 경우가 많으며, 과도한 권한들을 요구하는 앱의 실행은 프라이버시 침해 문제로 이어질 수 있다. 본 논문에서는 제공하는 기능들에 비해 과도한 권한들을 요구하는 안드로이드 앱들을 탐지하는 모델을 제안한다. 먼저 손전등, 다이어리, 지불(페이) 및 채팅 앱 207개를 대상으로 요구하는 권한들을 조사하여 정리하였다. 조사 결과를 기준으로 설치 또는 실행하려는 앱이 어느 정도의 권한들을 요구하는지 가늠할 수 있다. 설치된 앱들의 요구 권한들을 조회할 수 있는 앱 프로토타입을 개발하였으며, 향후 모델의 구체화 및 검증을 거쳐, 프로토타입에 적용할 계획이다.

  • PDF

인공신경망 은닉층 해석을 위한 토픽과의 비교 (Comparison Between Hidden Layers of Neural Networks and Topics for Hidden Layer Comprehension)

  • 정영섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.910-913
    • /
    • 2017
  • 데이터의 양이 증가하면서 인공신경망을 통한 데이터 분석 기술이 주목받고 있으며, 텍스트, 그림, 동영상 등에 이르기까지 다양한 종류의 데이터를 자동으로 분석하여, 번역기, 채팅봇, 그림 캡션 자동 생성 등에 대한 연구 및 서비스 개발에 활용되고 있다. 인공신경망 기반으로 수행된 많은 연구들이 공통적으로 가진 한계가 있는데, 그것은 은닉층에 대한 해석이 어렵다는 것이다. 가령, 입력층, 은닉층, 그리고 결과층으로 이루어진 인공신경망을 임의의 데이터로 학습시키면, 입력층과 은닝층 사이에 존재하는 행렬은 해당 데이터에 존재하는 패턴 정보를 내포하게 된다. 따라서, 행렬에 존재하는 패턴 정보를 직접 분석할 수 있다면, 인공신경망 결과물에 대한 해석이 가능할 뿐만 아니라 성능을 높이기 위해 어떤 조정이 필요한지에 대한 직관도 얻을 수 있을 것이다. 하지만, 이 행렬의 실체는 숫자로 이루어진 벡터이므로 사람이 직접 해석하는 것은 불가능하며, 지금까지 수행되어온 대부분의 인공신경망 연구들은 공통적으로 이러한 한계점을 가지고 있다. 본 연구는 데이터에 존재하는 패턴을 잡아내면서도 해석이 가능한 토픽 모델과 인공신경망의 결과물을 비교함으로써, 인공신경망 은닉층 해석에 대한 실마리를 찾기 위한 연구이다. 실험을 통해 토픽과 은닉층 패턴의 유사성을 검증하고, 향후 인공신경망 연구에서 은닉층에 대한 가능성을 논한다.