• 제목/요약/키워드: 논문 리뷰

검색결과 466건 처리시간 0.026초

Plug and Play Language Model을 활용한 대화 모델의 독성 응답 생성 감소 (Reducing Toxic Response Generation in Conversational Models using Plug and Play Language Model)

  • 김병주;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.433-438
    • /
    • 2021
  • 대화 시스템은 크게 사용자와 시스템이 특정 목적 혹은 자유 주제에 대해 대화를 진행하는 것으로 구분된다. 최근 자유주제 대화 시스템(Open-Domain Dialogue System)에 대한 연구가 활발히 진행됨에 따라 자유 주제를 기반으로 하는 상담 대화, 일상 대화 시스템의 독성 발화 제어 생성에 대한 연구의 중요성이 더욱 커지고 있다. 이에 본 논문에서는 대화 모델의 독성 응답 생성을 제어하기 위해 일상 대화 데이터셋으로 학습된 BART 모델에 Plug-and-Play Language Model 방법을 적용한다. 공개된 독성 대화 분류 데이터셋으로 학습된 독성 응답 분류기를 PPLM의 어트리뷰트(Attribute) 모델로 활용하여 대화 모델의 독성 응답 생성을 감소시키고 그 차이를 실험을 통해 정량적으로 비교한다. 실험 결과 어트리뷰트 모델을 활용한 모든 실험에서 독성 응답 생성이 감소함을 확인하였다.

  • PDF

감성 단어 등장 순서를 고려한 영화 리뷰 감성 분석 (Movie Revies Sentiment Analysis Considering the Order in which Sentiment Words Appear)

  • 김홍진;김담린;김보은;오신혁;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.313-316
    • /
    • 2020
  • 감성 분석은 문장의 감성을 분석해 긍정 또는 부정으로 분류하는 작업을 의미한다. 문장에 담긴 감성을 파악해야 하기 때문에 문장 전체를 이해하는 것이 중요하다. 그러나 한 문장에 긍정과 부정의 이중 극성이 동존하는 문장은 감성 분석에 혼동이 생길 수 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 단어의 감성 점수 예측을 통해 감성 단어 등장 순서를 고려한 감성 분석 모델을 제안한다. 또한 최근 다양한 자연어 처리 분야에서 좋은 성능을 보이는 사전 학습 언어 모델을 활용한다. 실험 결과 감성 분석 정확도 90.81%로 기존 모델들에 비해 가장 좋은 성능을 보였다.

  • PDF

데이터 정제를 통한 딥러닝 기반의 유저 맞춤형 음식추천시스템 (User-specific Food Recommended System Using Data Cleaning)

  • 김균엽;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.578-581
    • /
    • 2020
  • 제품을 추천하는 기능은 사용자의 콘텐츠 또는 제품 소비량에 직결되기에 다양한 인터넷 플랫폼에서 많은 관심을 받고 있다. 이러한 제품 추천 시스템의 성능은 다양한 머신러닝 알고리즘과 딥러닝의 발전에 의해 성능을 비약적으로 개선되어왔다. 하지만 여느 딥러닝과 머신러닝 알고리즘과 마찬가지로 추천 시스템들의 성능은 빅데이터의 품질에 따라 매우 민감한 영향을 받는다. 본 논문에서는 모바일 배달 플랫폼에서 사용자들의 리뷰 데이터들을 통해 딥러닝과 빅데이터를 사용하여 음식을 추천하는 방법을 제안한다. 또한 사용자들의 리뷰 데이터들을 정제하여 데이터의 품질을 높이는 과정을 추가하여 그 결과가 성능에 얼마만큼 영향을 미치는 지를 실험을 통하여 분석한다.

  • PDF

Item2vec과 LSTM을 사용한 추천 시스템 설계 (Recommender System Design with Item2vec and LSTM)

  • 차민수;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.145-146
    • /
    • 2023
  • 본 논문에서는 최대 규모의 게임 플랫폼인 Steam에서 수집한 유저 정보 데이터 셋에 Item2vec과 LSTM을 사용하여 추천 시스템을 구현한다. 수집한 유저 정보 데이터 셋에 Item2vec을 적용하여 각각의 유저들이 보유하고 있는 고유한 Appid들을 200차원의 벡터로 변환한다. 그 후 데이터 셋을 기간에 따라 4단계의 시퀀스로 나눈 후 LSTM을 사용하여 유저별로 최대 5가지의 추천 리스트를 생성한다. 유저 정보 데이터 셋은 액티브한 유저 정보를 얻기 위해 Steam 게임 리뷰 항목에서 리뷰를 남긴 유저들의 데이터를 api를 사용해 수집했으며 LSTM을 사용한 실험의 성능 평가 지표는 RMSE를 사용했고 이때의 성능은 0.1357을 얻을 수 있었다.

  • PDF

유아용 스마트폰 애플리케이션 평가 및 리뷰점수에 따른 차이분석 (Evaluation of Smart-phone Applications for Young Children and Analysis of Differences according to Review Scores)

  • 구희정
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.228-236
    • /
    • 2020
  • 본 연구는 2020년 4월 현재 우리나라의 안드로이드 기반 스마트폰에 탑재된 유아용 애플리케이션을 리뷰점수에 따라 상·하위 집단으로 나누어 각각 30개씩의 애플리케이션을 선정하고, 내용 분석 및 애플리케이션 평가를 실시하여 집단 간 차이가 있는지 살펴보는 것이었다. 이를 통해 유아용 스마트폰 애플리케이션에 대한 객관적 정보를 제공함으로써 부모와 유아교육전문가가 질적으로 우수한 유아용 애플리케이션을 선택할 수 있도록 돕고, 애플리케이션 개발자에게는 발달에 적합한 유아용 애플리케이션 개발을 위한 아이디어와 방향성을 제시하고자 하였다. 애플리케이션의 내용분석 결과, 애플리케이션 유형은 상·하위 집단 모두에서 자료제시형, 시뮬레이션형 및 게임형만 나타났고, 주제가 속한 누리과정 영역은 상·하위 집단에서 5개 누리과정영역이 모두 나타났으나 그 순서에서는 차이를 보였다. 앱 구매비용의 경우, 리뷰점수 상위 집단은 저가부터 100,000원 이상의 고가까지 분포되어 있는 반면, 하위집단에서는 상대적으로 고가의 애플리케이션이 적었다. 한편 애플리케이션 평가 결과, 리뷰점수 상·하위 집단 간에는 기능요소 전체와 내용요소 전체를 비롯하여 평가 점수 전체에 대해 유의미한 차이가 나타났다. 세부 하위요인의 경우 기능요소의 '기술성'을 제외한 모든 요인에서 유의미한 차이를 보였다.

동적 색인 스토리지 및 통합 검색 서비스 개발 (Dynamic index storage and integrated searching service development)

  • 이왕우;이석형;최호섭;윤화묵;김종환;허윤영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.346-349
    • /
    • 2007
  • 본 논문은 웹뉴스 및 리뷰 검색 서비스를 위해 만든 통합 검색 시스템을 소개한다. 검색 서비스를 위한 데이터 수집을 위해서 특정 사이트에서 수집한 뉴스와 리뷰 문서로부터 제목, 날짜, 저자, 본문처럼 특정한 영역의 데이터만 추출하는 XSLTRobot을 만들었다. XSLTRobot은 원하는 부분의 데이터만 추출하기 위해 XSLT 기술을 이용한다. 여러가지 검색 데이터 형식에 적합한 통합 검색엔진과 통합 검색엔진의 스토리지 모듈중 하나인 동적 색인 저장소(Dynamic Index Storage)를 소개한다. 동적 색인 저장소는 뉴스 데이터처럼 색인의 업데이트가 빨라야 하는 환경에 이용된다. 본 논문에서 제시하는 동적 색인 저장소는 대량의 실시간 업데이트 문서를 처리하지 않기 때문에 검색성능에 초점을 맞춰서 설계하였다.

  • PDF

IOCP 서버 모델을 이용한 세미나 보조시스템 (A Seminar Assistant System using IOCP Server Model)

  • 안현주;허다정;박동규;어윤
    • 한국정보통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.821-827
    • /
    • 2009
  • 웹 2.0의 발전과 함께 같이 참여와 공유를 통한 지식 기반 시스템은 오늘날 그 중요성이 더해지고 있다. 본 논문에서는 여러 대중을 상대로 이루어진 세미나 내용을 데이터베이스를 통하여 체계적으로 관리하고 이를 지식 공유시스템으로 발전시키는 세미나 보조 시스템에 관한 연구와 구현 결과를 다룬다. 이를 위하여 세미나 데이터베이스에 세미나 음성과 프레젠테이션 파일로 녹화된 내용을 저장하고, 추후에 세미나 수강자가 리뷰시스템을 통하여 수강할 수 있도록 제작하였다. 시스템을 위한 데이터 베이스는 마이크로소프트사의 MS SQL, 서버 측 네트워크를 위한 소켓은 소켓 모델 중에서 확장성이 뛰어난 IOCP 모델을 사용하였다. 강연자가 강연을 위하여 녹화하게 될 프리젠터 소프트웨어는 DirectShow와 WPF(Windows Presentation Foundation) 라이브러리를 사용하였으며, 사용자가 이용하는 리뷰시스템은 WPF와 C# 언어를 사용하여 개발하였다.

연관성 모델에 기반한 오피년마이닝 시스템의 설계 및 구현 (Design and Implementation of Opinion Mining System based on Association Model)

  • 김근형
    • 한국정보통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.133-140
    • /
    • 2011
  • 특정 제품이나 서비스에 대한 네티즌의 의견들은 고객들의 구매 행위에서의 참고대상일 뿐만 아니라 기업 입장에서도 마케팅이나 경영전략을 수립하기 위한 중요한 자료가 될 수 있기 때문에 온라인 고객리뷰를 분석하는 것은 매우 중요하다. 본 논문에서는 비정형(unformatted) 데이터형인 자연어(natural language) 형태로 웹상에 게시된 고객 의견들을 분석할 수 있는 새로운 오피년마이닝 기법을 제안한다. 기존 데이터마이닝 기법 중의 하나인 연관규칙탐사 기법을 수정하여 오피년마이닝 과정에 보다 효율적이고 효과적으로 적용하기 위한 방안을 고찰하고 이를 기반으로 실제 시스템을 설계하고 구현하였다.

Developing a Big Data Analysis Platform for Small and Medium-Sized Enterprises

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.65-72
    • /
    • 2020
  • 금융, 통신 등의 응용 분야에서 빅데이터는 광범위하게 활용되고 있으며, 빅데이터 분석 시장은 해마다 크게 성장하고 있다. 이에 반해 소상공인들의 빅데이터 활용 실적은 저조하며, 이는 기존 시스템이 소상공인들의 여건을 충분히 반영하지 못하는 동시에 서비스 이용 가격 역시 높다는 점에 기인한다. 이를 해결하기 위한 노력의 일환으로, 본 논문에서는 소상공인에 특화된 빅데이터 분석 서비스를 제공하는 새로운 플랫폼을 개발, 제안한다. 먼저 소셜 빅데이터 분석과 관련한 기존 연구들을 비교하고, 소상공인의 마케팅을 돕기 위해 필요한 서비스 지표들을 추출한다. 다음으로 도출된 지표들을 구현한 프로토타입 시스템을 소개하고, 구현을 통해 얻어진 시스템 완성에 필요한 기술적인 이슈들을 논의한다.

고령 암 환자의 방사선치료 (Radiotherapy in Elderly Patients with Cancer)

  • 전미선;조선미
    • Radiation Oncology Journal
    • /
    • 제29권1호
    • /
    • pp.1-10
    • /
    • 2011
  • 평균수명이 길어짐에 따라 암 발생률이 증가하고 있고, 보다 고령의 환자가 많아졌다. 자연적으로 고령의 암 환자는 장기 기능이 퇴화되고 동반질환을 갖는 경우가 흔하다. 사회적인 지지부족이나 조기진단의 부족으로 고령 암 환자의 치료는 일반적으로 빈약하다. 그러나 발표된 논문들을 바탕으로 하였을 때 신중히 환자 선택을 하여 암 치료 기간 동안 적극적인 지지치료를 한다면 대부분의 고령환자는 표준 치료를 잘 견디면서 좋은 결과를 얻을 수 있었다. 이에 저자들은 각각의 암에 대한 고령 환자의 치료 순응도와 치료 결과에 대한 논문들을 리뷰해 보았다.