• 제목/요약/키워드: Question and Answer Community

검색결과 44건 처리시간 0.022초

Application of ChatGPT text extraction model in analyzing rhetorical principles of COVID-19 pandemic information on a question-and-answer community

  • Hyunwoo Moon;Beom Jun Bae;Sangwon Bae
    • International journal of advanced smart convergence
    • /
    • 제13권2호
    • /
    • pp.205-213
    • /
    • 2024
  • This study uses a large language model (LLM) to identify Aristotle's rhetorical principles (ethos, pathos, and logos) in COVID-19 information on Naver Knowledge-iN, South Korea's leading question-and-answer community. The research analyzed the differences of these rhetorical elements in the most upvoted answers with random answers. A total of 193 answer pairs were randomly selected, with 135 pairs for training and 58 for testing. These answers were then coded in line with the rhetorical principles to refine GPT 3.5-based models. The models achieved F1 scores of .88 (ethos), .81 (pathos), and .69 (logos). Subsequent analysis of 128 new answer pairs revealed that logos, particularly factual information and logical reasoning, was more frequently used in the most upvoted answers than the random answers, whereas there were no differences in ethos and pathos between the answer groups. The results suggest that health information consumers value information including logos while ethos and pathos were not associated with consumers' preference for health information. By utilizing an LLM for the analysis of persuasive content, which has been typically conducted manually with much labor and time, this study not only demonstrates the feasibility of using an LLM for latent content but also contributes to expanding the horizon in the field of AI text extraction.

Q&A 커뮤니티 기반 전문영역 검색을 위한 프레임워크 (A Framework for Q&A Community based Vertical Search)

  • 정옥란;오제환;이은석
    • 한국전자거래학회지
    • /
    • 제16권2호
    • /
    • pp.143-158
    • /
    • 2011
  • 본 연구는 Q&A(question and answer:질문-답변) 커뮤니티 사이트에서 집단지성의 특성을 추출하고, 이를 이용한 전문지식이나 정보 검색을 위한 전문영역 검색(vertical search) 을 위한 프레임워크를 제안한다, 많은 Q&A 사이트로부터 얻은 정보는 하나의 집단지성의 형태로 볼 수 있으며, 전문영역 검색은 특정 전문 분야 검색에 초점을 맞춘 검색 방법이다. 제안된 프레임워크는 사용자가 검색하고자 하는 질의어와 연관되어 있는 질문(question)과 답변(answer) 정보를 이용하여 관련어를 확장한 후, 이를 기반으로 전문지식을 요구하는 특정 도메인분야에 적용하게 된다. 이를 통해 일반 검색 엔진을 통해 검색된 검색 결과보다 유용한 정보와 전문적인 상세정보까지 제공해 줄 수 있다.

지식검색 커뮤니티에서 신뢰성 있는 답변을 제공하기 위한 답변자들의 전략 (Answerers' Strategies to Provide Credible Information in Question Answering Community)

  • 김수정
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.21-35
    • /
    • 2010
  • 야후 앤서(Yahoo! Answers)와 네이버 지식인과 같은 지식 검색 커뮤니티가 활성화되면서 전문가가 아닌 일반인이 제공하는 정보에 대한 신뢰성이 끊임없이 제기되어 왔지만 일반인 답변자들의 신뢰성 있는 정보 제공 노력에 대한 연구는 미흡한 실정이다. 이에 본 연구는 야후 앤서에서 활동하는 44명의 일반인 답변자들과의 이메일, 채팅, 전화 인터뷰를 통해 그들이 이용하는 정보원, 신뢰성 있는 정보 제공을 위한 전략, 그리고 자칭 전문성(self-claimed expertise)에 대한 인식을 알아보았다. 본 연구의 결과는, 일반인을 효과적인 정보제공자로 교육시키는 이용자 교육 측면에서 활용될 수 있다.

위치문답형 지역광고 기반의 문화정보 서비스 모델링 (Regional Culture Contents Service Modeling Based On Localized Advertising of Question And Answer Format)

  • 신환섭;이재원
    • 한국콘텐츠학회논문지
    • /
    • 제19권8호
    • /
    • pp.465-472
    • /
    • 2019
  • 지역에서 생산되는 문화행사 및 문화 콘텐츠가 다양하고 많지만 관련한 경제소비의 확대를 위한 지역정보의 유통과 확산이 부족하다. 본 연구는 지역 문화정보의 확산과 사용을 목적으로 위치기반 서비스 관점에서 지역광고주의 지역광고를 질문과 답변 형식의 지식검색 방법과 결합하고 서비스화 하였다. 접근 방법으로는 지역에 기반한 지식검색에 대한 국내외 사례와 위치기반 광고 연구를 살펴보고, 위치문답형 정보서비스의 커뮤니티 모델 그리고 지역광고의 수익 모델을 제시하였다. 이를 통해 본 연구는 지역 문화행사와 문화콘텐츠의 정보유통을 위한 문답기반 커뮤니티와 지역광고의 운영구조 모델을 설계하고 정보 서비스 시스템을 프로토타이핑 형태로 개발하였다. 사용자간의 문답 데이터의 유통을 위치정보에 확장함으로써 지역의 문화콘텐츠 정보와 사용자 접근의 수요를 지역광고의 수익모델과 결합하여 제공하는 비즈니스 서비스 모델을 제시하였다는 의의를 갖는다.

다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템 (A Korean Community-based Question Answering System Using Multiple Machine Learning Methods)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1085-1093
    • /
    • 2016
  • 커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.

Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템 (Question and Answering System through Search Result Summarization of Q&A Documents)

  • 유동현;이현아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권4호
    • /
    • pp.149-154
    • /
    • 2014
  • 지식iN과 같은 사용자 참여 질의응답 커뮤니티에서 원하는 질문에 대한 답을 찾기 위해서는 검색 결과로 제공되는 다양한 문서를 일일이 확인하여 판단하는 과정이 필요하다. 만일 사용자가 원하는 답변을 자동으로 정제하여 제시할 수 있다면, 질의응답의 사용성이 크게 향상될 수 있다. 본 논문에서는 질의응답 데이터 분석을 통해 사용자의 질문의 유형을 단어, 목록, 도표, 글의 4가지 유형으로 분류하고, 문서 내 통계적 특성을 활용하여 각 분류별 답변을 자동으로 제시하기 위한 방식을 제안한다. 단어, 목록, 글 유형은 질의어에 대해 검색된 질문을 군집화하고, 군집 내 빈도와 질의어에 대한 근접도, 답변 신뢰도 등으로 계산된 답변 내 어휘의 적합도를 활용하여 요약한 답변을 사용자에게 제시한다. 도표형은 답변들에서 사용자의 의견 정보를 추출하여 의견 통계를 도표로 제시한다.

질의응답 커뮤니티에서 문서 간 이독성 비교 (Comparison of Readability between Documents in the Community Question-Answering)

  • 문길성
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.25-34
    • /
    • 2020
  • 커뮤니티 질의응답 서비스는 다양한 목적으로 활용되고 있다. 질의응답 문서에서 정보의 품질은 질문의 명확성과 답변 내용의 적절성으로 결정되며 문서의 읽기 쉬운 정도를 나타내는 이독성(readability)은 문서가 가지고 있는 정보의 품질을 평가하기 위한 주요 요소이다. 본 연구의 목적은 국내의 CQA 사이트에서 제공되는 문서의 품질을 측정하는 것이다. 이를 위하여 네이버 지식iN의 '국민 신문고' 커뮤니티의 문서에서 사용된 어휘 수준별 사용 빈도를 비교하고, 작성 기관별 문서의 이독성 지수를 측정하였다. 이독성 지수의 측정은 어휘 수준과 문장 길이를 바탕으로 계산되는 Dale-Chall 공식을 사용하였다. 분석 결과, 답변에서 사용된 어휘는 질문에서 사용된 어휘보다 더 어려운 수준이고 문장 길이도 더 길어서 이독성이 더 낮은 것으로 나타났다. 또한, 질의응답간 이독성의 차이는 작성 기관별로도 차이가 있음을 파악할 수 있었다. 본 연구의 결과는 상담업무에 반영할 수 있는 유용한 정보를 도출하여 온라인상의 민원상담 개선에 활용할 수 있으며, 이독성 지수에 기반하여 문서 수준의 정량적 분석을 시도함으로써 텍스트 마이닝의 주제를 확장할 수 있을 것으로 기대한다.

KOMUChat : 인공지능 학습을 위한 온라인 커뮤니티 대화 데이터셋 연구 (KOMUChat: Korean Online Community Dialogue Dataset for AI Learning)

  • 유용상;정민화;이승민;송민
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.219-240
    • /
    • 2023
  • 사용자가 만족감을 느끼며 상호작용할 수 있는 대화형 인공지능을 개발하기 위한 노력이 이어지고 있다. 대화형 인공지능 개발을 위해서는 사람들의 실제 대화를 반영한 학습 데이터를 구축하는 것이 필요하지만, 기존 데이터셋은 질문-답변 형식이 아니거나 존대어를 사용하여 사용자가 친근감을 느끼기 어려운 문체로 구성되어 있다. 이에 본 논문은 온라인 커뮤니티에서 수집한 30,767개의 질문-답변 문장 쌍으로 구성된 대화 데이터셋(KOMUChat)을 구축하여 제안한다. 본 데이터셋은 각각 남성, 여성이 주로 이용하는 연애상담 게시판의 게시물 제목과 첫 번째 댓글을 질문-답변으로 수집하였다. 또한, 자동 및 수동 정제 과정을 통해 혐오 데이터 등을 제거하여 양질의 데이터셋을 구축하였다. KOMUChat의 타당성을 검증하기 위해 언어 모델에 본 데이터셋과 벤치마크 데이터셋을 각각 학습시켜 비교분석하였다. 그 결과 답변의 적절성, 사용자의 만족감, 대화형 인공지능의 목적 달성 여부에서 KOMUChat이 벤치마크 데이터셋의 평가 점수를 상회했다. 본 연구는 지금까지 제시된 오픈소스 싱글턴 대화형 텍스트 데이터셋 중 가장 대규모의 데이터이며 커뮤니티 별 텍스트 특성을 반영하여 보다 친근감있는 한국어 데이터셋을 구축하였다는 의의를 가진다.

지역사회 약사의 구강건강에 대한 지식, 행동 및 교육 참여의사 (Oral health knowledge and behavior of community pharmacists and their willingness to participate in oral health education programs)

  • 황윤숙;정재연;안세연;한수진
    • 한국치위생학회지
    • /
    • 제21권4호
    • /
    • pp.403-412
    • /
    • 2021
  • Objectives: The objectives of this study were to assess oral health knowledge and behavior levels of community pharmacists as a step toward projecting them to play the role of oral health partners and to confirm pharmacists' willingness to participate in oral health education programs. Methods: t-test and one-way analysis of variance were performed to analyze the data, and correlation analysis was also performed. Results: The mean score for pharmacists' oral health knowledge was 7.29 out of 10. Of the 12 questions asked, the correct answer rate was highest for the question about the effect of smoking cessation on periodontal disease prevention; conversely, the correct answer rate was lowest for the question about the effect of taking medication for gingival infections on periodontal disease prevention. The mean score for pharmacists' oral health behavior was 2.97 out of 4 points. Of all oral health behaviors, brushing twice a day was the most practiced, whereas immediately visiting a dentist in case of an oral health issue was the least practiced. Pharmacists' oral health knowledge and behavior levels showed a weak positive correlation with their intention to participate in oral health education programs. Conclusions: Oral health education programs are necessary to improve community pharmacists' oral health knowledge and behavior.

확장된 나이브 베이즈 분류기를 활용한 질문-답변 커뮤니티의 질문 분류 (Modified Na$\ddot{i}$ve Bayes Classifier for Categorizing Questions in Question-Answering Community)

  • 연종흠;심준호;이상구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.95-99
    • /
    • 2010
  • 소셜 미디어(social media)는 블로그, 소셜 네트워크, 위키 등과 같이 사용자의 참여로 만들어지는 정보 컨텐츠이다. 사용자가 작성한 질문에 다른 사용자들이 답변을하는 질문-답변 커뮤니티 서비스도 이러한 소셜 미디어의 한 가지로서 지난 몇 년간 많은 양의 정보를 축적해왔다. 하지만 축적된 질문-답변의 양이 많아질수록 이전의 질문을 정확히 검색하는 것은 점점 어려운 작업이 되고 있다. 본 논문에서는 질문-답변 커뮤니티의 효율적인 정보 검색을 위해 확장된 나이브 베이즈 분류기(Na$\ddot{i}$ve Bayes classifier)를 이용하여 질문을 그 목적에 따라 정보형, 제안형, 의견형으로 자동 분류하는 기법을 제안한다. 정확한 분류를 위해 분류기는 질문-답변 문서의 구조적인 특징을 활용한다. 실제 질문-답변 커뮤니티의 질문들에 대해 실험을 수행한 결과 71.2%의 분류 정확도를 보였다.