• 제목/요약/키워드: GPT-3

검색결과 739건 처리시간 0.022초

한국어 반어 표현 탐지기 (Korean Ironic Expression Detector)

  • 방승주;박요한;김지은;이공주
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.148-155
    • /
    • 2024
  • 자연어 처리 분야에서 반어 및 비꼼 탐지의 중요성이 커지고 있음에도 불구하고, 한국어에 관한 연구는 다른 언어들에 비해 상대적으로 많이 부족한 편이다. 본 연구는 한국어 텍스트에서의 반어 탐지를 위해 다양한 모델을 실험하는 것을 목적으로 한다. 본 연구는 BERT기반 모델인 KoBERT와 ChatGPT를 사용하여 반어 탐지 실험을 수행하였다. KoBERT의 경우, 감성 데이터를 추가 학습하는 두 가지 방법(전이 학습, 멀티태스크 학습)을 적용하였다. 또한 ChatGPT의 경우, Few-Shot Learning기법을 적용하여 프롬프트에 입력되는 예시 문장의 개수를 증가시켜 실험하였다. 실험을 수행한 결과, 감성 데이터를 추가학습한 전이 학습 모델과 멀티태스크 학습 모델이 감성 데이터를 추가 학습하지 않은 기본 모델보다 우수한 성능을 보였다. 한편, ChatGPT는 KoBERT에 비해 현저히 낮은 성능을 나타내었으며, 입력 예시 문장의 개수를 증가시켜도 뚜렷한 성능 향상이 이루어지지 않았다. 종합적으로, 본 연구는 KoBERT를 기반으로 한 모델이 ChatGPT보다 반어 탐지에 더 적합하다는 결론을 도출했으며, 감성 데이터의 추가학습이 반어 탐지 성능 향상에 기여할 수 있는 가능성을 제시하였다.

ChatGPT는 우리에게 어떤 우려를 초래하는가?: 유튜브 영상 뉴스 댓글의 CTM(Correlated Topic Modeling) 분석을 중심으로 (What Concerns Does ChatGPT Raise for Us?: An Analysis Centered on CTM (Correlated Topic Modeling) of YouTube Video News Comments)

  • 송민호;이수범
    • 정보화정책
    • /
    • 제31권1호
    • /
    • pp.3-31
    • /
    • 2024
  • 본 연구는 ChatGPT로부터 촉박된 생성형 인공지능에 대해 국내의 특수성을 고려한 대중의 우려를 살펴보고자 하였다. 이를 위해 유튜브에서 102개의 윤리 관련 뉴스 영상에 포함된 댓글을 파이썬 스크래퍼를 개발하여 수집하였으며, 텍스톰을 통해 형태소 분석 및 전처리를 통해 15,735개 댓글을 대상으로 상관토픽모델(CTM)을 통해 분석하였다. 분석 결과, 뉴스 영상에 포함된 댓글의 주요 토픽은 '법적 및 윤리적 고려 사항', '지적 재산권 및 기술', '기술 발전과 인류 미래, 정보 처리에서 인공지능의 잠재력', 'AI에서의 감정 지능 및 윤리적 규제', '인간모방' 등 6개로 확인되었다. 또한 6개의 토픽을 10% 이상의 상관계수 값을 보이는 관계로 구조화한 결과 '법적 및 윤리적 고려 사항', 'ChatGPT의 데이터 생성 관련 이슈(지적 재산권 및 기술, 정보 처리에서의 인공지능의 잠재력, 인간모방', '인류 미래에 대한 두려움(기술 발전과 인류 미래, AI에서의 감정 지능 및 윤리적 규제)' 등 3개로 구조화할 수 있었다. 이를 바탕으로 ChatGPT로 인해 촉발된 생성형 인공지능에 관한 관심과 더불어 다양한 우려가 공존하고 있는 것을 확인하였고, 국내의 역사적 및 사회적 맥락을 반영한 특수성을 가진 우려도 존재하고 있음을 확인하였다. 이러한 결과를 통해 데이터 공정성에 대한 국가 주도의 노력이 필요함을 제안하였다.

의학 교육에서 인공지능의 응용: 임상의학 교육을 위한 ChatGPT의 활용을 중심으로 (Application of artificial intelligence in medical education: focus on the application of ChatGPT for clinical medical education)

  • 홍현미;강영준;김영전;김봄솔
    • Journal of Medicine and Life Science
    • /
    • 제20권2호
    • /
    • pp.53-59
    • /
    • 2023
  • This study explores the potential use of artificial intelligence (AI)-based services, specifically ChatGPT-3.5, in medical education. The application of this technology is acknowledged as a valuable tool for simulating authentic clinical scenarios and enhancing learners' diagnostic and communication skills. To construct a case, students received ChatGPT training using a clinical ethics casebook titled "Clinical Ethics Cases and Commentaries for Medical Students and Physicians." Subsequently, a role-play script was generated based on this training. The initial draft of the script was reviewed by two medical professors and was further optimized using ChatGPT-3.5. Consequently, a comprehensive role-play script, accurately reflecting real-world clinical situations, was successfully developed. This study demonstrates the potential for effectively integrating AI technology into medical education and provides a solution to overcome limitations in developing role-play scripts within conventional educational settings. However, the study acknowledges that AI cannot always generate flawless role-play scripts and recognizes the necessity of addressing these limitations and ethical concerns. The research explores both the potential and limitations of employing AI in the early stages of medical education, suggesting that future studies should focus on overcoming these limitations while further investigating the potential applications of AI in this field.

A Self-Guided Approach을 활용한 한국어 텍스트 생성 쓰기 보조 기법의 향상 방법 (A Self-Guided Approach to Enhance Korean Text Generation in Writing Assistants)

  • 장동현;김진수;이민호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.541-544
    • /
    • 2023
  • LLM(Largescale Language Model)의 성능 향상을 위한 비용 효율적인 방법으로 ChatGPT, GPT-4와 같은 초거대 모델의 output에 대해 SLM(Small Language Model)을 finetune하는 방법이 주목받고 있다. 그러나, 이러한 접근법은 주로 범용적인 지시사항 모델을 위한 학습 방법으로 사용되며, 제한된 특정 도메인에서는 추가적인 성능 개선의 여지가 있다. 본 연구는 특정 도메인(Writing Assistant)에서의 성능 향상을 위한 새로운 방법인 Self-Guided Approach를 제안한다. Self-Guided Approach는 (1) LLM을 활용해 시드 데이터에 대해 도메인 특화된 metric(유용성, 관련성, 정확성, 세부사항의 수준별) 점수를 매기고, (2) 점수가 매겨진 데이터와 점수가 매겨지지 않은 데이터를 모두 활용하여 supervised 방식으로 SLM을 미세 조정한다. Vicuna에서 제안된 평가 방법인, GPT-4를 활용한 자동평가 프레임워크를 사용하여 Self-Guided Approach로 학습된 SLM의 성능을 평가하였다. 평가 결과 Self-Guided Approach가 Self-instruct, alpaca와 같이, 생성된 instruction 데이터에 튜닝하는 기존의 훈련 방법에 비해 성능이 향상됨을 확인했다. 다양한 스케일의 한국어 오픈 소스 LLM(Polyglot1.3B, PolyGlot3.8B, PolyGlot5.8B)에 대해서 Self-Guided Approach를 활용한 성능 개선을 확인했다. 평가는 GPT-4를 활용한 자동 평가를 진행했으며, Korean Novel Generation 도메인의 경우, 테스트 셋에서 4.547점에서 6.286점의 성능 향상이 발생했으며, Korean scenario Genration 도메인의 경우, 테스트 셋에서 4.038점에서 5.795 점의 성능 향상이 발생했으며, 다른 유사 도메인들에서도 비슷한 점수 향상을 확인했다. Self-Guided Approach의 활용을 통해 특정 도메인(Writing Assistant)에서의 SLM의 성능 개선 가능성을 확인했으며 이는 LLM에 비용부담을 크게 줄이면서도 제한된 도메인에서 성능을 유지하며, LLM을 활용한 응용 서비스에 있어 실질적인 도움을 제공할 수 있을 것으로 기대된다.

  • PDF

합성 텍스트 생성을 위한 ChatGPT 기반 의료 텍스트 증강 도구 개발 (Development of ChatGPT-based Medical Text Augmentation Tool for Synthetic Text Generation)

  • 공진우;김기연;김유섭;오병두
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.3-4
    • /
    • 2023
  • 자연어처리는 수많은 정보가 수집된 전자의무기록의 비정형 데이터에서 유의미한 정보나 패턴 등을 추출해 의료진의 의사결정을 지원하고, 환자에게 더 나은 진단이나 치료 등을 지원할 수 있어 큰 잠재력을 가지고 있다. 그러나 전자의무기록은 개인정보와 같은 민감한 정보가 다수 포함되어 있어 접근하기 어렵고, 이로 인해 충분한 양의 데이터를 확보하기 어렵다. 따라서 본 논문에서는 신뢰할 수 있는 의료 합성 텍스트를 생성하기 위해 ChatGPT 기반 의료 텍스트 증강 도구를 개발하였다. 이는 사용자가 입력한 실제 의료 텍스트로 의료 합성 데이터를 생성한다. 이를 위해, 적합한 프롬프트와 의료 텍스트에 대한 전처리 방법을 탐색하였다. ChatGPT 기반 의료 텍스트 증강 도구는 입력 텍스트의 핵심 키워드를 잘 유지하였고, 사실에 기반한 의료 합성 텍스트를 생성할 수 있다는 것을 확인할 수 있었다.

  • PDF

수도근(水稻根)의 Amino산(酸) 대사(代謝)에 관한 연구 -제(第) 3 보(報) 수도근(水稻根)의 몇가지 효소(酵素)의 활성(活性)에 미치는 삼요소(三要素)및 호흡저해제(呼吸沮害劑)의 영향(影響) (Studies on the amino acid metabolism of young rice root (Part 3) - Effects of nitrogen, phosphorus, potassium and respiratory inhibitor on the enzyme activities of rice root -)

  • 김용웅
    • 한국토양비료학회지
    • /
    • 제7권4호
    • /
    • pp.201-207
    • /
    • 1974
  • 수도(水稻)의 생육(生育)과 GOT, GPT 및 Peroxidase의 활성(活性)에 미치는 삼요소(三要素)와 호흡저해제(呼吸沮害劑)의 영향(影響)에 대한 결과(結果)를 요약(要約)하면 다음과 같다. 1. 질소(窒素)의 형태(形態)에 따른 근(根)과 지상부(地上部)의 신장정도(伸長程度)는 $NO_3$-N 구(區) > urea-N 구(區) > $NH_4$-N 구(區)의 순(順)이며 GOT, GPT, Peroxidase의 활성도(活性度)는 $NH_4$-N 구(區) > urea-N 구(區) > $NO_3$-N 구(區)의 순(順)으로 수도(水稻)의 생육(生育)과는 반대(反對) 현상(現象)을 나타내었다. 2. 수도근(水稻根)의 ${\alpha}$-naphthylamine의 산화력(酸化力)은 $NO_3$-N 구(區) > urea-N 구(區) > $NH_4$-N 구(區)의 순(順)이며 질소농도(窒素濃度)에 따라 증가(增加)하는 경향(傾向)이다. 3. 수도근(水稻根)의 GOT, GPT는 무질소구(無窒素區)에서 가장 활성감소(活性減少)가 컸으며 삼요소(三要素) 결핍(缺乏)에 의(依)한 영향(影響)은 GOT가 GPT 보다 심(深)했으며 peroxidase는 반대(反對)로 활성(活性)이 증가(增加)하였고 그 경향(傾向)은 무가리구(無加里區) > 무인산구(無燐酸區) > 무질소구(無窒素區)의 순(順)이었다. 4. 호흡조해제(呼吸阻害劑)가 수도(水稻)의 지상부(地上部) 생장(生長)에 미치는 영향(影響)은 질소형태(窒素形態)에 따라 억제(抑制) 정도(程度)가 무질소구(無窒素區) > $NH_4$-N 구(區) > urea-N 구(區) > $NO_3$-N 구(區)의 순(順)이었다. 5. 호흡조해제(呼吸阻害劑)에 의한 수도근(水稻根)의 GOT, GPT 활성(活性)에 미치는 영향(影響)도 무질소구(無窒素區) > $NH_4$-N 구(區) > urea-N 구(區) > $NO_3$-N 구(區)의 순(順)으로 저해(沮害)를 받으며 Peroxidase의 활성(活性)에 미치는 영향(影響)은 일정(一定)한 경향(傾向)을 보이지 않는다.

  • PDF

준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델 (Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning)

  • 서재형;오동석;어수경;박성진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF

송악의 페놀성 물질의 간 보호효과 (Protective Effects of the Phenolic Compounds from the Leaves of Hedera rhombea on Hepatic Injury)

  • 김경숙;송지영;이인란
    • 약학회지
    • /
    • 제43권4호
    • /
    • pp.516-525
    • /
    • 1999
  • Hedera rhombea (HR) has been used for treatments of hemorrage, chronic catarrh, jaundice, lithisis and convulsion. This study was done to isolate active compounds that have protective effect on liver damage. BuOH and EtOAc fractions of HR recovered serum glutamic pyruvic transaminase (GPT), glutamic oxaloacetic transaminase (GOT) and ${\gamma}-glutamyltranspeptidase$ (${\gamma}-GTP$) activities in CCl4 treated rats. We isolated 7 phenolic compounds from BuOH and EtOAc fractions, which were identified as 3-caffeoyl quinic acid, 3,4-di-O-caffeoyl quinic acid, 3,5-di-O-caffeoyl quinic acid, 4,5-di-O-caffeoyl quinic acid, caffeic acid, methyl 3,4-di-O-caffeoyl quinic acid and methyl 3,5-di-O-caffeoyl quinic acid by chemical and spectral analysis. These compounds reduced significantly serum GOT and GPT elevated by CCl4 treatment in rats, and 3-caffeoyl quinic acid, 3,5-di-O-caffeoyl quinic acid and caffeic acid also showed mild inhibitory activity against human immunodeficiency virus.

  • PDF

마로부터 분리한 Acetylmannan의 Paraquat 독성 억제 효과 (Inhibitory Effect of Acetylmannan of Dioscorea bataras on Toxicity of Paraquat)

  • 심창섭;정세영
    • Environmental Analysis Health and Toxicology
    • /
    • 제11권3_4호
    • /
    • pp.11-16
    • /
    • 1996
  • Paraquat is a useful nonselective herbicide widely used throught the world. However accidental or intentional ingestion of the herbicide cause fatal pulmonary injuring. But there is not suitable antidote of paraquat intoxication and therapeutic agents now be used are not effective. So, in this study we intended to evaluate the inhibitory effects of acetylmannan from Dioscorea batalas on paraquat toxicity. 100mg/kg acetylmannan from wild or cultured Dioscorea bataras was administered orally to male SD rats for 3 days and the administration time interval was 24hours. After one hour of final administration, 50mg/kg paraquat was administered intraperitonially. After 24 hours, the biochemical parameters of blood and tissues were examined. In paraquat treated groups, sGPT, BUN, creatinine, ALP levels were increased by 2 to 4 times of normal values. However in acetylmannan from wild Dioscorea batatas treated groups, sGPT, BUN, creatinine, ALP levels in blood and lung tissue were significantly decreased to normal levels. In acetylmannan from cultured Dioscorea batatas treated groups, BUN, creatinine were significantly decreased to normal values, but not in sGPT, ALP levels. Therefore, we concluded that acetylmannan from wild Dioscorea batatas can be used as an. antidote of paraquat toxicity.

  • PDF

Enhancing Video Storyboarding with Artificial Intelligence: An Integrated Approach Using ChatGPT and Midjourney within AiSAC

  • Sukchang Lee
    • International Journal of Advanced Culture Technology
    • /
    • 제11권3호
    • /
    • pp.253-259
    • /
    • 2023
  • The increasing incorporation of AI in video storyboard creation has been observed recently. Traditionally, the production of storyboards requires significant time, cost, and specialized expertise. However, the integration of AI can amplify the efficiency of storyboard creation and enhance storytelling. In Korea, AiSAC stands at the forefront of AI-driven storyboard platforms, boasting the capability to generate realistic images built on open datasets foundations. Yet, a notable limitation is the difficulty in intricately conveying a director's vision within the storyboard. To address this challenge, we proposed the application of image generation features from ChatGPT and Midjourney to AiSAC. Through this research, we aimed to enhance the efficiency of storyboard production and refined the intricacy of expression, thereby facilitating advancements in the video production process.