• 제목/요약/키워드: language training

검색결과 685건 처리시간 0.026초

변형된 비속어 탐지를 위한 토큰 기반의 분류 및 데이터셋 (Token-Based Classification and Dataset Construction for Detecting Modified Profanity)

  • 고성민;신유현
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.181-188
    • /
    • 2024
  • 기존의 비속어 탐지 방법들은 의도적으로 변형된 비속어를 식별하는 데 한계가 있다. 이 논문에서는 자연어 처리의 한 분야인 개체명 인식에 기반한 새로운 방법을 소개한다. 우리는 시퀀스 레이블링을 이용한 비속어 탐지 기법을 개발하고, 이를 위해 한국어 악성 댓글 중 일부 비속어를 레이블링하여 직접 데이터셋을 구축하여 실험을 수행하였다. 또한 모델의 성능을 향상시키기 위하여 거대 언어 모델중 하나인 ChatGPT를 활용해 한국어 혐오발언 데이터셋의 일부를 레이블링을 하는 방식으로 데이터셋을 증강하여 학습을 진행하였고, 이 과정에서 거대 언어 모델이 생성한 데이터셋을 인간이 필터링 하는 것만으로도 성능을 향상시킬 수 있음을 확인하였다. 이를 통해 데이터셋 증강 과정에는 여전히 인간의 관리감독이 필요함을 제시하였다.

국제 교류 시각에서 본 조선시대 한문교육 분석 (A study on the teaching of the Chinese language in the Chosun Dynasty in the context of international exchanges)

  • 왕금령
    • 국제교류와 융합교육
    • /
    • 제2권1호
    • /
    • pp.43-55
    • /
    • 2022
  • 본 연구는 문헌 연구를 통하여 국제 교류 시각에서 조선시대의 한문교육 시행의 의미에 대해 살펴보았다. 구체적으로 역사적 자료들을 정리하면서 조선시대 한문교육의 시행 기관, 교육내용 및 주요 특징, 당시 한반도에 미치는 영향 및 오늘날 중국의 중국어 국제교육에 주는 시사점을 살펴봤다. 연구결과, 조선시대의 한문 교육 기관으로 주로 사역원과 승문원에서 한문 교육의 역할을 하고 있었다. 시행한 한문 교육의 내용은 주로 중국어 구어 교재의 개발, 운서와 같은 도구 서적의 간행, 사전 등에 대한 편찬 및 중국어 통역원 양성 등으로 나타났다. 중국 운서에 대한 깊은 연구를 통하여 한반도는 1433년 자기 민족의 문자인 한글이 창제되어 한자의 의지에서 벗어나게 되었다. 한글의 발명은 한반도의 정치, 경제 및 문화 분야의 발전을 크게 발전시켰다. 또한 조선시대의 한문교육은 오늘날 중국의 중국어 국제교육에 좋은 경험을 제공해 주었다.

A Unicode based Deep Handwritten Character Recognition model for Telugu to English Language Translation

  • BV Subba Rao;J. Nageswara Rao;Bandi Vamsi;Venkata Nagaraju Thatha;Katta Subba Rao
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.101-112
    • /
    • 2024
  • Telugu language is considered as fourth most used language in India especially in the regions of Andhra Pradesh, Telangana, Karnataka etc. In international recognized countries also, Telugu is widely growing spoken language. This language comprises of different dependent and independent vowels, consonants and digits. In this aspect, the enhancement of Telugu Handwritten Character Recognition (HCR) has not been propagated. HCR is a neural network technique of converting a documented image to edited text one which can be used for many other applications. This reduces time and effort without starting over from the beginning every time. In this work, a Unicode based Handwritten Character Recognition(U-HCR) is developed for translating the handwritten Telugu characters into English language. With the use of Centre of Gravity (CG) in our model we can easily divide a compound character into individual character with the help of Unicode values. For training this model, we have used both online and offline Telugu character datasets. To extract the features in the scanned image we used convolutional neural network along with Machine Learning classifiers like Random Forest and Support Vector Machine. Stochastic Gradient Descent (SGD), Root Mean Square Propagation (RMS-P) and Adaptative Moment Estimation (ADAM)optimizers are used in this work to enhance the performance of U-HCR and to reduce the loss function value. This loss value reduction can be possible with optimizers by using CNN. In both online and offline datasets, proposed model showed promising results by maintaining the accuracies with 90.28% for SGD, 96.97% for RMS-P and 93.57% for ADAM respectively.

Zero-shot Korean Sentiment Analysis with Large Language Models: Comparison with Pre-trained Language Models

  • Soon-Chan Kwon;Dong-Hee Lee;Beak-Cheol Jang
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.43-50
    • /
    • 2024
  • 본 논문은 GPT-3.5 및 GPT-4와 같은 대규모 언어 모델의 한국어 감성 분석 성능을 ChatGPT API를 활용한 zero-shot 방법으로 평가하고, 이를 KoBERT와 같은 사전 학습된 한국어 모델들과 비교한다. 실험을 통해 영화, 게임, 쇼핑 등 다양한 분야의 한국어 감성 분석 데이터셋을 사용하여 모델들의 효율성을 검증한다. 실험 결과, LMKor-ELECTRA 모델이 F1-score 기준으로 가장 높은 성능을 보여주었으며, GPT-4는 특히 영화 및 쇼핑 데이터셋에서 높은 정확도와 F1-score를 기록하였다. 이는 zero-shot 학습 방식의 대규모 언어 모델이 특정 데이터셋에 대한 사전 학습 없이도 한국어 감성 분석에서 높은 성능을 발휘할 수 있음을 시사한다. 그러나 일부 데이터셋에서의 상대적으로 낮은 성능은 zero-shot 기반 방법론의 한계점으로 지적될 수 있다. 본 연구는 대규모 언어 모델의 한국어 감성 분석 활용 가능성을 탐구하며, 이 분야의 향후 연구 방향에 중요한 시사점을 제공한다.

후천성 인공와우 이식 성인의 청능훈련 사례 연구 (Case Study of Auditory Training for the Acquired Hearing loss Adult with Cochlear Implant)

  • 홍하나
    • 재활복지
    • /
    • 제17권4호
    • /
    • pp.371-382
    • /
    • 2013
  • 최근 인공와우 이식 수술에 대한 건강보험이 확대 되면서 이식자들의 수는 늘어나게 되었다. 2005~2009년 사이 최근 6년간 인공와우 수술을 받은 환자는 약 3,300여명이 이르며 그 중 성인의 인공와우 이식 수가 늘어가는 양상을 보이고 있다. 어린 아동의 경우 인공와우 이식 후 청능훈련을 적극적으로 받으며 관련 연구도 많이 있지만 성인에 대한 이식 후 청능훈련에 대한 연구는 많지 않다. 본 연구는 언어습득이후 인공와우를 이식한 성인여자(54세) 1명을 대상으로 Ling 6 sound test, 표준화된 자음과 모음 듣기 검사, 문장 검사 그리고 실생활에 필요한 환경음과 단어의 인지 및 확인 평가 도구를 이용하여 10주간 청능훈련을 실시하였다. 10주간의 청능 훈련 결과, 대상자는 Ling 6 sound의 모든 음소를 확인하였으며 표준화된 자모음과 문장 듣기 검사에서도 100%에 가까운 수행력을 보였다. 또한 실생활에 환경음과 단어의 인지 및 확인은 57%에서 95%까지 수행력이 개선되었다. 본 연구 결과는 성인을 대상으로 한 청능훈련은 체계적이고 효과적인 계획과 개인의 특성을 고려한 재활 프로그램이 필요함을 보여주었다.

SVM 기계학습을 이용한 웹문서의 자동 의미 태깅 (Automatic semantic annotation of web documents by SVM machine learning)

  • 황운호;강신재
    • 한국산업정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.49-59
    • /
    • 2007
  • 본 논문은 시맨틱 웹의 실현을 위해서는 필수적인 작업인 웹문서의 의미를 자동으로 태깅할 수 있는 시스템에 관한 것이다. 웹상의 방대한 자원을 일일이 사람이 수작업으로 의미를 태깅한다는 것은 사실상 불가능하기 때문에 한국어 웹문서를 대상으로 대량의 학습 데이터를 수집하고 자연어처리 기법과 시소러스를 이용하여 특징을 추출한 후 SVM 기계학습을 통하여 개념분류기를 구축하였다. 한국어의 특징을 파악하여 의미 태깅에 필요한 특징 정보를 추출하기 위해서 형태소 분석과 구문 분석을 하였다. 추출된 특징정보는 가도카와 시소러스의 의미코드를 이용하여 학습벡터로 구성되는데, 이는 유사한 단어나 구를 하나의 개념코드로 매핑하여 시스템의 재현율을 높이는 역할을 하게 된다. 실험결과 자동 의미 태깅 분야에서 본 접근방법의 가능성을 확인할 수 있었다.

  • PDF

경증 자폐성 장애인을 위한 보완·대체의사소통 지원프로그램 (Individual with mild autistic disorder Augmentative and alternative communication Training Program)

  • 유성령;박정화;박수현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.507-509
    • /
    • 2013
  • 본 논문에서는 최근 많은 관심을 받고 있는 안드로이드를 활용한 경증 자폐성장애인을 위한 보완대체의사소통 지원프로그램을 구현하였다. 보완대체의사소통이란 구어 및 비구어적 의사표현하기 어려운 사람들을 위해 사용하는 의사소통체계로서, 본 프로그램에서는 자폐장애인의 의사소통과 의사소통 언어의 선택적 빈도를 측정하는 방법과 자폐 아등의 지적 장애인의 언어에 대한 기본적인 훈련을 하는 방법을 소개한다. 본 논문에서는 보완대체 의사소통에서의 언어표상기법을 활용하여 여러 의사소통의 자유가 없는 사용자들이 효과적인 의사소통 및 학습을 할 수 있도록 개발하였으며, TTS(Text to Speech)를 사용하여 사용자의 의사를 육성으로 전달할 수 있도록 하였다. 그림판기능을 제공하여 사용자의 의사전달의 폭을 넓히고 언어빈도 측정을 통한 사용자의 언어사용빈도 그리고 자폐아의 경우 의식적 무의식 의사전달에 따른 백분율 수치를 두어 도움을 주도록 구현하였다.

  • PDF

Java 프로그래밍 학습을 위한 로봇 트레이닝키트의 설계 및 구현 (The Design And Implementation of Robot Training Kit for Java Programming Learning)

  • 백정현
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.97-107
    • /
    • 2013
  • 최근의 프로그래밍 패러다임은 객체지향프로그래밍과 이를 기반으로 하는 비주얼프로그래밍이 주류를 이루고 있다. 그러나 객체지향프로그래밍은 기존의 구조적프로그래밍기법에 비하여 개념이 어렵고 복잡하여 IT 관련학과 학생들을 교육하기에 어려움이 많았다. 본 연구에서는 학생들이 다양한 입출력 장치를 부착하고 로봇제어가 가능한 트레이닝 키트를 사용하여 객체지향 프로그래밍 학습 의욕 고취와 동기를 유발할 수 있도록 Java 가상머신을 내장한 Java 로봇 트레이닝 키트를 설계하고 구현하였다. 개발된 Java 로봇 트레이닝 키트는 USB 인터페이스로 컴퓨터와 통신 가능하며, 다양한 입출력 장치와 DC 모터 및 서보모터를 구동할 수 있는 범용 입출력 포트를 내장하여 교육용 로봇제작과 응용프로그래밍 실습이 가능하다. 따라서 IT 융합시대를 맞이하여 학문과 전공간의 벽이 낮아지고 창의 공학적 객체지향 프로그래밍언어 교육의 도입이 필요한 시점에서 본 연구에서 개발한 Java 로봇 트레이닝 키트가 많은 기여를 할 것으로 기대된다.

교육용로봇을 이용한 프로그래밍 학습 모형 - 재량활동 및 특기적성 시간에 레고 마인드스톰의 Labview 언어 중심으로 - (A Programming Language Learning Model Using Educational Robot)

  • 문외식
    • 정보교육학회논문지
    • /
    • 제11권2호
    • /
    • pp.231-241
    • /
    • 2007
  • 본 연구는 창의적 문제해결 능력 향상을 위한 알고리즘 학습도구로서 로봇을 이용한 프로그래밍 학습방법을 제안하는데 목적이 있다. 이를 위해 30차시 분량의 로봇 프로그래밍 교육과정과 교재를 개발하였으며, 초등학생 6학년을 대상으로 30차시를 학습시킨 후 평가하였다. 각 차시별 학습결과 산출물 중심으로 성취수준을 평가한 결과, 학습자들이 교육과정 내용을 대부분 이해한 수준으로 분석되었다. 이러한 결과는 개발한 교육과정과 교재가 초등학생들에게 충분히 공감하고 실천 가능하도록 구성되었다고 판단된다. 본 연구에서의 실행 경험을 통해 초등학교에서 로봇 프로그램 학습이 창의적 알고리즘 학습도구로 성공할 수 있는 가능성을 확인하게 되었다.

  • PDF

The Effectiveness of a Cultural Competence Training Program for Public Health Nurses using Intervention Mapping

  • Kim, Yune Kyong;Lee, Hyeonkyeong
    • 지역사회간호학회지
    • /
    • 제27권4호
    • /
    • pp.410-422
    • /
    • 2016
  • Purpose: This study evaluated the effects of a cultural competence training program for public health nurses (PHNs) using intervention mapping. Methods: An embedded mixed method design was used. Forty-one PHNs (experimental: 21, control: 20) and forty marriage migrant women (MMW) (20, in each group) who were provided nursing care by PHN participated in the study. The experimental group was provided with a four-week cultural competence program consisting of an eight hour offline and online course, e-mail newsletters and social networking services (BAND). Transcultural Self-efficacy (TSE) of the PHNs, client-nurse trust, and satisfaction with nursing care of MMW were measured. Ten PHNs in the experimental group were interviewed after the experimental study. Results: The experimental group showed a significantly greater improvement in TSE, client-nurse trust, and satisfaction with nursing care than did the control group. Six themes emerged from qualitative data: (a) Recognizing cultural differences, (b) Being interested in the multicultural policy, (c) Trying to communicate in MMW's own language, (d) Providing medical information using internet and smart phone, (e) Embracing culturally diverse people into society, and (f) Requiring ongoing cultural competence training. Conclusion: Cultural competence training enabled PHNs to provide culturally competent care and contribute to MMW's health outcomes.