• 제목/요약/키워드: language training

검색결과 685건 처리시간 0.023초

헤세의 다매체적 특징과 상호매체 넘나들기 (Hesse's Multimedia Features and Inter-Media Crossing)

  • 조희주;채연숙
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권2호
    • /
    • pp.515-523
    • /
    • 2017
  • 문학을 활용하는 실습현장에서는 문학의 전문이 아니라 일부분을 발췌해서 사용한다. 따라서 어느 부분을 기억힌트로 활용할 것인지, 어떻게 제시하는 것이 효과적인지에 관한 실증적인 지침이 필요하다. 본 연구를 위해서 헤세의 삶 전반과 그의 인물들을 문학치료적인 관점으로 들여다보았다. 첫째, 헤세의 작품 속 인물을 분석하는 과정에서 자가치유적인 삶을 살아가고 있는 헤세의 모습을 만날 수 있었다. 또한 그는 쓰기, 그리기, 연주하기, 감상하기, 명상하기, 걷기 등과 함께하는 다매체적인 삶을 살았다. 둘째, 연구자는 헤세와 그의 작품을 활용한 문학치료 콘텐츠를 조현병 환자들에게 적용해 보았다. 임상에서 활용한 매체는 헤세의 작품 속에서 추출한 것이었다. 참여자들은 헤세의 작품에 대해 정서적 공감을 할 수 있었으며 나아가 참여자들간의 상호공감나누기도 가능하였다. 헤세가 보여주는 다매체적인 특성과 활용방법은 현대인의 정신건강을 증진하고 병리적인 문제를 치유하기 위해서 중요한 인문학적 자원이 될 것이다.

반복적 기법을 사용한 그래프 기반 단어 모호성 해소 (Graph-Based Word Sense Disambiguation Using Iterative Approach)

  • 강상우
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권2호
    • /
    • pp.102-110
    • /
    • 2017
  • 최근 자연어 처리 분야에서 단어의 모호성을 해소하기 위해서 다양한 기계 학습 방법이 적용되고 있다. 지도 학습에 사용되는 데이터는 정답을 부착하기 위해 많은 비용과 시간이 필요하므로 최근 연구들은 비지도 학습의 성능을 높이기 위한 노력을 지속적으로 시도하고 있다. 단어 모호성 해소(word sense disambiguation)를 위한 비지도 학습연구는 지식 기반(knowledge base)를 이용한 방법들이 주목받고 있다. 이 방법은 학습 데이터 없이 지식 기반의 정보을 이용하여 문장 내에서 모호성을 가지는 단어의 의미를 결정한다. 지식 기반을 이용한 방법에는 그래프 기반방식과 유사도 기반 방법이 대표적이다. 그래프 기반 방법은 모호성을 가지는 단어와 그 단어가 가지는 다양한 의미들의 집합 간의 모든 경로에 대한 의미 그래프를 구축한다는 장점이 있지만 불필요한 의미 경로가 추가되어 오류를 증가시킨다는 단점이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 그래프 구축을 위해 불필요한 간선들을 배제하면서 반복적으로 그래프를 재구축하는 모델을 제안한다. 또한, 구축된 의미 그래프에서 더욱 정확한 의미를 예측하기 위해 하이브리드 유사도 예측 모델을 적용한다. 또한 제안된 모델은 다국어 어휘 의미망 사전인 BabelNet을 사용하기 때문에 특정 언어뿐만 아니라 다양한 언어에도 적용 가능하다.

텍스트 요약 품질 향상을 위한 의미적 사전학습 방법론 (Semantic Pre-training Methodology for Improving Text Summarization Quality)

  • 전민규;김남규
    • 스마트미디어저널
    • /
    • 제12권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 최근 사용자에게 의미있는 정보만을 자동으로 간추리는 텍스트 자동 요약이 꾸준히 연구되고 있으며, 특히 인공신경망 모델인 트랜스포머를 활용한 텍스트 요약 연구가 주로 수행되고 있다. 다양한 연구 중 특히 문장 단위 마스킹을 통해 모델을 학습시키는 GSG 방식이 가장 주목을 받고 있지만, 전통적인 GSG는 문장의 의미가 아닌 토큰의 중복 정도에 기반을 두어 마스킹 대상 문장을 선정한다는 한계를 갖는다. 따라서 본 연구에서는 텍스트 요약의 품질을 향상시키기 위해, 문장의 의미를 고려하여 GSG의 마스킹 대상 문장을 선정하는 SbGSG(Semantic-based GSG) 방법론을 제안한다. 뉴스기사 370,000건과 요약문 및 레포트 21,600건을 사용하여 실험을 수행한 결과, ROUGE와 BERT Score 측면에서 제안 방법론인 SbGSG가 전통적인 GSG에 비해 우수한 성능을 보임을 확인하였다.

A Study on the Employment Predictive Factors of Young University Graduates

  • Jun-Su Kim;Woo-Hong Cho
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.241-246
    • /
    • 2023
  • 본 연구의 목적은 청년 대학 졸업자 취업 성공 요인 분석과 수도권과 비수도권의 결정 요인 비교를 통해 대학의 취업 지원 방향을 제시하고자 하였다. 이를 위해 한국고용정보원에서 제공하는 2019년도 '대졸자 직업이동경로 조사 자료를 활용하여 SPSS 25.0 통계패키지 이분형 로지스틱 회귀분석으로 요인을 분석하였다. 연구 결과, 서울·수도권 대졸자는 개인 특성 중 연령, 부모 자산, 어학연수 경험이 취업 성공(+) 요인이었고, 대학 특성은 2~3년제 대졸자가 4년제나 교육대 대졸자보다 취업 성공 가능성이 높게 나타났다. 또한, 비수도권 대졸자는 개인 특성 중 연령, 부모 자산이 취업 성공(+) 요인이었고, 2~3년제 대졸자가 4년제 대졸자보다 취업 성공 가능성이 높게 나타났다.

사전 자세에 따른 근전도 기반 손 제스처 인식 (Recognition of hand gestures with different prior postures using EMG signals)

  • 최현태;김덕화;장원두
    • 사물인터넷융복합논문지
    • /
    • 제9권6호
    • /
    • pp.51-56
    • /
    • 2023
  • 손 제스처의 인식은 구어 사용이 어려운 사람들의 의사소통을 위한 중요한 기술이다. 제스처 인식에 널리 사용되는 근전도 신호는 사전 자세에 따라 동작이 달라지기 때문에 제스처 인식의 어려움이 있을 것으로 예상되지만, 이에 관한 연구는 찾기 어렵다. 본 연구에서는 사전 자세에 따른 제스처 인식 성능의 변화를 분석하였다. 이를 위해 총 20명의 피험자에게서 사전 자세를 가지는 동작에 대한 근전도 신호를 측정하고, 제스처 인식을 실험하였다. 그 결과, 학습 및 테스트 데이터 간 사전 상태가 단일한 경우에는 평균 89.6%의 정확도를, 상이한 경우에는 평균 52.65%의 정확도를 보였다. 반면, 사전 자세를 모두 고려한 경우에는 정확도가 다시 회복됨을 발견하였다. 이를 통해 본 연구에서는 근전도를 활용하는 손 제스처 인식시에 사전 자세가 다양하게 고려하여야 함을 실험적으로 확인하였다.

음성 데이터의 내재된 감정인식을 위한 다중 감정 회귀 모델 (Multi-Emotion Regression Model for Recognizing Inherent Emotions in Speech Data)

  • 이명호;임명진;신주현
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.81-88
    • /
    • 2023
  • 최근 코로나19로 인한 비대면 서비스의 확산으로 온라인을 통한 소통이 증가하고 있다. 비대면 상황에서는 텍스트나 음성, 이미지 등의 모달리티를 통해 상대방의 의견이나 감정을 인식하고 있다. 현재 다양한 모달리티를 결합한 멀티모달 감정인식에 관한 연구가 활발하게 진행되고 있다. 그중 음성 데이터를 활용한 감정인식은 음향 및 언어정보를 통해 감정을 이해하는 수단으로 주목하고 있으나 대부분 단일한 음성 특징값으로 감정을 인식하고 있다. 하지만 대화문에는 다양한 감정이 복합적으로 존재하기 때문에 다중 감정을 인식하는 방법이 필요하다. 따라서 본 논문에서는 복합적으로 존재하는 내재된 감정인식을 위해 음성 데이터를 전처리한 후 특징 벡터를 추출하고 시간의 흐름을 고려한 다중 감정 회귀 모델을 제안한다.

개인정보 보호를 고려한 딥러닝 데이터 자동 생성 방안 연구 (A Study of Automatic Deep Learning Data Generation by Considering Private Information Protection)

  • 장성봉
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.435-441
    • /
    • 2024
  • 수집된 대량의 데이터셋이 딥러닝 학습데이터로 사용되기 위해서는 주민번호, 질병 정보등과 같이 민감한 개인정보는 해커에게 노출되지 않도록 값을 변경하거나 암호화해야 하고 구축된 딥러닝 모델의 구조와 일치 하도록 데이터를 재구성 해주어야 한다. 현재, 이러한 작업은 전문가에 의해 수동으로 이루어지기 때문에, 시간과 비용이 많이 소요 된다. 이러한 문제점을 해결하기 위해, 본 논문에서는 딥러닝 과정에서 개인정보 보호를 위한 데이터 처리 작업을 자동으로 수행할 수 있는 기법을 제안한다. 제안된 기법에서는 데이터 일반화에 기반한 개인정보 보호 작업을 수행하고 원형큐를 사용하여 데이터 재구성 작업을 수행한다. 제안된 기법의 타당성을 검증하기 위해, C언어를 사용하여 직접 구현하였다. 검증 결과, 데이터 일반화가 정상적으로 수행되고 딥러닝 모델에 맞는 데이터 재구성이 제대로 수행됨을 확인 할 수 있었다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

중앙아시아 한인의 사회문화적 특성과 과제 (The Sociocultural Characteristics of Korean Ethnics in Central Asia)

  • 정성호
    • 한국인구학
    • /
    • 제20권2호
    • /
    • pp.161-180
    • /
    • 1997
  • 본 연구는 중앙아시아 한인의 생활 실태를 밝히는데 그 목적이 있다. 이를 위해 본 연구는 중앙아시아 한인의 인구학적 특성을 살펴보고, 그들이 지니고 있는 사회문화적 특성과 문제점을 전반적인 사회변동의 맥락에서 검토하고자 한다. 본 연구는 중앙아시아의 우즈베키스탄, 카자흐스탄 한인 사회에 대한 현지조사를 기초로 진행되었다. 현지조사는 설문조사와 심층면접으로 이루어졌다. 설문조사는 타쉬켄트와 알마타에서 러시아어로 준비된 질문지를 통해 수행되었다. 이와 함께 한인 및 단체에 대한 방문, 면담, 관찰 등으로 얻은 질적 자료도 활용되었다. 연구결과 중앙아시아 한인들이 당면하고 있는 가장 심각한 문제는 구소련이 해체되면서 급속히 진행되고 있는 체제변화 속에서 어떻게 적응해야 하는가라는 과제와 직결된다. 예컨대, 경제적 기반이자 정신문화의 구심점이었던 집단농장이 붕괴돼 가고, 한글을 모르는 세대가 성장하면서 신구세대간의 갈등이 빚어지고, 정신적 보루였던 고려일보, 조선극장 등 각종 문화단체들이 변화의 소용돌이 속에서 생존의 몸부림을 치고 있다. 이와 함께 각 공화국의 자민족 중심정책에 따른 언어문제도 한인들에게 또 다른 적응의 고통이 되고 있다. 이들에게 필요한 것은 한인들이 다민족 사회에서 자기의 말과 문화를 간직한 채 상당한 정도의 동질성을 유지해 가며 주위의 다른 민족과 잘 살아 나아가는 것이다. 현지어의 습득을 위한 노력도 게을리 하지 말아야 하며 각 공화국 개혁에 능동적으로 참여하는 주인역도 맡아야 한다. 이러한 노력과 함께 한국인 및 한국정부도 이들에 보다 많은 관심과 정책적 배려를 아끼지 말아야 한다. 특히 정부 및 민간 차원의 경제적·문화적 교류 활성화와 그 결과로서 현지 한인들의 생활기반 안정과 지위 향상을 도모하는 노력이 지속적으로 전개되어야 할 것이다. 한국어와 한국문화에 대한 제도적 지원, 그리고 한국경제의 지속적인 발전에 따른 한인들의 자부심 고양 등이 한인들에 대한 자극제로 작용할 때 한인과 한국인 사이의 인식의 공감대가커질 수 있으며, 이는 다시 조국과 민족의식을 되찾아 주는 계기가 될 것이기 때문이다.

  • PDF