• 제목/요약/키워드: 성표현

검색결과 8,753건 처리시간 0.039초

한국어 문장 표현을 위한 비지도 대조 학습 방법론의 비교 및 분석 (Comparison and Analysis of Unsupervised Contrastive Learning Approaches for Korean Sentence Representations)

  • 유영현;이규민;전민진;차지이;김강산;김태욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.360-365
    • /
    • 2022
  • 문장 표현(sentence representation)은 자연어처리 분야 내의 다양한 문제 해결 및 응용 개발에 있어 유용하게 활용될 수 있는 주요한 도구 중 하나이다. 하지만 최근 널리 도입되고 있는 사전 학습 언어 모델(pre-trained language model)로부터 도출한 문장 표현은 이방성(anisotropy)이 뚜렷한 등 그 고유의 특성으로 인해 문장 유사도(Semantic Textual Similarity; STS) 측정과 같은 태스크에서 기대 이하의 성능을 보이는 것으로 알려져 있다. 이러한 문제를 해결하기 위해 대조 학습(contrastive learning)을 사전 학습 언어 모델에 적용하는 연구가 문헌에서 활발히 진행되어 왔으며, 그중에서도 레이블이 없는 데이터를 활용하는 비지도 대조 학습 방법이 주목을 받고 있다. 하지만 대다수의 기존 연구들은 주로 영어 문장 표현 개선에 집중하였으며, 이에 대응되는 한국어 문장 표현에 관한 연구는 상대적으로 부족한 실정이다. 이에 본 논문에서는 대표적인 비지도 대조 학습 방법(ConSERT, SimCSE)을 다양한 한국어 사전 학습 언어 모델(KoBERT, KR-BERT, KLUE-BERT)에 적용하여 문장 유사도 태스크(KorSTS, KLUE-STS)에 대해 평가하였다. 그 결과, 한국어의 경우에도 일반적으로 영어의 경우와 유사한 경향성을 보이는 것을 확인하였으며, 이에 더하여 다음과 같은 새로운 사실을 관측하였다. 첫째, 사용한 비지도 대조 학습 방법 모두에서 KLUE-BERT가 KoBERT, KR-BERT보다 더 안정적이고 나은 성능을 보였다. 둘째, ConSERT에서 소개하는 여러 데이터 증강 방법 중 token shuffling 방법이 전반적으로 높은 성능을 보였다. 셋째, 두 가지 비지도 대조 학습 방법 모두 검증 데이터로 활용한 KLUE-STS 학습 데이터에 대해 성능이 과적합되는 현상을 발견하였다. 결론적으로, 본 연구에서는 한국어 문장 표현 또한 영어의 경우와 마찬가지로 비지도 대조 학습의 적용을 통해 그 성능을 개선할 수 있음을 검증하였으며, 이와 같은 결과가 향후 한국어 문장 표현 연구 발전에 초석이 되기를 기대한다.

  • PDF

인터넷 지식공유에 영향을 미치는 요인 연구: 사회적자본 이론과 자기표현 이론을 중심으로

  • 한진우;유철우;최영찬
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2008년도 춘계학술대회
    • /
    • pp.866-871
    • /
    • 2008
  • 본 연구는 사회적자본 이론(Social Capital Theory)과 자기표현 이론(Self Expression Theory)을 중심으로, 인터넷 지식공유에 미치는 영향을 밝히고자 시도하였다. 전체 108명의 표본을 AMOS 7.0을 사용하여 구조모형 분석을 실시하였으며, 분석한 결과, 혁신성은 자기표현에 유의한 영향을 주었고, 자기효능감은 사회적자본과 자기표현에 유의한 영향을 주었다. 또한 사회적자본과 자기표현은 지식공유에 유의한 영향을 주고 있다.

  • PDF

웹 온톨로지 구축에서 시간 관계 표현 (The Representation of Temporal Relations for Building the Web Ontology)

  • 정관호;공현장;최준호;박세현;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.487-489
    • /
    • 2003
  • 시맨틱 웹에서 가장 중요한 부분인 웹 온톨로지 구축을 위한 많은 연구는 많은 발전과 표준화를 거쳐서 현재 웹 온톨로지 구축 언어인 OWL을 가장 널리 이용하여 웹 온톨로지를 구축하고 있다. 온톨로지의 구축에서는 각 개념간의 관계의 정의가 매우 중요하며, 이를 표현하고 정의하는 많은 일련의 과정이 진행되고 있다. 그러나 온톨로지 구축 시에 중요하게 여기어지고 있는 개념간의 관계표현은 아직도 많은 부분 미흡하다. 특히 시간관계 표현에 관한 내용은 일반적으로 중요하게 생각되어지고 있지만, 그 표현 방법이 제시되지 않고 있다. 이에 본 논문에서는 온톨로지 구축 시 생겨나는 많은 관계들 중, 특히 시간적 관계를 표현하고, 적용하여 그 실용성을 제시하고자 한다.

  • PDF

마일즈 데이비스와 에드거 앨런 포우의 계산된 창작법 (Pre-Planned Creativity In Miles Davis And Edgar Allan Poe)

  • 김형천
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 춘계학술논문집 2부
    • /
    • pp.626-628
    • /
    • 2011
  • 문학과 음악처럼 다른 두 예술 분야에서는 필연적으로 발생하는 시대별 표현방법의 변화에서 공통점이 발견되기 마련이다. 시기적으로는 고전주의적 표현에서 낭만주의적 표현으로의 변화를 겪은 18-19 세기 영, 미 문학의 표현 형태와 20세기 중반 미국재즈의 획기적인 표현방법상의 변화에서 공통점을 발견할 수 있다. 1846년, 제약과 규범의 틀을 탈피한 인간 중심의 자기 주도적 표현 방식을 보인 낭만주의적 성향이 만연한 시기에 모든 창작은 계산에 의해 나와야한다는 에드거 앨런 포우의 한 비평문이 소개된다. 신고전주의적 사상의 출발로 볼 수 있을 정도인 이 비평문에서 포우는 작가의 순간적 감정을 자제시키면서 창작은 사전 준비에 의해서만 행해져야한다는 주장을 한다. 이 연구는 포우가 비평문을 통하여 주장하는 사상을 마일즈 데이비스의 작품 속에서 의도적 창작의 개연성을 연계하여 유추하는 것에 중심을 둔다.

  • PDF

디자인교육에서의 표현 재료와 방법에 대한 연구(1) (A Study on the expressions material and method in design education(1))

  • 임남숙
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.1061-1063
    • /
    • 2009
  • 디자인교육에서의 표현 재료와 방법은 다양한 양상으로 변하고 이에 의한 미적 효과에 주목하고 있다. 과학 기술이 발달하면서 디자인의 표현 영역도 넓혀지고 과학 기술 발달은 디자인에 새로운 재료와 표현의 방법으로 영향을 미치고 있다. 또한 우리 인간의 오감각에 대한 심리적 요인도 표현의 재료와 구현 방법에 감각적 체험이란 요인으로 현 디자인에서 주목받고 있다. 디자인은 사회적, 역사적, 문화적, 과학-기술적 상황 변화에 따라 급속한 발달을 해 왔다. 디자인의 표현 재료와 방법에 대한 연구를 통하여 창의성 계발과 심미안을 키우는 효과가 기대된다.

  • PDF

최적 통신 걸침 나무 문제해결을 위한 유전알고리즘의 유전자 표현법에 대한 연구 (Study on Gene Representation in GA for Optimal Communication Spanning Tree Problems)

  • 김종율
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.277-280
    • /
    • 2007
  • 통신 시스템에 대한 관심은 인터넷의 급격한 발전에 의해 가상공간의 출현과 유비쿼터스 컴퓨팅 환경 구축에 대한 요구가 증대됨에 따라 관련 이론 및 기술의 발전을 주도해 왔다. 이와 관련한 문제들 중에 가장 근간이 되는 문제들 중 하나는 최적 통신 걸침 나무 (OCST: Optimal Communication Spanning Tree) 문제이다. 본 논문에서는 이러한 최적 통신 걸침 나무 문제를 해결하기 위해 유전 알고리즘 (GA)를 이용한다. 유전 알고리즘을 이용함에 있어서 중요한 단계중 하나는 유전자표현을 어떻게 문제에 적합하게 설계하느냐이다. 본 논문에서는 걸침나무를 표현하기 위해 기존의 $Pr\ddot{u}fer$수 기반의 유전자 표현법을 개선하여 n개의 노드에 대해 n-2개의 숫자열로 표현가능하면서도 보다 더 최적 통신 걸침 문제에 적합하도록 고안한 새로운 유전자 표현법을 이용한다. 임의로 생성된 예제에 대한 수치 실험을 통해 통신시스템의 기본 문제 중 하나인 최적 통신 걸침 문제의 해법으로서의 제안 알고리즘의 유용성과 효율성을 확인한다.

  • PDF

관용적 표현의 대응 관계에 기반한 영어-한국어 기계 번역 (English-Korean Machine Translation based-on Bilingual Relation of Idiomatic Expressions)

  • 윤성희;김영택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.571-580
    • /
    • 1993
  • 영어 문장을 한국어 문장으로 기계 번역하는 과정에는 분석 규칙이나 변환 규칙만으로는 해결하기 어려운 표현의 대응 관계들이 많이 나타난다. 본 논문은 영어-한국어 기계 번역에서 질적으로 향상된 한국어 문장을 얻기 위하여 두 언어 표현들 사이의 관용적 대응 관계에 기반하는 번역 방식을 논한다. 두 언어 표현들 사이의 다양한 직접 대응 관계를 제공하는 번역 사전을 이용하며, 입력 영어 문장으로부터 이와 같은 표현들을 인식하고 한국어 표현으로 직접적으로 대응시키는 번역 방식이다. 이러한 번역 방식은 기존의 변환 규칙 기반의 번역 방식보다 자연스러운 한국어 문장을 생성할 뿐만 아니라, 많은 구조적-의미적 모호성을 해결함으로써 시간적-공간적 처리효율을 크게 높일 수 있다.

  • PDF

개체명 인식을 이용한 소셜 미디어에서의 약물 부작용 표현 추출 및 분류 (Detecting and classification ADRs using Named Entity Recognition on social media)

  • 정현정;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2021
  • 의약품에 대한 안전성 정보 수집과 관리는 온라인, 오프라인을 통해 약물 이상 사례를 보고받는 형태로 진행되고 있다. 하지만 소비자들의 자발적인 참여로 이루어지므로 실제 발생하는 약물 부작용보다 데이터가 현저히 적다는 단점이 존재한다. 본 논문에서는 약물 이상 데이터 희소성 문제를 해결 할 수 있도록 소셜 미디어에서 약물 부작용 표현을 찾을 수 있도록 하였다. 소셜 미디어의 경우에는 표준 약물 부작용 용어를 사용하기보다는 일반인들이 자연어로 표현한 경우가 많으므로 개체명 인식 기법을 이용해 부작용을 추출할 수 있는 모델을 개발하였다. 또한 추출된 부작용 표현을 표준용어로 분류할 수 있는 모델을 제시하였다. 실험 결과 제안한 두 가지 모델은 0.9 이상의 정확도를 얻을 수 있었으며, 일반 사용자들이 자연어로 표현한 약물 부작용 표현을 효과적으로 찾아내고 표준 부작용 용어로 매핑할 수 있음을 보여준다.

라이프스타일과 자기표현욕구가 비건화장품 구매의도에 미치는 영향에 관한 연구

  • 김정인;허철무
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2022년도 추계학술대회
    • /
    • pp.187-191
    • /
    • 2022
  • 최근 기초화장품 트렌드로 클린 화장품, 비건 화장품 등이 브랜드별로 새롭게 출시되고 시장내 성장하고 있다. 한동안 화장품의 성분에 대한 관심과 영향이 커지면서 기능성화장품, 코스메슈티컬화장품, 더마화장품들이 신뢰를 얻고 인기가 있던 가운데, 효능 외의 요소를 소구하는 브랜드와 제품에 대한 관심이 커지고 있는 중이다. 본 연구는 이러한 변화에 있어 소비자의 라이프스타일과 소비가치의 상관관계가 영향이 있을 것으로 보고 이를 분석하고자 한다. 또한 ESG가 강조되는 사회 분위기 속에 클린 화장품 또는 비건 화장품의 소비가 일종의 자기표현의 욕구를 충족시켜주는 역할로써의 관계가 있는지도 알아보고자 한다. 따라서 기초 화장품을 사용하는 소비자들을 대상으로 라이프스타일과 자기표현욕구가 비건화장품 구매의도에 미치는 영향 및 소비가치를 매개변수로 하여 라이프스타일과 자기표현욕구와 구매의도 간의 영향을 살펴하고자 한다. 독립변수는 라이프스타일의 하위변수인 외모관리 지향형, 질적건강추구형으로 구분하였고, 자기표현욕구를 사용하였다. 설문조사는 대학생, 직장인, 주부등 20대부터 40대까지 연령층을 대상으로 진행하여 실증분석에 사용할 예정이다. SPSS v22.0을 사용하여 3단계 매개모형을 기반으로 회기분석할 예정이다.

  • PDF

어머니의 양육효능감과 정서표현성이 영아의 사회 정서발달에 미치는 영향 (The Effects of Mother's Parenting Efficacy and Emotional Expressiveness on Infant's Social Emotional Development)

  • 박미숙;정희정
    • 한국보육학회지
    • /
    • 제18권3호
    • /
    • pp.21-34
    • /
    • 2018
  • 본 연구의 목적은 어머니의 양육효능감과 정서표현성이 영아의 사회정서발달에 어떠한 영향을 미치는지를 알아보는 것이다. 연구대상은 S시 G구에 소재한 어린이집에 다니고 있는 영아들과 그들의 어머니 269명으로 질문지를 사용하여 자료를 수집하였다. 자료는 SPSS WIN 16.0 프로그램을 사용하여 빈도분석, t검증, ANOVA 검증, $Scheff{\acute{e}}$사후 검증, Pearson 적률상관분석, 중다회귀분석을 실시하였다. 연구결과 첫째, 어머니의 양육효능감, 정서표현성, 영아의 사회정서발달을 살펴본 결과 연령, 양육참여시간, 학력에 따른 유의한 차이가 있었다. 둘째, 어머니의 양육효능감, 정서표현성이 영아의 사회정서발달에 영향을 미치는 것으로 분석되었다. 결론적으로 어머니의 양육효능감, 정서표현성은 영아의 사회정서발달에 영향을 미치는 것을 확인할 수 있으며, 본 연구는 영아가 사회 정서적으로 건강하게 자랄 수 있도록 어머니의 양육효능감을 높이고 긍정적 정서표현성을 나타낼 수 있는 다양한 교육 프로그램이 필요함을 시사한다.