• 제목/요약/키워드: 초점어

검색결과 121건 처리시간 0.03초

등급 재현율: 이중언어 사전 구축에 대한 평가 방법 (Rated Recall: Evaluation Method for Constructing Bilingual Lexicons)

  • 서형원;권홍석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.146-151
    • /
    • 2013
  • 이중언어 사전 구축 방법을 평가하는 방법에는 정확률, 재현율, MRR(Mean Reciprocal Rank) 등이 있다. 이들 방법들은 평가 집합에 있는 대역어를 정확하게 찾는 것에 초점을 맞추고 있다. 그러나 어떤 대역어가 얼마나 많이 사용되는지는 전혀 고려하지 않는다. 즉 자주 사용되는 대역어를 빨리 찾을 수 있는 방법이 좋은 방법이라고 말할 수 있다. 이와 같은 문제를 해결하기 위해서 본 논문에서는 이중언어 사전 구축의 새로운 평가 방법인 등급 재현율을 제안한다. 등급 재현율(rated recall)은 대역어가 학습 말뭉치에 나타난 정도를 반영하는 재현율이며, 자주 사용되는 대역어를 얼마나 정확하게 찾는지를 파악할 수 있는 좋은 측도이다. 본 논문에서는 문맥벡터와 중간언어를 이용한 이중언어 사전 구축 시스템의 성능을 평가하고 기존의 방법과 비교 분석하였다.

  • PDF

잠재적 의미 색인을 이용한 유사 질의어 확장 (Query expansion by Similar words Using LSI)

  • 임태훈;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-169
    • /
    • 2009
  • 오늘날 인터넷 검색은 하루가 다르게 발전되고 있다. 주로 키워드 매칭에 의존을 둔 지금의 검색 서비스들은 사용자 중심의 아이템들을 개발해 정보검색의 경과시간 및 결과의 분류면에서 우수함을 보여주고 있다. 질의어의 의미에 유사한 검색은 아직은 발전하는 단계로, 내용에 기반을 둔 검색 환경에 초점이 맞춰지고 있다. 이와 관련하여 행렬의 특이치 분해(SVD)를 이용한 잠재적 의미 색인 기법(LSI)을 본 연구에서 다루고자 한다. 구축한 시스템의 성능 평가는 재현도 계산으로 비교되었는데 작은 크기의 특이값(singular value)들 생략에 의한 SVD의 성능과 그것을 재이용, 질의어에 대한 의미 구조상 근접한 용어들을 찾아 질의어를 확장한 후 적합한 문서들의 검색을 사용한 특이값 개수, 유사단어 확장 개수를 달리하여 실험하였다. 실험 결과, 특이값 2개를 사용한 잠재적 의미 색인이 특이값 3개를 사용한 잠재적 의미 색인보다 보다 나은 성능을 보였다. 그리고 조건을 달리한 모든 잠재적 의미 색인의 경우 단어 매칭에 의한 적합문서 검색보다 별 뚜렷한 나은 결과는 보이지 않았다. 하지만 의미적으로 관계가 깊은 유사어들을 찾아냈고, 의미적으로 가장 관계 깊은 문서를 대부분의 경우에서 순위 1위로 찾아내는 부분적 우수함을 보였다.

  • PDF

초급 외국인 학습자와 계승어 학습자의 상호작용 비교 연구 -형태 초점 양상을 중심으로- (A Comparative Study on Differences in Interaction between Beginning Foreign Learners and Heritage Learners: Focused on Form)

  • 이복자
    • 한국어교육
    • /
    • 제29권3호
    • /
    • pp.197-225
    • /
    • 2018
  • The purpose of this study is to compare the difference in the interactions between beginning language learners and heritage learners on their forms based on the interaction hypothesis. In this study, three types of information gap activities were used to analyze Language Related Episodes (LREs) while investigating the interaction patterns in language use between four pairs (eight learners) of foreign learners and four pairs (eight learners) of English-speaking heritage learners. The result indicated that foreign learners had a high focus on form during interaction. In particular, they had a tendency to focus on vocabulary rather than grammar, and they conducted self-repair by examining and mostly adjusting their speech to postposition and tense. However, in the problem-solving process, they showed a limited ability in interaction, and thus directly asked others to settle the problem or resorted to using English due to their lack of ability to employ various communication strategies. However, heritage learners had a relatively low focus on form compared to foreign learners. Yet, they also focused more on vocabulary rather than grammar and conducted self-repair in interaction, especially for vocabulary. In addition, they were skillful at using various communication strategies such as indirect expressions, use of alternative words, evasion, and delaying, to expand speech and prevent communication breakdown. They focused less on grammar and mostly did not provide negative feedback in interaction.

국내 학술지 논문의 주제어를 통한 학술연구분야 관계분석 (Relation Analysis Among Academic Research Areas Using Subject Terms of Domestic Journal Papers)

  • 이혜영;곽승진
    • 한국비블리아학회지
    • /
    • 제22권3호
    • /
    • pp.353-371
    • /
    • 2011
  • 본 연구의 목적은 국내 연구자들의 연구 성과물인 학술지 논문에 나타난 학문분야의 상호관계성과 연관성에 대한 연구로 연구동향에 대한 시사점을 제시하는 것이다. 학술논문을 이용한 계량적 연구는 주로 논문의 초록, 자동추출 키워드, 논문의 풀텍스트를 활용하는 것이 일반적이나 본 연구는 실험대상 학술논문의 저자가 제시한 주제어에 초점을 두었다. 실험대상 자료는 2009년도 한국연구재단 등재학술지 80종으로 학술논문 7,616건, 주제어 58,143건이다. 자료 분석결과 공학, 농수해양, 복합학, 사회, 예술체육, 의약학, 인문, 자연과학 등의 8개 각 연구분야는 주제어 사용에서 차이점을 보였다. 특히 공학분야의 주제어가 다른 연구 분야에서도 주제어로 많이 사용되고 있었다. 또한 주제어 네트워크를 통해 연구분야를 클러스터링 한 결과, 3개 클러스터를 얻을 수 있었다. 클러스터A는 '공학', '자연과학', '사회', '복합학', '인문', 클러스터B는 '의약학', '예술체육', 클러스터C는 '농수해양'이었다.

격언의 언어학적 특성과 프랑스어 학습 적용 방안 (Linguistic Characteristics of the Proverb and it's Effective Application to French Learning)

  • 정일영
    • 비교문화연구
    • /
    • 제44권
    • /
    • pp.283-314
    • /
    • 2016
  • 이 연구의 목적은 격언을 중심으로 프랑스어 학습 자료의 다양성을 모색하고 학습 효과의 효율성을 높이기 위한 학습 방안을 제시하는데 있다. 이 논문은 두 부분으로 구성되어져 있다. 첫 번째 부분에서는 격언들이 프랑스어의 형태, 통사적 특성을 바탕으로 구성되어 있음을 살펴볼 것이다. 또한 격언을 중심으로 한 프랑스어 학습 활용 방안과 관련한 선행 연구들을 분석함으로써 프랑스어 학습에 활용될 수 있는 가능성에 초점을 맞추었다. 두 번째 부분에서는 학습자들의 프랑스어 능력과 학습 내용의 난이도에 따라 초급 단계와 중급 단계로 구분하여 실제 학습에서 활용할 수 있는 예들을 살펴볼 것이다. 이를 통해 우리는 격언이 문화적인 영역의 요소일 뿐 아니라 프랑스어 학습 능력을 향상시킬 수 있는 효율적인 학습 자료로 활용될 수 있다는 점을 강조하였다. 언어 학습에서 문화적 요소의 중요성은 이미 오래 전부터 강조되어 왔다. 따라서 학습자의 수준과 학습 내용을 고려한 문화적 특성을 지니는 격언의 교육 현장에서의 적용은 교수법의 측면에서 학습의 효율성을 높일 수 있을 것이다.

피부 병변 분할을 위한 어텐션 기반 딥러닝 프레임워크 (Attention-based deep learning framework for skin lesion segmentation)

  • 아프난 가푸어;이범식
    • 스마트미디어저널
    • /
    • 제13권3호
    • /
    • pp.53-61
    • /
    • 2024
  • 본 논문은 기존 방법보다 우수한 성능을 달성하는 피부 병변 분할을 위한 새로운 M자 모양 인코더-디코더 아키텍처를 제안한다. 제안된 아키텍처는 왼쪽과 오른쪽 다리를 활용하여 다중 스케일 특징 추출을 가능하게 하고, 스킵 연결 내에서 어텐션 메커니즘을 통합하여 피부 병변 분할 성능을 더욱 향상시킨다. 입력 영상은 네 가지 다른 패치로 분할되어 입력되며 인코더-디코더 프레임워크 내에서 피부 병변 분할 성능의 향상된 처리를 가능하게 한다. 제안하는 방법에서 어텐션 메커니즘을 통해 입력 영상의 특징에 더 많은 초점을 맞추어 더욱 정교한 영상 분할 결과를 도출하는 것이다. 실험 결과는 제안된 방법의 효과를 강조하며, 기존 방법과 비교하여 우수한 정확도, 정밀도 및 Jaccard 지수를 보여준다.

구문 정보와 비용기반 중심화 이론에 기반한 자연스러운 지시어 생성 (Generation of Natural Referring Expressions by Syntactic Information and Cost-based Centering Model)

  • 노지은;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1649-1659
    • /
    • 2004
  • 텍스트 생성(text generation)은 언어가 아닌 다양한 지식원으로부터 텍스트를 생성해 내는 언어 처리의 한 분야로, 여러 가지 복합적이고 단계적인 과정을 통해 이루어진다. 본 논문에서는 자연스러운 텍스트 생성을 위한 여러 과정 중, 한번 언급된 대상(entity)을 자연스럽게 지시(refer)하기 위한 지시어 생성(referring expression generation), 특히 한국어에 두드러진 영형(zero pronoun)에 의한 대용화(pronominalization) 과정에 초점을 맞춘다. 이를 위해, 구문 정보와 비용기반 중심화 이론(cost-based centering model)을 바탕으로, 한국어에 적합한 지시어 특히 영형의 생성에 영향을 미치는 다양한 자질(feature)들온 규명하고, 기계 학습을 통해 지시어 생성 모델을 구축하였다. 세 개의 장르 - 묘사문(설명문), 뉴스, 짧은 우화 - 에서 총 95개의 텍스트로부터 학습이 이루어 졌으며 이론 대상으로, 제안된 자질들이 지시어의 생성, 특히 영형의 생성에 효율적으로 적용될 수 있음을 보였다. 또한, 지시어 생성과 관련된 기존의 방법론들과 본 논문에서 제안한 모델을 비교하여 성능이 크게 향상되었음을 보이고, T-test를 통해 99.9%의 신뢰 구간에서 그 성능 향상이 통계적으로 의미가 있음을 확인하였다.

국어 의문사${\cdot}$부정사 의문문의 초점 실현에 대한 음향음성학적 연구 (Acoustic Phonetic Study about Focus Realization of wh-word Questions in Korean)

  • 박미영;안병섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.289-292
    • /
    • 2002
  • 국어에서 wh-단어가 포함된 의문사 의문문과 부정사 의문문은 통사적으로 같은 구조를 가지지만 의미적으로는 중의 관계에 있다. 그러나 두 의문문은 문장으로 발화될 때 음성적으로 서로 다른 여러 가지 운율 특징의 차이를 보여줌으로써, 발화 차원에서는 더 이상 중의 관계를 유지하지 않는다. 본고에서는 이러한 중의성의 해소는 두 의문문의 초점이 달리 실현되기 때문이라고 본다. 기존의 연구에서는 두 가지 의문문의 억양 연구를 초점의 작용 범위와 문말 억양의 차이, 강세구 형성의 유형을 중심으로 고찰하였다 .그리고 의문사와 부정사의 의미는, 이에 후행하는 서술어와 형성하는 강세구 유형에서 우선적으로 그 의미가 구분될 수 있다고 보았다. 그러나, 본고에서는 국어의 wh-단어가 초점으로서 작용하는 운율적 돋들림을 좀더 다양한 환경에서 실험하였다. 그리고 의문사${\cdot}$부정사와 후행하는 언어단위의 강세구 형성(accentual phrasing) 유형, 의문사${\cdot}$부정사 의문문 전체 문장 억양의 실현 양상, wh-단어 자체의 음의 높낮이(pitch contour) 실현 유형, 문말 억양(boundary tone)에서 음의 높낮이를 대상으로 분석하였다.

  • PDF

Balanced Attention Mechanism을 활용한 CG/VR 영상의 초해상화 (CG/VR Image Super-Resolution Using Balanced Attention Mechanism)

  • 김소원;박한훈
    • 융합신호처리학회논문지
    • /
    • 제22권4호
    • /
    • pp.156-163
    • /
    • 2021
  • 어텐션(Attention) 메커니즘은 딥러닝 기술을 활용한 다양한 컴퓨터 비전 시스템에서 활용되고 있으며, 초해상화(Super-resolution)를 위한 딥러닝 모델에도 어텐션 메커니즘을 적용하고 있다. 하지만 어텐션 메커니즘이 적용된 대부분의 초해상화 기법들은 Real 영상의 초해상화에만 초점을 맞추어서 연구되어, 어텐션 메커니즘을 적용한 초해상화가 CG나 VR 영상 초해상화에도 유효한지는 알기 어렵다. 본 논문에서는 최근에 제안된 어텐션 메커니즘 모듈인 BAM(Balanced Attention Mechanism) 모듈을 12개의 초해상화 딥러닝 모델에 적용한 후, CG나 VR 영상에서도 성능 향상 효과를 보이는지 확인하는 실험을 진행하였다. 실험 결과, BAM 모듈은 제한적으로 CG나 VR 영상의 초해상화 성능 향상에 기여하였으며, 데이터 특징과 크기, 그리고 네트워크 종류에 따라 성능 향상도가 달라진다는 것을 확인할 수 있었다.

기쁨의 의미연구 - 러시아어와 한국어의 비교를 중심으로 - (A Comparative Study on Joy in Russian and Korean)

  • 김정일
    • 비교문화연구
    • /
    • 제41권
    • /
    • pp.113-140
    • /
    • 2015
  • 본 연구를 통해 필자는 러시아어와 한국어에서 인간의 가장 원초적이고 본원적인 감정 중 하나인 "기쁨"이 어떻게 언어적으로 구현되는지를 살펴보고자 하였다. 그 과정에서 특히 "기쁨"이라는 개념이 러시아와 한국어에서 어떻게 기술되는지, 그리고 그러한 기술이 문화적 맥락과 어떤 관련을 맺고 있는지 살펴봄으로써, 러시아어와 한국어에서 "기쁨"이 가지는 의미적, 화용적 특징들을 규명해 보고자 하였다. 기쁨은 러시아어에서 주로 радость [기쁨]과 удовольствие [즐거움(만족)] 으로 기술되며, 전자가 보다 넓은 종교적, 정신적, 지속적, 문화적 맥락과 후자는 보다 구체적, 육체적, 순간적 맥락과 관련된다. 전자가 보다 거시적 맥락에서 의미와 투영대상을 찾는다면 후자는 보다 일상적인 맥락에서 욕망이 구체적으로 투영될 대상을 찾는다는 것이 전통적인 설명방식이었다. 하지만 오늘날 이러한 대립관계는 점차 약화되고, 기쁨의 대상이 되는 존재에 보다 초점을 맞추고, 그 존재의 실존적 관계에 보다 집중하는지 아니면 일상의 디테일에서 즉각적으로 느끼는 기쁨에 보다 초점을 맞추는지의 대립으로 전환되어 감을 알 수 있었다. 반면에 한국어에서 기쁨은 주로 "기쁨"과 "즐거움"이라는 두 개의 어휘로 구현되는데, 전자가 보다 정신적인 작용과 관련을 가지며, 그 유발하는 원인과 그 결과 사이의 논리적 관계에 대한 추론이 기저에 깔려있는 반면, 후자는 화자가 참여자로서 해당 상황에 개입하는 과정에서 즉각적으로 느끼는 감정과 연관된다. "기쁨"이 화자가 사전에 가졌던 기대와 계획, 예상과의 부합 혹은 충족으로 인한 흡족함에서 오는 것이라면 "즐거움"은 상황속에서 적극적으로 참여하고 활동하는 화자에게서 즉각적으로 느껴지는 감정이다. 따라서 러시아어의 기쁨의 부차적인 개념 "즐거움(만족)(удовольствие)"과 한국어의 "즐거움"은 매우 중요한 의미적 자질을 공유하고 있다고 할 수 있다. 결국 두 언어 모두 화자가 대상에 대하여 어떠한 태도와 입장을 취하는지에 따라 기쁨에 대한 2개의 변별적인 선택지를 가지고 있다고 볼 수 있다.