• 제목/요약/키워드: Linguistic Features

검색결과 178건 처리시간 0.027초

기계 학습을 이용한 바이오 분야 학술 문헌에서의 관계 추출에 대한 실험적 연구 (An Experimental Study on the Relation Extraction from Biomedical Abstracts using Machine Learning)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제50권2호
    • /
    • pp.309-336
    • /
    • 2016
  • 본 논문에서는 지지벡터기계(Support Vector Machines, SVM) 기반의 기계 학습 모듈을 활용하여 특정 문장 내에서의 두 개체 간의 관계를 자동으로 식별하고 분류하는 바이오 분야 관계 추출 시스템을 제안한다. 제안된 시스템의 특징은 개체를 포함하고 있는 문장 내에서 풍부한 언어 자질을 추출하여 학습에 활용함으로써 그 성능을 극대화할 수 있는 다양한 기능들을 포함하고 있다는 점이다. 제안된 시스템의 성능 측정을 위해서 전 세계적으로 많이 활용되고 있는 바이오 분야 관계 추출 표준 컬렉션 3가지를 활용하여 심층적인 실험을 수행한 결과 모든 컬렉션에서 높은 성능을 획득하여 그 우수성을 입증하였다. 결론적으로, 본 논문에서 수행한 바이오 분야 관계 추출에 대한 광범위하고 심층적인 실험 연구가 향후 기계학습 기반의 바이오 분야 텍스트 분석 연구에 많은 시사점을 제공할 것으로 보인다.

안동부 고지도의 유형별 수록지명 연구 (A Study on the Place-Names in Old Maps of Andong-Bu)

  • 배미애
    • 한국지역지리학회지
    • /
    • 제10권3호
    • /
    • pp.511-538
    • /
    • 2004
  • 지명은 특정 지역의 생활양식이나 고유한 지리적인 특성을 반영한 상징적 언어이다. 지도에 수록된 지명을 통하여 과거나 현재의 지역성과 역사적 연속성을 살펴볼 수 있다. 조선시대 안동대도호부를 그린 지도의 지명을 추출하여 과거 안동부의 지역성을 파악하고 이를 통하여 오늘날의 안동문화권을 이해하고자하는 것이 본 연구의 목적이다. 안동부 고지도의 자연지명을 통하여 산천을 신앙시하는 선조들의 사고를 엿볼 수 있다. 그리고 합리적인 행정을 위해 지도가 갖추어야 할 조건에 충실하여 방면 등 행정지명에 비중을 두었음을 알 수 있다. 봉수중심의 군사지명과 역원중심의 교통지명은 중앙과의 연계에서 안동부 사람들의 지역의 안위에 대한 인식과 영남내륙의 교통중심으로서 안동부의 위상을 설명해준다. 영남사림의 중심지역인 안동부는 삶의 근간을 이루는 중요한 사상으로서 유교를 중심축으로 하여 공간구성이 이루어졌으며 이는 안동부 고지도에 수록된 문화지명 속에 고스란히 반영되어 있다.

  • PDF

필사본 "조선지지자료(朝鮮地誌資料)" 충청북도편 지명 자료의 시론적 분석 (A Preliminary Study on the Toponymic Data of Joseon Jiji Jaryo : Chungcheongbuk-do)

  • 김순배
    • 한국지역지리학회지
    • /
    • 제19권1호
    • /
    • pp.31-44
    • /
    • 2013
  • 필사본 "조선지지자료"의 학술적 가치는 한글로 표기된 고유 지명과 그와 대응되는 한자 지명이 전국적인 수준으로 다량 수록되었다는 점이다. 이 문헌을 통해 우리나라 지명 변천의 언어학적인 특징을 규명하고 이를 바탕으로 지리학적인 명명 유연성과 당시 행정 구역 등을 추론할 수 있는 1차 자료를 얻을 수 있게 되었다. 본 논문은 "조선지지자료"가 가지는 지명학적 가치에 주목하면서 아직 초보 단계에 머물고 있는 이 문헌에 대한 학술적 연구를 제고하기 위해 기초적이고 시론적인 분석을 실시하였다. 즉 충청북도편을 중심으로 서지 사항과 내용 구성을 재검토하여 지금까지 알려진 편찬 시기에 대한 지역적 편차 가능성과 내용 구성의 오류를 지적하였다. 또한 이 문헌에 수록된 지명 자료의 지명학적 가치를 촌락 지명의 표기 변화와 차자 표기 경향을 중심으로 제시하였다.

  • PDF

영상애니메이션 트랜지션의 메타모포시스 시각 표현에 관한 연구 (A Study on Expression Visual of Metamorphosis Transition of Image Animation)

  • 주해정;김치용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.347-350
    • /
    • 2010
  • 뉴 미디어 시대의 도래로 우리는 움직이는 영상 이미지의 세계에 살고 있다고 해도 과언이 아니다. 매체의 발달과 함께 일상에서는 이미지와 함께 순간을 지나며 느끼며 그것을 일부처럼 공존하며 소통하고 있다. 이러한 시대에 논리적이고 현실적인 사고보다 감각적이고 형상적인 이미지가 더 많은 것을 전달하고 설명하기도 한다. 움직이는 이미지를 보는 행위는 언어적이고 개념적인 의미의 전달 이전에 색채와 화면을 구성하고 있는 조형적인 요소와 그것들이 만들어내는 변화가 먼저 인식된다. 특히 서사의 구조를 가지는 영화영상 애니메이션에서는 그 영역이 더욱 크게 작용하며 이러한 장면의 이미지를 연결시키는 트랜지션의 기법 역시 본연의 단순한 기능에서 의미소통의 기능으로 확대되고 있다. 이러한 트랜지션 효과는 단순한 장면전환의 전통적 기법에서 시각적 유희성을 제공하고 서사의 흐름에 도움을 주는 내러티브 기능으로 수행되는 관점에서 시각적 표현의 연구는 지속되어야 한다.

  • PDF

한글 말뭉치를 이용한 한글 표절 탐색 모델 개발 (Developing of Text Plagiarism Detection Model using Korean Corpus Data)

  • 류창건;김형준;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권2호
    • /
    • pp.231-235
    • /
    • 2008
  • 최근 들어 각종 창작물에 대한 표절 사건이 빈번하게 발생하고 있다. 특히 문서들 간의 표절은 현재 많은 이슈가 되고 있다. 영어에 관한 표절연구는 서양에서 오래전부터 이뤄져 왔지만 한글은 구조적인 어려움으로 인해 아직 많은 연구가 이뤄지지 않고 있다. 한글은 영어와 구조적인 특징이 많이 다르기 때문에 영어기반의 탐색 기법을 한글 문서에 적용하기는 어렵다. 본 논문에서는 한글의 특성에 맞는 새로운 표절 탐색 기법을 소개하고 한글 말뭉치를 이용하여 그 성능을 실험해본다. 제안된 기법은 "k-mer"와 "지역정렬" 방법을 기반으로, 문서들 간의 표절구간을 매우 빠르고 정확하게 찾아낸다. 또한 우리는 천만어절 이상의 크기를 가진 한글 말뭉치를 이용하여 표절이 일어나지 않은 일반적인 문서에서 우연히 나타나게 될 유사 확률에 관한 모형을 만들었다. 시스템을 이용하여 성능을 측정해 본 결과, 표절 문서를 매우 정확하게 찾는 것을 알 수 있었다.

비지니스 이메일 영작문에 나타난 오류분석: 사례연구 (An Error Analysis on Business E-mails in English : A Case-Study)

  • 황선유
    • 융합정보논문지
    • /
    • 제8권6호
    • /
    • pp.273-279
    • /
    • 2018
  • 본 연구는 번역기를 활용한 영작문 수업에서 대학생들이 작성한 비즈니스 이메일 영작문에 나타난 오류를 분석하고 설명하려는 연구이다. 연구는 취업실무영어 수업을 수강한 대학생들이 3가지 과제에 대해 작성한 21개 이메일을 분석하여 이에 나타난 문법오류를 분석 정리하였다. 이메일에 나타난 문법오류를 살펴보면, 동사의 용법을 제대로 알지 못해서 발생한 언어 내 오류가 가장 빈번했으며, 완료 시제를 사용해야 하는 문장에서 과거동사를 사용하는 시제에 관한 오류와 명사 앞에 정관사를 사용하지 않은 정관사 오류와 전치사 잘못 사용한 오류와 같은 언어 간 오류도 있었다. 문맥과 관련된 오류를 보면 지칭하는 명사에 맞게 단 복수대명사를 제대로 사용하지 못한 오류라던가, 문장을 연결하다가 생략할 수 없는 주어를 생략한 오류는 의미전달에 문제가 될 수 있는 심각한 오류이다. 이러한 오류분석을 통하여 영어를 학습하고 있는 학습자가 특정한 문법사항을 학습하는 데에 어려움을 겪고 있다는 것과 학생들의 영어능력 발달단계를 가늠해 주는 정보를 제공함으로 연구의 의미가 있다고 볼 수 있다.

현대 러시아 광고언어에 있어서의 '언어유희' 현상에 대한 연구 (A Study on Phenomenon 'Play of Words' in Modern Russian Advertising Language)

  • 김성완
    • 비교문화연구
    • /
    • 제42권
    • /
    • pp.241-260
    • /
    • 2016
  • 이 글의 목표는 현대 러시아 광고언어에 있어서 어떤 유형의 '언어유희'(игра слов) 현상이 나타나고 있으며, 이는 광고의 어떤 특징 때문에 연유하는지에 대해 밝히는 것이다. 이러한 목표를 달성하기 위해 광고의 정의 및 광고언어의 특징을 살펴보고, 광고의 효과를 극대화하기 위해 언어를 어떻게 이용하고 있는지를 밝힐 것이다. 광고 연구에 있어서 필요한 학문은 언어학을 비롯하여 경제학, 심리학, 사회학, 마케팅, 문학, 예술학, 음악 등으로 아주 다양하다. 이는 현대의 광고가 화면과 소리, 그리고 텍스트가 결합되는 기호학적 대상이기 때문이다. 본 연구에서는 비록 이렇게 다양한 부분을 한꺼번에 연구할 수 없지만 광고 텍스트들에서 나타나는 언어유희 현상을 중심으로 광고 기획자와 소비자가 인식하는 언어유희 현상에 대한 인식에 대해 밝히고자 한다. 광고는 언어학자들에 의해 그 해당 언어를 파괴하는 주범으로 인식되어 온 측면도 있는데, 이는 광고에 사용되어지는 비문법적인 문장 생성이나 비문법적인 단어 표현, 외국어의 남발 및 잘못된 외래어 표기, 비속어 및 은어의 잦은 사용, 맞춤법 등 어문규범의 파괴가 그 원인이다. 이러한 것들이 광고의 어떤 목적을 위해 이루어지는 것인지 밝히고자 한다.

영미 아동 모험 소설에 관한 코퍼스 분석 연구: 『보물섬』을 중심으로 (A Corpus Analysis of British-American Children's Adventure Novels: Treasure Island)

  • 최은샘;정채관
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.333-342
    • /
    • 2021
  • 본 연구에서는 대표적인 영미 아동 모험 소설 『보물섬』의 언어적 특징을 파악하기 위해 『보물섬』을 코퍼스화 하여 어휘, 리마, 키워드, n-그램을 분석하였다. 이 연구를 통해 고빈도 어휘가 텍스트의 핵심어라는 일반적인 주장과 달리 『보물섬』의 고빈도 어휘는 『보물섬』과 직접 관련이 없는 기능어, 고유명사 등이 최상위층에 포진하고 있다는 것을 발견하였고, 통계적인 방법으로 추출한 『보물섬』 키워드 역시 『보물섬』의 내용을 가늠하기에 충분하지 않음을 발견하였다. 따라서 1차 정량적인 키워드 분석 후 진행된 2차 정성적인 키워드 분석을 통해 추출한 30개의 핵심 키워드를 통해 『보물섬』 내용을 신속하고 구체적으로 파악하는 단초를 마련하였고, 이를 바탕으로 그동안 직관적으로만 회자 되던 『보물섬』에 나타난 남성성을 계량적으로 분석할 수 있었다. 또한, n-그램 분석을 통해 『보물섬』의 작가가 다른 작가에 비해 선호하고 자주 사용하는 연속어휘구를 발견하였고, 이를 토대로 문학 작품의 계량적 연구가 가능한 코퍼스 문체론 연구의 가능성을 탐색하였다. 본 연구를 통해 밝혀낸 연구결과가 영미 아동문학 콘텐츠의 확산과 코퍼스 문체론 연구에 도움이 되기를 희망한다.

Biaffine Average Attention 모델을 이용한 의미역 결정 (Semantic Role Labeling using Biaffine Average Attention Model)

  • 남충현;장경식
    • 한국정보통신학회논문지
    • /
    • 제26권5호
    • /
    • pp.662-667
    • /
    • 2022
  • 의미역 결정 작업은 서술어와 문장 내 행위자, 피행위자, 장소, 시간 등 서술어와 관련 있는 논항들을 추출하는 작업이다. 기존 의미역 결정 방법은 문장의 언어학적 특징 추출을 위한 파이프라인을 구축하는데, 파이프라인 내 각 추출 작업들의 오류가 의미역 결정 작업의 성능에 영향을 미치기 때문에 현재는 End-to-End 방법의 신경망 모델을 이용한 방법들이 제안되고 있다. 본 논문에서는 의미역 결정 작업을 위해 Biaffine Average Attention 구조를 이용한 신경망 모델을 제안한다. 제안하는 모델은 기존 연구에서 제안된 특정 시점에 대한 레이블 예측을 위해 주변 시점 정보를 이용하는 LSTM 모델 대신 문장 내 서술어와 논항의 거리에 상관없이 문장 전체 정보에 집중할 수 있는 Biaffine Average Attention 구조로 이루어져 있다. 제안하는 모델의 성능 평가를 위해 F1 점수를 이용하여 기존 연구에서 제안한 BERT 기반의 모델들과 비교하였으며, 76.21%의 성능으로 비교 모델보다 높은 성능을 보였음을 확인하였다.

언어적 특성과 서비스를 고려한 딥러닝 기반 한국어 방언 기계번역 연구 (Deep Learning-based Korean Dialect Machine Translation Research Considering Linguistics Features and Service)

  • 임상범;박찬준;양영욱
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.21-29
    • /
    • 2022
  • 본 논문은 방언 연구, 보존, 의사소통의 중요성을 바탕으로 소외될 수 있는 방언 사용자들을 위한 한국어 방언 기계번역 연구를 진행하였다. 사용한 방언 데이터는 최상위 행정구역을 기반으로 배포된 AIHUB 방언 데이터를 사용하였다. 방언 데이터를 바탕으로 Transformer 기반의 copy mechanism을 적용하여 방언 기계번역기의 성능 향상을 도모하는 모델링 연구와 모델 배포의 효율성을 도모하는 Many-to-one 기반의 방언 기계 번역기를 제안한다. 본 논문은 one-to-one 모델과 many-to-one 모델의 성능을 비교 분석하고 이를 다양한 언어학적 시각으로 분석하였다. 실험 결과 BLEU점수를 기준으로 본 논문이 제안하는 방법론을 적용한 one-to-one 기계번역기의 성능 향상과 many-to-one 기계번역기의 유의미한 성능을 도출하였다.