• 제목/요약/키워드: 표현어휘

검색결과 364건 처리시간 0.025초

한국어에 나타나는 '진실' 표현 어휘의 담화표지 기능 연구 (A Corpus-based Study of the Truth-related Words in Korean Used as Discourse Markers)

  • 김태호;정선영
    • 비교문화연구
    • /
    • 제29권
    • /
    • pp.453-477
    • /
    • 2012
  • This study investigates how the truth-related words in Korean, which were originally noun or adverb with 'truth' related meaning, can be used as discourse markers with the functions such as 'emphatic marker', 'attention getter', or 'hesitation marker', and it argues that such functions of the discourse markers are the result of grammaticalization process. That is to say that the truth-related words have acquired new functions as discourse markers from their corresponding lexical items as a noun or an adverb through grammaticalization process. In this study, we demonstrate that the truth-related words tend to appear sentence-initially or sentence-medially when they are used as discourse markers. We also show that they are most likely to be used as emphatic marker because of the lexical meaning of the truth-related words. Finally, we state that truth-related words differ from one another in where they appear and what function they are used with.

KAISER: 워드 임베딩 기반 개체명 어휘 자가 학습 방법을 적용한 개체명 인식기 (KAISER: Named Entity Recognizer using Word Embedding-based Self-learning of Gazettes)

  • 함영균;최동호;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.337-339
    • /
    • 2016
  • 본 논문에서는 한국어 개체명 인식의 성능 향상을 위하여 워드 임베딩을 활용할 수 있는 방법에 대하여 기술한다. 워드 임베딩이란 문장의 단어의 공기정보를 바탕으로 그 단어의 의미를 벡터로 표현하는 분산표현이다. 이러한 분산 표현은 단어 간의 유의미한 정도를 계산하는데 유용하다. 본 논문에서는 이러한 워드 임베딩을 통하여 단어 벡터들의 코사인 유사도를 통한 개체명 사전 자가 학습 및 매칭 방법을 적용하고, 그 실험 결과를 보고한다.

  • PDF

시맨틱웹을 위한 효율적인 온톨로지 객체 모델 (Efficient Ontology Object Model for Semantic Web)

  • 윤보현;서창호
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.7-13
    • /
    • 2006
  • 시멘틱 웹의 대두로 인해 웹 상에서 데이터를 접근 할 수 있는 방법도 다양화 되었다. 이에 현재 진행되고 있는 웹 온톨로지 뿐만 아니라 기존에 구축된 지식베이스 시스템에 접근하여 데이터를 핸들링 할 수 있는 모델이 필요하다. 웹 온톨로지를 표현하기 위한 언어로 RDF(Resource Description Framework), DAML-OIL, OWL(Web Ontology Language)등이 사용되고 있다. 본 논문은 웹 온톨로지와 기존의 구축된 지식 베이스의 데이터를 접근, 표현 및 처리할 수 있는 온톨로지 객체 모델의 생성과 그 방법에 관한 것이다. 웹 온톨로지에 대한 접근 방법으로 각각의 언어에 맞는 파서(Parser)를 이용하여 메모리 상에 모델을 생성하여 접근하게 되어 있는 기존의 방법과는 다르게 본 논문에서는 웹 온톨로지를 표현하기 위한 모델을 계층별로 구별하여 프레임 기반의 상위 온톨로지(frame-based ontology layer), 다른 도메인에서도 사용이 가능한 공통된 어휘(vocabulary)를 표현한 핵심 온톨로지(generic ontology layer)와 각각의 온톨로지 언어에 의존적인 어휘를 표현한 기능 온톨로지(functional ontology layer)로 구성한다. 이는 표현의 중복을 없애고 재 사용성을 높이기 위한 모델을 제공함으로써, 외부 어플리케이션(온톨로지 추론, 온톨로지 병합, 온톨로지 저작 도구 등)에서의 온톨로지에 대한 쉬운 지식 표현과 접근 및 핸들링을 제공할 수 있다.

  • PDF

SNS내 사회감성의 어휘적 의미와 표현에 대한 유의성 (Valence of Social Emotions' Sense and Expression in SNS)

  • 현혜정;황민철
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.37-48
    • /
    • 2014
  • 사회감성은 다양한 사회적 네트워크가 형성됨으로서 우리생활에서 의사소통의 질적 관점에서 중요한 요인으로 대두되고 있다. 이러한 사회감성을 이해하기 위해서 감성의 어휘적 의미와 표현에서 보여 지는 유의성을 검증하고 분석하여 사회감성의 복합적인 의미를 이해하고자 한다. 본 연구에서 의사소통의 대표적인 채널인 SNS(Social Network Service)상에서 감성표현 결과를 이용하여 그 의미와 표현에 대한 척도를 구하고 군집분석을 통해서 그 차이를 깊이 있게 이해하려고 하였다. 분석결과 사회감성요인은 부정적 평가 요인 항목이 긍정적 요인에 비교하여 비중이 높은 반면, 사회감성 표현은 긍정적인 표현이 상당히 많이 제시되는 것으로 나타났다. 사회감성요인에 대한 분류에서 기본 감성이나 유인가로 구분이 가능한 반면에 감성표현에서는 사회감성에서 요구되는 부가적인 내용을 복합적인 의미로 내포하고 있으며 양가적 내용 특성 포함하고 있다.

감정형용사 유의어 결합 연구 -[[감정형용사 + '-고'] + 감정형용사] 구성- (Synonym Emotional Adjectives in Coordination: Analyzing [Emotional Adjective + '-ko(and)'] + Emotional Adjective] Structures in Korean)

  • 박진아;정용호
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.565-577
    • /
    • 2024
  • 본 논의는 [[감정형용사+-고]+감정형용사] 형식으로 감정형용사가 연결되는 양상을 살펴보았다. 이로써 한국어에서 감정을 표현할 때 두 개 이상의 감정형용사를 접속하여 표현하는 사례가 적지 않음을 확인할 수 있었다. 이는 해당 구성으로 어울려 사용하는 감정형용사를 파악함으로써 한국어 학습자가 감정형용사의 개별 어휘 의미를 보다 분명하게 이해하고 표현하는 데 도움을 줄 수 있다. 한국어 학습자가 한국어로 감정을 표현할 때 복합적인 감정을 표현하거나, 풍부한 감정 표현을 만드는 데 도움을 줄 수 있다고 보았다. 본 논의에서 보인 [[감정형용사+-고]+감정형용사] 용례 및 빈도가 한국어 감정 어휘 교수-학습에 작게나마 도움이 되기를 기대해 본다.

보강제ㆍ무기충진제 및 착색제

  • 백봉기
    • 타이어
    • /
    • 통권13호
    • /
    • pp.31-36
    • /
    • 1968
  • 본장에서는 전호에서 논술한 Carbon black을 제외한 각종 보고무용 보강제, 무기충진제 및 착색제를 해설키로 한다. 논제에서는 세가지 배합제로 분류하였으나 편의상 이들 세가지 배합제를 보진제란 한 어휘로 표현하였다.

  • PDF

보강제ㆍ무기충진제 및 착색제(2)

  • 백봉기
    • 타이어
    • /
    • 통권14호
    • /
    • pp.26-30
    • /
    • 1968
  • 본장에서는 전호에서 논술한 Carbon black을 제외한 각종 고무용보강제, 무기보진제 및 착색제를 해설키로 한다. 논제에서는 세가지 배합제로 분류하였으나 편의상 이들 세가지 배하제를 보진제란 한 어휘로 표현하였다.

  • PDF

보강제ㆍ무기충진제 및 착색제(3)

  • 백봉기
    • 타이어
    • /
    • 통권15호
    • /
    • pp.22-28
    • /
    • 1968
  • 본장에서는 전호에서 논술한 Carbon black을 제외한 각종 보고무용 보강제, 무기충진제 및 착색제를 해설키로 한다. 논제에서는 세가지 배합제로 분류하였으나 편의상 이들 세가지 배합제를 보진제란 한 어휘로 표현하였다.

  • PDF

잠정적 부적합 문서와 어휘 근접도를 반영한 어휘 그래프 기반 질의 확장 (Query Expansion Based on Word Graphs Using Pseudo Non-Relevant Documents and Term Proximity)

  • 조승현;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.189-194
    • /
    • 2012
  • 본 논문에서는 정보검색 성능 향상을 위해 잠정적 적합 문서 및 부적합 문서와 어휘 그래프를 이용한 질의 확장 방법을 제안한다. 언어모델에 의한 초기 검색 결과 상위 문서들은 질의 어휘 조합과 근접도를 기반으로 핵심 질의를 포함하는 문서들로 구성된 핵심 질의 클러스터와 핵심 질의를 포함하지 않는 문서들로 구성된 비핵심 질의 클러스터로 분류된다. 이때, 핵심 질의 클러스터는 잠정적 적합 문서 집합으로, 비핵심 질의 클러스터는 잠정적 부적합 문서 집합으로 본다. 각 클러스터는 어휘들과 질의 어휘와의 가까운 정도에 따라 어휘 그래프로 표현된다. 각 어휘에 대한 중요도는 핵심 질의 클러스터 그래프에서의 어휘 가중치에서 비핵심 질의 클러스터 그래프에서의 어휘의 가중치를 빼서 계산한다. 이는 부적합 문서에서 높은 가중치를 갖는 어휘는 확장 질의에서 제외시키는 역할을 한다. 중요도가 높은 어휘 순으로 확장할 질의를 선택한다. 웹 문서 테스트컬렉션인 TREC WT10g에서의 실험 결과에서 제안 방법이 언어모델(LM)에 비해 평균 정확률의 평균(MAP)에서 9.4% 성능 향상을 보였다.

화장품 후기글의 자질기반 감성분석을 위한 다단어 표현의 유한그래프 사전 및 문법 구축 (Building Korean Multi-word Expression Lexicons and Grammars Represented by Finite-State Graphs for FbSA of Cosmetic Reviews)

  • 황창회;유광훈;최성용;신동혁;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.400-405
    • /
    • 2018
  • 본 연구는 한국어 화장품 리뷰 코퍼스의 자질기반 감성 분석을 위하여, 이 도메인에서 실현되는 중요한 다단어 표현(MWE)의 유한상태 그래프 사전과 문법을 구축하는 방법론을 제시하고, 실제 구축된 사전과 문법의 성능을 평가하는 것을 목표로 한다. 본 연구에서는 자연어처리(NLP)에서 중요한 화두로 논의되어 온 MWE의 어휘-통사적 특징을 부분문법 그래프(LGG)로 형식화하였다. 화장품 리뷰 코퍼스에 DECO 한국어 전자사전을 적용하여 어휘 빈도 통계를 획득하고 이에 대한 언어학적 분석을 통해 극성 MWE(Polarity-MWE)와 화제 MWE(Topic MWE)의 전체 네 가지 하위 범주를 분류하였다. 또한 각 모듈간의 상호관계에 대한 어휘-통사적 속성을 반복적으로 적용하는 이중 증식(double-propagation)을 통해 자원을 확장하였다. 이 과정을 통해 구축된 대용량 MWE 유한그래프 사전 DECO-MWE의 성능을 테스트한 결과 각각 0.844(Pol-MWE), 0.742(Top-MWE)의 조화평균을 보였다. 이를 통해 본 연구에서 제안하는 MWE 언어자원 구축 방법론이 다양한 도메인에서 활용될 수 있고 향후 자질기반 감성 분석에 중요한 자원이 될 것임을 확인하였다.

  • PDF