• 제목/요약/키워드: 단어 표현

검색결과 568건 처리시간 0.03초

인지어휘 유형개념 (Cognitive Dictionaries Inferred from Word Associations)

  • 지혜련
    • 아동학회지
    • /
    • 제5권
    • /
    • pp.47-52
    • /
    • 1984
  • 인지 어휘 유형(cognitive dictionary)이란 단어 연상의 반응 어휘를 인지 유형에 따라 분류, 분석하는 것을 가리킨다. 인지 어휘 유형 개념을 McNeill의 언어 발달 연구에 준하여 논의하였다. 즉 아동의 어의(語義) 발달은 자작문(自作文) 형식(形式) 표현에서 시작되어 어휘 사용에 이른다는 것이다. 한편 Moran은 범세계적으로 유아들의 인지 어휘 유형은 단어의 동작적(動作的) 특성에 주로 의거한다는 것을 발견했는데 이는 언어의 효시에 관한 Piaget 나 Bruner의 이론과 일치하는 것이다. Moran의 인지 어휘 유형의 추가 개념은 Bruner의 심상(心象)(ikonic representation)에 의한 관계, 기능적 관계 (functional representation), 논리적(logical)관계를 포함한 단어의 연합 관계에 반영시켰다.

  • PDF

웹 검색 환경에 적용할 추론 망 기반 검색모델 (Inference Network-Based Retrieval Model for Web Search Environment)

  • 최익규;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.19-21
    • /
    • 2001
  • 대다수의 사용자는 웹 검색에서 자신이 찾고자 하는 것을 표현할 때, 평균 2, 3개의 단어를 사용하고 있다. 벡터 모델이나 추론 망 모델에서 이런 질의 정보를 이용하여 좋은 결과를 얻기에는 몇 가지 어려움이 있다. 특히 추론 망 모델에서 많이 사용되는 유사도 계산식인 weighted-sum방법은 질의에 나타나는 단어의 수가 적고 많은 문서들이 이 단어들을 모두 가지고 있을 경우에 좋지 않은 검색결과를 보여주고 있다. 본 논문은 추론 망 모델에 적용되는 유사도 계산식인 weighted-sum방법을 개선하였고, 이를 기반으로 Web Trec 9의 자료를 검색하여 좋은 결과를 얻었다.

  • PDF

WordNet 기반 개념적 이미지 주석 시스템 설계 (Design of Conceptual Image Annotation System Using WordNet)

  • 조미영;최준호;김판구
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1081-1086
    • /
    • 2002
  • 이미지검색을 위해서 객체의 시각적인 특징에 대한 저차원의 특징 정보를 추출하고 이미지에 의미를 부여하기 위하여 주석을 다는 것이 일반적이다. 하지만 주석 기반 검색에서는 주석으로 달아 놓은 단어와 정확한 매칭이 없다면 찾을 수가 없다. 이러한 문제를 해결하기 위해 재질의 질의어 확장과 같은 기법을 써서 문제를 해결해 왔으나 여전히 개념적 매칭이 아닌 스트링 매칭의 문제를 안고 있다고 볼 수 있다. 이에 본 논문에서는 이미지 관련 Text에서 단어를 추출한 후 추출된 단어들간의 개념 관계를 WordNet을 이용하여 표현한 주석 시스템을 제안한다. 이 시스템은 단순 스트링 매칭이 아닌 개념적 매칭에 의한 개념 기반 검색을 지원할 수 있다.

  • PDF

언어장애인용 문장발생장치에 적용 가능한 동사예측 (An Applicable Verb Prediction in Augmentative Communication System for Korean Language Disorders)

  • 이은실;홍승홍;민홍기
    • 감성과학
    • /
    • 제3권1호
    • /
    • pp.25-32
    • /
    • 2000
  • 본 논문에서는 언어장애인용 문장발생장치의 통신율을 증진시키기 위한 처리방안으로 신경망을 이용하여 문장발생장치에 동사예측을 적용하는 방법을 제안하였다. 각 단어들은 구문론과 의미론에 따른 정보벡터로 표현되며, 언어처리는 전통적으로 사전을 포함하는 것과는 달리, 상태공간에서 다양한 영역으로 분류되어 개념적으로 유사한 단어는 상태공간에서의 위치를 통하여 알게 된다. 사용자가 심볼을 누르면 심볼에 해당하는 단어는 상태공간에서의 위치를 찾아가며, 신경망 학습을 통해 동사를 예측하였고 그 결과 제한된 공간 내에서 약 20% 통신율 증진을 가져올 수 있었다.

  • PDF

문서 임베딩을 이용한 소셜 미디어 문장의 개체 연결 (Document Embedding for Entity Linking in Social Media)

  • 박영민;정소윤;이정엄;신동수;김선아;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-196
    • /
    • 2017
  • 기존의 단어 기반 접근법을 이용한 개체 연결은 단어의 변형, 신조어 등이 빈번하게 나타나는 비정형 문장에 대해서는 좋은 성능을 기대하기 어렵다. 본 논문에서는 문서 임베딩과 선형 변환을 이용하여 단어 기반 접근법의 단점을 해소하는 개체 연결을 제안한다. 문서 임베딩은 하나의 문서 전체를 벡터 공간에 표현하여 문서 간 의미적 유사도를 계산할 수 있다. 본 논문에서는 또한 비교적 정형 문장인 위키백과 문장과 비정형 문장인 소셜 미디어 문장 사이에 선형 변환을 수행하여 두 문형 사이의 표현 격차를 해소하였다. 제안하는 개체 연결 방법은 대표적인 소셜 미디어인 트위터 환경 문장에서 단어 기반 접근법과 비교하여 높은 성능 향상을 보였다.

  • PDF

질의 어휘와의 근접도를 반영한 단어 그래프 기반 질의 확장 (Query Expansion based on Word Graph using Term Proximity)

  • 장계훈;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.37-42
    • /
    • 2012
  • 잠정적 적합성 피드백모델은 초기 검색 결과의 상위에 순위화된 문서를 적합 문서라 가정하고, 상위문서에서 빈도가 높은 어휘를 확장 질의로 선택한다. 빈도수를 이용한 질의 확장 방법의 단점은 문서 안에서 포함된 어휘들 사이의 근접도에 상관없이 각 어휘를 독립적으로 생각한다는 것이다. 본 논문에서는 어휘빈도를 이용한 질의 확장을 대체할 수 있는 어휘 근접도를 반영한 단어 그래프 기반 질의 확장을 제안한다. 질의 어휘 주변에 발생한 어휘들을 노드로 표현하고, 어휘들 사이의 근접도를 에지의 가중치로 하여 단어 그래프를 표현한다. 반복된 연산을 통해 확장 질의를 선택함으로써 성능을 향상시키는 기법을 제안한다. 유효성 검증을 위해 웹문서 집합인 TREC WT10g 테스트 컬렉션에 대한 실험에서 언어모델 보다 MAP 평가 기준에서 6.4% 향상됨을 보였다.

확률 발음사전을 이용한 대어휘 연속음성인식 (Stochastic Pronunciation Lexicon Modeling for Large Vocabulary Continous Speech Recognition)

  • 윤성진;최환진;오영환
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.49-57
    • /
    • 1997
  • 본 논문에서는 대어휘 연속음성인식을 위한 확률 발음사전 모델에 대해서 제안하였다. 확률 발음 사전은 HMM과 같이 단위음소 상태의 Markov chain으로 이루어져 있으며, 각 음소 상태들은 음소들에 대한 확률 분포 함수로 표현된다. 확률 발음 사전의 생성은 음성자료와 음소 모델을 이용하여 음소 단위의 분할과 인식을 통해서 자동으로 생성되게 된다. 제안된 확률 발음 사전은 단어내 변이와 단어간 변이를 모두 효과적으로 표현할 수 있었으며, 인식 모델과 인식기의 특성을 반영함으로써 전체 인식 시스템의 성능을 보다 높일 수 있었다. 3000 단어 연속음성인식 실험 결과 확률 발음 사전을 사용함으로써 표준 발음 표기를 사용하는 인식 시스템에 비해 단어 오류율은 23.6%, 문장 오류율은 10% 정도를 감소시킬 수 있었다.

  • PDF

BIT 표기법을 활용한 한국어 개체명 인식 (Korean Named Entity Recognition Using BIT Representation)

  • 윤호;김창현;천민아;박호민;남궁영;최민석;김재균;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.190-194
    • /
    • 2019
  • 개체명 인식이란 주어진 문서에서 개체명의 범위를 찾고 개체명을 분류하는 것이다. 최근 많은 연구는 신경망 모델을 이용하며 하나 이상의 단어로 구성된 개체명을 BIO 표기법으로 표현한다. BIO 표기법은 개체명이 시작되는 단어의 표지에 B(Beginning)-를 붙이고, 개체명에 포함된 그 외의 단어의 표지에는 I(Inside)-를 붙이며, 개체명과 개체명 사이의 모든 단어의 표지를 O로 간주하는 방법이다. BIO 표기법으로 표현된 말뭉치는 O 표지가 90% 이상을 차지하므로 O 표지에 대한 혼잡도가 높아지는 문제와 불균형 학습 문제가 발생된다. 본 논문에서는 BIO 표기법 대신에 BIT 표기법을 제안한다. BIT 표기법이란 BIO 표기법에서 O 표지를 T(Tag) 표지로 변환하는 방법이며 본 논문에서 T 표지는 품사 표지를 나타낸다. 실험을 통해서 BIT 표기법이 거의 모든 경우에 성능이 향상됨을 확인할 수 있었다.

  • PDF

얼굴정서 판단에 미치는 감정단어의 맥락조절효과 (Context Modulation Effect by Affective Words Influencing on the Judgment of Facial Emotion)

  • 이정수;양현보;이동훈
    • 감성과학
    • /
    • 제22권2호
    • /
    • pp.37-48
    • /
    • 2019
  • 본 연구의 목적은 최근 심리구성주의 정서이론에서 제안한 얼굴정서 지각 과정에 미치는 언어의 영향을 정신물리학적 방법을 사용하여 검증하는 것이다. 본 연구에서는 감정단어가 얼굴표정 전에 제시될 경우, 얼굴표정의 정서 범주에 대한 판단 기준을 그 감정단어가 표상하는 정서 개념 맥락에 가깝게 이동시킬 것이라는 가설을 세웠다. 실험에서는 분노 또는 기쁨을 표현하는 감정단어가 표적 얼굴 전에 잠시 제시되었고, 표적 얼굴로는 중립에서 분노 (실험 1), 중립에서 행복 (실험 2)으로 점진적으로 변화하는 얼굴표정 중 하나가 무선적으로 제시되었다. 실험참가자는 표적얼굴의 정서를 분노 혹은 중립 (실험 1), 행복 혹은 중립 (실험 2)으로 판단하는 2안 강제선택 과제를 수행하였다. 실험 1 결과, 통제조건과 비교하여 분노 표현 감정단어들은 표적 얼굴정서를 분노로 판단하는 판단 경계 (PSE: the point of subjective equality)를 낮추었고, 행복 표현 감정단어들은 판단 경계를 높였다. 중립-행복 표정을 판단하는 실험 2에서는 반대의 결과가 관찰되었다. 본 연구의 결과는 얼굴정서를 지각하는 과정이 다양한 맥락 정보를 사용하여 능동적으로 구성하는 과정이며, 감정단어들은 정서에 대한 개념적 맥락을 제공함으로써 얼굴정서 지각에 영향을 준다는 구성된 정서 이론의 주장을 지지하는 것으로 해석할 수 있다.

수화소 분석을 통한 손동작 움직임 표현방법 (Advanced Representation Method of Hand Motion by Cheremes Analysis in KSL)

  • 이부형;송필재
    • 한국멀티미디어학회논문지
    • /
    • 제9권8호
    • /
    • pp.1067-1075
    • /
    • 2006
  • 본 논문에서는 손동작 인식을 위한 개선된 손동작 움직임 표현방법을 제안한다. 제안된 방법은 다양하고 통일된 손동작 움직임을 인식하기 위해서 수화(한글수화) 시 사용되는 손동작에 적용시킨 표현방법이다. 수화 특히, 한글수화(KSL)는 수화소(Cheremes)라는 요소들, 즉, 손의 이동 방향, 손가락모양, 손의 위치 등의 조합에 의해 단어 또는 문장이 완성되어 의미 있는 수화가 완성된다. 본 논문에서는 한글 수화에서 이용되는 수화소(Cheremes)를 5개의 수화소 즉, 손의 이동방향(HMO),손가락모양(FS), 손의 방향(H0), 손의 위치(HP) 및 사용하는 손의 수(HN)로 분류, 표현한다. 손의 이동방향(HMO)은 수화에서 단어 또는 문장을 표현하는데 사용되는 방향을 고려하여 17개의 방향성분으로 표현한다. 손가락 모양(FS)은 수화동작에서 사용되는 손가락의 모양에 따라 17개의 성분으로 표현할 수 있으며, 또한, 손의 바닥을 이용하는지 손등을 이용하는지에 따라 손의 방향(HO)이 2가지 특징으로 표현된다. 손의 현재 위치(HP)는 수화동작에서 손이 놓이는 위치를 의미하며, 머리영역에서 가슴영역까지 전체 8개의 영역으로 나뉘어 표현한다. 마지막으로 사용하는 손의수는 수화동작에서 손 하나만을 사용하는지 양쪽 모두를 사용하는 지를 나타내는 것으로, 2가지 특징으로 표현한다. 제안된 손동작 표현방법을 한글수화의 단어 및 문장 모두에 적용한 결과 모든 KSL이 제안된 표현방법으로 완벽하게 표현됨을 보였다.

  • PDF