• 제목/요약/키워드: 단어형성

검색결과 145건 처리시간 0.064초

영한 기계번역에서의 복합어구 인식 (Complex Phrase Recognition in English-to-Korean Machine Translation : MATES/EK)

  • 장두성;김덕봉;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.503-510
    • /
    • 1992
  • 복합어는 여러개의 단어가 하나의 의미론 나타내는 단어를 말한다. 이 논문에서는 번역시 구성단어들의 의미의 합이 아닌 다른 또 하나의 의미를 나타내는 단어를 대상으로 한다. 이러한 복합어는 구문해석 단계에서 많은 애매성의 원인이 되며, 유형에 따라 숙어 처럼 새로운 의미로 항상 같이 쓰이는 복합어와 복합어의 형성이 복잡하여 규칙으로서 단어를 이해할 필요가 있는 단어로 구분할 수 있다. 첫번째 유형은 단어의 형성이 단순하여 하나의 사전 엔트리로 등록될 수 있다. 이때 이들 복합어가 가지는 개별 어휘 규칙을 같이 사전에 등록하여 사전을 효과적 이용할 수 있다. 두번째 유형은 규칙에 의한 처리를 하여야 한다. 이러한 복합어에 대한 인식을 구문분석이전에 행함으로서 적은 노력으로 복합어로 인한 전체 문장의 애매성을 감소시키고, 문장내 단어의 수를 감소시킴으로서 전채 번역시스템의 효율을 증대하며, 복합어의 처리는 번역문을 자연스럽게 생성하는 데 큰 효과를 나타낸다.

  • PDF

단어에 대한 공각적 주의가 암묵기억에 미치는 영향 (Effects of Spatial Attention for Words on Implicit Memory)

  • 심원목;김민식
    • 인지과학
    • /
    • 제11권3_4호
    • /
    • pp.13-22
    • /
    • 2000
  • 단어 정체확인 과정을 요구하지 않고 기억 과제와 무관한 단어의 지각적 특질에만 근거하여 공간적 주의를 할당하도록 하는 경우, 이러한 공간적 주의의 차이가 단어의 암묵기억에 미치는 영향을 두 개의 실험을 통하여 알아보았다. 실험 1에서는 독특한 색을 가진 표적자극의색을 판단하는 시각 탐색 과제를, 실험 2에서는 단서가 주어진 위치에 제시된 단어자극의 색을 판별하도록 하는 초점 주의 과제를 실시한후, 단어완성검사를 통하여 암묵기억을 측정하였다. 두 실험 결과, 방해자극뿐 아니라 표적자극에 대해서도 유의미한 점화효과가 관찰되지 않았다. 이는 기억 과제와 무관한 지각적 특질에 주의를 주는 것만으로는 단어에 대한 암묵기억 표상을 형성하기 어려우며, 단어에 대한 암묵기억 표상을 형성하기 위해서는 자극의 부호화 과정에서 단어 정채 확인 과정이 필요함을 시사한다.

  • PDF

연속분포 HMM에 의한 실시간 Word Spotting 에 관한 연구 (A Study on the Real-time Word Spotting by Continuous density HMM)

  • 서상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.92-95
    • /
    • 1995
  • 연속분포 HMM을 사용한 실시간 로봇 암 제어 시스템에 대해 기술하고 있다. 본 시스템은 자연스러운 문장의 로봇 암 제어 명령 발성을 받아 핵심단어 인식의 framework을 통한 명령 인식 및 로봇 제어를 구현하고 있다. 로봇 몸체의 부분, 방향, 각도, 동작명령들에 대해 각기 우향 HMM, 이외의 비 핵심어들에 대해서는 이들을 한데 모아 ergodic형 상태천이를 모델링하는 garbage HMM을 형성했는데, 조사, 감탄사 등을 따로 모은 garbage 모델과, silence 및 배경 잡음에 대한 garbage 모델을 형성, 학습 및 인식에 포함시켜 연결단어 인식을 수행함으로써 핵심단어 인식의 효과를 얻었다. 이때 핵심단어들의 사용에 있어 간단한 문법적 제약을 가정하였다. 남성화자 35명을 대상으로 30개 문형에 대해 데이터 수집용 개념적 문장을 구성하여 음성 데이터를 수집하였다. 학습 화자에 대한 제어 명령 인식률은 95% 이상을 나타내고 있으며, 비 학습화자에 대한 인식율은 90% 이상이다. 또한 학습된 단어외의 비 핵심단어들의 사용에 대해서도 긍정적인 인식 성능을 보였다.

  • PDF

문서의 키워드 추출에 대한 신경망 접근 (Neural Based Approach to Keyword Extraction from Documents)

  • 조태호;서정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.317-319
    • /
    • 2000
  • 문서는 자연어로 구성된 비정형화된 데이터이다. 이를 처리하기 위하여 문서를 정형화된 데이터로 표현하여 저장할 필요가 있는데, 이를 문서 대용물(Document Surrogate)라 한다. 문서 대용물은 대표적으로 인덱싱 과정에 의해 추출된 단어 리스트를 나타낸다. 문서 내의 모든 단어가 내용을 반영하지 않는다. 문서의 내용을 반영하는 중요한 단어만을 선택할 필요가 있다. 이러한 단어를 키워드라 하며, 기존에는 단어의 빈도와 역문서 빈도(Inverse Document Frequency)에 근거한 공식에 의해 키워드를 선택하였다. 실제로 문서내 빈도와 역문서 빈도뿐만 아니라 제목에 포함 여부, 단어의 위치 등도 고려하여야 한다. 이러한 인자를 추가할 경우 이를 수식으로 표현하기에는 복잡하다. 이 논문에서는 이를 단어의 특징으로 추출하여 특징벡터를 형성하고 이를 학습하여 키워드를 선택하는 신경망 모델인 역전파의 접근을 제안한다. 역전파를 이용하여 키워드를 판별한 결과 수식에 의한 경우보다 그 성능이 향상되었음을 보여주고 있다.

  • PDF

단어 의미와 자질 거울 모델을 이용한 단어 임베딩 (A Word Embedding used Word Sense and Feature Mirror Model)

  • 이주상;신준철;옥철영
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.226-231
    • /
    • 2017
  • 단어 표현은 기계학습을 사용하는 자연어 처리 분야에서 중요하다. 단어 표현은 단어를 텍스트가 아닌 컴퓨터가 분별할 수 있는 심볼로 표현하는 방법이다. 기존 단어 임베딩은 대량의 말뭉치를 이용하여 문장에서 학습할 단어의 주변 단어를 이용하여 학습한다. 하지만 말뭉치 기반의 단어 임베딩은 단어의 등장 빈도수나 학습할 단어의 수를 늘리기 위해서는 많은 양의 말뭉치를 필요로 한다. 본 논문에서는 말뭉치 기반이 아닌 단어의 뜻풀이와 단어의 의미 관계(상위어, 반의어)를 이용하며 기존 Word2Vec의 Skip-Gram을 변형한 자질거울모델을 사용하여 단어를 벡터로 표현하는 방법을 제시한다. 기존 Word2Vec에 비해 적은 데이터로 많은 단어들을 벡터로 표현 가능하였으며 의미적으로 유사한 단어들이 비슷한 벡터를 형성하는 것을 확인할 수 있다. 그리고 반의어 관계에 있는 두 단어의 벡터가 구분되는 것을 확인할 수 있다.

대학생과 초등학생의 단어 연상 비교 (Comparison of word association between adults and children)

  • 박미자
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.17-39
    • /
    • 2008
  • 오기억(false memory) 연구에 필요한 한국어 단어 연상 목록을 작성하기 위해 대학생과 초등학생을 대상으로 자료를 수집하였다. 비연속적 자유연상 기법을 이용하여 각 단어들에 대한 연상단어와 연상 강도, 총 연상단어 수에 대한 세트 크기 비율을 집단별로 산출해서 질적, 양적 차이가 있는지를 비교하였다. 각 단어마다 연상 강도가 매우 높은 연상단어들은 두 집단 간 같거나 비슷한 반면 연상 강도가 낮아질수록 두 집단에서 연상된 단어들이 다양했다. 대학생 집단이 초등학생 집단보다 세트 크기 비율이 더 컸다. 이 결과는 대학생이 초등학생보다 더 전형적이고 수렴된 의미망을 형성한다는 것을 시사한다. 본 자료는 오기억 연구뿐 아니라 연상 단어를 이용해 인지적 기제를 밝히려는 연구들을 위해 유용한 기초자료를 제공해 줄 수 있다.

  • PDF

국어 의문사${\cdot}$부정사 의문문의 초점 실현에 대한 음향음성학적 연구 (Acoustic Phonetic Study about Focus Realization of wh-word Questions in Korean)

  • 박미영;안병섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.289-292
    • /
    • 2002
  • 국어에서 wh-단어가 포함된 의문사 의문문과 부정사 의문문은 통사적으로 같은 구조를 가지지만 의미적으로는 중의 관계에 있다. 그러나 두 의문문은 문장으로 발화될 때 음성적으로 서로 다른 여러 가지 운율 특징의 차이를 보여줌으로써, 발화 차원에서는 더 이상 중의 관계를 유지하지 않는다. 본고에서는 이러한 중의성의 해소는 두 의문문의 초점이 달리 실현되기 때문이라고 본다. 기존의 연구에서는 두 가지 의문문의 억양 연구를 초점의 작용 범위와 문말 억양의 차이, 강세구 형성의 유형을 중심으로 고찰하였다 .그리고 의문사와 부정사의 의미는, 이에 후행하는 서술어와 형성하는 강세구 유형에서 우선적으로 그 의미가 구분될 수 있다고 보았다. 그러나, 본고에서는 국어의 wh-단어가 초점으로서 작용하는 운율적 돋들림을 좀더 다양한 환경에서 실험하였다. 그리고 의문사${\cdot}$부정사와 후행하는 언어단위의 강세구 형성(accentual phrasing) 유형, 의문사${\cdot}$부정사 의문문 전체 문장 억양의 실현 양상, wh-단어 자체의 음의 높낮이(pitch contour) 실현 유형, 문말 억양(boundary tone)에서 음의 높낮이를 대상으로 분석하였다.

  • PDF

부운동영역의 뇌지도화 (Somatotopic Mapping of the Supplementary Motor Area)

  • 한영민;정수현;이헌;진공용;이상용;정경호
    • Investigative Magnetic Resonance Imaging
    • /
    • 제8권1호
    • /
    • pp.9-16
    • /
    • 2004
  • 목적 : 운동, 감각, 단어형성 , 듣고이해하기, 기억력과제를주면서 기능적자기공명영상를 이용하여 부운동영역의 기능적 지도화를 한다. 대상 및 방법 : 16명의 오른손잡이 정상지원자를 대상으로 1.5 T자기공명영상기기를 사용하여 전뇌를 BOLD EPI를 기능적자기공명영상을 얻었다. 왼손가락운동, 고온감각, 단어형성 , 듣고이해하기 그리고 기억자극을 주면서 5번의 자극기와 휴식기를 반복하여 영상을 얻었다. p = 0.0001의 역치를 사용하여 활성화된 뇌의 지도화를 시행하였고 역치 이상의 뇌활성화가 보이는 부위를 MNI 공간으로 표시하여 각각의 자극에 대한 해부학적 위치와 활성화를 분석하였다. 결과 : 16명의 정상지원자 중 부운동영역의 활성화는 운동자극시 16명 모두에서, 감각자극시 11명, 단어형성자극시 15명, 듣고이해하기자극시 5명, 그리고 기억자극시 15명에서 보였다. 부운동영역중 앞부분의 활성화는 단어형성자극과 기억자극시 보였으며, 뒤부분의 활성화는 운동과 감각자극시 측정되었다. 운동과 감각자극시 자극부위와 반대편의 부운동영역에서 활성화, 그리고 단어형성자극과 기억자극시 왼쪽반구의 활성화가 주로 측정되었다. 결론 : 부운동영역은 운동과 감각 그리고 단어형성기능과 기억기능에 연관이 있는 뇌부위이며, 부운동영역중에서도 각각의 기능에 해당하는 부위가 존재한다.

  • PDF

친숙감이 심리적 거리에 미치는 영향 (Effects of familiarity on the construction of psychological distance)

  • 배희경;김경미;이도준
    • 인지과학
    • /
    • 제25권2호
    • /
    • pp.109-133
    • /
    • 2014
  • 관찰자가 대상이나 상황에 관해 느끼는 주관적인 간극을 심리적 거리라고 한다. 심리적 거리는 개인이 그 대상과 상황에 대해 취하는 의사결정과 행위에 영향을 끼친다. 본 연구는 친숙감의 수준이 심리적 거리의 형성에 끼치는 효과를 탐색하였다. 친숙한 자극이 덜 친숙한 자극에 비해 심리적으로 더 가깝게 느껴진다면, 자극이 유발하는 친숙감 수준이 자극의 지각된 공간적 거리와 상호작용할 것으로 예상하였다. 각 실험에서 참가자들은 먼저 사전 노출 단계에서 세 개의 무의미 단어를 경험하였다. 선행연구들에 따르면 친숙감은 자극의 노출 횟수와 지각적 유창성(perceptual fluency)의 영향을 받는다. 따라서 참가자들이 단어 판단 과제를 수행하는 동안, 무의미 단어들은 각기 다른 수준의 빈도(실험 1)와 선명도(실험 2)로 제시되었다. 그 다음 단계에서 참가자들은 가장 친숙한 무의미 단어와 가장 덜 친숙한 무의미 단어를 가지고 거리 스트룹 과제를 수행하였다. 각각의 단어들은 깊이 단서가 분명한 장면 사진들 속에서 지각적으로 가깝거나 먼 장소에 출현하였다. 그 결과, 두 실험 모두에서 단어의 친숙감과 공간적 거리 간 상호작용이 유의미하였다. 친숙한 단어는 가까운 위치에서 제시되었을 때 빠른 판단반응을 유발하였고 상대적으로 덜 친숙한 단어는 먼 위치에서 제시되었을 때 빠른 판단 반응을 유발하였다. 이러한 결과는 친숙감에 대한 상위인지적 평가(metacognitive evaluation)가 심리적 거리의 형성을 뒷받침하는 주요 요인임을 의미한다.

단어통사론을 위한 계산 모형 (A Computational Model for the Word-Syntax)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제39권6호
    • /
    • pp.11-23
    • /
    • 2002
  • 한국어 형태론에 대한 기존의 전산모형은 선형적인 것들로 단어 내부구조 분석보다 형태소 분리 문제에만 관심을 두고 있다. 이러한 선형적 전산모형을 구문 분석 과정과 통합적으로 고려할 경우, 구문 단위 요소의 형성을 위해 형태소 분석 결과를 묶어야만 하는 추가적인 과정이 필요할 뿐만 아니라 의미적 직관성을 얻기도 어려웠다. 본 논문에서는 형태소 분리와 구문 요소 형성뿐만 아니라 단어의 구조 분석까지도 통합적으로 다룰 수 있는 단어통사론적 시각에 따른 전산 모형을 제안한다. 먼저 형태소 분리와 변형 문제를 다루기 위해 2단계형태론의 형식화를 도입하고, 품사 문맥을 반영하기 위해 기능성 구분문자를 제안한다. 그리고 형태소의 통사적 결합 검사를 위해 GLR에 기반한 변형 알고리즘을 제안한다.