• 제목/요약/키워드: 단어집 크기

검색결과 9건 처리시간 0.025초

한국어 시각 단어 재인에서 음운, 철자이웃 크기 효과 (The Phonological and Orthographic Neighborhood Effect in Korean Visual Word Recognition : LDT study & fMRI study)

  • 권유안;박창수;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2006년도 춘계학술대회
    • /
    • pp.47-51
    • /
    • 2006
  • 본 실험은 한국어 심성어휘집의 표상 정보가 음운정보로 이루어져 있는지, 철자정보로 이루어져 있는지 알아보기 위해 실시되었다. 실험자극은 한국어의 2음절 단어 중 음운변화(자음동화)를 겪는 단어(예: 국민)를 사용하였으며, 각 조건은 철자이웃이 크며 음운 이웃이 큰 단어 조건(O+P+), 철자이웃이 크고 음운이웃은 작은 단어 조건(O+P-), 철자이웃은 작고 음운이웃이 큰 단어 조건(O-P+), 철자이웃과 음운이웃 모두가 작은 조건(O-P-)이었다 실험 1에서 어휘판단 과제를 실시한 결과, 음운이웃 크기와 철자이웃 크기간의 상호작용이 나타났다. 실험2는 동일한 실험자극을 사용한 fMRI 연구를 수행하였다. 실험2 결과 음운처리에 관련된 뇌영역의 활성화가 나타났다. 본 연구결과는 한국어의 경우 심성어휘집이 음운정보로 이루어져 있음을 시사한다.

  • PDF

한국어 시각단어재인 과정에서의 음운정보 역할 규명을 위한 계산주의적 모델 (Computational Model for Proving Phonological Information a Role in Visual Korean Word Recognition)

  • 박기남;임희석;한군희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 춘계학술발표논문집
    • /
    • pp.178-180
    • /
    • 2007
  • 본 논문은 인간의 언어정보처리 과정 중 시각단어재인(visual word recognition) 과정에서 음운정보와 철자정보의 역할 및 심성어휘집의 표상 형태를 알아보기 위해, 계산주의적 모델을 제안하고, 제안된 모델을 이용하여 실험하였다. 실험결과 계산주의적 모텔은 한국어에 대한 시각 단어재인 시 보이는 언어현상 중 음운, 철자 이웃 크기효과(phonological and orthographic neighborhood effect)를 나타냈으며, 이를 통해 한국어 시각단어재인 과정에서 심성어휘집이 음운정보로 표상되어 있다는 것을 시사하는 증거를 보였다.

  • PDF

품사 부착 실험을 통한 Bags-of-Features 방법의 정량적 평가 (Quantitative Evaluation of Bags-of-Features Method Using Part-of-Speech Tagging)

  • 이찬희;이설화;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.298-300
    • /
    • 2017
  • 본 논문에서는 단순하지만 효과적인 단어 표현 방법인 Bags of Features에 대한 비교 실험을 수행한다. Bags of Features는 어휘집의 크기에 제한이 없으며, 문자 단위의 정보를 반영하고, 벡터화 과정에서 신경망 구조에 의존하지 않는 단어 표현 방법이다. 영어 품사 부착 실험을 사용하여 실험한 결과, one-hot 인코딩을 사용한 모델과 대비하여 학습 데이터에 존재하지 않는 단어의 경우 49.68%, 전체 부착 정확도는 0.96% 향상이 관찰되었다. 또한, Bags of Features를 사용한 모델은 기존의 영어 품사 부착 분야의 최첨단 모델들 중 학습 데이터 외의 추가적인 데이터를 활용하지 않는 모델들과 비견할 만한 성능을 보였다.

  • PDF

품사 부착 실험을 통한 Bags-of-Features 방법의 정량적 평가 (Quantitative Evaluation of Bags-of-Features Method Using Part-of-Speech Tagging)

  • 이찬희;이설화;임희석
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.298-300
    • /
    • 2017
  • 본 논문에서는 단순하지만 효과적인 단어 표현 방법인 Bags of Features에 대한 비교 실험을 수행한다. Bags of Features는 어휘집의 크기에 제한이 없으며, 문자 단위의 정보를 반영하고, 벡터화 과정에서 신경망 구조에 의존하지 않는 단어 표현 방법이다. 영어 품사 부착 실험을 사용하여 실험한 결과, one-hot 인코딩을 사용한 모델과 대비하여 학습 데이터에 존재하지 않는 단어의 경우 49.68%, 전체 부착 정확도는 0.96% 향상이 관찰되었다. 또한, Bags of Features를 사용한 모델은 기존의 영어 품사 부착 분야의 최첨단 모델들 중 학습 데이터 외의 추가적인 데이터를 활용하지 않는 모델들과 비견할 만한 성능을 보였다.

  • PDF

사전학습 모델을 이용한 음식업종 고객 발화 의도 분류 분석 (Analysis of utterance intent classification of cutomer in the food industry using Pretrained Model)

  • 김준회;임희석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.43-44
    • /
    • 2022
  • 기존 자연어 처리 모델은 문맥 단위 단어 임베딩을 처리하지 못하는 한계점을 가지고 있는 한편 최근 BERT 기반 사전학습 모델들은 문장 단위 임베딩이 가능하고 사전학습을 통해 학습 효율이 비약적으로 개선되었다는 특징이 있다. 본 논문에서는 사전학습 언어 모델들을 이용하여 음식점, 배달전문점 등 음식 업종에서 발생한 고객 발화 의도를 분류하고 모델별 성능을 비교하여 최적의 모델을 제안하고자 한다. 연구결과, 사전학습 모델의 한국어 코퍼스와 Vocab 사이즈가 클수록 고객의 발화 의도를 잘 예측하였다. 한편, 본 연구에서 발화자의 의도를 크게 문의와 요청으로 구분하여 진행하였는데, 문의와 요청의 큰 차이점인 '물음표'를 제거한 후 성능을 비교해본 결과, 물음표가 존재할 때 발화자 의도 예측에 좋은 성능을 보였다. 이를 통해 음식 업종에서 발화자의 의도를 예측하는 시스템을 개발하고 챗봇 시스템 등에 활용한다면, 발화자의 의도에 적합한 서비스를 정확하게 적시에 제공할 수 있을 것으로 기대한다.

  • PDF

계산주의적 시각단어재인 모델에서의 시각이웃과 음운이웃 효과 (Visual and Phonological Neighborhood Effects in Computational Visual Word Recognition Model)

  • 임희석;박기남;남기춘
    • 한국산학기술학회논문지
    • /
    • 제8권4호
    • /
    • pp.803-809
    • /
    • 2007
  • 본 논문은 인간의 언어정보처리 과정 중 시각단어재인(visual word recognition) 과정에서 음운정보(phonological information)와 철자정보(orthography information)의 역할 및 심성어휘집의 표상(representation) 형태를 알아보기 위해 신경망(neural network)을 이용한 계산주의적 모델(computational model)을 제안한다. 제안하는 모델은 한국어 2음절을 입력 값으로 사용하는 입력층(input layer), 은닉층(hidden layer) 그리고 의미를 표현하는 출력층(output layer)으로 구성된 전방향 신경회로망(feed forward network) 구조로 설계하였다. 실험결과 계산주의적 모델은 한국어에 대한 시각 단어재인 시 보이는 언어현상 중 음운, 철자 이웃 크기효과(phonological and orthographic neighborhood effect)를 나타냈으며, 이를 통해 한국어 시각단어재인 과정에서 심성어휘집이 음운정보로 표상되어 있음을 시사하는 증거를 보였다.

  • PDF

한국어 규칙 동사와 불규칙 동사의 심성 어휘집 접근 과정 (The Lexical Access of Regular and Irregular Korean Verbs in the Mental Lexicon)

  • 박희진;구민모;남기춘
    • 인지과학
    • /
    • 제23권1호
    • /
    • pp.1-23
    • /
    • 2012
  • 본 연구는 한국어 동사의 활용된 형태인 굴절 동사의 심성어휘집 접근 과정을 알아보기 위한 연구이다. 이를 위하여 차폐 점화 어휘 판단과제 실험을 실시하여 점화크기를 비교하였다. 한국어 규칙 동사와 불규칙 동사를 다섯 가지로 나누어 실험을 수행하였다. 활용의 종류는 1) 완전규칙 2) 발음변화규칙 3) 철자변화규칙 4) 어간변화 불규칙 5) 어미변화 불규칙으로 1), 2), 3)은 규칙 활용의 범주로 4), 5)는 불규칙활용의 범주이다. 기본형의 동사를 표적자극으로 사용하였고, 점화자극으로 총 세 가지 유형이 사용하였다. 점화자극으로 사용한 자극은 기본형의 어간의 변화가 없는 규칙활용, 기본형의 어간이 철자적, 음운적으로 변화하는 불규칙활용과, 의미 및 형태적으로 관련 없는 통제된 단어이다. 또한 단어재인의 처리에서 형태소 분해 정보처리의 시간대를 살펴보기 위하여 SOA의 간격을 43ms, 72ms, 230ms의 3가지로 나누어 실험하였다. 모든 동사가 모든 SOA에서 규칙활용과 불규칙활용이 통제단어에 비해 빠른 반응시간을 보임으로써 점화효과가 관찰되었다. 그러나 규칙활용과 불규칙활용에서 뚜렷이 점화효과의 차이가 관찰되지 않는다. 이러한 규칙활용과 불규칙활용의 범주의 구분 없이 비슷한 패턴을 보여주는 결과는 한국어가 단순히 규칙과 불규칙의 기준으로 나뉘어서 처리되지 않는다는 것을 시사한다. 또한 모든 SOA에서 촉진효과를 보임으로써 형태소 정보처리가 초기과정부터 일어남을 확인하였다.

  • PDF

한국농수산대학 졸업생 영농정착 성공 사례집의 Text Mining - 주요단어의 빈도 분석 및 word cloud - (Text Mining of Successful Casebook of Agricultural Settlement in Graduates of Korea National College of Agriculture and Fisheries - Frequency Analysis and Word Cloud of Key Words -)

  • 주진수;김종숙;박석영;송천영
    • 현장농수산연구지
    • /
    • 제20권2호
    • /
    • pp.57-72
    • /
    • 2018
  • 본 연구는 한농대에서 발간하는 청년 농어업인들의 우수한 영어·영농 정착사례에서 의미 있는 정보를 추출하고자 프로그램 R의 Text mining으로 주요단어를 추출하고 시각화를 위하여 word cloud를 작성하였다. 먼저 전체 표본에 대한 text mining 결과에서는 '대표', '이사', '생각', '자신', '시작', '마음', '노력' 등이 상위 50개 핵심 단어 가운데 빈도수가 높게 나타난 단어들이다. 이는 젊은 농부들이 회사의 경영주가 되기 위해서거나 또는 경영주로서 그들 스스로 생각하고 판단하고 추진하는 능력을 갖추고 있음을 표현이며 자기의 꿈을 버리지 않고 스스로 꿈꾸는 일을 헤쳐 나가는 모습의 표현이라 할 수 있다. '아버지', '부친' 및 '부모님' 등의 단어 빈도수가 높은 것은 부모협농과 승계농의 비율이 높은 경영형태의 영향이라 할 수 있으며, '한국농수산대학', '대학', '졸업', '공부' 등의 단어는 이들의 높은 교육의식을 나타낸 결과이며, '유기농'과 '친환경' 의 단어는 우수사례자들의 친환경 농업에 대한 관심도를 나타낸 결과라 할 수 있다. 또한 '판매', '체험' 등의 6차산업 관련어는 농어업·농어촌을 활성화시키기 위한 이들의 노력을 나타내는 결과라 할 수 있다. 한편 '인터넷', '블로그', '온라인', '홈페이지', 'SNS', 'ICT', '융복합' 및 '스마트' 등의 단어들은 비록 상위 50위 안에는 없었으나 이들 단어들이 빠지지 않고 추출된 결과는 영어·영농의 과학화·첨단화에 청년농부들의 관심이 높아지고 있음을 알 수 있었다. 다음으로 품목별 샘플에 대하여 빈도수가 상위 50위 이내인 주요단어를 그룹화 한 결과로서 축산, 채소 및 수산은 '시설', 식량작물은 '장비', '기계' 등의 빈도수가 높게 나타냈다. '친환경'은 채소작물과 식량작물에서 나타났으며, '유기농'은 채소, 식량작물, 과수에서 나타났다. 식량작물에서는 '우렁이'가 추출되었으며, 우수농수산물을 의미하는 '인증'은 수산에서만 나타났다. '6차산업' 관련단어로 '생산'은 모든 계열, '가공', '유통'은 과수, '체험'은 채소, 식량작물 및 과수에서 나타났다. 그리고 텍스트 마이닝으로 추출한 단어를 시각화하기 위하여 전체 샘플과 각 품목별로 word cloud를 작성하여 구조화되지 않은 비정형 텍스트인 우수사례들이 내포하고 있는 의미를 글자의 크기로 알 수 있도록 나타냈다.

한국어 불규칙 용언의 형태 정보 : 실어증 환자를 중심으로 (The Processing of Irregular Verbals in Korean : Shown in Aphasics)

  • 김윤정;김수정;김희정;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.303-308
    • /
    • 2000
  • 용언은 그 어간이 여러 문법소와 결합하면서 자동적 음운 변동을 제외한 형태 변동이 있는가, 없는가에 의해 규칙 용언/불규칙 용언으로 구분할 수 있다. 이러한 불규칙 용언은 심성 어휘집에 어떤 형태로 저장되어 있으며, 규칙 용언과는 어떠한 관계가 있는지, 나아가 실어증 환자의 경우에는 정상인에 비해 어떤 행동장애를 보이며, 장애가 있다면 어느 경로의 손상으로 인한 장애인지를 알아보는 것이 본 연구의 목적이다. 이를 위해 이해성 실어증 환자 한 명과 음어적 실행증 현상을 동반한 경미한 정도의 실어증 환자를 피험자로 하였다. 실험 과제는 단어 채워 넣기 과제(word completion task)를 사용하였다. 즉 주어진 기본형 용언을 검사 문장의 문맥에 맞게 활용하여 채워 넣는 것이다. 실험 결과에 의하면 환자들은 규칙용언의 활용(예. 먹다/먹는)과 불규칙 용언 중 형태를 유지한 채로 활용하는 경우(예. 줍다/줍고)에는 거의 오류가 없었으나, 불규칙 용언이 형태 변화를 겪어야 할 경우(예. 줍다/주워)에는 대부분 오류를 보였다. 또 이때는 기본형(basic form)을 그대로 유지하는 오류 방향성을 관찰할 수 있었다. 이는 그간 문법으로 구분되어 오던 규칙 용언/불규칙 용언의 정보 처리보다는 형태 유지/형태 변화 정보 처리의 영향이 크다는 것을 알 수 있다. 특히 이해성 실어증 환자는 전체적인 오류율이 매우 높았는데, 규칙 용언의 경우에도 오류를 보였다. 이때, 용언의 어간에 해당하는 부분에는 오류가 없고, 뒤에 따르는 내용과의 관계를 파악해야 하는 문법 기능소, 즉 연결 어미에서 오류를 보여 정보의 유지, 통합에 문제가 있다는 기존의 연구와도 일치하는 결과를 나타냈다.환자는 시제 선어말 어미를 선택하는데도 어려움을 보임이 확인되었다. 실험 3 역시 실험 1과 실험2에서와 동일하게 처리의 어려움을 보였다. 이러한 실험 결과들은 국어의 존칭과 시제 선어말 어미가 통사부에서 구(XP)와 결합하여 새로운 구를 형성하는 통사적 접사로 해석할 수 있으며 Grodzinsky의 가설을 지지하는 결과를 보여 줌으로서 국어에서도 AgrP, TP, CP 사이의 통사적 위계가 있음을 뒷받침하는 증거가 된다.전처리한 Group 3에서는 IL-2와 IL-4의 수준이 유의성있게 억제되어 발현되었다 (p < 0.05). 이러한 결과를 통하여 T. denticola에서 추출된 면역억제 단백질이 Th1과 Th2의 cytokine 분비 기능을 억제하는 것으로 확인 되었으며 이 기전이 감염 근관에서 발견되는 T. denticola의 치수 및 치근단 질환에 대한 병인기전과 관련이 있는 것으로 사료된다.을 보였다. 본 실험 결과, $Depulpin^{\circledR}은{\;}Tempcanal^{\circledR}와{\;}Vitapex^{\circledR}$에 비해 높은 세포 독성을 보여주공 있으나, 좀 더 많은 임상적 검증이 필요할 것으로 사료된다.중요한 역할을 하는 것으로 추론할 수 있다.근관벽을 처리하는 것이 필요하다고 사료된다.크기에 의존하며, 또한 이러한 영향은 $(Ti_{1-x}AI_{x})N$ 피막에 존재하는 AI의 함량이 높고, 초기에 증착된 막의 업자 크기가 작을 수록 클 것으로 여겨진다. 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로 나타났다.corner$적 의도에 의한 경관구성의 일면을 확인

  • PDF