• 제목/요약/키워드: lexical level

검색결과 82건 처리시간 0.022초

의미 기반 정보 검색을 제공하는 멀티미디어 게시판 시스템 (A Multimedia Bulletin Board System Providing Semantic-based Searching)

  • 정의현
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.75-84
    • /
    • 2005
  • 게시판 시스템은 텍스트 외에도 다양한 멀티미디어 데이터를 포함하는 구조로 발전해왔다. 그러나 기존 시스템은 사용자가 게시물의 내용을 파악하기 위해서는 많은 시간과 노력을 들여야 한다는 단점을 갖고 있다. 이런 문제를 해결하기 위해 대부분의 게시판 시스템에서 검색 기능을 제공하지만, 렉시컬 수준의 정보 접근으로 사용자의 의도에 적합한 게시물을 찾는 것은 어려운 일이다. 더욱이 게시물이 멀티미디어를 포함하는 경우에는 검색이 거의 불가능하게 된다. 본 논문에서는 이를 해결하기 위하여 시맨틱 웹을 적용한 새로운 게시판 시스템을 제안한다. 제안된 게시판 시스템은 게시물의 분야와 멀티미디어 속성을 표현할 수 있는 온톨로지를 제공한다. 또한, 사용자들이 제안된 온톨로지로 분야별 게시판 온톨로지를 기술할 수 있도록 설계되었다. 시스템의 수정 없이 다양한 분야별 의미기반 검색을 제공하기 위하여, 관리자가 기술한 게시판 온톨로지를 게시판 시스템에서 도입할 경우 자동으로 입력/검색 인터페이스와 RDF 데이터의 접근 구조가 형성되도록 구현하였다. 제안된 게시판 시스템은 사용자의 의도에 적합한 게시물 검색을 하는 의미기반 검색의 가능성과 유효성을 보여주었다.

  • PDF

The Unsupervised Learning-based Language Modeling of Word Comprehension in Korean

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.41-49
    • /
    • 2019
  • 본 연구는 비지도 기계학습 기술과 코퍼스의 각 단어를 이용하여 한국어 단어를 형태소 분석하는 언어 모델을 구축하는데 목적을 둔다. 그리고 이 언어 모델의 단어 형태소 분석의 결과와 언어 심리 실험결과에서 얻은 한국어 언어사용자의 단어 이해/판단 시간이 상관관계을 갖는지를 규명하고자 한다. 논문에서는 한국어 세종코퍼스를 언어 모델로 학습하여 형태소 분리 규칙을 통해 한국어 단어를 자동 분리하는데 발생하는 단어 정보량(즉, surprisal(놀라움) 정도)을 측정하여 실제 단어를 읽는데 걸리는 반응 시간과 상관이 있는지 분석하였다. 이를 위해 코퍼스에서 단어에 대한 형태 구조 정보를 파악하기 위해 Morfessor 알고리즘을 적용하여 단어의 하위 단위 분리와 관련한 문법/패턴을 추출하고 형태소를 분석하는 언어 모델이 예측하는 정보량과 반응 시간 사이의 상관관계를 알아보기 위하여 선형 혼합 회귀(linear mixed regression) 모형을 설계하였다. 제안된 비지도 기계학습의 언어 모델은 파생단어를 d-형태소로 분석해서 파생단어의 음절의 형태로 처리를 하였다. 파생단어를 처리하는 데 필요한 사람의 인지 노력의 양 즉, 판독 시간 효과가 실제로 형태소 분류하는 기계학습 모델에 의한 단어 처리/이해로부터 초래될 수 있는 놀라움과 상관함을 보여 주었다. 본 연구는 놀라움의 가설 즉, 놀라움 효과는 단어 읽기 또는 처리 인지 노력과 관련이 있다는 가설을 뒷받침함을 확인하였다.

An effective automated ontology construction based on the agriculture domain

  • Deepa, Rajendran;Vigneshwari, Srinivasan
    • ETRI Journal
    • /
    • 제44권4호
    • /
    • pp.573-587
    • /
    • 2022
  • The agricultural sector is completely different from other sectors since it completely relies on various natural and climatic factors. Climate changes have many effects, including lack of annual rainfall and pests, heat waves, changes in sea level, and global ozone/atmospheric CO2 fluctuation, on land and agriculture in similar ways. Climate change also affects the environment. Based on these factors, farmers chose their crops to increase productivity in their fields. Many existing agricultural ontologies are either domain-specific or have been created with minimal vocabulary and no proper evaluation framework has been implemented. A new agricultural ontology focused on subdomains is designed to assist farmers using Jaccard relative extractor (JRE) and Naïve Bayes algorithm. The JRE is used to find the similarity between two sentences and words in the agricultural documents and the relationship between two terms is identified via the Naïve Bayes algorithm. In the proposed method, the preprocessing of data is carried out through natural language processing techniques and the tags whose dimensions are reduced are subjected to rule-based formal concept analysis and mapping. The subdomain ontologies of weather, pest, and soil are built separately, and the overall agricultural ontology are built around them. The gold standard for the lexical layer is used to evaluate the proposed technique, and its performance is analyzed by comparing it with different state-of-the-art systems. Precision, recall, F-measure, Matthews correlation coefficient, receiver operating characteristic curve area, and precision-recall curve area are the performance metrics used to analyze the performance. The proposed methodology gives a precision score of 94.40% when compared with the decision tree(83.94%) and K-nearest neighbor algorithm(86.89%) for agricultural ontology construction.

불안수준 및 일시적 유발정서가 서열정보 어휘처리에 미치는 효과 (An Effect for Sequential Information Processing by the Anxiety Level and Temporary Affect Induction)

  • 김충명
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.224-231
    • /
    • 2019
  • 본 연구는 불안 및 정상그룹을 대상으로 서열성을 판단하는 인지과제 수행과정에서, 유발된 배경정서와 내재된 불안 수준이 과제처리에 미치는 영향을 밝히고자 하였다. 어휘 간 관계정보 중 서열판단 과제에서의 피험자 내 변인으로 유발정서 유형(기쁨, 분노, 슬픔 및 통제) 및 인지과제 처리유형(숫자서열 및 크기서열)을, 피험자 간 변인으로는 일반 대학생 중 벡 불안척도 검사를 통해 분리된 불안여부로 설정한 후 반응시간 및 오류율의 차이를 분석하였다. 자극의 제시와 반응의 수집은 DmDx5를 활용하였다. 실험결과, 집단 간 반응의 차이가 확인되었고 불안그룹이 과제유형에 관계없이 모든 정서유발 조건에서 정상그룹에 비해 더 느린 반응시간과 더 높은 오류율을 보였다. 그리고 정서유형에 관계없이 두 서열과제에서도 지체응답 경향을 보였다. 다음으로 정서유발 및 서열과제 효과를 통해 정서 및 과제 특정적인 반응경향을 확인하였는데, 슬픔조건이 타 정서보다 빠른 반응을 보였으며, 숫자서열 조건이 크기서열 조건보다 더 빨랐다. 이는 그룹별 그리고 과제유형별 인지과제 처리경향은 물론, 수반되는 정서유형에 따른 응답경향의 차이를 확인해 줌으로써 정서-인지 관련 행동에서의 기저의 배경정서가 처리과정에 주요 요인이 될 수 있음을 시사하는 결과라 하겠다.

2022 개정 교육과정에 따른 초등학교 1~2학년 수학 교과서 현장검토본의 어휘 적정성 분석 및 개선 연구 (A study to analyze and improve vocabulary adequacy of field-reviewed textbooks for 1st and 2nd grade elementary school mathematics according to the 2022 revised curriculum)

  • 이대현;권미선;이미진;성창근
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제27권1호
    • /
    • pp.75-90
    • /
    • 2024
  • 본 연구의 목적은 2022 개정 교육과정에 따른 초등학교 1~2학년 수학 교과서 현장검토본에 제시된 어휘를 9등급 어휘 체계로 분석하고, 그 결과를 토대로 교과서에 사용된 어휘를 개선하는 것이다. 9등급 어휘 체계에 따른 분석 결과, 학생들의 수준에 적합하지 않은 어휘 빈도수의 비율은 1학년 1학기 6.67%, 2학기 12.17%로 나타났으며, 2학년 1학기 11.73%, 2학기 14.19%로 나타났다. 이를 통해 학생들에게 어려울 수 있는 어휘가 전체 어휘 빈도수의 약 6%~15%를 차지하고 있음을 알 수 있다. 분석 결과를 토대로 학생들에게 어려울 수 있는 어휘는 삭제, 수정, 보완하였다. 구체적으로 난도가 높은 어휘 중 수업 내용과 관련없는 어휘는 삭제하였다. 수업 내용과 관련 있는 어휘인 경우 난도가 낮은 유사어로 수정하거나 학생들의 이해를 도울 수 있는 그림을 추가로 제시하였다. 이 연구를 통해 교과서에 사용된 어휘의 양상을 파악하고 어휘를 적절히 수정하여, 효과적인 수학 학습을 위한 수준 높은 교과서 개발에 도움이 될 것으로 기대한다.

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

친숙감이 심리적 거리에 미치는 영향 (Effects of familiarity on the construction of psychological distance)

  • 배희경;김경미;이도준
    • 인지과학
    • /
    • 제25권2호
    • /
    • pp.109-133
    • /
    • 2014
  • 관찰자가 대상이나 상황에 관해 느끼는 주관적인 간극을 심리적 거리라고 한다. 심리적 거리는 개인이 그 대상과 상황에 대해 취하는 의사결정과 행위에 영향을 끼친다. 본 연구는 친숙감의 수준이 심리적 거리의 형성에 끼치는 효과를 탐색하였다. 친숙한 자극이 덜 친숙한 자극에 비해 심리적으로 더 가깝게 느껴진다면, 자극이 유발하는 친숙감 수준이 자극의 지각된 공간적 거리와 상호작용할 것으로 예상하였다. 각 실험에서 참가자들은 먼저 사전 노출 단계에서 세 개의 무의미 단어를 경험하였다. 선행연구들에 따르면 친숙감은 자극의 노출 횟수와 지각적 유창성(perceptual fluency)의 영향을 받는다. 따라서 참가자들이 단어 판단 과제를 수행하는 동안, 무의미 단어들은 각기 다른 수준의 빈도(실험 1)와 선명도(실험 2)로 제시되었다. 그 다음 단계에서 참가자들은 가장 친숙한 무의미 단어와 가장 덜 친숙한 무의미 단어를 가지고 거리 스트룹 과제를 수행하였다. 각각의 단어들은 깊이 단서가 분명한 장면 사진들 속에서 지각적으로 가깝거나 먼 장소에 출현하였다. 그 결과, 두 실험 모두에서 단어의 친숙감과 공간적 거리 간 상호작용이 유의미하였다. 친숙한 단어는 가까운 위치에서 제시되었을 때 빠른 판단반응을 유발하였고 상대적으로 덜 친숙한 단어는 먼 위치에서 제시되었을 때 빠른 판단 반응을 유발하였다. 이러한 결과는 친숙감에 대한 상위인지적 평가(metacognitive evaluation)가 심리적 거리의 형성을 뒷받침하는 주요 요인임을 의미한다.

다차원 구어 단기기억에 따른 전도 실어증 환자의 언어수행력 분석 (Language performance analysis based on multi-dimensional verbal short-term memories in patients with conduction aphasia)

  • 하지완;황유미;편성범
    • 인지과학
    • /
    • 제23권4호
    • /
    • pp.425-455
    • /
    • 2012
  • 다차원 구어 단기기억 기제는 크게 음운적 통로와 어휘-의미적 통로로 구분된다. 전자를 음운단기기억, 후자를 의미단기기억이라고 할 수 있는데, 단기기억 과제를 정상적으로 수행하기 위해서는 두 통로 모두의 정보를 활발히 활용하여야 한다. 그리고 음운단기기억은 다시 음운입력완충기와 음운출력완충기로 나누어지며, 음운입력완충기는 음운자극의 입력 시, 음운출력완충기는 음운 산출 시에 작동한다. 본 연구에서는 유사한 수준의 전도 실어증 증상을 보이는 세 명의 환자에 대해, 각각의 언어 수행력을 구어 단기기억의 다차원적 측면에서 분석하였다. 그러기 위하여 세 명의 전도 실어증 환자들에게 단어 수준과 문장 수준에서 스스로 말하기, 따라말하기, 스스로 쓰기, 받아쓰기의 네 가지 양태의 언어과제를 실시하여 수행력을 비교 분석하였고, 숫자폭검사와 언어학습검사를 이용하여 음운단기기억력과 의미단기기억력을 평가하였다. 그 결과 세 대상자들은 네 양태의 언어 검사에서 다양한 수행력과 오반응 유형을 보였고, 단기기억력 검사 결과도 동일하게 나타나지 않았다. 즉 전도 실어증 환자들의 언어 수행력은 의미단기기억 또는 음운단기기억의 결함으로 설명될 수 있으며, 음운단기기억 가운데에서도 음운입력완충기, 음운출력완충기 혹은 둘 다의 결함 여부에 따라 언어특성이 상이하게 나타날 가능성을 제시하고 있다. 본 연구에서는 전도 실어증 환자들의 언어 검사와 단기기억력 검사 결과를 바탕으로, 언어와 다차원 구어 단기기억력과의 관계에 대하여 논의하고 있다.

  • PDF

Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석 (Sentiment Analysis using Robust Parallel Tri-LSTM Sentence Embedding in Out-of-Vocabulary Word)

  • 이현영;강승식
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.16-24
    • /
    • 2021
  • word2vec 등 기존의 단어 임베딩 기법은 원시 말뭉치에 출현한 단어들만을 대상으로 각 단어를 다차원 실수 벡터 공간에 고정된 길이의 벡터로 표현하기 때문에 형태론적으로 풍부한 표현체계를 가진 언어에 대한 단어 임베딩 기법에서는 말뭉치에 출현하지 않은 단어들에 대한 단어 벡터를 표현할 때 OOV(out-of-vocabulary) 문제가 빈번하게 발생한다. 문장을 구성하는 단어 벡터들로부터 문장 벡터를 구성하는 문장 임베딩의 경우에도 OOV 단어가 포함되었을 때 문장 벡터를 정교하게 구성하지 못하는 문제점이 있다. 특히, 교착어인 한국어는 어휘형태소와 문법형태소가 결합되는 형태론적 특성 때문에 미등록어의 임베딩 기법은 성능 향상의 중요한 요인이다. 본 연구에서는 단어의 형태학적인 정보를 이용하는 방식을 문장 수준으로 확장하고 OOV 단어 문제에 강건한 병렬 Tri-LSTM 문장 임베딩을 제안한다. 한국어 감정 분석 말뭉치에 대해 성능 평가를 수행한 결과 한국어 문장 임베딩을 위한 임베딩 단위는 형태소 단위보다 문자 단위가 우수한 성능을 보였으며, 병렬 양방향 Tri-LSTM 문장 인코더는 86.17%의 감정 분석 정확도를 달성하였다.

과학영재학교 재학생 영어발화 주파수 대역별 음향 에너지 분포의 영어 성취도 예측성 연구 (A study on the predictability of acoustic power distribution of English speech for English academic achievement in a Science Academy)

  • 박순;안현기
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.41-49
    • /
    • 2022
  • 본 연구는 미국영어 화자의 평균적 음향 스펙트럼 분포를 확보한 후 과학영재학교 재학생의 영어발화 양상을 비교하여 상대적으로 우수한 지적 역량을 갖춘 우리나라 과학영재들의 초분절적 영어 유창성 양상을 규명하고, 그 근접성 정도가 영재학교 학생의 영어 과목 정기고사 성취도와 어떤 관계성을 갖는지 탐구하고자 진행되었다. 불과 수 초에서 수십 초에 불과한 음성녹음 데이터 위주로 분석을 시행했던 종래의 연구와 달리 총 4시간에 달하는 미국영어 원어민 화자(남성 15명, 여성 15명)의 음성녹음 자료를 MATLAB(R2022a; The Math Works) 코드로 분석하여 20 -20,000 Hz 주파수 범위 내의 대역별로 장기 스펙트럼 음향에너지 분포값을 확보했으며, 이를 기준으로 과학영재학교 1학년 신입생 80명의 녹음데이터 LTASS(long-term average speech spectrum) 분석 수치와 비교한 결과, 영어 과목 학기말고사의 학업성취도 수준이 상위 30% 이내인 학생들의 표본을 제외하고는 미국영어 음향에너지 분포와의 근접성이 통계적으로 유미하지 않다고 밝혀졌다. 영재학교 입학 후 영어 성취도를 예측하기 위한 지표를 발견하기 위해 수용성 어휘크기검사(receptive vocabulary size test), 학기 중 복수 회 실시한 영어 어휘 형성평가 퀴즈 누적 점수, 공인 영어말하기시험(English Speaking Proficiency Test, ESPT) 성취도를 추가 변량으로 하여 정기고사 성취도와의 상관관계 분석 및 각 변량 간 선형 회귀분석을 시행하였는데, 대개 유년시절 완성되는 영어 유창성을 측정하는 ESPT보다는, 1학기 및 2학기 초 실시한 수용성 어휘크기검사 및 수과학 분야 저빈도 어휘 위주 형성평가 점수와의 통계적 유의성이 월등히 높다는 사실이 관찰되었다. 따라서, 본 연구로부터 확보된 이론적 기반을 토대로 국내 영재학교에서는 발음교육보다 과학영재를 주요 대상으로 한 전문적 수준의 저빈도어휘 교육이 보다 효과적인 교수 요목이라 추정할 수 있다.