• 제목/요약/키워드: Lexical Analysis

검색결과 174건 처리시간 0.021초

카페 이미지에서 목재 마감재에 따른 색채배색과 감성 선호도 분석 메커니즘 (The Analysis of Mechanism on Color Scheme and Emotional Affectivity Preferences according to Wood Material Finishing in the Cafe Images)

  • 최진경;김주연
    • 한국생활환경학회지
    • /
    • 제24권5호
    • /
    • pp.654-664
    • /
    • 2017
  • The use of environmentally friendly finishing materials allows us to create a space where we can feel nature and to have stability and peace in the city center. In this paper, we examined the sensitivity of people to the three café spaces where wooden finishing materials are used in the space elements that change according to people's demands for environmentally friendly space due to pollution of living environment. First, we examined the wood and finishing materials and emotional vocabulary through literature review and previous research. Second, the values of L *, a *, b* and sR, sG and sB values were extracted by using a line spectrophotometer (Ci6X). Third, we conducted a 7 - point scale questionnaire based on the extracted 13 pairs of emotional vocabulary. Using SPSS 21, frequency analysis by descriptive statistics, crossover analysis by visiting purpose and intention, and emotional lexical factor analysis were performed. Through the study, the following points were found. First, CB (The Coffee Bean), SB (Starbucks) and HS (Hollys Coffee) showed differences in CB (65%), SB (40%) and HS (37%) in the spatial analysis. Second, CB gave color similar to the color of wall and furniture wood, but HS changed the color or brightness of wood finishing color of furniture. HS or SB showed favorable use of wood color scheme. Third, SB (26.3%) and HS (19.7%) were selected by taste. Fourth, there were differences in the items of CB, 'local-exotic' and SB 'dark-bright' in the factor value. The use of wood finishing materials differed in the atmosphere evaluation depending on the spatial factors and the color of the furniture. However, in this study, there are many factors that are insufficient in the accuracy of the ratio of the applied wood finishing material to the space element and the amount of the survey. If we further study the evaluation of emotional image according to the ratio of wood finishing materials, we think that it is necessary to study now that interest in environmentally friendly is increasing.

한·중 피동 표현 대조 연구 - 한국어 행위주 표지와 중국어 피동 표지 대비 중심으로 - (A Contrastive Study on Korean and Chinese Passive Expression: Centered on Korean Act Subject Marks and Chinese Passive Marks)

  • 우동동;김인균
    • 비교문화연구
    • /
    • 제47권
    • /
    • pp.217-240
    • /
    • 2017
  • 본고는 피동 표현에서의 한국어 행위주 표지 '-에게(한테)', '-에, -로'와 중국어 피동 표지 '피(被)[$b{\grave{e}}i$]/양(?)[$r{\grave{a}}ng$]/규(叫)[$ji{\grave{a}}o$]/급(?)[$g{\check{e}}i$]'를 연구 대상으로 삼아 그 분포양상 및 특징을 살피고 이들 형태를 비교 대조를 통하여 그 대응 관계를 면밀히 고찰해 보고자 하였다. 대조 분석 시 두 언어의 유형적 특징, 피동 표현에서의 행위주, 피동주에 대한 선택 제약, 그리고 '받다'류 피동 표현에서 행위주(피동) 표지의 사용 제약과 같은 3가지 측면에 중점을 두었다. 본 대조 분석을 통해 확인한바, 한 중 피동 표현에서 한국어 행위주 표지 '-에게(한테)', '-에, -로'와 중국어 피동 표지 '피(被)/양(?)/규(叫)/급(?)'는 각각 행위주와 결합하여 부사어 역할을 하고 있는 공통점에도 불구하고 용법에 있어 차이점을 보였다. 먼저 두 언어 유형적 특징에 따라 피동 표현에서 행위주와의 결합 방식이 각각 달리 나타남을 확인하였다. 그리고 한국어 행위주 표지는 오로지 조사 역할을 하여 '행위주 유정성 유무'에 대한 제약만 받는 반면, 중국어 피동 표지 '피(被)/양(?)/규(叫)/급(?)'는 각각 문법화 정도에 따라 행위주 유무뿐만 아니라 피동주 유정성 유무 그리고 문장에 나타나는 어휘의 의미에 따른 제약 등을 보인다. 특히 한국어 '받다'류 피동 표현에서 한국어의 행위주 표지 '에게(한테), -에, -로'는 그대로 사용되지만 대응하는 중국어에서는 피동 표지 사용에 여러 제약이 있음을 확인하였다.

Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석 (Sentiment Analysis using Robust Parallel Tri-LSTM Sentence Embedding in Out-of-Vocabulary Word)

  • 이현영;강승식
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.16-24
    • /
    • 2021
  • word2vec 등 기존의 단어 임베딩 기법은 원시 말뭉치에 출현한 단어들만을 대상으로 각 단어를 다차원 실수 벡터 공간에 고정된 길이의 벡터로 표현하기 때문에 형태론적으로 풍부한 표현체계를 가진 언어에 대한 단어 임베딩 기법에서는 말뭉치에 출현하지 않은 단어들에 대한 단어 벡터를 표현할 때 OOV(out-of-vocabulary) 문제가 빈번하게 발생한다. 문장을 구성하는 단어 벡터들로부터 문장 벡터를 구성하는 문장 임베딩의 경우에도 OOV 단어가 포함되었을 때 문장 벡터를 정교하게 구성하지 못하는 문제점이 있다. 특히, 교착어인 한국어는 어휘형태소와 문법형태소가 결합되는 형태론적 특성 때문에 미등록어의 임베딩 기법은 성능 향상의 중요한 요인이다. 본 연구에서는 단어의 형태학적인 정보를 이용하는 방식을 문장 수준으로 확장하고 OOV 단어 문제에 강건한 병렬 Tri-LSTM 문장 임베딩을 제안한다. 한국어 감정 분석 말뭉치에 대해 성능 평가를 수행한 결과 한국어 문장 임베딩을 위한 임베딩 단위는 형태소 단위보다 문자 단위가 우수한 성능을 보였으며, 병렬 양방향 Tri-LSTM 문장 인코더는 86.17%의 감정 분석 정확도를 달성하였다.

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.

2022 개정 교육과정에 따른 초등학교 1~2학년 수학 교과서 현장검토본의 어휘 적정성 분석 및 개선 연구 (A study to analyze and improve vocabulary adequacy of field-reviewed textbooks for 1st and 2nd grade elementary school mathematics according to the 2022 revised curriculum)

  • 이대현;권미선;이미진;성창근
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제27권1호
    • /
    • pp.75-90
    • /
    • 2024
  • 본 연구의 목적은 2022 개정 교육과정에 따른 초등학교 1~2학년 수학 교과서 현장검토본에 제시된 어휘를 9등급 어휘 체계로 분석하고, 그 결과를 토대로 교과서에 사용된 어휘를 개선하는 것이다. 9등급 어휘 체계에 따른 분석 결과, 학생들의 수준에 적합하지 않은 어휘 빈도수의 비율은 1학년 1학기 6.67%, 2학기 12.17%로 나타났으며, 2학년 1학기 11.73%, 2학기 14.19%로 나타났다. 이를 통해 학생들에게 어려울 수 있는 어휘가 전체 어휘 빈도수의 약 6%~15%를 차지하고 있음을 알 수 있다. 분석 결과를 토대로 학생들에게 어려울 수 있는 어휘는 삭제, 수정, 보완하였다. 구체적으로 난도가 높은 어휘 중 수업 내용과 관련없는 어휘는 삭제하였다. 수업 내용과 관련 있는 어휘인 경우 난도가 낮은 유사어로 수정하거나 학생들의 이해를 도울 수 있는 그림을 추가로 제시하였다. 이 연구를 통해 교과서에 사용된 어휘의 양상을 파악하고 어휘를 적절히 수정하여, 효과적인 수학 학습을 위한 수준 높은 교과서 개발에 도움이 될 것으로 기대한다.

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

다차원 구어 단기기억에 따른 전도 실어증 환자의 언어수행력 분석 (Language performance analysis based on multi-dimensional verbal short-term memories in patients with conduction aphasia)

  • 하지완;황유미;편성범
    • 인지과학
    • /
    • 제23권4호
    • /
    • pp.425-455
    • /
    • 2012
  • 다차원 구어 단기기억 기제는 크게 음운적 통로와 어휘-의미적 통로로 구분된다. 전자를 음운단기기억, 후자를 의미단기기억이라고 할 수 있는데, 단기기억 과제를 정상적으로 수행하기 위해서는 두 통로 모두의 정보를 활발히 활용하여야 한다. 그리고 음운단기기억은 다시 음운입력완충기와 음운출력완충기로 나누어지며, 음운입력완충기는 음운자극의 입력 시, 음운출력완충기는 음운 산출 시에 작동한다. 본 연구에서는 유사한 수준의 전도 실어증 증상을 보이는 세 명의 환자에 대해, 각각의 언어 수행력을 구어 단기기억의 다차원적 측면에서 분석하였다. 그러기 위하여 세 명의 전도 실어증 환자들에게 단어 수준과 문장 수준에서 스스로 말하기, 따라말하기, 스스로 쓰기, 받아쓰기의 네 가지 양태의 언어과제를 실시하여 수행력을 비교 분석하였고, 숫자폭검사와 언어학습검사를 이용하여 음운단기기억력과 의미단기기억력을 평가하였다. 그 결과 세 대상자들은 네 양태의 언어 검사에서 다양한 수행력과 오반응 유형을 보였고, 단기기억력 검사 결과도 동일하게 나타나지 않았다. 즉 전도 실어증 환자들의 언어 수행력은 의미단기기억 또는 음운단기기억의 결함으로 설명될 수 있으며, 음운단기기억 가운데에서도 음운입력완충기, 음운출력완충기 혹은 둘 다의 결함 여부에 따라 언어특성이 상이하게 나타날 가능성을 제시하고 있다. 본 연구에서는 전도 실어증 환자들의 언어 검사와 단기기억력 검사 결과를 바탕으로, 언어와 다차원 구어 단기기억력과의 관계에 대하여 논의하고 있다.

  • PDF

복합 커널을 사용한 한국어 종속절의 의존관계 분석 (Analyzing dependency of Korean subordinate clauses using a composit kernel)

  • 김상수;박성배;박세영;이상조
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.1-15
    • /
    • 2008
  • 한국어에서 절들의 의존관계를 밝히는 작업은 구문 분석 작업에서 가장 어려운 작업들 중에 하나로 인식되고 있다. 절의 의존관계를 파악하는 일은 표면적으로 나타나는 정보만을 가지고 처리할 수 없고, 의미정보와 같은 추가적인 정보가 필요할 것으로 판단하고 처리해 왔다. 본 논문에서는 추가적인 정보를 사용하지 알고, 문장에서 얻을 수 있는 표면적인 정보만을 사용하여 절들 간의 의존관계를 파악하는 방법을 제안한다. 문장에서 얻을 수 있는 표면적인 정보는 문장의 구문 정보(tree structure information)와 어휘 및 거리 정보를 가지고 있는 정적인 정보(static information)로 나누어 볼 수 있다. 본 논문에서는 절들 간의 의존 관계 파악을 위하여 구문 정보와 정적 정보를 다루는 하나 이상의 커널의 결합해서 사용하는 복합 커널(composite kernel)을 제안하고, 이 커널에 맞는 다양한 인스턴스 공간의 설정을 제안한다. 실험은 최적화된 인스턴스 공간을 절들 간의 의존관계 파악 및 문장 수준에서 성능을 검정하였다. 관계 인스턴스 공간은 절들 간의 연결 및 하부절의 표현 유무로 나누었고, 결정된 인스턴스 공간에서 복합커널을 사용한 방법이 좋은 성능을 발휘함을 보였다.

  • PDF

영한 기계번역 시스템의 영한 변환사전 확장 도구 (English-Korean Transfer Dictionary Extension Tool in English-Korean Machine Translation System)

  • 김성동
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.35-42
    • /
    • 2013
  • 영한 기계번역 시스템을 개발하기 위해서는 언어에 대한 다양한 정보를 필요로 하며, 특히 영어 단어에 대한 의미 정보를 포함하는 영한 변환사전의 풍부한 정보량은 번역품질에 중요한 요소이다. 지속적으로 생성되는 새로운 단어들은 사전에 등록되어 있지 않아 번역문에 영어 단어가 그대로 출력되어 번역품질을 저하시킨다. 또한 복합명사는 어휘분석, 구문분석을 복잡하게 하고 사전에 의미가 등록되지 않은 경우가 많아 올바르게 번역하기 어렵다. 따라서 영한 기계번역의 번역품질 향상을 위해서는 사전에 등록되어 있지 않은 단어들과 자주 사용되는 복합명사들을 수집하고 의미 정보를 추가하여 영한 변환사전을 지속적으로 확장하는 것이 필요하다. 본 논문에서는 인터넷 신문기사로부터 말뭉치를 추출하고, 사전 미등록 단어와 자주 나타나는 복합명사를 찾은 후, 이들에 대해 의미를 부착하여 영한 변환사전에 추가하는 일련의 과정으로 구성되는 영한 변환사전의 확장 방안을 제안하고 이를 지원하는 도구를 개발하였다. 사전 정보의 확대는 많은 사람의 노력을 필요로 하는 일이지만, 영한 기계번역 시스템의 개선을 위해서는 필수적이다. 본 논문에서 개발한 도구는 사람의 노력을 최소화 하면서, 영한 변환사전의 정보량 지속적인 확대를 위해 유용하게 활용되어 영한 기계번역 시스템의 번역품질 개선에 기여할 것으로 기대된다.

딥러닝 자동 분류 모델을 위한 공황장애 소셜미디어 코퍼스 구축 및 분석 (Building and Analyzing Panic Disorder Social Media Corpus for Automatic Deep Learning Classification Model)

  • 이수빈;김성덕;이주희;고영수;송민
    • 정보관리학회지
    • /
    • 제38권2호
    • /
    • pp.153-172
    • /
    • 2021
  • 본 연구는 공황장애 말뭉치 구축과 분석을 통해 공황장애의 특성을 살펴보고 공황장애 경향 문헌을 분류할 수 있는 딥러닝 자동 분류 모델을 만들고자 하였다. 이를 위해 소셜미디어에서 수집한 공황장애 관련 문헌 5,884개를 정신 질환 진단 매뉴얼 기준으로 직접 주석 처리하여 공황장애 경향 문헌과 비 경향 문헌으로 분류하였다. 이 중 공황장애 경향 문헌에 나타난 어휘적 특성 및 어휘의 관계성을 분석하기 위해 TF-IDF값을 산출하고 단어 동시출현 분석을 실시하였다. 공황장애의 특성 및 증상 간의 관련성을 분석하기 위해 증상 빈도수와 주석 처리된 증상 번호 간의 동시출현 빈도수를 산출하였다. 또한, 구축한 말뭉치를 활용하여 딥러닝 자동 분류 모델 학습 및 성능 평가를 하였다. 이를 위하여 최신 딥러닝 언어 모델 BERT 중 세 가지 모델을 활용하였고 이 중 KcBERT가 가장 우수한 성능을 보였다. 본 연구는 공황장애 관련 증상을 겪는 사람들의 조기 진단 및 치료를 돕고 소셜미디어 말뭉치를 활용한 정신 질환 연구의 영역을 확장하고자 시도한 점에서 의의가 있다.