• Title/Summary/Keyword: 언어적 분석

Search Result 3,359, Processing Time 0.027 seconds

Procedures and Problems in Compiling a Disambiguated Tagged Corpus (어휘의미분석 말뭉치 구축의 절차와 문제)

  • Shin, Chi-Hyon;Choi, Min-Woo;Kang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.479-486
    • /
    • 2001
  • 동음이의어 간의 서로 다른 의미를 효율적으로 변별해 줄 수 있는 방법 중 하나로 어휘의미분석 말뭉치의 활용을 들 수 있다. 이는 품사 단위의 중의성을 해소해 줄 수 있는 형태소 분석 말뭉치를 기반으로, 이 단계에서 해결하지 못하는 어휘적인 중의성을 해결한 것으로, 보다 정밀한 언어학적 연구와 단어 의미의 중의성 해결(word sense disambiguation) 등 자연언어처리 기술 개발에 사용될 수 있는 중요한 언어 자원이다. 본 연구는 실제로 어휘의미분석 말뭉치를 구축하기 위한 기반 연구로서, 어휘의미분서 말뭉치의 설계와 구축 방법론상의 제반 사항을 살펴보고, 중의적 단어들의 분포적 특징과 단어의 중의성 해결 단계에서 발생할 수 있는 문제점을 지적하고, 아울러 그 해결 방법을 모색해 의는 것을 목적으로 한다.

  • PDF

Recognition and Evaluation of Efficient Language Analysis Unit for Korean (한국어에서 실용적 언어분석 단위의 인식과 평가)

  • 박인철
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.1
    • /
    • pp.65-76
    • /
    • 2004
  • In this paper, we observe the differences between linguistic and computational aspect in the automatic processing of languages which are dominant representation method for information in the Internet. For efficient information retrieval, information extraction and machine translation from the massive documents, we investigate analysis units for morphology analysis, syntactic analysis and semantic analysis. and propose the syntactic longest analysis unit rather than morphological unit based on linguistics. Also, by evaluating with massive documents, we show that the proposed analysis units can be used for the constraint which can reduce the ambiguity occurring in the language processing.

  • PDF

A Case Analysis of Study on Verbal Interaction during the Math Class of a Special Classroom (특수학급 수학 수업에서 나타난 언어적 상호작용 사례 분석)

  • Hong, Jae-Young
    • Journal of the Korea Convergence Society
    • /
    • v.8 no.8
    • /
    • pp.215-224
    • /
    • 2017
  • The purpose of this study was to analyze the cases of verbal interactions occurring during the mathematics lessons taught in middle school special classes in order to examine the elements and types of verbal interactions that occur between the teachers and students. Data were collected and analyzed for the sessions on geometric units that formed part of the mathematics lessons routinely implemented in the special classes. The analysis showed that the teachers initiated 237 (84.1%) of the 291 instances of verbal linguistic interactions. A total of 240 teachers' questions were analyzed, and questions in the area of knowledge occurred the most frequently, at 160 times (66.7%). A total of 617 student responses were analyzed, and short answers occurred the most frequently, at 367 times (59.5%). Teacher feedback occurred 581 times in total, and correct/incorrect (simple) feedback occurred the most frequently, at 234 times (40.3%). A total of 237 verbal interactions were observed between the teachers and children, and the I (RF) type (one teacher question, one student response, and one instance of teacher feedback) occurred most frequently, at 83 times (35.0%).

A Study on the Vowel System Universals of Southeast Asian Languages: The Cases of Tagalog, Malay and Thai. (동남아시아 언어의 모음체계 보편성 연구 - 타갈로그어, 말레이어, 타이어를 대상으로 -)

  • Heo, Yong
    • Cross-Cultural Studies
    • /
    • v.48
    • /
    • pp.391-417
    • /
    • 2017
  • Southeast Asian languages are famous for having a large number of vowel sounds with an average of more than 20 vowel sounds in this certain language family. In addition, there are approximately 1,500 languages in this area, which accounts for approximately 20% of total languages in the world. For this reason, vowel systems of Southeast Asian languages should be explored to determine the nature of vowel structures of human natural languages. In this study, we analyze vowel systems of three languages, Tagalog, Malay and Thai, that have only primary or normal vowels and thus are relatively simple structures based on descriptive and analytic universals. We would also like to confirm if the six criteria of the tentative evaluation model taken from several previous literature is appropriate in applying analysis of vowel system universals under the method of the Greenbergian Universals or statistic universals. What we have found from this research are (i) the three languages have high level of universals with some exceptional cases such as three-vowel system of Tagalog, and (ii) some of the six criteria, together with some cases of analytic universals, are not quite suitable for understanding language-specific universals that are different from other languages.

Corpus Analyzer for Linguists (언어학자를 위한 말뭉치 분석기)

  • Jeong, Seok-Pal;Lim, Seong-Jyeon;Jeon, Jin-Hyeong;Lee, Hyun Ah
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.95-98
    • /
    • 2012
  • 말뭉치는 언어를 연구하기 위한 중요한 재료이다. 본 논문에서는 말뭉치에서 나타나는 언어 현상을 보다 효율적으로 분석하기 위한 언어학자를 위한 말뭉치 분석기를 제안하고 그 구현 방법을 설명한다. 제안하는 말뭉치 분석기는 기본적인 통계 정보와 함께, 형태소 분석된 파일을 대상으로 위치 색인을 포함하는 역파일 색인을 구성하여 빠른 형태소 검색과 다앙한 수준의 연어 검색을 제공한다. 분석기는 세종말뭉치를 기본 말뭉치로 하며, 다앙한 말뭉치에 대한 통계자료와 검색 기능을 제공하기 위해 사용자 말뭉치 파일에 대한 처리도 지원한다. 시스템은 사용자가 업로드한 말뭉치 파일에 대하여 자동 형태소 분석을 제공하며 형태소 분석 결과 수정을 가능하게 하여 다앙한 말뭉치에서 언어학자들의 우리말 연구를 지원한다.

  • PDF

A Comparative Study on Building Korean & Chinese Music Request Sentence Patterns for AI Assistant Platforms (AI 어시스턴트 플랫폼의 한국어와 중국어 음악청취 요청문 패턴구축 비교 연구)

  • Yun, Soeun;Li, Jiabin;Nam, Jeesun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.383-388
    • /
    • 2020
  • 본 연구에서는 AI 어시스턴트의 음악청취 도메인 내 요청문을 인식 및 처리하기 위해 한국어와 중국어를 중심으로 도메인 사전 및 패턴문법 언어자원을 구축하고 그 결과를 비교분석 하였다. 이를 통해 향후 다국어 언어자원 구축의 접근 방법을 모색할 수 있으며, 궁극적으로 패턴 기반 문법으로 기술한 언어자원을 요청문 인식에 직접 활용하고 또한 주석코퍼스 생성을 통해 기계학습 성능 향상에 도움을 줄 수 있을 것으로 기대된다. 본 연구에서는 우선 패턴문법의 구체적인 양상을 살펴보기에 앞서, 해당 도메인의 요청문 유형의 카테고리를 결정하는 과정을 거쳤다. 이를 기반으로 한국어와 중국어 요청문의 실현 양상과 패턴유형을 LGG 프레임으로 구조화한 후, 한국어와 중국어 패턴문법 간의 통사적, 형태적, 어휘적 차이점을 비교분석 하여 음악청취 도메인 요청문의 언어별 생성 구조 차이점을 관찰할 수 있었다. 구축한 패턴문법은 개체명을 변수(X)로 설정하는 경우, 한국어에서는 약 2,600,600개, 중국어에서는 약 11,195,600개의 표현을 인식할 수 있었다. 결과적으로 본 연구에서 제안한 언어자원의 언어별 차이에 대한 통찰을 통해 다국어 차원의 요청문 인식 자원과 기계학습 데이터로서의 효용을 확인하였다.

  • PDF

A Study on the Natural Language Generation by Machine Translation (영한 기계번역의 자연어 생성 연구)

  • Hong Sung-Ryong
    • Journal of Digital Contents Society
    • /
    • v.6 no.1
    • /
    • pp.89-94
    • /
    • 2005
  • In machine translation the goal of natural language generation is to produce an target sentence transmitting the meaning of source sentence by using an parsing tree of source sentence and target expressions. It provides generator with linguistic structures, word mapping, part-of-speech, lexical information. The purpose of this study is to research the Korean Characteristics which could be used for the establishment of an algorism in speech recognition and composite sound. This is a part of realization for the plan of automatic machine translation. The stage of MT is divided into the level of morphemic, semantic analysis and syntactic construction.

  • PDF

Effects of categorization on linguistic spatial representation and non-linguistic spatial representation (언어적 공간표상과 비언어적 공간표상에서의 범주화의 효과)

  • 서원식;한광희
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.119-124
    • /
    • 2002
  • 공간적 관계정보(spatial relation)가 언어적 표상시스템과 비언어적 표상시스템에서 어떻게달라지는가를 범주화 모델의 원형이론 모델을 적용하여 알아보고자 하였다. 이전의 연구들에 따르면 공간적 관계정보에 대한 프로토타입이 언어적 범주와 비언어적 범주에서 다르다는 연구 결과(Crawford 등 2000, Huttenlocher 등 1991)와 동일하다. (Hayward & Tarr 1995)는 상반된 연구 결과가 제기되고 있다. 하지만 이전 연구들에서의 문제점은 언어/비언어 표상체계 간의 편향을 통제하지 못했기 때문에 과제에 따라 서로 다른 결과가 나온 것이라고 볼 수 있다 본 연구에서는 두 대상간의 관계정보를 문장으로 제시한 조건, 그림으로 제시한 조건, 그리고 두 조건을 혼합한 조건을 사용하여 편향에 의한 효과를 제거하고자 하였다. 실험은 각 조건에 따라 짝으로 구성된 자극을 학습한 후 검사자극을 공간적 관계정보를 다양하게 하여 학습자극과 동일한지 아닌지를 판단하게 하였다. 실험결과 관계정보를 언어적으로 제시한 조건과 비언어적으로 제시한 조건간에 대상의 위치에 따른 반응시간의 경향성에서 차이가 없었으며, 대상이 단어인지 그림인지에 따라서 반응시간에서 통계적으로 차이가 나타났다. 그리고 두 표상체계에서 공간적 관계에 대한 프로토타입을 분석한 결과 수직축을 중심으로 전형성 효과가 나타나는 것을 알 수 있었다.

  • PDF

Analysis on Gifted Class in Mathematics using Flanders Category System (Flanders 언어상호작용 분석법을 활용한 수학영재 수업 분석)

  • Lee, Yoon-Gyeong;Lee, Joong-Kweon
    • The Journal of the Korea Contents Association
    • /
    • v.14 no.5
    • /
    • pp.512-523
    • /
    • 2014
  • The purpose of this study is to provide useful information for improving interaction between teacher and student by analysing gifted class in mathematics with the Flanders Category System. Research questions are as follow. In gifted class in mathematics, How is the result of analysis regarding interactions between the teacher and students, according to 1) Flanders' Coding system? 2) Flanders' language pattern? 3) Flanders' Index system? For this, 3 gifted classes in mathematics were recorded by video camera and analyzed by Advanced Flanders(AF) analysis program version 3.54. Results are as follow. 1) Code Category Analysis mostly consists of lecture, voluntary speaking and chaos, silence work. 2) Most class patterns are not in accordance with effective class pattern models. So teacher needs to accept student's opinion actively and give appropriate feedback. 3) In Indices Results, revised I/d ratio, teacher's question ratio, student's speaking ratio, Student question and wide answer ratio are higher than analysis standard, indirect ratio is lower than analysis standard.

Linguistic Analysis of Picture Description for Language Impairment Diagnosis (언어 장애 진단을 위한 그림 설명글의 언어학적 특성 분석)

  • Lee, Yong-Jae;Min, Hye-Jin;Park, Jong-C.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.244-247
    • /
    • 2011
  • 사람은 성장 배경이나 학습에 따라 고유의 언어 사용 특성을 가지게 된다. 이러한 언어 사용 특성은 개인의 언어 유창성에 대한 지표를 제공하며, 언어 사용 특성에 대한 분석은 장애에 따른 변화에도 능동적으로 대처할 수 있게 한다. 그러나 어떤 특정인의 언어 사용 특성을 파악하는 연구는 아직 부족한 실정이다. 본 연구에서는 개인 언어 사용 특성 파악을 위하여 일차적으로 일반인들의 그림 설명글 데이터를 모았으며, 이에 대한 분석 결과에 기반하여 언어 장애 진단에 적용하기 위한 언어 사용 특성을 파악하고자 한다. 본 연구의 결과로 형태소 단위, 단어 단위, 그리고 내용 전달의 방식에 따른 개인의 언어 사용특성을 일부 파악할 수 있었으며, 이와 같은 특성은 향후 치매와 같은 인지 기능 장애로 인한 언어 사용의 변화를 추적하는데 중요한 실마리를 제공할 수 있을 것으로 기대된다.