• Title/Summary/Keyword: 어휘 분석

Search Result 861, Processing Time 0.026 seconds

A Study on the Analysis of Disaster Safety Lexicon Patterns in Social Media (소셜미디어를 통해 본 재난안전 분야 어휘 사용 양상 분석)

  • Kim, Tae-Young;Lee, Jung-Eun;Oh, Hyo-Jung
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.10
    • /
    • pp.85-93
    • /
    • 2017
  • Standardization of disaster safety lexicon is important as the most basic process for successful accident prevention and response. A lack of understanding of disaster safety lexicon leads lack of communication and information sharing, which can be a problem in communicating with appropriate responses in case of a disaster. Currently disaster and safety control agencies produce and manage heterogeneous information and they also develop and use word dictionaries individually. To solve this problem, identifying differences of disaster safety lexicon patterns by the user are essential for standardization. In this paper, we conducted lexicon patterns analysis based on social media and revealed the characteristics according to pattern types. At the result, we proposed the standardization and construction methods of disaster safety word dictionary.

Korean Structural Disambiguation using Adverb Information (부사 정보를 이용한 한국어 구조 중의성 해소)

  • 신승은;서영훈
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.110-115
    • /
    • 2000
  • 자연 언어 처리의 구문 구조 분석에서는 중의성 있는 결과가 많이 생성된다. 이러한 중의성을 해소하는데 어휘정보가 유용하다는 것은 잘 알려져 있으며, 이러한 어휘정보와 이를 이용한 중의성 해소에 관한 연구가 많이 이루어지고 있다. 본 논문은 한국어의 구문 구조 분석 시 부사에 의해 발생되는 중의성을 해소하기 위해 수식어 사전을 이용하여 구문 분석에서의 구조 중의성을 해소하였다. 수식어 사전의 어휘정보와 대상 말뭉치를 통해 각각의 부사에 대한 문법을 구성하고, 이를 이용하여 한국어 구문 구조 분석에서 부사에 의해 발생되는 중의성을 줄일 수 있다.

  • PDF

A Study on the Features of Communicative Languages by Frequency Information (자모 빈도에 의한 통신 언어의 특성 연구)

  • Kang, Seung-Shik;Kim, Bo-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.501-504
    • /
    • 2003
  • 인터넷 채팅과 문자 메시지 등 통신 환경에서 사용되는 어휘들은 일정한 규칙성과 방향성을 가지고 있을 것으로 추정된다. 통신 용어의 생성 규칙과 음운론적 변형 현상을 규명하기 위하여 통신 용어의 사용 빈도의 분석과 언어학적 접근 방법을 통하여 통신 언어의 생성 원인을 분석한다 통신 환경에서 변형되어 사용되는 어휘들의 표준어와 통신상에서 사용되는 어휘 형태에 대해 각각 초성, 중성, 종성 빈도를 계산하고 통신 용어와 표준의 자모 사용 비율 변화를 분석하여 통신 용어가 생성되는 원인을 분석하였다.

  • PDF

A Study on the Extraction of Emotional Words for Media Facade (내용분석 및 자유연상을 통한 미디어 파사드의 감성어휘 추출)

  • Lee, Seung-min;Bang, Kee-chun
    • Journal of Digital Contents Society
    • /
    • v.16 no.5
    • /
    • pp.741-748
    • /
    • 2015
  • The aim of this paper is to select a distinct vocabulary for understanding the media facade of user and to lay the foundation for a media facade emotional scale. Firstly, we assembled a set of emotional words that were sufficient to represent a general overview of korean emotions, collected from various literature studies. Secondly, we found emotional words from collecting user opinion on the Youtube website. Finally the emotional words were collected from phrase by using non-structural survey. The collected words were integrated according to standards and they were organized 39 pieces that can be used in the survey. As a result, we extracted 21 emotional words for measuring user's emotions expressed while watching media facade, such as 'novel', 'cool', 'awesome', 'gorgeous', 'exciting', 'amazing', 'wonderful,', 'showy', 'great,', 'intense', 'good', 'grand', 'colorful', 'unique', 'variety', 'new', 'fun', 'beautiful', 'luxurious,', 'mysterious', 'satisfactory'. And we categorized the 21 words to form 5 elements by using factor analysis such as 'surprise', 'attention', 'variety', 'aesthetics', 'interest'.

Functional Lexical Bundles in Nuclear Science and Engineering Research Articles (원자력과학공학 학술 논문에 나타난 기능적 어휘다발 분석)

  • Nam, Daehyeon
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.11
    • /
    • pp.426-435
    • /
    • 2021
  • This study aims to functionally classify lexical bundles appearing in academic papers on nuclear science and engineering written in English and then analyze the lexical bundles' characteristics compared to those appearing in general academic papers. To this end, the texts of nuclear science and engineering papers were collected and produced as a corpus(c. 1 mil. tokens). Then they were statistically compared through Chi-square tests and standardized residuals with the corpus of general academic papers(c. 750,000 tokens). The results revealed that, compared to general academic papers, the bundles in the stance lexical bundle category were mainly used among the functional lexical bundle in nuclear science and engineering. The use of the lexical bundles lacked much variety. The same type of lexical bundles was 're-used' and 'recycled'. Based on these research results, educational implications for English for Academic Purposes and the further direction of follow-up research were discussed and suggested.

Study on Effective Extraction of New Coined Vocabulary from Political Domain Article and News Comment (정치 도메인에서 신조어휘의 효과적인 추출 및 의미 분석에 대한 연구)

  • Lee, Jihyun;Kim, Jaehong;Cho, Yesung;Lee, Mingu;Choi, Hyebong
    • The Journal of the Convergence on Culture Technology
    • /
    • v.7 no.2
    • /
    • pp.149-156
    • /
    • 2021
  • Text mining is one of the useful tools to discover public opinion and perception regarding political issues from big data. It is very common that users of social media express their opinion with newly-coined words such as slang and emoji. However, those new words are not effectively captured by traditional text mining methods that process text data using a language dictionary. In this study, we propose effective methods to extract newly-coined words that connote the political stance and opinion of users. With various text mining techniques, I attempt to discover the context and the political meaning of the new words.

Analyzing Vocabulary Characteristics of Colloquial Style Corpus and Automatic Construction of Sentiment Lexicon (구어체 말뭉치의 어휘 사용 특징 분석 및 감정 어휘 사전의 자동 구축)

  • Kang, Seung-Shik;Won, HyeJin;Lee, Minhaeng
    • Smart Media Journal
    • /
    • v.9 no.4
    • /
    • pp.144-151
    • /
    • 2020
  • In a mobile environment, communication takes place via SMS text messages. Vocabularies used in SMS texts can be expected to use vocabularies of different classes from those used in general Korean literary style sentence. For example, in the case of a typical literary style, the sentence is correctly initiated or terminated and the sentence is well constructed, while SMS text corpus often replaces the component with an omission and a brief representation. To analyze these vocabulary usage characteristics, the existing colloquial style corpus and the literary style corpus are used. The experiment compares and analyzes the vocabulary use characteristics of the colloquial corpus SMS text corpus and the Naver Sentiment Movie Corpus, and the written Korean written corpus. For the comparison and analysis of vocabulary for each corpus, the part of speech tag adjective (VA) was used as a standard, and a distinctive collexeme analysis method was used to measure collostructural strength. As a result, it was confirmed that adjectives related to emotional expression such as'good-','sorry-', and'joy-' were preferred in the SMS text corpus, while adjectives related to evaluation expressions were preferred in the Naver Sentiment Movie Corpus. The word embedding was used to automatically construct a sentiment lexicon based on the extracted adjectives with high collostructural strength, and a total of 343,603 sentiment representations were automatically built.

Applying Basic Word Lists and Contents for Elementary School English Education by Mobile Games (초등학생용 모바일 영어어휘 게임을 위한 어휘목록 및 콘텐츠 적용 방법 제시)

  • Jeong, Dong-Bin;Kim, Hyun-Jung;Won, Eun-Sok
    • Journal of Korea Game Society
    • /
    • v.10 no.4
    • /
    • pp.35-48
    • /
    • 2010
  • The purpose of the present study was to suggest basic word lists and contents of English for mobile games and to propose how to apply basic word lists to mobile games for English vocabulary learning because it is possible that some potential advantages of mobile games can provide elementary school students with new learning environment for English vocabulary learning. To support this idea, firstly, the basic word lists were selected from essential word lists in the national English curriculum, the word lists from textbooks, and five randomly chosen word books. Secondly, mobile games were examined and appropriate mobile games for learning English words was selected. Lastly, the basic word lists for mobile games were applied to the selected game.

Dimension of the Emotion Structure through the Analysis of Emotion related terms in Korean Language (정서관련 어휘 분석을 통한 내적 상태의 차원 연구)

  • 김영아;김진관;박수경;오경자;정찬섭
    • Science of Emotion and Sensibility
    • /
    • v.1 no.1
    • /
    • pp.145-152
    • /
    • 1998
  • 본 연구에서는 한국어의 정서관련 어휘분석을 통하여 내적체계의 차원을 알아보고자 하였다. 이를 위해 연구1에서는 내적경험을 표현하는 데 자주 쓰이는 어휘들을 자유연상을 통해 100개를 선정하고 유사성과 빈도평가 자료를 다차원분석한 결과, 1차원(63%)은 불쾌, 2차원(25%)은 각성수준으로 해석될 수 있었고, 이는 기존의 차원모형의 주장과 거의 유사한 결과였다. 다른 이휘목록을 사용하였을 때의 결과와 비교하기 위해, 연구 2에서는 표정을 보고 정서를 추론하는 실험을 통해 자주 언급된 단어를 빈도순으로 22개 선정하였다. 이를 이용하여 같은 방법으로 다차원 분석한 결과 역시 같은 차원들이 얻어졌으나, 1차원의 비중이 훨씬 커서(89%)각성수준의 설명력은 (6%)상대적으로 작았다. 연구 3에서는 연구 1,2의 이휘목록이 전체 재적체계의 차원 공간에서 차지하는 상대적인 위치를 비교하기 위해, 두 어휘목록을 포함한 83개 내적체계의 단어를 차원평정시켜 분석하였고, 연구결과가 차원모형에서 갖는 시사점이 논의되었다.

  • PDF

Tagging Error Correction Using Lexical Morpheme Context (형태소 어휘 문맥에 기반한 태깅 오류 정정)

  • Kim, Young-Kil;Yang, Sung-Il;Hong, Mun-Pyo;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.63-68
    • /
    • 2003
  • 본 논문에서는 형태소 분석 대상 어절의 좌우 어절내의 대표 형태소 어휘 문맥 정보에 기반한 형태소 오류 정정 방안을 제안한다. 현재까지 주변의 품사열 문맥 정보에만 의존하는 기존의 품사 태깅 모델과 달리 주변 어휘를 반영할 수 있는 좌우 어절 문맥을 이용해 형태소 태거의 성능을 향상시킬 수 있는 방법들이 제시되었다. 그러나 이러한 어절 문맥에 의한 지속적인 성능 향상을 위해서는 대량의 품사 태킹 문맥 정보를 필요로 한다. 따라서 본 논문에서는 이러한 자료 부족 문제를 해결하기 위하여 기존의 분석 대상 어절 좌우의 어절 단위의 어휘 문맥 정보가 아닌 좌우 어절내의 대표 형태소 단위의 형태소 어휘 문맥을 이용한 품사 태깅 오류 정정 방안을 제안한다. 실험을 통해, 형태소 어휘 단위의 문맥 정보의 적용성(Coverage)의 높고 기존의 품사 문맥 정보 기반의 형태소 분석기의 태깅 오류를 정정하여 그 정확성을 크게 향상시킬 수 있음을 보인다.

  • PDF