• Title/Summary/Keyword: 의미범주

Search Result 723, Processing Time 0.026 seconds

Detecting spam mails using Text Mining Techniques (광고성 메일을 자동으로 구별해내는 Text Mining 기법 연구)

  • 이종호
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.35-39
    • /
    • 2002
  • 광고성 메일이 개인 당 하루 평균 10통 내외로 오며, 그 제목만으로는 광고메일을 효율적으로 제거하기 어려운 현실이다. 이러한 어려움은 주로 광고 제목을 교묘히 인사말이나 답신처럼 변경하는 데에서 오는 것이며, 이처럼 제목으로 광고를 삭제할 수 없도록 은폐하는 노력은 계속될 추세이다. 그래서 제목을 통한 변화에 적응하면서, 제목뿐만 아니라 내용에 대한 의미 파악을 자동으로 수행하여 스팸 메일을 차단하는 방법이 필요하다. 본 연구에서는 정상 메일과 스팸 메일의 범주화(classification) 방식으로 접근하였다. 이러한 범주화 방식에 대한 기준을 자동으로 알기 위해서는 사람처럼 문장 해독을 통한 의미파악이 필요하지만, 기계가 문장 해독을 통해서 의미파악을 하는 비용이 막대하므로, 의미파악을 단어수준 등에서 효율적으로 대신하는 text mining과 web contents mining 기법들에 대한 적용 및 비교 연구를 수행하였다. 약 500 통에 달하는 광고메일을 표본으로 하였으며, 정상적인 편지군(500 통)에 대해서 동일한 기법을 적용시켜 false alarm도 측정하였다. 비교 연구 결과에 의하면, 메일 패턴의 가변성이 너무 커서 wrapper generation 방법으로는 해결하기 힘들었고, association rule analysis와 link analysis 기법이 보다 우수한 것으로 평가되었다.

  • PDF

Korean Surface Realizer Based on Topic-Comment Structure (토픽-코멘트 구조에 기반한 한국어 표층 생성기)

  • Kim, Jung-Eun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.503-508
    • /
    • 2001
  • 본 논문은 자연언어생성 기술을 이용하여 질병에 대한 기술문을 생성해 내는 시스템에서 사용되는 표층 생성기에 대해서 다루고 있다. 표층 생성기는 문장의 추상적인 표현으로부터 통사적으로, 형태론적으로 올바른 텍스트로 생성하여 내는 것을 목표로 한다. 질병에 관한 기술문에 있는 문장들은 두가지 특징을 가지고 있다. 첫번째로, 질병 기술문의 문장들은 토픽-코멘트 구조로 나타내어질 수 있다. 두번째로, 같은 의미 범주에 속하는 문장들은 같은 토픽을 가진다. 따라서, 토픽은 의미범주로부터 유추될 수 있으므로 표층 생성기의 입력인 구 명세 (phrase specification)에 표현될 필요가 없다. 본 논문에서는 이런 특징을 이용하여 효율적인 표층 생성기를 만들기 위하여 표층 생성의 단계를 내부 표현 생성과 외부 문장 생성의 두 단계로 나누었다. 내부 표현 생성 단계에서는 코멘트에 해당하는 부분을 생성하고 외부 문장 생성 단계에서 의미범주 태그에 따라 토픽을 첨가하여 최종 문장으로 생성하였다. 이런 방법으로 실험한 결과, 본 표층 생성기는 문법에 맞으면서 자연스러운 텍스트를 생성해 낸다는 것을 알 수 있었다.

  • PDF

Categorial Grammar and Quantifer Floating (범주문법과 양화사 유동)

  • 강범모
    • Korean Journal of Cognitive Science
    • /
    • v.2 no.1
    • /
    • pp.73-86
    • /
    • 1990
  • This study aims to give a syntactic and semantic analysis of the phe- nomenon of Quantifier Floating in the framework of Generalixed Cate- gorial Grammar. Floated quantifiers like neys-i as in Hakayngtul-i neys-i swul-ul masyessta are syntactically analyxed as VP modifiers(VP/VP), and semantically as involving nominalixed properties. Related forms like neys(NP/NP) and neys-ul(TV-TV) are also given rigorous syntactic and semantic analysis. A successful anaysis sheds light on the possiblity of using Categorial Grammar, which is subject to adjacency principle, for the (computer) processing od Korean.

Sense Distinction of Adjectival Medical Terms through Lexico-semantic Criteria and Semantic Classification of Arguments (어휘의미론적 기준 및 논항의 의미 범주 분류를 통한 형용사 의학 용어의 의미 구분)

  • Bae Hee Sook
    • Language and Information
    • /
    • v.9 no.1
    • /
    • pp.1-18
    • /
    • 2005
  • In Korean terminologies, adjectival terms are rare, and the meaning and function associated with adjectives in Indo-European languages are often realized instead in noun form. However, the rarer adjectival terms we, the more they are used in restrictive and repetitive ways in specialized domains. Thus, it is important to distinguish the different senses of these terms. In this work, focusing on semantic modeling in terminology, we distinguish the different senses of adjectival medical terms by applying lexico-semantic criteria (L'Homme, 2004a) and by classifying the semantic category of the arguments of the adjective (Bae and others, 2002). The result not only contributes to enriching medical terminology, but also empirically demonstrates a method for distinguishing the different senses of adjectival medical terms. In this work, we obtained an average of 1.854 senses for each term. We used the KAIST corpus, composed of medical texts (1,500,000 eojeols), and a group of texts on various subjects (40,000,000 eojeols)

  • PDF

Hemispheric Asymmetry in Processing Semantic Relationship Shown in Normals and Aphasic (정상인과 명칭성 실어증 환자에게서 보이는 의미적 관련성의 좌우반구 편재화)

  • Chae, Su-Kyung;Kim, Dung-Hye;Pyum, Sung-Bum;Hong, Sung-Bin;Lee, Hong-Jae;Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.462-469
    • /
    • 1999
  • 본 연구에서는 시각적으로 제시되는 단어 자극의 의미 관련성의 차이에 따라 좌우반구의 처리가 어떻게 이루어지는지 알아보고자 하였다. 이를 위해서 명칭성 실어증 환자와 정상인 대학생 피험자를 대상으로 점화 어휘판단 과제를 수행하였다. 이 연구의 기본 논리는 명칭성 실어증 환자의 왼쪽 뇌가 손상되어 있기 때문에 어떤 정보처리가 왼쪽 뇌에서 일어나는 것이라면 정상인과 명칭성 실어증환자간의 수행에서 어떤 차이가 나타날 것을 기대되는 반면, 만일에 우뇌에서 처리되는 것이라면 정상인의 과제 수행 형태와 명칭성 실어증 환자의 것이 일치하는 형태를 보일 것이라는 것이다. 실험 1에서는 수직적 범주관련성이 어느 반구에서 정보처리 되는지를 조사하였다. 그 결과 정상인은 좌반구에서 유의미한 점화효과가 있고 우반구에서는 점화효과가 없었던 반면에, 명칭성 실어증 환자는 정상인과 정반대의 점화 효과를 보이고 있다. 이러한 결과는 좌반구가 일차적으로 수직적 범주 관련성 정보처리와 관련이 있음을 시사해 준다. 또한 수평적 범주 관련성에 따른 실험 은 정상인과 환자 두 집단 모두 수평적 범주관련성이 우반구에서 처리되는 유사한 패턴을 보여주었다. 실험2에서는 연합적 범주관련성에 따른 두 집단간의 점화 효과를 비교하였다. 정상인 집단과 환자 모두 좌우반구에 점화효과를 보여주고 있지만, 정상인 집단의 경우에는 우반구에서, 환자는 좌반구에서 점화량이 더 컸다. 연합관련 정보처리는 좌우반구 모두에서 일어난다고 하는 기존의 견해와 관련하여 볼 때 연합관련 정보처리는 좌우반구에서 일어난다고 해석할 수 있을 것이다. 명칭 실어증 환자의 정보처리는 정상인과 다르게 이루어지므로 이러한 좌우반구에서의 차이가 난 것으로 볼 수 있다. 이상의 실험1과 2의 결과를 종합해 보면, 시각적으로 제시되는 단어의 범주적 관련성이 주는 어휘정보 처리는 반구에 따라 처리하는 기능이 다르다고 결론 내릴 수 있다. 즉, 좌반구는 수직적 범주 관련성을 담당하고 우반구는 수평적 관련성을 담당하며, 연합적 관련성은 좌우반구 모두에서 정보처리 된다는 것이다.

  • PDF

An Experimental Study on Automatic Summarization of Multiple News Articles (복수의 신문기사 자동요약에 관한 실험적 연구)

  • Kim, Yong-Kwang;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.1 s.59
    • /
    • pp.83-98
    • /
    • 2006
  • This study proposes a template-based method of automatic summarization of multiple news articles using the semantic categories of sentences. First, the semantic categories for core information to be included in a summary are identified from training set of documents and their summaries. Then, cue words for each slot of the template are selected for later classification of news sentences into relevant slots. When a news article is input, its event/accident category is identified, and key sentences are extracted from the news article and filled in the relevant slots. The template filled with simple sentences rather than original long sentences is used to generate a summary for an event/accident. In the user evaluation of the generated summaries, the results showed the 54.l% recall ratio and the 58.l% precision ratio in essential information extraction and 11.6% redundancy ratio.

Development of Language Rehabilitation Program Using the Smart Device-based Application (스마트 기기 기반 언어재활 프로그램 개발)

  • Hwang, Yu Mi;Park, Kinam;Jung, Young Hee;Pyun, Sung-Bom
    • Journal of Digital Convergence
    • /
    • v.17 no.10
    • /
    • pp.321-327
    • /
    • 2019
  • The purpose of this study is to develop a smart device-based Language Rehabilitation Program (LRP) to improve communication ability for the patients with language disability. The content of the LRP includes a variety of semantic categories and grammatical elements and consists of 17 semantic categories, 29 tasks and 3780 items to improve comprehension/production ability at word level, semantic category level, sentence level and discourse level. We developed LRP as a Windows-base management program and an Android-base language rehabilitation application. LRP was developed into an application for smart devices, providing real-time delivery of training contents, measurement and database of training task results, and patient progress and monitoring. A follow-up study will be conducted on the verification of the language rehabilitation effect using LRP by patients with language disability.

초등학교 5학년 학생들의 넓이 측정과 관련된 지식 상태의 분석

  • Park Hye-Gyeong;Kim Yeong-Hui;Jeon Pyeong-Guk
    • Proceedings of the Korea Society of Mathematical Education Conference
    • /
    • 2006.10a
    • /
    • pp.79-90
    • /
    • 2006
  • 새로운 것을 학습할 때 학생들은 자신이 어떤 지식 상태를 갖고 있는지에 따라 상당히 다른 이해의 정도를 나타낸다. 유의미한 이해를 이끌어 내기 위해서 교사들은 학생들의 사전 지식상태를 파악하고 그것에 근거하여 학습과제를 제시할 필요가 있으며, 어떤 단원을 학습한 후에 학생들의 지식상태를 파악해 보는 방법도 모색되어야 할 것이다. 본 연구는 충청북도 C도시 4개 초등학교 5학년 학생 285명에게 수학 5-가 6단원을 학습한 후 넓이 측정과 관련된 지식상태 검사를 실시하고 그 결과를 Doignon & Falmagne(1999)의 지식공간론을 활용하여 분석하였다. 학생들의 답안에서 평면도형의 넓이 측정과 관련된 지식의 상태를 파악하고 세 가지 범주-측정의 의미 파악, 공식 활용, 전략의 사용-에서 지식 상태의 위계도를 작성하였다. 첫 번째 범주인 측정의 의미 파악과 관련하여 학생들은 둘레나 넓이의 속성 파악에서 혼동을 보이거나 직관적으로 넓이를 비교해야 하는 과제에서도 계산을 시도하는 지식 상태가 반 이상인 것으로 드러났다. 두 번째 범주인 공식 활용과 관련해서는 학생들의 상당수가 부적합한 수치를 넣어 무조건 넓이 계산을 시도하고 있었다. 또한 세 번째 범주인 전략 사용에 관해서는 분할이나 등적변형 등의 전략을 알고 있는 학생 중에도 40% 가량은 문제를 표상하는데 어려움이 있어 해결하지 못하는 것으로 드러났다.

  • PDF

Dynamic Expansion of Semantic Dictionary for Topic Extraction in Automatic Summarization (자동요약의 주제어 추출을 위한 의미사전의 동적 확장)

  • Choo, Kyo-Nam;Woo, Yo-Seob
    • Journal of IKEEE
    • /
    • v.13 no.2
    • /
    • pp.241-247
    • /
    • 2009
  • This paper suggests the expansion methods of semantic dictionary, taking Korean semantic features account. These methods will be used to extract a practical topic word in the automatic summarization. The first is the method which is constructed the synonym dictionary for improving the performance of semantic-marker analysis. The second is the method which is extracted the probabilistic information from the subcategorization dictionary for resolving the syntactic and semantic ambiguity. The third is the method which is predicted the subcategorization patterns of the unregistered predicate, for the resolution of an affix-derived predicate.

  • PDF

Lexicon of Semantic-Polarity of Korean Adjectives for the Classification of On-line Opinion Documents (온라인 오피니언 문서 분류를 위한 한국어 형용사 의미 극성 사전)

  • Ahn, Ae-Lim;Shim, Seung-Hye;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.166-171
    • /
    • 2010
  • 본 논문은 한국어 온라인 리뷰 문서의 오피니언 분류(Opinion Classification)에 있어 그 핵심 키워드가 형용사 (Adjective) 범주라는 점을 고려하여, 한국어 형용사를 <문맥에 의존하지 않는 절대 극성>과, <문맥에 의존하여 극성이 바뀌는 상대극성>으로 대분류한 뒤 그 각각의 의미 극성을 하위 분류하는 작업을 수행하였다. 기존의 연구에서 특징적인 오피니언 어휘 수십개에 의존하여 자동 분류를 시도하고자 하였던 문제점을 극복하기 위해서는 한국어 형용사 전체 범주에 대한 체계적인 극성 분류가 이루어져야 할 필요가 있으며, 여기서 특히 상세히 주목받지 못했던 상대 극성 어휘에 대한 본격적인 의미 분류가 요구된다. 본 연구에서 제시하는 형용사의 극성 분류는 기존의 이론 언어학적 형용사 의미 분류와 달리 온라인 오피니언 문서에서 도메인에 따라 나타나는 특징적 의미 유형을 결정하고, 이를 기준으로 온라인 오피니언 문서의 극성 판별에 효과적으로 적용할 수 있는 사전을 구축하였다는 점에서 의의를 가진다.

  • PDF