• 제목/요약/키워드: Meaning of Word

검색결과 483건 처리시간 0.023초

영어 동사의 의미적 유사도와 논항 선택 사이의 연관성 : ICE-GB와 WordNet을 이용한 통계적 검증 (The Strength of the Relationship between Semantic Similarity and the Subcategorization Frames of the English Verbs: a Stochastic Test based on the ICE-GB and WordNet)

  • 송상헌;최재웅
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권1호
    • /
    • pp.113-144
    • /
    • 2010
  • The primary goal of this paper is to find a feasible way to answer the question: Does the similarity in meaning between verbs relate to the similarity in their subcategorization? In order to answer this question in a rather concrete way on the basis of a large set of English verbs, this study made use of various language resources, tools, and statistical methodologies. We first compiled a list of 678 verbs that were selected from the most and second most frequent word lists from the Colins Cobuild English Dictionary, which also appeared in WordNet 3.0. We calculated similarity measures between all the pairs of the words based on the 'jcn' algorithm (Jiang and Conrath, 1997) implemented in the WordNet::Similarity module (Pedersen, Patwardhan, and Michelizzi, 2004). The clustering process followed, first building similarity matrices out of the similarity measure values, next drawing dendrograms on the basis of the matricies, then finally getting 177 meaningful clusters (covering 437 verbs) that passed a certain level set by z-score. The subcategorization frames and their frequency values were taken from the ICE-GB. In order to calculate the Selectional Preference Strength (SPS) of the relationship between a verb and its subcategorizations, we relied on the Kullback-Leibler Divergence model (Resnik, 1996). The SPS values of the verbs in the same cluster were compared with each other, which served to give the statistical values that indicate how much the SPS values overlap between the subcategorization frames of the verbs. Our final analysis shows that the degree of overlap, or the relationship between semantic similarity and the subcategorization frames of the verbs in English, is equally spread out from the 'very strongly related' to the 'very weakly related'. Some semantically similar verbs share a lot in terms of their subcategorization frames, and some others indicate an average degree of strength in the relationship, while the others, though still semantically similar, tend to share little in their subcategorization frames.

  • PDF

《영추(靈樞)·경근(經筋)》에서 근(筋)의 해부학적 의미에 대한 연구 (Study on the Anatomical Meaning of 'Geun(筋)' in 『Yeongchu·Gyeonggeun(靈樞·經筋)』)

  • 김민식;송종근;김창건;김소림;이은용
    • 대한한의학회지
    • /
    • 제43권1호
    • /
    • pp.42-59
    • /
    • 2022
  • Objectives: This study was done to establish the anatomical meaning of the term 'Geun(筋)'. Methods: Through analysis of 《HwangJeNaeGyeong(黃帝內經)》, the meaning of 'Geun(筋)', 'GeunMag(筋膜)', 'Yug(肉)', and 'Gi(肌)' were established. Based on analysis, the anatomical meaning of the 'Meridian-muscle(經筋)' was studied by comparing it with anatomy. Results & Conclusions: 'Gyeong(經)' is recognized as a metaphysical expression and "Geun(筋)" means myofascia in anatomy. The concept of 'Geun(筋)' includes the epimysium and perimysium, as well as tendons and ligaments, which are extensions of these. 'Fascia', refers to the fascia of the whole body, and also appertain to 'Geun(筋)'. 'Yug(肉)' means endomysium, muscle fiber, and adipose tissue and layer. The word 'GeunMag(筋膜)' used in the 《HwangJeNaeGyeong(黃帝內經)》 means anatomically a 'tendon'. Therefore, 'Muscle' should be translated as 'GeunYug(筋肉)' in Traditional medicine. 'Meridian-muscle(經筋)' can be defined as the longitudinal muscle and fascia system, which is the basis of whole body encompassing dynamics.

제품 관여수준과 인터넷 구전메시지 유형이 소비자 커뮤니케이션에 미치는 영향 -FCB 모델에 따른 제품과 인터넷 쇼핑몰의 구매 댓글을 중심으로- (Effect That Type Gets in Consumer Communication : Product Participation Level and Internet Word-of-mouth -Laying stress on purchase review of product and Internet shopping mall by FCB Model-)

  • 진홍근;이은주
    • 경영과정보연구
    • /
    • 제22권
    • /
    • pp.85-115
    • /
    • 2007
  • Following is discovered in this study by some. First, attribute(product/non- product) of that truth that get through experiment of this study is WOM deduced result that have statistical meaning in dependent variable which is public trust only in this study. Specially, information by word of mouth type received High positive response more with non-product information by word of mouth attribute than the product attribute in all experiment products that is parted according to involvement. Consumer's response by involvement level of product can affect for site attitude, public trust, and intention to purchase by second. For example, consumer's site attitude has induced the most positive response, and can confirm positive response of High consumer most in that involvement sensitivity product in that participation reason type product and could confirm response that is the most positive in that involvement reason product even if there is for intention to purchase. Result of this study is grasped that have High mean value relatively in site attitude, product attitude, information by word of mouth effect, public trust, brand attitude, purchase intention etc. generally that product involvement and information by word of mouth attribute are interrelation by third. This can change fairly data processing process according to consumer's Involvement Level, behavior deterministic process, consumer's action with attitude formation process, and involvement for products. High occasion than is low incline more efforts in information retrieval and is discreet result such as study finding of produce.

  • PDF

단어와 문장의 의미를 고려한 비속어 판별 방법 (Swearword Detection Method Considering Meaning of Words and Sentences)

  • 이명호;임명진;신주현
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.98-106
    • /
    • 2020
  • 현재 인터넷 사용자가 증가하면서 비속어 사용이 무분별하게 증가하고 있다. 이에 따른 청소년들의 사이버폭력도 매우 심각하게 증가하고 있으며 그중에서도 사이버 언어폭력이 가장 심각하게 대두되고 있다. 사이버 언어폭력을 근절하기 위해 비속어 판별 연구가 계속 진행되고 있으나 단어의 의미와 문맥의 흐름을 보고 비속어를 판별하는 방법은 정확도가 미흡한 실정이다. 따라서 본 논문에서는 고의로 변형한 비속어와 비속어로 잘못 판별된 표준어를 문맥의 흐름을 보고 정확하게 판별할 수 있도록 FastText 모델과 LSTM 모델을 활용하여 비속어를 판별하는 방법을 제안한다.

한글 문장의 자동 띄어쓰기를 위한 두 가지 통계적 모델 (Two Statistical Models for Automatic Word Spacing of Korean Sentences)

  • 이도길;이상주;임희석;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.358-371
    • /
    • 2003
  • 자동 띄어쓰기는 문장 내에서 잘못 띄어쓴 어절들을 올바르게 복원하는 과정으로서, 독자에게 글의 가독성을 높이고 문장의 뜻을 정확히 전달하기 위해 매우 중요하다. 기존의 통계 기반 자동 띄어쓰기 접근 방법들은 이전 띄어쓰기 상태를 고려하지 않기 때문에 잘못된 확률 정보에 의한 띄어쓰기를 할 수밖에 없었다. 본 논문에서는 기존의 통계 기반 접근 방법 의 문제점을 해결할 수 있는 두 가지 통계적 띄어쓰기 모델을 제안한다. 제안하는 모델은 자동 띄어쓰기를 품사 부착과 같은 분류 문제(classification problem)로 간주할 수 있다는 착안에 기반하며, 은닉 마르코프 모델을 일반화함으로써 확장된 문맥을 고려할 수 있고 보다 정확한 확률을 추정할 수 있도록 고안되었다. 제안하는 모델과 지금까지 가장 좋은 성능을 보이는 기존의 방법을 비교하기 위해 여러 가지 실험 조건에 따른 다양한 실험을 수행하였고, 오류에 대한 자세한 분석을 제시하고 있다 제안하는 모델을 복합 명사를 고려하는 평가 방식에 적응한 실험 결과, 98.33%의 음절 단위 정확도와 93.06%외 어절단위 정확률을 얻었다.

형태상의 공간과 의미 (Formal space and meaning)

  • 권경원
    • 영어어문교육
    • /
    • 제6호
    • /
    • pp.89-111
    • /
    • 2000
  • Since speaking is correlated with time and time is metaphorically conceptualized in terms of space, it is natural for us to conceptualize language metaphorically in terms of space. For example, we think that the future is in front and the past is behind. Reddy(1979) suggested in his conduit metaphor that linguistic expressions are containers. According to him, the speaker puts his ideas(objects) into words{containers)and sends them along a conduit to a hearer who takes the idea(object) out of the word(container). As a result we are able to know that the larger linguistic expressions have more meaning in it. In other words the space of a linguistic form has close relationship with meaning. Moreover we are able to see that formal distance between arguments or elements of linguistic expressions shows semantic influences between them. If two elements keep close distance, a preceeding element has a strong, direct and whole influence upon the following element. Sometimes even the results of the influence can be brought out implicitly by the formal relation between two elements. Therefore, the purpose of this paper is to show that tins difference in meaning which is due to formal distance of sentence elements can be explained by the metaphorical concept presented by Lakoff and Johnson(1980).

  • PDF

초등 1학년 발달성 난독 아동의 낱말 해독, 음운인식, 빠른 이름대기, 자소 지식 (Korean first graders' word decoding skills, phonological awareness, rapid automatized naming, and letter knowledge with/without developmental dyslexia)

  • 양유나;배소영
    • 말소리와 음성과학
    • /
    • 제10권2호
    • /
    • pp.51-60
    • /
    • 2018
  • This study aims to compare the word decoding skills, phonological awareness (PA), rapid automatized naming (RAN) skills, and letter knowledge of first graders with developmental dyslexia (DD) and those who were typically developing (TD). Eighteen children with DD and eighteen TD children, matched by nonverbal intelligence and discourse ability, participated in the study. Word decoding of Korean language-based reading assessment(Pae et al., 2015) was conducted. Phoneme-grapheme correspondent words were analyzed according to whether the word has meaning, whether the syllable has a final consonant, and the position of the grapheme in the syllable. Letter knowledge asked about the names and sounds of 12 consonants and 6 vowels. The children's PA of word, syllable, body-coda, and phoneme blending was tested. Object and letter RAN was measured in seconds. The decoding difficulty of non-words was more noticeable in the DD group than in the TD one. The TD children read the syllable initial and syllable final position with 99% correctness. Children with DD read with 80% and 82% correctness, respectively. In addition, the DD group had more difficulty in decoding words with two patchims when compared with the TD one. The DD group read only 57% of words with two patchims correctly, while the TD one read 91% correctly. There were significant differences in body-coda PA, phoneme level PA, letter RAN, object RAN, and letter-sound knowledge between the two groups. This study confirms the existence of Korean developmental dyslexics, and the urgent need for the inclusion of a Korean-specific phonics approach in the education system.

의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상 (Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity)

  • 윤희근;최수정;박성배
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.653-661
    • /
    • 2016
  • 기존의 패턴기반 트리플 생성 시스템은 distant supervision의 가정으로 인해 오류 패턴을 생성하여 트리플 생성 시스템의 성능을 저하시키는 문제점이 있다. 이 문제점을 해결하기 위해 본 논문에서는 패턴과 프로퍼티 사이의 의미 유사도 기반의 패턴 신뢰도를 측정하여 오류 패턴을 제거하는 방법을 제안한다. 의미 유사도 측정은 비지도 학습 방법인 워드임베딩과 워드넷 기반의 어휘 의미 유사도 측정 방법을 결합하여 사용한다. 또한 한국어 패턴과 영어 프로퍼티 사이의 언어 및 어휘 불일치 문제를 해결하기 위해 정준 상관 분석과 사전 기반의 번역을 사용한다. 실험 결과에 따르면 제안한 의미 유사도 기반의 패턴 신뢰도 측정 방법이 기존의 방법보다 10% 높은 정확률의 트리플 집합을 생성하여, 트리플 생성 성능 향상을 증명하였다.

한글 워드임베딩과 아프리오리를 이용한 검색 시스템의 질의어 확장 (Query Extension of Retrieve System Using Hangul Word Embedding and Apriori)

  • 신동하;김창복
    • 한국항행학회논문지
    • /
    • 제20권6호
    • /
    • pp.617-624
    • /
    • 2016
  • 한글 워드임베딩은 명사 추출과정을 거치지 않으면, 학습에 필요하지 않은 단어까지 학습하게 되어 효율적인 임베딩 결과를 도출할 수 없다. 본 연구는 한글 워드임베딩, 아프리오리, 텍스트 마이닝을 이용하여, 특정 도메인에서 질의어 확장에 의해 보다 효율적으로 답변을 검색할 수 있는 모델을 제안하였다. 워드임베딩과 아프리오리는 질의어에 대해서 의미와 맥락에 따라 연관 단어를 추출하여, 질의어를 확장하는 단계이다. 한글 텍스트 마이닝은 명사 추출, TF-IDF, 코사인 유사도를 이용하여, 유사답변 추출과 사용자에게 답변하는 단계이다. 제안모델은 특정 도메인의 답변을 학습하고, 연관성 높은 질의어를 확장함으로서 답변의 정확성을 높일 수 있다. 향후 연구과제로서, 데이터베이스에 저장된 사용자 질의를 분석하고, 보다 연관성 높은 질의어를 추출하는 연구가 필요하다.

단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류 (Document Classification using Recurrent Neural Network with Word Sense and Contexts)

  • 주종민;김남훈;양형정;박혁로
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권7호
    • /
    • pp.259-266
    • /
    • 2018
  • 본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을 추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가 빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.