• 제목/요약/키워드: word selection

검색결과 172건 처리시간 0.027초

단어재인에 있어서 처리단위의 적응적 변화 (Adaptive Changes in the Grain-size of Word Recognition)

  • Lee, Chang H.
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.111-116
    • /
    • 2002
  • The regularity effect for printed word recognition and naming depends on ambiguities between single letters (small grain-size) and their phonemic values. As a given word is repeated and becomes more familiar, letter-aggregate size (grain-size) is predicted to increase, thereby decreasing the ambiguity between spelling pattern and phonological representation and, therefore, decreasing the regularity effect. Lexical decision and naming tasks studied the effect of repetition on the regularity effect for words. The familiarity of a word from was manipulated by presenting low and high frequency words as well as by presenting half the stimuli in mixed upper- and lowercase letters (an unfamiliar form) and half in uniform case. In lexical decision, the regularity effect was initially strong for low frequency words but became null after two presentations; in naming it was also initially strong but was merely reduced (although still substantial) after three repetitions. Mixed case words were recognized and named more slowly and tended to show stronger regularity effects. The results were consistent with the primary hypothesis that familiar word forms are read faster because they are processed at a larger grain-size, which requires fewer operations to achieve lexical selection. Results are discussed in terms of a neurobiological model of word recognition based on brain imaging studies.

  • PDF

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

Automatic Sense Disambiguation for Target Word Selection

  • Kim, Kwon-Yang;Park, Se-Young;Lee, Sang-Jo
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 1995년도 Language, Information and Computation = Proceedings of the 10th Pacific Asia Conference, Hong Kong
    • /
    • pp.109-114
    • /
    • 1995
  • PDF

모바일 게임에서 휴리스틱 유형이 구전속성 및 행동의도에 미치는 영향 - 구전속성을 매개변인으로 - (Influence that Heuristic Type has on Word of Mouth and Behavioral Intention in Mobile Game - Word of Mouth as a Mediator -)

  • 김종무
    • 디지털융복합연구
    • /
    • 제16권8호
    • /
    • pp.269-278
    • /
    • 2018
  • 본 연구는 이용자의 선택에 영향을 미치는 휴리스틱 유형이 구전속성에 미치는 영향과 구전속성이 이용자의 행동의도에 미치는 영향 및 구전속성이 휴리스틱 유형과 행동의도 간에 매개 역할을 할 것인지를 알아보고자, 모바일 게임을 이용하는 102명의 결과를 분석 하였다. 첫째, 휴리스틱(대표성, 조정) 유형은 구전속성(호의성, 신뢰성, 설득성)에 정(+)의 영향력을 갖는 것으로 나타났다. 둘째, 신뢰성 구전속성은 행동의도에 유의한 영향력을 갖는 것으로 나타났으나, 호의성과 설득성 구전속성은 행동의도에 유의한 영향력을 갖지 않는 것으로 나타났다. 셋째, 휴리스틱(대표성, 조정) 유형은 행동의도에 유의한 영향력을 갖는 것으로 나타났다. 넷째, 신뢰성 구전속성만이 조정 휴리스틱 유형과 행동의도 관계에서 매개역할을 하는 것으로 나타났다. 본 연구 결과는 모바일 게임 시장에서 이용자들이 게임을 선택하는 행동의도를 이해하는데 도움을 제공해 줄 수 있을 것이다.

말소리 산출에서 단어빈도효과의 위치 (The Locus of the Word Frequency Effect in Speech Production)

  • 구민모;남기춘
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.99-108
    • /
    • 2006
  • Three experiments were conducted to determine the exact locus of the frequency effect in speech production. In Experiment 1. a picture naming task was used to replicate whether the word frequency effect is due to the processes involved in lexical access or not. The robust word frequency effect of 31ms was obtained. The question to be addressed in Experiment 2 is whether the word frequency effect is originated from the level where a lemma is selected. To the end, using a picture-word interference task, the significance of interactions between the effects of target frequency, distractor frequency and semantic relatedness were tested. Interaction between the distractor frequency and semantic relatedness variables was significant. And interaction between the target and distractor frequency variables showed a significant tendency. In addition, the results of Experiment 2 suggest that the mechanism underlying the word frequency effect is encoded as different resting activation level of lemmas. Experiment 3 explored whether the word frequency effect is attributed to the lexeme level where phonological information of words is represented or not. A methodological logic applied to Experiment 3 was the same as to Experiment 2. Any interaction was not significant. In conclusion, the present study obtained the evidence supporting two assumptions: (a) the locus of the word frequency effect exists in the processes involved in lemma selection, (b) the mechanism for the word frequency effect is encoded as different resting activation level of lemmas. In order to explain the word frequency effect obtained in this study, the core assumptions of current production models need to be modified.

  • PDF

질문대답 아카이브에서 어휘 연관성을 이용한 질문 분류 (Question Classification Based on Word Association for Question and Answer Archives)

  • 김설영;이경순
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.327-332
    • /
    • 2010
  • 보통 두 세 개의 어휘로 구성된 질문 분류에서 어휘의 다양한 표현으로 인한 어휘 불일치문제는 성능 저하의 주요 원인이다. 따라서 질문 분류에서 어휘 사이의 연관성을 반영하는 것이 필수적이다. 본 논문에서는 같은 범주의 질문-질문 쌍들에 대해 계산한 어휘 번역확률을 번역기반 언어모델에 반영하여 질문을 분류하는 방법을 제안한다. 실험에서 야후!앤써 질문대답 아카이브를 이용해서 전체 질문-대답 쌍들에 대해서 번역확률을 계산하는 것보다 같은 범주에 속하는 질문-질문 쌍들에 대해서 번역확률을 계산하는 것이 질문 분류에서 더 좋은 번역확률인 것을 증명한다.

문서의 불균등 분포를 고려한 단어 불순도 기반 특징 선택 방법 (An Enhanced Feature Selection Method Based on the Impurity of Words Considering Unbalanced Distribution of Documents)

  • 강진범;양재영;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.804-816
    • /
    • 2007
  • 기계 학습 과정에서 수집된 많은 정보들 중에는 학습하고자 하는 개념과 관련이 없거나 중복된 정보를 가진 경우가 많다. 또한 자료 자체에 오류가 있기도 하다. 이와 같이 학습 모델 생성을 위해 수집된 정보를 신뢰할 수 없다면, 학습 과정에서도 정확한 지식 습득이 어렵다. 그래서 기계 학습은 학습 과정에서 정확한 지식 습득을 위해 특징 선택 방법을 사용한다. 특징 선택은 학습할 클래스와 관련이 없거나 중복된 정보를 학습 모델 생성 이전에 제거함으로써 학습 알고리즘의 성능을 향상시킨다. 기존의 특징선택 방법들은 적절한 특징을 선택하기 위하여 문서가 균등하게 분포되어 있다고 가정한다. 하지만, 실제로는 그렇지 않으며, 문서의 수 또는 문서의 길이가 모두 동일한 학습 예제를 준비하는 것도 매우 어렵다. 본 논문에서는 보다 효율적으로 특징을 선택하기 위해 클래스 별 단어의 불순도와 문서의 불균등 분포를 고려한 특징 선택 방법을 제안한다. 클래스를 대표할 수 있는 특징 후보들을 단어의 불순도 측정을 통해 얻고, 문서의 불균등 분포를 고려하여 특징을 선택한다. 실험을 통해 보다 좋은 성능을 보임을 입증한다.

노인요양병원 선택요인이 환자만족도와 재이용 및 구전의도에 미치는 영향 (Effects of Selection Factors of Hospitals for the Elderly upon Satisfaction of Patients and their Intent of Revisit and Information by Word of Mouth)

  • 권진
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.301-311
    • /
    • 2011
  • 이 연구는 노인요양병원의 선택요인이 환자만족도와 재이용 및 구전의도에 영향을 미치는 인과적 관계를 파악하고자 시도하였다. 이를 위해 서울 경기지역의 5개 노인요양병원 입원환자를 대상으로 2009년 8월 1일부터 9월 30일까지 설문조사를 실시하였으며 총 472부를 최종 연구자료로 활용하였다. 연구결과, 첫째, 노인요양병원에 대한 환자만족도에는 직원친절, 시설환경, 행정서비스에 대한 기대가 유의한 정(+)의 영향을 미치는 것으로 분석되었다. 둘째, 노인요양병원의 재이용의도와 구전의도에는 의료서비스 신뢰와 행정서비스에 대한 만족이 유의한 정(+)의 영향을 미치는 것으로 분석되었다. 셋째, 재이용의도는 구전의도에 유의한 정(+)의 영향을 미치는 것으로 분석되었다. 따라서 노인의 병원 선택동기 및 선택성향을 이해하고, 환자만족도를 제고하기 위한 노력과 환자 지향적인 서비스정신의 함양이 뒷받침 되어야 한다. 또한 의료진과 진료효과, 의료시설에 대한 신뢰성을 확보하기 위한 노력이 요구되며, 가격경쟁력을 견지한 새로운 마케팅 전략을 수립하기 위해 노력해야 할 것이다.

한국어 Word2vec 모델을 위한 최적의 형태소 분석기 선정 (Selection of the Optimal Morphological Analyzer for a Korean Word2vec Model)

  • 강형석;양장훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.376-379
    • /
    • 2018
  • 본 논문의 목적은 오픈 소스로 공개된 3가지 한국어 형태소 분석기 (kkma, twitter 및 mecab-ko)를 비교해서 한국어 자연어 처리에 가장 적합한 분석기를 선정하는 것이다. 이를 위해, 자연어 처리 분야에서 중요한 단어 임베딩 방법론 중 하나인 word2vec 모델의 성능 검증 방법을 사용해서 각 형태소 분석기의 성능을 정량적으로 비교했다. 그 결과 mecab-ko 형태소 분석기가 최적임이 확인되었다. 단 성능 검증에 사용된 어휘가 오직 명사뿐이라는 한계가 있으므로, 향후 연구에서는 좀 더 다양한 품사에 대한 성능검증이 필요할 것으로 보인다.

Linguistic Characteristics of Domestic Men's Formal Wear Brand Names

  • Kwon, Hae-Sook
    • 패션비즈니스
    • /
    • 제14권6호
    • /
    • pp.11-22
    • /
    • 2010
  • The main purpose of this research was to examine the linguistic characteristics of domestic men's formal wear brand name. Four linguistic characteristics of language type, combined structure type of language, word class, length of brand name were investigated in this research and also examined the difference between brand type. For sample selection, the 209 men's fashion brands were selected from '2009 Korea Fashion Yearbook' and then, 25 brands which could not collect proper informations about the brand name or naming were excluded. Among total 184 men's brand names, 66 men's formal wear brands were selected and studied. For data analysis, quantitative evaluation of the frequency and qualitative evaluation have been used. The result as follows.; (1) Seven language types were found in domestic men's formal wear brand names. English has been used the most, then followed by Italian and French. (2) For combined structure type of brand name language, the single word used the most, followed by separately combined word type, artificially combined word, and unified word type. (3) The most frequently used the type of word class was noun, and followed by phrase, adjective, and verb. In the noun type, 6 different types which expressed a person, concrete & abstract entity, place, acronym, and neologic were found. For phrase, only noun type was appeared, however, 6 out of 20 phrases were abbreviated type. All eight adjective brand names implied an attributive character of the brand such as 'Dainty' or 'Solus(Solo)'. (4) The long name used most and then followed by normal and short length of brand name. Looking by the number of syllable, 4 syllables appeared the most and then followed by 3, 5, 6, 2 & 7 showed the same rate, and 8 syllables. (5) The result which compared the difference according to each brand type showed a difference in its language type, language combined style, word class, but length of brand name.