• 제목/요약/키워드: Word order

검색결과 1,011건 처리시간 0.026초

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

CPC 환경을 위한 Product 온톨로지 기반 의미 공유 접근법 (An Approach to Semantic Mapping using Product Ontology for CPC Environment)

  • 김경영;서효원
    • 한국CDE학회논문집
    • /
    • 제9권3호
    • /
    • pp.192-202
    • /
    • 2004
  • This paper introduces an approach to semantic mapping using Product ontology for CPC environment. In CPC environment, it is necessary that the participants in a product life cycle should share the same understanding about the semantic of product terms. For example, they should know that although 'COMPONENT' and 'ITEM' are different word-expressions, they could have the same meaning. In order to handle such terms in the information system, it is desirable that the system automatically recognizes that the terms have the same semantics. Serving this purpose, we described an ontology design methodology using first order logic, knowledge interchange format, and knowledge engineering process. In our approach, we investigated domain knowledge of the Bill Of Material, and then designed Product ontology of it. Based on the ontology, we described syntactic translation, semantic translation, and semantic mapping procedure with an example.

호가창(Limit Order Book)과 뉴스 헤드라인을 이용한 딥러닝 기반 주가 변동 예측 (Deep Learning-based Stock Price Prediction Using Limit Order Books and News Headlines)

  • 류의림;김채현;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.541-544
    • /
    • 2021
  • 본 논문은 어떤 기업의 주식 주문 정보를 담고 있는 호가창(limit order book)과 해당 기업과 관련된 뉴스 헤드라인을 사용하여 해당 기업의 주가 등락을 예측하는 딥러닝 기반 모델을 제안한다. 제안 모델은 호가창의 중기 변화와 단기 변화를 모두 고려하는 한편, 동기간 발생한 뉴스 헤드라인까지 예측에 고려함으로써 주가 등락 예측 정확도를 높인다. 제안 모델은 호가창의 변화의 특징을 CNN(convolutional neural network)으로 추출하고 뉴스 헤드라인을 Word2vec으로 생성된 단어 임베딩 벡터를 사용하여 나타낸 뒤, 이들 정보를 결합하여 특정 기업 주식의 다음 날 등락여부를 예측한다. NASDAQ 실데이터를 사용한 실험을 통해 제안 모델로 5개 종목(Amazon, Apple, Facebook, Google, Tesla)의 일일 주가 등락을 예측한 결과, 제안 모델은 기존 방법에 비해 정확도를 최대 17.14%, 평균 10.7% 향상시켰다.

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템 (The Online Game Coined Profanity Filtering System by using Semi-Global Alignment)

  • 윤태진;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.113-120
    • /
    • 2009
  • 온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.

워드넷 의미정보로 선별된 우선 태그와 이를 이용한 웹 이미지의 검색 (Web Image Retrieval using Prior Tags based on WordNet Semantic Information)

  • 권대현;홍준혁;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제12권7호
    • /
    • pp.1032-1042
    • /
    • 2009
  • 본 연구는 태깅된 웹 이미지의 검색에서 태그들의 의미정보를 미리 추출하여 검색 시에 이용하고자 하는 것이다. 일반적으로 웹 이미지의 태그들은 사용자들에 의해 순서 구분 없이 무작위로 매겨지며 많게는 그 수가 100여개에 이른다. 본 논문에서는 이 태그들 간에 의미정보가 많이 공유된 것일수록 해당 이미지를 설명하는 중요 태그가 될 것임에 착안하여 이미지와 태그 정보가 업 로드되는 시점에 중요도에 따른 우선 태그를 결정하고 이를 검색에 활용하는 방법을 소개한다 제안된 방법은 워드넷에 기반하여 태그의 연관성점수를 계산하고 이를 이용하여 다단계 검색으로 태징된 웹 이미지를 검색한다. 평가를 위하여 제안된 방법으로 검색된 결과와 검색어와 태그의 단순 비교방식인 기존의 검색을 비교하였으며 실험 결과, 정확도와 재현율에서 본 시스템의 우수함을 확인할 수 있었다.

  • PDF

대학생의 영어 리듬과 억양구조 인식에 대한 연구 (A Study on the Perception of English Rhythm and Intonation Structure by Korea University Students)

  • 박주현
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1997년도 7월 학술대회지
    • /
    • pp.92-114
    • /
    • 1997
  • This study is aimed to grasp the actual problems of the perception of English rhythm and intonation structure by Korean University students who have studied English in the secondary schools for the past six years, and to establish the systems of English rhythm and intonation structure for the Korean students of English. For this study, the listening test is provided, and 100 students are chosen as the subjects of the study. The noticeable findings are summarized as follows: (1) Koreans perceive the words stress comparatively well in nonsense words, unfamiliar place names, and familiar word. (2) Koreans do not perceive the isochrony of English rhythm well enough. The perception of the sentence stress is very unstable, especially in the sentence involved in polysyllabic words, compound words, and 'emphatic stress' pr 'contrastive stress'(or in the different rhythmic patterns). (3) Koreans do not perceive the nucleus well enough. The perception of the nucleus is more stable in content words than in function words, at the end of a sentence than in the middle of a sentence, and in monosyllabic words than in the polysyllabic words. (4) Koreans do not perceive the boundary(or pause) of intonation group well enough. The perception of the pause is unstable in the long or complex sentence. (5) Koreans discriminate the meaning of English word stress comparatively well, especially in disyllabic words. But the discrimination is somewhat unstable in polysyllabic words and between 'adjective' and 'verb' (6) Koreans' discrimination of the intonation meaning is below the level. Koreans do not perceive the differences of intonation meaning according to the pitch accent or the focus. In conclusion, the writer will propose the procedures for the teaching of rhythm and intonation in the following order: word stress drill longrightarrowstressed and reduced syllables drilllongrightarrowrhythm group drilllongrightarrowthe varying rhythm drilllongrightarrowsentence stress drilllongrightarrownucleus drill longrightarrowintonation group drilllongrightarrowlong utterance drill of more than two intonation group.

  • PDF

한국어 방송 음성 인식에 관한 연구 (A Study on the Korean Broadcasting Speech Recognition)

  • 김석동;송도선;이행세
    • 한국음향학회지
    • /
    • 제18권1호
    • /
    • pp.53-60
    • /
    • 1999
  • 이 논문은 한국 방송 음성 인식에 관한 연구이다. 여기서 우리는 대규모 어휘를 갖는 연속 음성 인식을 위한 방법을 제시한다. 주요 관점은 언어 모델과 탐색 방법이다. 사용된 음성 모델은 기본음소 Semi-continuous HMM이고 언어 모델은 N-gram 방법이다. 탐색 방법은 음성과 언어 정보를 최대한 활용하기 위해 3단계의 방법을 사용하였다. 첫째로, 단어의 끝 부분과 그에 관련된 정보를 만들기 위한 순방향 Viterbi Beam탐색을 하였으며, 둘째로 단어 의 시작 부분과 그에 관련된 정보를 만드는 역방향 Viterbi Beam탐색, 그리고 마지막으로 이들 두 결과와 확률적인 언어 모델을 결합하여 최종 인식결과를 얻기 위해 A/sup */ 탐색을 한다. 이 방법을 사용하여 12,000개의 단어에 대한 화자 독립으로 최고 96.0%의 단어 인식률과 99.2%의 음절 인식률을 얻었다.

  • PDF

Localization of Broca's Area Using Functional MR Imaging: Quantitative Evaluation of Paradigms

  • Kim, Chi-Heon;Kim, Jae-Hun;Chung, Chun-Kee;Kim, June-Sic;Lee, Jong-Min;Lee, Sang-Kun
    • Journal of Korean Neurosurgical Society
    • /
    • 제45권4호
    • /
    • pp.219-223
    • /
    • 2009
  • Objective : Functional magnetic resonance imaging (fMRI) is frequently used to localize language areas in a non-invasive manner. Various paradigms for presurgical localization of language areas have been developed, but a systematic quantitative evaluation of the efficiency of those paradigms has not been performed. In the present study, the authors analyzed different language paradigms to see which paradigm is most efficient in localizing frontal language areas. Methods : Five men and five women with no neurological deficits participated (mean age, 24 years) in this study. All volunteers were right-handed. Each subject performed 4 tasks, including fixation (Fix), sentence reading (SRI. pseudoword reading (PR), and word generation (WG). Fixation and pseudoword reading were used as contrasts. The functional area was defined as the area(s) with a t-value of more than 3.92 in fMRI with different tasks. To apply an anatomical constraint, we used a brain atlas mapping system, which is available in AFNI, to define the anatomical frontal language area. The numbers of voxels in overlapped area between anatomical and functional area were individually counted in the frontal expressive language area. Results : Of the various combinations, the word generation task was most effective in delineating the frontal expressive language area when fixation was used as a contrast (p<0.05). The sensitivity of this test for localizing Broca's area was 81 % and specificity was 70%. Conclusion : Word generation versus fixation could effectively and reliably delineate the frontal language area. A customized effective paradigm should be analyzed in order to evaluate various language functions.

온라인 서비스품질에 대한 자신의 인지적 평가와 타인의 구전효과가 고객만족도와 재방문의도에 미치는 영향 - 패밀리 레스토랑 웹사이트를 대상으로 (The Effect of Perceived e-Service Quality and Other-Word of Mouth on Customer Satisfaction and Revisit Intention - In a Family Restaurant Website)

  • 문윤지
    • 한국산학기술학회논문지
    • /
    • 제14권5호
    • /
    • pp.2157-2167
    • /
    • 2013
  • 본 연구의 목적은 온라인 패밀리 레스토랑 웹사이트 상에서 웹사이트가 제공하는 서비스품질에 대해 사용자 자신이 인지하는 서비스품질 평가와, 자신이 아닌 타인 사용자의 평가에 기반을 둔 구전효과의 영향효과가 고객만족도 및 웹사이트에 대한 재방문의도에 미치는 영향을 분석하고자 하는 것이다. 서비스품질, 구전효과, 고객만족도, 그리고 재방문의도의 4가지 구성개념을 기반으로 연구모형이 제시되었으며, 연구모형은 수도권 3개 대학의 175명의 대학생 설문지를 대상으로 구조방정식을 이용하여 검증 하였다. 검증결과, 서비스품질은 고객만족도에 유의적인 영향을 미쳤으나, 구전효과는 서비스품질과 고객만족도 간 관계에서 완전매개효과가 있음이 나타났다. 또한 고객만족도와 재방문 의도 간 관계는 유의한 것으로 드러났다. 결론적으로 패밀리 레스토랑 업체는 웹사이트를 고객관계관리의 효과적인 수단으로 활용하기 위해서 서비스품질요인과 더불어 온라인 구전효과와 같은 사회적 영향 효과를 함께 관리하는 노력이 필요할 것이다.

CERAD-K의 단어목록기억검사를 통해 알아본 알츠하이머형 치매, 혈관성 치매, 노년기 우울, 정상 집단의 계열위치효과 비교 연구 (Comparison of the Serial Position Effect in Alzheimer's Disease, Vascular Dementia, Elderly Depression, and in Normal Group: Using the CERAD-K's Word List Memory Test)

  • 박정란;이석범
    • 동의신경정신과학회지
    • /
    • 제28권4호
    • /
    • pp.401-408
    • /
    • 2017
  • Objectives: The purpose of this study is to obtain the differential variable and learning effect of the serial position effect, targeting individuals aged 60 years and over. A total of 89 individuals were categorized into the following groups: Alzheimer's group, vascular dementia group, elderly depression group, and normal group. Methods: Considering the size of the groups used for comparison, of the total 89 participants, 28 were in the Alzheimer's group, 24 in the vascular dementia group, 16 in the elderly depression group, and 21 were randomly chosen for the normal group. In the CERAD-K word list memory test, 10 words were shown to the subjects. We then asked them to freely recall the words. After changing the order of the words three times, the same process was followed. Results: First, a significant difference was observed among the groups in terms of word recalling rate. The analysis conducted afterward showed that, as predicted, the depressed group showed significantly better performance in recalling the words. Second, the vascular dementia patients and the Alzheimer's patients showed, as predicted, better recall of the largest recency region of words shown. Third, the normal group and the elderly depressed group showed a high-performance rate, proving that the reiterative method can contribute to the recalling process. Thus, we demonstrated that the Alzheimer's group showed the deterioration of short memory recalling skills and the elderly depressed showed deteriorated output performance skill.