• 제목/요약/키워드: Corpus-based Study

검색결과 204건 처리시간 0.022초

Color Recommendation for Text Based on Colors Associated with Words

  • Liba, Saki;Nakamura, Tetsuaki;Sakamoto, Maki
    • 한국산업정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.21-29
    • /
    • 2012
  • In this paper, we propose a new method to select colors representing the meaning of text contents based on the cognitive relation between words and colors, Our method is designed on the previous study revealing the existence of crucial words to estimate the colors associated with the meaning of text contents, Using the associative probability of each color with a given word and the strength of color association of the word, we estimate the probability of colors associated with a given text. The goal of this study is to propose a system to recommend the cognitively plausible colors for the meaning of the input text. To build a versatile and efficient database used by our system, two psychological experiments were conducted by using news site articles. In experiment 1, we collected 498 words which were chosen by the participants as having the strong association with color. Subsequently, we investigated which color was associated with each word in experiment 2. In addition to those data, we employed the estimated values of the strength of color association and the colors associated with the words included in a very large corpus of newspapers (approximately 130,000 words) based on the similarity between the words obtained by Latent Semantic Analysis (LSA). Therefore our method allows us to select colors for a large variety of words or sentences. Finally, we verified that our system cognitively succeeded in proposing the colors associated with the meaning of the input text, comparing the correct colors answered by participants with the estimated colors by our method. Our system is expected to be of use in various types of situations such as the data visualization, the information retrieval, the art or web pages design, and so on.

CHILDES 코퍼스를 기반으로 한 아동의 영어 굴절형태소 발달 연구 (A Study on the Development of English Inflectional Morphemes Based on the CHILDES Corpus)

  • 민명숙;전종섭;이선영
    • 인지과학
    • /
    • 제24권3호
    • /
    • pp.203-235
    • /
    • 2013
  • 본 연구의 목적은 선행 연구에서 보고된 영어 모국어 아동의 굴절형태소 습득 과정을 대규모 언어습득 데이터베이스를 활용하여 검증하는 것이다. 이를 위해, 우리는 CHILDES(Child Language Data Exchange System) 데이터베이스에 등장하는 1-7세 영국 및 미국 아동 1,630명이 발화한 470만 어절 말뭉치를 대상으로 굴절형태소의 발달 과정을 분석하였다. 본 논문에서는 동사의 현재분사 -ing, 과거형 -(e)d, 형용사의 비교/최상급 -er/est 등의 형태소에 대해 어휘 유형(Type)과 사례(Token) 빈도, 전체 사례(Token)에 대한 유형(Type) 비율인 TTR(Type per Token Ratio), 어휘 다양성 척도인 Lexical Diversity(D) 값을 구하여 이를 국가 및 연령별로 비교, 분석하였다. 그 결과, 굴절형태소별로 연령과 D 값의 상관관계가 다르게 나타났다. 특히, 현재분사 -ing와 D 값 사이에는 주목할 만한 상관관계가 나타나지 않은 반면, 과거형 -(e)d의 경우 양의 상관관계 경향성이 보였고, 비교/최상급 -er/-est는 유의미한 상관관계를 보였다. 이는 현재진행형이 과거형보다 먼저 습득된다고 보고한 Brown(1973)의 견해를 지지한다. 다음으로, 과잉일반화에 따른 오류 표현이 2-3세 사이에 많이 나타나면서 U자형 발달 양상을 보였다. 과잉일반화도 현재분사보다 과거형에서 많이 나타났는데, 이것 또한 현재분사가 과거형보다 일찍 습득된다는 주장을 지지한다. 영국과 미국 아동의 연령별 굴절형태소 사용 양상을 비교한 결과, 미국 아동의 D 값이 영국 아동보다 높았다. 이는 미국 아동이 영국 아동보다 더 많은 어휘 유형에 대해 굴절형태소를 사용했음을 의미한다. 본 연구는 소수의 아동을 대상으로 수행된 선행 연구의 다양한 논점을 대규모 데이터베이스로 검증하고, CHILDES 코퍼스를 효율적으로 분석하는 연구 방법론을 제안했다는 점에서 의의가 있다.

  • PDF

한국 신문의 영어 번역에 나타난 번역 보편소의 코퍼스 기반 분석 (A Corpus-based Study of Translation Universals in English Translations of Korean Newspaper Texts)

  • 고광윤;이영희
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.109-143
    • /
    • 2016
  • 본 연구는 번역된 텍스트들에 전형적으로 나타나는 언어적 특성들인 번역 보편소(translation universals)에 관한 코퍼스 기반 연구이다. 지금까지의 번역 보편소 연구는 언어계통상 서로 밀접한 관련이 있는 영어와 다른 유럽어 사이의 번역에 집중되어 왔으며, 다른 한편으로 주로 문학 장르의 분석에 치중되어 있다는 아쉬움을 지닌다. 본 연구에서는 관련 연구가 지닌 이러한 두 가지 주요 문제점을 보완하고자 하는 노력의 일환으로 한국어를 원문으로 하는 영어 번역 가운데 비문학 장르인 신문언어 텍스트를 분석대상으로 선택하였다. 먼저, 번역된 신문영어 텍스트와 비번역 신문영어 텍스트를 정해진 기준에 따라 수집하여 번역과 비번역 영어(translated and non-translated English)로 구성된 대응코퍼스(comparable corpora)를 구축하였다. 이렇게 구축된 대응 코퍼스를 바탕으로 기존 문헌에서 논의된 번역 보편소 가설 가운데 가장 대표적인 단순화(simplification), 명시화(explicitation), 규범화(normalization), 평준화(leveling-out) 현상이 한국어 신문의 영어 번역 텍스트에서 어떠한 양상을 보이는지 살펴봄으로써 각 가설들이 지니는 타당성을 검증해보고자 하였다. 본 연구의 분석결과를 종합해보면, 단순화와 규범화를 제외한 나머지 하위가설의 언어적 특성들은 모든 언어쌍과 모든 텍스트 장르에 걸쳐 일반화하기에 다소 한계가 있는 것으로 나타났다. 또한, 번역 보편소의 개념 규정이나 분석지표의 정교화, 그리고 결과의 일반화에는 신중한 접근이 필요할 것으로 보인다.

AI기반 콜센터 실시간 상담 도우미 시스템 개발 - N은행 콜센터 사례를 중심으로 (Development of AI-based Real Time Agent Advisor System on Call Center - Focused on N Bank Call Center)

  • 류기동;박종필;김영민;이동훈;김우제
    • 한국산학기술학회논문지
    • /
    • 제20권2호
    • /
    • pp.750-762
    • /
    • 2019
  • 기업의 대고객 접점으로써 콜센터의 중요성은 커지고 있다. 하지만, 콜센터는 상담사의 지식 부족과 업무 부적응에 따른 잦은 이직으로 인해 상담사 운영이 어렵고, 이로 인한 고객 서비스 품질 저하의 문제를 안고 있다. 이에 본 연구에서는 상담사에게 업무 지식에 대한 부하를 줄이고 서비스 품질을 향상 시키기 위해 음성 인식 기술과 자연어 처리 및 질의응답을 지원하는 AI 기술과 PBX, CTI 등의 콜센터 정보시스템을 결합하여 실시간으로 상담사에게 고객의 질의 내용에 대한 답변을 제공해주는 "실시간 상담 도우미" 시스템 개발 방안에 대해 N은행 콜센터 사례를 통해 연구하였다. 사례연구 결과, 실시간 통화 분석을 위한 음성인식 시스템의 구성방안과, 질의응답 시스템의 자연어처리 성능 향상을 위한 말뭉치 구축 방안을 확인 할 수 있었으며, 특히 개체명 인식기의 경우 도메인에 맞는 말뭉치 학습 후 정확도가 31% 향상됨을 확인하였다. 또한, 상담 도우미 시스템을 적용한 후 상담 도우미의 답변에 대한 상담사들의 긍정적 피드백 비율이 93.1%로써 충분히 상담사 업무에 도움을 주고 있음을 확인하였다.

기분석사전과 기계학습 방법을 결합한 음절 단위 한국어 품사 태깅 (Syllable-based Korean POS Tagging Based on Combining a Pre-analyzed Dictionary with Machine Learning)

  • 이충희;임준호;임수종;김현기
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.362-369
    • /
    • 2016
  • 본 논문은 음절 단위 한국어 품사 태깅 방법의 성능 개선을 위해 기분석사전과 기계학습 방법을 결합하는 방법을 제안한다. 음절 단위 품사 태깅 방법은 형태소분석을 수행하지 않고 품사 태깅만을 수행하는 방법이며, 순차적 레이블링(Sequence Labeling) 문제로 형태소 태깅 문제를 접근한다. 본 논문에서는 순차적 레이블링 기반 음절 단위 품사 태깅 방법의 전처리 단계로 품사 태깅말뭉치와 국어사전으로부터 구축된 복합명사 기분석사전과 약 1천만 어절의 세종 품사 태깅말뭉치로부터 자동 추출된 어절 사전을 적용함으로써 품사 태깅 성능을 개선시킨다. 성능 평가를 위해서 약 74만 어절의 세종 품사 태깅말 뭉치로부터 67만 어절을 학습 데이터로 사용하고 나머지 7만 4천 어절을 평가셋으로 사용하였다. 기계학습 방법만을 사용한 경우에 96.4%의 어절 정확도를 보였으며, 기분석사전을 결합한 경우에는 99.03%의 어절 정확도를 보여서 2.6%의 성능 개선을 달성하였다. 퀴즈 분야의 평가셋으로 실험한 경우에도 기계학습 엔진은 96.14% 성능을 보인 반면, 하이브리드 엔진은 97.24% 성능을 보여서 제안 방법이 다른 분야에도 효과적임을 확인하였다.

Developing and Pre-Processing a Dataset using a Rhetorical Relation to Build a Question-Answering System based on an Unsupervised Learning Approach

  • Dutta, Ashit Kumar;Wahab sait, Abdul Rahaman;Keshta, Ismail Mohamed;Elhalles, Abheer
    • International Journal of Computer Science & Network Security
    • /
    • 제21권11호
    • /
    • pp.199-206
    • /
    • 2021
  • Rhetorical relations between two text fragments are essential information and support natural language processing applications such as Question - Answering (QA) system and automatic text summarization to produce an effective outcome. Question - Answering (QA) system facilitates users to retrieve a meaningful response. There is a demand for rhetorical relation based datasets to develop such a system to interpret and respond to user requests. There are a limited number of datasets for developing an Arabic QA system. Thus, there is a lack of an effective QA system in the Arabic language. Recent research works reveal that unsupervised learning can support the QA system to reply to users queries. In this study, researchers intend to develop a rhetorical relation based dataset for implementing unsupervised learning applications. A web crawler is developed to crawl Arabic content from the web. A discourse-annotated corpus is generated using the rhetorical structural theory. A Naïve Bayes based QA system is developed to evaluate the performance of datasets. The outcome shows that the performance of the QA system is improved with proposed dataset and able to answer user queries with an appropriate response. In addition, the results on fine-grained and coarse-grained relations reveal that the dataset is highly reliable.

The Effect that the Application of Time-Based Electrolysis Has on Acute Ischemia

  • Lee, Jung Sook;Song, Young Wha;Kim, Sung Won
    • 국제물리치료학회지
    • /
    • 제6권2호
    • /
    • pp.846-851
    • /
    • 2015
  • This neurological damage accelerates the infection reaction of cells and apoptosis at the time of reperfusion after ischemia occurs. BCL-2/BCL-2 allogeneic begeminum has a function of suppressing the apoptosis of cells, and thus it is inferred that the susceptibility of cells to apoptosis is determined by the amount of allogeneic begeminum present which is determined based on the amount of BAX. Ischemia was induced in SD mice by occluding the common carotid artery for 5 minutes, after which blood was re-perfused. NEES was applied to acupuncture points, at 12, 24, and 48 hours post-ischemia on the joksamri, Hapgok. Protein expression was investigated through BAX antibody immuno-reactive cells in the cerebral nerve cells and Western blotting. The results were as follows: In the present study as well, as a result of observation of the change in the number of the BAX reaction cells after the inducement of GI, there was the aspect of most of the BAX reaction cells being observed in the corpus striatum area of the GI group 24 hours after the inducement of ischemia. This revealed the same results as those of previous studies in which the change in the number of BAX reaction cells occurred in all areas while ischemia was in progress. The change in the expression of BAX protein after 24 hours showed that there was a very significant reduction in the NEES group compared to the GI group (p<.01). As a result, a greatest amount of change in the number of BAX immunoreactive cells related to apoptosis 24 hours after ischemia appeared in the NEES group. This study that ischemia increases the expression of BAX that induces apoptosis. Thus, it is determined that ischemia is the main cause of the apoptosis of neurons, and this study reveals that low frequency needle electrode electrical stimulation has the effect of blocking the apoptosis of neurons by reducing protein related to the apoptosis of cells that has increased after ischemia has occurred.

빈도 정보를 이용한 한국어 저자 판별 (Authorship Attribution in Korean Using Frequency Profiles)

  • 한나래
    • 인지과학
    • /
    • 제20권2호
    • /
    • pp.225-241
    • /
    • 2009
  • 본고에서는 빈도 정보를 이용한 저자 판별 (authorship attribution) 기법을 한국어에 적용한 연구를 소개한다. 그 대상으로는 정형화된 장르인 신문 칼럼을, 구체적으로는 조선일보에 연재 중인 4인 칼럼니스트들의 각 40개 칼럼, 총 160개 칼럼 텍스트를 선정하였다. 이들에 대하여 어절, 음절, 형태소, 각 단위 2연쇄 등의 다양한 언어 단위들의 빈도 정보들을 이용한 저자 판별을 시도한 결과, 형태소 빈도를 기반으로 하여 최고 93%를 넘는 높은 예측 정확도를 얻을 수 있었다. 또한, 저자 개인 문체간의 거리도 빈도 정보로써 계량적 표상이 가능함을 보일 수 있었다. 이로써 빈도 분석과 같은 통계적, 계량적 방법을 통하여 한국어 텍스트에 대한 성공적인 저자 판별과 개인 문체의 정량화가 가능하다는 결론을 내릴 수 있다.

  • PDF

The Effect of NEES on the Occurrence of Caspase-3 in the Cerebellum of Rats with Transient Global Ischemia

  • Lee, Jung Sook;Song, Young Wha;Kim, Sung Won
    • 국제물리치료학회지
    • /
    • 제5권2호
    • /
    • pp.718-722
    • /
    • 2014
  • The cerebellum is known to control balance, equilibrium, and muscle tone. If the cerebellum becomes damaged, the body is unable to retain its balancing functions or involuntary muscle movement. This is why, in stroke patients, there is a high risk of functional disability, as well as a myriad of other disabilities secondary to stroke. Ischemia was induced in SD mice by occluding the common carotid artery for 5 minutes, after which blood was reperfused. Needle electrode electrical stimulation(NEES) was applied to acupuncture points, at 12, 24, and 48 hours post-ischemia on the joksamri. Protein expression was investigated through caspase-3 antibody immuno-reactive cells in the cerebral nerve cells and Western blotting. The results were as follows: The number of caspase-3 reactive cells in the corpus cerebellum 12 and 24 hours post-ischemia was significantly (p<.05) smaller in the NEES group compared to the GI group. caspase-3 expression 12 and 24 hours post-ischemia was significantly(p<.05) smaller in the NEES group compared to the GI group. Based on these results, NEES seems to have a significant effect on Caspase-3 in the cerebellum in an ischemic state at 12 and 24 hours post ischemia, NEES delays the occurrence of early stage apoptosis-inducing Caspase-3, delaying and inhibiting apoptosis. Further systematic studies will have to be conducted in relation to the application of this study's results on stroke patients.

괄사요법(刮痧療法)에 대한 고찰(考察) (A study of Meridian Scraping Therapy)

  • 유진호;고형균;강성길
    • Journal of Acupuncture Research
    • /
    • 제17권3호
    • /
    • pp.45-56
    • /
    • 2000
  • Objectives : Meridian Scraping Therapy(MST: Kwal-Sa: 刮痧) has not well known in Korea. But it's a kind of Traditional Physical Therapy wide spreaded in China and Taiwan. So I want to introduce this new Therapy by summarizing the basic theories and practical manipulations. Conclusions : To analyse the meaning of the character Kwal-Sa, Kwal(刮) means scraping the skin by some tools and Sa(痧) means originally the red spots on skin of measles but in this therapy it's the red spot on skin after the treatment. Meridian Scraping Therapy is based on the meridiology and holism which are the basic theory of Oriental Medicine. The main effects of Meridian Scraping Therapy are draining of pathogenic factors, promoring the flow of ki and blood, tonify yang, balancing the harmony of intemal organs and enhancing the immuno-ability in body. Rhinoceros corpus is common matrial of MST-plate which is the tool of manipulation. And by this plate several manipulation is performed according to the symptom and the locations of pain. The merits of MST are that easily learned by practician, the effects of the treatment are very quickly manifest and no significant side-effects. And additionally this therapy performed not only for treat diseases but prevent it and preserve health.

  • PDF