• Title/Summary/Keyword: 내용 문장

Search Result 398, Processing Time 0.033 seconds

Development of Semantic-Based XML Mining for Intelligent Knowledge Services (지능형 지식서비스를 위한 의미기반 XML 마이닝 시스템 연구)

  • Paik, Juryon;Kim, Jinyeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.59-62
    • /
    • 2018
  • XML을 대상으로 하는 연구가 최근 5~6년 사이에 꾸준한 증가를 보이며 이루어지고 있지만 대다수의 연구들은 XML을 구성하고 있는 엘리먼트 자체에 대한 통계적인 모델을 기반으로 이루어졌다. 이는 XML의 고유 속성인 트리 구조에서의 텍스트, 문장, 문장 구성 성분이 가지고 있는 의미(semantics)가 명시적으로 분석, 표현되어 사용되기 보다는 통계적인 방법으로만 데이터의 발생을 계산하여 사용자가 요구한 질의에 대한 결과, 즉 해당하는 정보 및 지식을 제공하는 형식이다. 지능형 지식서비스 제공을 위한 환경에 부합하기 위한 정보 추출은, 텍스트 및 문장의 구성 요소를 분석하여 문서의 내용을 단순한 단어 집합보다는 풍부한 의미를 내포하는 형식으로 표현함으로써 보다 정교한 지식과 정보의 추출이 수행될 수 있도록 하여야 한다. 본 연구는 범람하는 XML 데이터로부터 사용자 요구의 의미까지 파악하여 정확하고 다양한 지식을 추출할 수 있는 방법을 연구하고자 한다. 레코드 구조가 아닌 트리 구조 데이터로부터 의미 추출이 가능한 효율적인 마이닝 기법을 진일보시킴으로써 다양한 사용자 중심의 서비스 제공을 최종 목적으로 한다.

  • PDF

Article Analytic and Summarizing Algorithm by facilitating TF-IDF based on k-means (TF-IDF를 활용한 k-means 기반의 효율적인 대용량 기사 처리 및 요약 알고리즘)

  • Jang, Minseo;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.271-274
    • /
    • 2018
  • 본 논문에서는 뉴스기사 데이터를 활용하여 대규모 뉴스기사를 소주제로 분류하는 군집 분석 방법을 제안한다. 또한, 분류된 뉴스기사를 사용자가 빠르게 이해하고 접할 수 있도록 핵심 문장을 추출하여 제공하는 방법을 제안한다. 분석 데이터는 포털 사이트 점유율 1위인 네이버의 경제 분야 뉴스기사를 크롤링하여 수집한다. 뉴스기사의 분석을 위해 전 처리를 통해 특수문자, 조사, 어미, 구두점 등의 불 용어 처리를 수행한다. 또한, k-means 알고리즘을 이용하여 대용량의 뉴스기사를 주제 별로 분류하는 것을 진행하며 그것을 토대로 핵심 문장을 추출한다. 추출된 핵심 문장은 분류된 뉴스기사의 주제를 나타내며 사용자에게 빠르게 정보를 전달하기 위해 활용한다. 본 논문의 연구 내용이 여러 언론사 사이트에 반영되면 사이트 품질과 사용자 만족도 향상에 기여할 수 있을 것으로 보인다.

Method of making a conception class from problem description using sentence analysis (문제기술서의 문장 분석을 통한 개념클래스 도출 방법 제안)

  • Park, Ga-Young;Lee, Yong-Hun;Lee, San-Bum
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.958-961
    • /
    • 2010
  • 본 논문에서는 고객의 초기 요구 문서인 문제 기술서로부터 문장 분석을 통하여 개념클래스를 도출하는 방법에 대하여 제안한다. 문제기술서는 개발할 시스템에 대한 고객의 요구사항을 개괄적으로 작성된 문서로서 요구사항을 분석하고 설계할 때 이용되는 초기 문서 역할을 한다. 개발자는 이 문서의 내용을 바탕으로 시스템에 중요한 개념클래스를 도출하는 작업을 시작한다. 시스템 개발에 사용될 개념클래스들을 도출하는 것은 객체지향적인 설계에서 중요한 과정이다. 문서 기술서로부터 개념클래스 도출 과정은 주로 개발자의 경험과 직관에 의존하는 경향이 있으며 경험이 많은 전문 개발자들은 문제 기술서로부터 개념클래스들을 올바르게 도출할 수 있지만 초보 개발자의 경우 도출에 어려움이 따른다. 이러한 문제점의 개선 방법으로 기술서의 문서에서 문장 단위로 형태소 분석을 통하여 명사와 동사를 추출한다. 추출된 명사를 통하여 2가지 분류 기준에 따라 개념클래스 도출하고, 이후 동사를 이용하여 개념클래스 간의 관계 설정하는 방법을 제안한다.

Player Chop : Media Player Program for Enhancing Language Studies (Player Chop : 어학 기능이 강화된 미디어 플레이어 프로그램)

  • Yang, Mi-Hyon;Jo, Kyong-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1600-1601
    • /
    • 2011
  • 태블릿 PC의 등장, 미디어 기기의 소형화, 스마트 폰의 등장과 맞물려 기존의 동영상 및 음성을 통한 교육 콘텐츠시장이 크게 확대되어 가고 있다. 특히 어학 콘텐츠의 경우 구간 반복을 통한 내용 전달이 필수적이어서 많은 미디어 플레이어는 사용자가 직접 설정한 구간을 반복 시청할 수 있도록 하는 기능을 포함하고 있다. 본 논문은 기존의 구간 반복 기능에서 한 단계 나아가 사용자의 수동 조작없이 미디어 플레이어가 자동적으로 문장을 감지하여 해당 문장을 반복하는 Player chop를 소개한다. Player chop 는 영상 파일에서 추출된 모든 문장의 시작과 종료 지점에 대한 시간 정보를 목록화 하여 손쉽게 반복 재생이 가능하도록 하였으며, 목록화 된 시간 정보를 바탕으로 자막을 연동하여 사용자의 외국어 학습에 도움이 될 수 있도록 하였다.

Validity and Reliability of Korean Version of Home Falls and Accidents Screening Tool (HOME FAST) (한글판 낙상 위험 주거환경 평가 (Home Falls and Accidents Screening Tool; HOME FAST)의 내용이해도 및 신뢰도 연구)

  • Ju, Yumi;Cho, Sun-Young
    • Therapeutic Science for Rehabilitation
    • /
    • v.8 no.4
    • /
    • pp.77-92
    • /
    • 2019
  • Objective : This study aims to obtain the validation of Korean version of HOME FAST using the translation-back translation process and to evaluate the reliability. Methods : Total three stages were conducted which includes forward translation to Korean, test for degree of understanding of translated version, back translation to English, and then review and proof reading process. 21 occupational therapists were participated in the evaluation of understanding of Korean-translated HOME FAST, then some of expressions were modified for better understanding. Korean version was went through back-translation to English. Similarity between the original version and re-translated version were evaluated. Total 75 data from community dwelling elderly group were collected to assess internal consistency. Two occupational therapists simultaneously evaluated for the inter-rater reliability. Results : 11 items of Korean-translated scale were responded as having confused meaning by occupational therapists. There was some modification on expression. In the evaluation of similarity between original version and re-translated version, 3 items were selected as dissimilar items in terms of syntax and 6 items were selected in terms of semantic similarity. After the repetitive modification process, items were obtained conceptual equivalence between two different languages. Internal consistency was .62(KR20) (p<.01) and inter-rater reliability was .97(ICC) (p<.01). Conclusion : Korean version of HOME FAST was finalized through translation-retranslation process. The conceptual equivalence was established and Korean version showed highly reliable. In further study, The modification of items reflecting Korean house and life style should be conducted.

A Study on Automatic Extraction of Core Sentences from Document using Word Cooccurrence Graph (단어의 공기 관계 그래프를 이용한 문서의 핵심 문장 추출에 관한 연구)

  • Ryu, Je;Han, Kwang-Rok;Sohn, Seok-Won;Rim, Kee-Wook
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.11
    • /
    • pp.3427-3437
    • /
    • 2000
  • In this paper,we propose an method of core sciences extractionusing word cooccrrence graph in order to summarize a document. For automatic extraction of core sentenees, we construct a mean cluster from word cooccurrence graph, and find insistence which corresponds a porposed of author. And then we extract keywords by using relationship between mean cluster and isistence. Finally, core senrences are sclected based on keywords and insitances. The esults are evaluated by comparing with manual extraction, and show that the extraction performance is improved about 10%.

  • PDF

Method of Semantic Passage Generation and Retrieval for Encyclopedia QA system (백과사전 질의응답 시스템을 위한 의미적 단락 생성 및 검색 기법)

  • Lee, Chung-Hee;Oh, Hyo-Jung;Kim, Hyeon-Jin;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.159-166
    • /
    • 2004
  • 본 논문에서는 질의응답 시스템에서 질문의 주제와 개념적으로 일치하는 단락으로부터 정보를 추출할 경우에 보다 정확한 정답을 추출할 수 있다는 가정 하에 문장 주제를 활용한 의미적 단락 생성 및 검색 기법을 제안한다. 문장주제란 백과사전 문서 집합에서 공통으로 기술하는 내용이나 자주 언급하고 있는 사건 혹은 개념들의 집합을 의미하는 것으로, 주제별로 응집된 문장들로 재구성된 단락을 의미적 단락이라고 정의한다. 제안된 방법의 성능을 평가하기 위해 의미적 단락의 신뢰도를 파악하고, 백과사전 본문을 3문장 단위로 잘라서 고정길이 단락을 만든 후 의미적 단락의 검색결과와 비교하였다. 평가척도로는 TREC의 역순위평균(MRR : Mean Reciprocal Rank)과 상위 5개 단락 안에 정답유무를 측정하는 사용자 정답만족도를 사용하였다. ETRI 평가셋을 대상으로 한 실험 결과, 주제를 이용한 의미적 단락 검색 성능이 고정길이 단락 검색보다 우수함을 알 수 있었다.

  • PDF

A Document Sentiment Classification System Based on the Feature Weighting Method Improved by Measuring Sentence Sentiment Intensity (문장 감정 강도를 반영한 개선된 자질 가중치 기법 기반의 문서 감정 분류 시스템)

  • Hwang, Jae-Won;Ko, Young-Joong
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.6
    • /
    • pp.491-497
    • /
    • 2009
  • This paper proposes a new feature weighting method for document sentiment classification. The proposed method considers the difference of sentiment intensities among sentences in a document. Sentiment features consist of sentiment vocabulary words and the sentiment intensity scores of them are estimated by the chi-square statistics. Sentiment intensity of each sentence can be measured by using the obtained chi-square statistics value of each sentiment feature. The calculated intensity values of each sentence are finally applied to the TF-IDF weighting method for whole features in the document. In this paper, we evaluate the proposed method using support vector machine. Our experimental results show that the proposed method performs about 2.0% better than the baseline which doesn't consider the sentiment intensity of a sentence.

Linguistic and Cognitive Factors that Affect Word Problem Solving (수학 문장제 해결에 영향을 주는 언어적.인지적 요인 -혼합물 문제를 중심으로-)

  • 김선희
    • Journal of Educational Research in Mathematics
    • /
    • v.14 no.3
    • /
    • pp.267-281
    • /
    • 2004
  • Many students feel the word problems are very difficult. This study analyzes the linguistic and cognitive factors that affect word problem solving so that we help students bring through the difficulty. There are a text base, a situation model, and a real world in the linguistic aspects. Students have a difficulty at the transition from text base to situation model(equation), and make lots of errors at the situation model. In the cognitive aspects, I investigated problem solving schemes, strategies, and complexity level. Students are likely to choose strategy by the contents which teacher instructed, but not by low complexity level, and mix up the amount of sugar and sugar water, and concentration. We can recognize how complex the types of word problems are to solve, which strategies students choose largely, and what errors that students make in the problem solving are.

  • PDF

A Study on the Structure and Character of Abstracts (초록의 구조와 속성에 관한 연구)

  • Chang, Woo-Kwon
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2015.08a
    • /
    • pp.83-86
    • /
    • 2015
  • 이 연구는 정보관리학회지에 실린 국문과 영문 초록을 중심으로 초록의 구조와 그 속성을 파악하고자 한다. 이를 위해 학회지의 저자초록을 중심으로 편집규정, 초록의 종류, 구조, 문장분석, 내용분석, 문체분석을 하였다. 대상초록은 1997년과 2014년에 간행된 학회지 논문이다. 그 결과 1997년까지는 지시적 초록이었으며 이후 대부분 정보적 초록으로 나타났다. 초록의 내용은 1997년에는 수록 논문의 68%가 목적 범위와 연구방법으로, 2014년에는 84%가 목적 범위/연구방법/결과 결론으로 나타났다.

  • PDF