• Title/Summary/Keyword: 텍스트 연구

Search Result 3,492, Processing Time 0.03 seconds

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF

왜 하필 4+3인가?

  • Kim, Chang-Il;Kim, Sin-Jwa
    • Communications of Mathematical Education
    • /
    • v.18 no.1 s.18
    • /
    • pp.45-60
    • /
    • 2004
  • 수학텍스트의 한 부분인 식은 일상 언어, 시각적 표현, 상징 등의 여러 기호와 함께 학생들에게 다양한 수학을 경험을 제공한다. 그러나 이러한 수학텍스트의 다양성은 수학시험 채점시 4+3인가, 4+3=7인가 혹은 부분점수를 줄 것인가의 이슈로서 변질되어 등장한다. 따라서 본 연구에서는 초등학교에서 다루는 식의 의미, 초등학교 아동에게 지도되는 식의 형태, 초등학교 1학년 아동의 식에 대한 이해, 초등학교 교사들의 식에 대한 이해 형태를 서울시 소재 한 초등학교의 1학년 담임교사 9명과 1학년 1 개 학급에 속한 아동과의 면담 및 설문 조사를 통하여 알아보았다. 아울러 제언에서는 수학텍스트의 한 부분인 식의 실제 교육현장에서 어떻게 반영되고 있는가에 대한 탐색을 통하여 식의 의미를 올바르게 전하기 위한 지도 방법, 교사 인식에 대한 방향을 제시하였다.

  • PDF

Applying Method WordNet for Concept based Image Retrieval system (개념 기반 이미지 검색 시스템을 위한 WordNet 적용 방안)

  • 조미영;최준호;김판구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.487-489
    • /
    • 2002
  • 기존의 키워드 기반 이미지 검색에서는 의미적 내용 인식을 위해 일반적으로 어휘적 정보나 텍스트 정보를 인간이 주석 형태로 달아주었다. 그러나 이런 텍스트 정보 기반 이미지 검색은 개념적 매칭이 아닌 스트링 매칭이므로 주석을 달아놓은 단어와 정확한 매칭이 없다면 찾을 수가 없다. 이러한 문제를 해결하기 위해 본 논문에서는 개념 기반 이미지 검색 시스템을 위한 WordNet의 적용 방안에 대해 연구했다. WordNet은 단언형이 아닌 단어의 의미 즉 synset이 구성 요소라는 특징을 이용해 각각의 이미지에 텍스트 정보 대신 적합한 개념의 Synset번호를 저장한다. 그리고 검색시 개념간의 유사성 측정을 이용해 검색어와 개념적으로 유사한 모든 이미지를 검색하도록 한다.

  • PDF

Text Region Extraction of Natural Scene Images using Gray-level Information and Split/Merge Method (명도 정보와 분할/합병 방법을 이용한 자연 영상에서의 텍스트 영역 추출)

  • Kim Ji-Soo;Kim Soo-Hyung;Choi Yeong-Woo
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.6
    • /
    • pp.502-511
    • /
    • 2005
  • In this paper, we propose a hybrid analysis method(HAM) based on gray-intensity information from natural scene images. The HAM is composed of GIA(Gray-intensity Information Analysis) and SMA(Split/Merge Analysis). Our experimental results show that the proposed approach is superior to conventional methods both in simple and complex images.

A Study on the Hypertext Characteristics of Contemporary Architecture space (현대건축공간에 나타난 하이퍼텍스트의 특성에 관한 연구)

  • Lee, Sun-Mi;Shim, Eun-Ju
    • Proceedings of the Korean Institute of Interior Design Conference
    • /
    • 2007.11a
    • /
    • pp.128-133
    • /
    • 2007
  • Modern society changes so fast that it makes the borderlines obscure among all the elements in physical environments as well as culture and economy through rapid flows of Network or new media. Also these flows of changes appears and collides everywhere at the same time, which continuously generates heterogeneous environmental factors. For this reason, architecture is required to correspond with circumstances of the day, but it doesn't keep up with the speed of social changes actually because it features physically fixed construction. This research offers new direction and possibilities of architecture space elements using pluralistic and do-centering attributes of hypertext as a counterplan, and finds out how architecture space should correspond with the moving environment of modern society.

  • PDF

Feature Selection for a Hangul Text Document Classification System (한글 텍스트 문서 분류시스템을 위한 속성선택)

  • Lee, Jae-Sik;Cho, You-Jung
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2003.05a
    • /
    • pp.435-442
    • /
    • 2003
  • 정보 추출(Information Retrieval) 시스템은 거대한 양의 정보들 가운데 필요한 정보의 적절한 탐색을 도와주기 위한 도구이다. 이는 사용자가 요구하는 정보를 보다 정확하고 보다 효과적이면서 보다 효율적으로 전달해주어야만 한다. 그러기 위해서는 문서내의 무수히 많은 속성들 가운데 해당 문서의 특성을 잘 반영하는 속성만을 선별해서 적절히 활용하는 것이 절실히 요구된다. 이에 본 연구는 기존의 한글 문서 분류시스템(CB_TFIDF)[1]의 정확도와 신속성 두 가지 측면의 성능향상에 초점을 두고 있다. 기존의 영문 텍스트 문서 분류시스템에 적용되었던 다양한 속성선택 기법들 가운데 잘 알려진 세가지 즉, Information Gain, Odds Ratio, Document Frequency Thresholding을 통해 선별적인 사례베이스를 구성한 다음에 한글 텍스트 문서 분류시스템에 적용시켜서 성능을 비교 평가한 후, 한글 문서 분류시스템에 가장 적절한 속성선택 기법과 속성 선택에 대한 가이드라인을 제시하고자 한다.

  • PDF

A Study Video using Image and Voice Search (음성과 이미지를 이용한 동영상 검색에 관한 연구)

  • Sin, In-Gyeong;Park, Sung-Hyun;Ahn, Hyo-Chang;Rhee, Sang-Burm
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.568-571
    • /
    • 2012
  • 정보화 사회의 정보 기반 구조로서, 고속 정보망의 구축, 개인용 컴퓨터의 급속한 보급, 멀티미디어 기술의 발전 등으로 인하여 정보 서비스의 새로운 장이 열리고 있다. 동영상 데이터는 텍스트만이 아니라 영상정보, 음성정보등 각종 의미있는 다양한 멀티미디어 정보를 포함하고 있다. 본 논문에서는 동영상에서 음성과 영상을 분리하여 음성을 이용하여 음성열을 분할 및 복원하여 음성을 텍스트로 변환하여 텍스트색인파일을 만들고 영상은 이미지를 분할 및 히스토그램을 사용하여 이미지 샷을 검출하여 두 색인파일을 이용하여 인덱싱을 하여 동영상 검색에 활용한다.

Korean Pre-trained Model KE-T5-based Automatic Paper Summarization (한국어 사전학습 모델 KE-T5 기반 자동 논문 요약)

  • Seo, Hyeon-Tae;Shin, Saim;Kim, San
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.505-506
    • /
    • 2021
  • 최근 인터넷에서 기하급수적으로 증가하는 방대한 양의 텍스트를 자동으로 요약하려는 연구가 활발하게 이루어지고 있다. 자동 텍스트 요약 작업은 다양한 사전학습 모델의 등장으로 인해 많은 발전을 이루었다. 특히 T5(Text-to-Text Transfer Transformer) 기반의 모델은 자동 텍스트 요약 작업에서 매우 우수한 성능을 보이며, 해당 분야의 SOTA(State of the Art)를 달성하고 있다. 본 논문에서는 방대한 양의 한국어를 학습시킨 사전학습 모델 KE-T5를 활용하여 자동 논문 요약을 수행하고 평가한다.

  • PDF

Evaluation of Major Heavy Rain Events in the Annals and Rainfall Records of the Joseon Dynasty using Text Mining (텍스트마이닝을 이용한 조선왕조실록 및 측우기기록에 나타난 주요 호우사상의 평가)

  • Kim, Gwan-Jun;Kim, Soon-Mi;Lee, Dong-Hwan;Chae, Mool-Seok;Jeong, Sang
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2023.11a
    • /
    • pp.198-199
    • /
    • 2023
  • 본 연구에서는 조선왕조실록을 중심으로 조선시대의 호우 및 홍수기록의 기술방법에 대해 텍스트마이닝 분석을 실시하였다. 조선왕조실록은 조선시대의 큰 호우사상은 모두 포함하고 있기 때문에 이를 일정한 등급으로 나누어 분류한다면 극치 호우 사상의 발생특성을 이해하는데 도움이 될 수 있다. 전체적으로 '큰비'에서와 같이 강우에 대한 언급만이 있는 경우가 '큰물', '홍수', '폭우'와 같이 홍수유출 및 이에 따른 피해가 설명되어 있는 경우보다 강우의 재현기간이 작게 나타나는 것을 파악할 수 있었다. 또 하나 주목할만한 점은 기록된 호우사상이 강우의 총량보다는 강우의 지속기간에 보다 민감하다는 점이다. 즉, 일시에 많은 비가 온 경우보다는 장기간에 걸쳐 내린 호우사상에 보다 초점이 맞추어져 있다는 점이다. 즉, 홍수유출의 크기 및 이에 따른 피해의 정도가 실제 이들 호우사상이 기록으로 남게 되는 원인으로 파악된다.

  • PDF

Development of a Depression Prevention Platform using Multi-modal Emotion Recognition AI Technology (멀티모달 감정 인식 AI 기술을 이용한 우울증 예방 플랫폼 구축)

  • HyunBeen Jang;UiHyun Cho;SuYeon Kwon;Sun Min Lim;Selin Cho;JeongEun Nah
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.916-917
    • /
    • 2023
  • 본 연구는 사용자의 음성 패턴 분석과 텍스트 분류를 중심으로 이루어지는 한국어 감정 인식 작업을 개선하기 위해 Macaron Net 텍스트 모델의 결과와 MFCC 음성 모델의 결과 가중치 합을 분류하여 최종 감정을 판단하는 기존 82.9%였던 정확도를 텍스트 모델 기준 87.0%, Multi-Modal 모델 기준 88.0%로 개선한 모델을 제안한다. 해당 모델을 우울증 예방 플랫폼의 핵심 모델에 탑재하여 covid-19 팬데믹 이후 사회의 문제점으로 부상한 우울증 문제 해소에 기여 하고자 한다.