• Title/Summary/Keyword: 학술적 텍스트

Search Result 1,089, Processing Time 0.035 seconds

Implementation of OCR System Based on Smart Phone (스마트폰 기반 OCR 시스템의 구현)

  • Heo, Jin-Kyu;Kim, Hyun-Gon;Jang, Min-Seok;Jang, Seok-Hwan;Kwon, Soon-Kak;Park, Yoo-Hyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.05a
    • /
    • pp.500-503
    • /
    • 2012
  • 스마트폰은 폭발적인 성장세와 더불어 어플리케이션의 시장규모가 크게 증대될 것으로 예상된다. 본 논문에서는 직접 사진을 캡처 시킨 문자들을 텍스트로 변환시켜주고 데이터베이스를 이용해서 그 문자들의 의미를 표현하는 어플리케이션을 구현한다. 어플리케이션의 기능으로는 텍스트로 변환하고자 하는 사진을 찍거나 혹은 앨범에 있는 사진을 불러내어 텍스트로 변환을 시켜서 상대방에게 메시지나 블루투스 등을 이용하여 전송을 가능하게 해줄 수 있으며, 글꼴을 바꾼다거나 크기 등 편집 기능까지 추가적으로 가능하도록 할 수 있다. 이 어플리케이션으로 인한 효과로 인터넷이나 거리를 돌아다니다가 원하는 문구가 있으면 바로 원하는 상대방에게 쉽고 간편하고 빠르게 전달할 수 있는 편리함 등이 있다.

  • PDF

The Comparison of Neural Network and k-NN Algorithm for News Article Classification (신경망 또는 k-NN에 의한 신문 기사 분류와 그의 성능 비교)

  • 조태호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.363-365
    • /
    • 1998
  • 텍스트 마이닝(Text Mining)이란 텍스트형태의 문서들의 패턴 또는 관계를 추출하여 사용자가 원하는 새로운 정보를 가공하거나 기존의 정보를 변형하는 과정을 말한다. 텍스트 마이닝의 기능에는 문서 범주화(Document Categorization), 문서 군집화(Document Clustering), 그리고 문서 요약(Document Summarization)이 이에 해당된다. 문서 범주화란 문서에게 사전에 정의한 범주를 부여하는 과정을 말하고, 문서 군집화란 문서들을 계층적 구조로 형성하는 과정을 말하고, 문서 요약이란 문서의 전체 내용을 대표할 수 있는 내용의 일부만을 추출하는 과정을 말한다. 이 논문에서는 문서 범주화만을 다룰 것이며 그 대상으로는 신문기사로 설정하였다. 그의 범주는 4가지로 정치, 경제, 스포츠, 그리고 정보통신으로 설정하였다. 문서 범주화는 문서 분류(Document Classification)라고도 하며 문서에 범주를 자동으로 부여하여 기존에 인위적으로 부여함으로써 소요되는 시간과 비용을 절감하는 것이 목적이다. 문서 범주화에 대하여 k-NN(k-Nearest Neighbor)와 신경망을 이용하였으며, 신경망을 이용한 경우가 k-NN을 이용한 경우보다 성능이 우수하였다.

  • PDF

An In-depth Analysis on Soccer Game via Webcast and Association Rule Mining (웹 캐스트와 연관규칙 마이닝을 이용한 축구 경기의 심층 분석)

  • Jung, Ho-Seok;Lee, Jong-Uk;Yu, Jae-Hak;Park, Dai-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.17-20
    • /
    • 2011
  • 축구 비디오를 분석하고 이를 팀 전략 수립에 활용하는 축구 비디오 분석관의 역할이 강조됨에 따라, 축구 비디오에서 주요 이벤트의 탐지와 같은 절차적 기능에서 부터 고수준의 해석 방법에 이르는 다양한 기능들이 요구된다. 본 논문에서는 축구 웹 캐스트에서 실시간으로 제공하는 텍스트 정보를 기반으로 메타데이터 키워드 매칭을 통하여 축구 경기의 다양한 속성들을 추출하고 텍스트 마이닝의 대표적 해석 기법인 연관규칙 마이닝을 사용함으로써 축구 경기의 전략 수립이 가능한 고수준의 해석 방법을 소개한다. 실제 2010년 월드컵의 스페인 경기를 중계한 웹 캐스트의 텍스트 정보를 대상으로 제안된 방법론의 타당성을 검증한다.

The Application to the Programming Education Using LabVIEW OOP (LabVIEW OOP를 활용한 프로그래밍 교육의 적용 방안)

  • Jung, Min-Po;Cho, Hyuk-Gyu;Jung, Deok-Gil
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.147-148
    • /
    • 2012
  • 일반적으로 프로그램을 배우는 초보자들은 텍스트 기반으로 프로그램을 하는 것이 매우 어렵다. 이러한 문제를 쉽게 풀기 위한 한 방법이 Visual C++, Visual Basic, Delphi와 같은 비주얼 프로그램으로 구현하는 것이다. 그러나 이러한 프로그램을 배우는 학습자들 역시, 비주얼 컴포넌트 작동에 대한 텍스트 프로그래밍을 어려워하고 있다. 논문에서는 이러한 문제를 해결하기 위해 논리적 사고를 표현하고 객체지향을 지원하기 위해 UML을 도입하고 텍스트 프로그래밍 요소를 비주얼 프로그래밍 요소로 대체하기 위해 객체지향을 지원하는 LabVIEW OOP를 사용하여 학습자들에게 프로그래밍 교육을 하는 방법을 제시하였다. 또한, 제시된 프로그래밍 교육 방법에 대해 설문조사를 실시하여 교육적인 효과를 분석하였다.

  • PDF

Feature Selection for a Hangul Text Document Classification System (한글 텍스트 문서 분류시스템을 위한 속성선택)

  • Lee, Jae-Sik;Cho, You-Jung
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2003.05a
    • /
    • pp.435-442
    • /
    • 2003
  • 정보 추출(Information Retrieval) 시스템은 거대한 양의 정보들 가운데 필요한 정보의 적절한 탐색을 도와주기 위한 도구이다. 이는 사용자가 요구하는 정보를 보다 정확하고 보다 효과적이면서 보다 효율적으로 전달해주어야만 한다. 그러기 위해서는 문서내의 무수히 많은 속성들 가운데 해당 문서의 특성을 잘 반영하는 속성만을 선별해서 적절히 활용하는 것이 절실히 요구된다. 이에 본 연구는 기존의 한글 문서 분류시스템(CB_TFIDF)[1]의 정확도와 신속성 두 가지 측면의 성능향상에 초점을 두고 있다. 기존의 영문 텍스트 문서 분류시스템에 적용되었던 다양한 속성선택 기법들 가운데 잘 알려진 세가지 즉, Information Gain, Odds Ratio, Document Frequency Thresholding을 통해 선별적인 사례베이스를 구성한 다음에 한글 텍스트 문서 분류시스템에 적용시켜서 성능을 비교 평가한 후, 한글 문서 분류시스템에 가장 적절한 속성선택 기법과 속성 선택에 대한 가이드라인을 제시하고자 한다.

  • PDF

Disease related Gene Identification Using Literature and Google data (텍스트마이닝 기법과 구글데이터를 이용한 질병관련 유전자 식별)

  • Kim, Jeong-U;Kim, Hyeon-Jin;Park, Sang-Hyeon
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1084-1087
    • /
    • 2013
  • 텍스트마이닝은(Text mining) 바이오분야에서 사용되는 도구 중 하나이다. 본 논문에서는 전립선암(Prostate cancer)과 관련된 질병 유전자(Disease gene)를 찾기 위해 텍스트마이닝을 이용하여 유전자 네트워크(Gene-network)를 구축하였다. 추가적으로 구글(Google) 검색을 통해 네트워크 내의 유전자 노드(Node)들 사이의 간선(Edge)에 새로운 가중치(Weight)를 추가하고 네트워크를 재구성하였다. 구축된 네트워크에서 노드와 노드 사이의 가중치를 기반으로 전립선암과 관련된 질병 유전자를 추출하였다. 본 논문의 방법은 성공적으로 네트워크를 구축하고 질병 유전자를 찾았으며, 구글 데이터를 사용하지 않고 네트워크를 구축하는 경우보다 더 높은 정확성을 입증했다.

Offering system for major article Using Text Mining and Data Mining (텍스트마이닝과 데이터마이닝을 이용한 주요기사 제공 시스템)

  • Song, Sung-Mook;Ryu, Joon-Suk;Kim, Ung-Mo
    • Annual Conference of KIPS
    • /
    • 2009.11a
    • /
    • pp.733-734
    • /
    • 2009
  • 현대사회에서 인터넷의 비약적인 발전과 빠른 보급으로 우리가 접할 수 있는 정보의 양이 늘어나고 이들 중에서 필요한 정보만을 얻어내기에는 쉽지 않다. 특히 비구조적이고 정형화되지 않은 텍스트 데이터인 기사들을 텍스트마이닝을 이용하여 기사 헤드라인을 용어 단위로 구분하여 추출하고 데이터마이닝의 연관 규칙을 적용하여 빈발항목의 지지도와 용어간의 연관성을 통해 기사의 내용에 효과적으로 접근하는 시스템을 제안하고자 한다.

Subtitle Highlighting System for Video Streaming using Speech Interface STT (Speech to Text) (음성 인터페이스 STT(Speech to Text)를 활용한 동영상 스트리밍 자막 강조 시스템)

  • Lee, Kang-Chan;Cho, Dae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.567-568
    • /
    • 2021
  • 자막은 자막을 볼 수 있는 모든 사람들의 정보전달, 의사소통을 할 수 있는 유용한 도구로 사용 되고 있지만 자막은 평범한 텍스트로 있어 자막에서 강조된 부분, 감정 등을 전달 할 수 없다는 단점을 가지고 있다. 그러므로 청각 장애인들은 해당 컨텐츠의 감정, 강조 되는 부분을 알 수 없어 대화의 숨은 의미가 다른 방향으로 이해 할 수 있다는 위험성을 가지고 있다. 본 논문에서는 음성을 텍스트로 변환하는 STT(Speech To Text)를 이용하여 동영상 스트리밍 서비스를 실시간으로 음성을 텍스트로 변환과 동시에 강조하는 부분까지 개발하여 청각장애인 입장에서 기존 자막보다 효율적인 시각적 효과를 주는 미디어 접근을 위한 동영상 스트리밍 자막 서비스를 개발하고자 한다.

  • PDF

Header Text Generation based on Structural Information of Table (테이블 구조 정보를 활용한 헤더 텍스트 생성)

  • Haemin Jung;Myoseop Sim;Kyungkoo Min;Jooyoung Choi;Minjun Park;Stanley Jungkyu Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.415-418
    • /
    • 2023
  • 테이블 데이터는 일반적으로 헤더와 데이터로 구성되며, 헤더는 데이터의 구조와 내용을 이해하는데 중요한 역할을 한다. 하지만 웹 스크래핑 등을 통해 얻은 데이터와 같이 다양한 상황에서 헤더 정보가 누락될 수 있다. 수동으로 헤더를 생성하는 것은 시간이 많이 걸리고 비효율적이기 때문에, 본 논문에서는 자동으로 헤더를 생성하는 태스크를 정의하고 이를 해결하기 위한 모델을 제안한다. 이 모델은 BART를 기반으로 각 열을 구성하는 텍스트와 열 간의 관계를 분석하여 헤더 텍스트를 생성한다. 이 과정을 통해 테이블 데이터의 구성요소 간의 관계에 대해 이해하고, 테이블 데이터의 헤더를 생성하여 다양한 애플리케이션에서의 활용할 수 있다. 실험을 통해 그 성능을 평가한 결과, 테이블 구조 정보를 종합적으로 활용하는 것이 더 높은 성능을 보임을 확인하였다.

  • PDF

Image classification model utilizing text to improve image classification accuracy (이미지 분류 정확도 향상을 위한 텍스트 활용 이미지 분류 모델)

  • Ju-Hyeok Lee;Mi-Hui Kim
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.724-726
    • /
    • 2023
  • 컴퓨터 비전 문제 중 이미지 분류는 핵심적인 주제 중 하나이다. 딥러닝의 발전으로 이미지 분류 문제에서 높은 정확도와 성능을 보여준다. 하지만 대부분 이미지 분류 연구에서 시각정보인 이미지 내의 특징에만 의존하고 있다. 그렇기에 이미지의 본질적인 맥략과 함께 있는 텍스트 정보를 활용하지 못하는 경우도 있다. 이에 본 논문은 텍스트 정보를 활용하여 이미지 분류 성능을 개선하는 방식을 제안한다.