• Title/Summary/Keyword: 텍스트 연구

Search Result 3,492, Processing Time 0.035 seconds

Disambiguating in Transliteration of some Text Symbols using Decision tree (결정 트리를 이용한 ′이음표′ 문자화의 중의성 해소)

  • 정영임;이동훈;남현숙;윤애선;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.940-942
    • /
    • 2004
  • 한국어 텍스트 음성합성에서 문장 기호의 문자화에 나타나는 오류는 기호의 중의성에 기인한다. 선행연구에서 규칙에 기반하여 중의성을 해결하는 방안이 제안되었으나 여전히 기호는 다양한 문맥에서 높은 중의성을 가지고 문자화된다. 따라서 본 연구에서는 신문 텍스트에 나타나는 문장 기호 중 이음표의 문자화를 이음표를 포함한 어절의 패턴, 패턴의 좌우에 위치하는 어절 정보 및 휴리스틱스 자질을 학습하여 제시된 이음표의 문자화의 중의성을 해소하는 방안을 제안하였다. 이를 위해 국내 1개 일간지 2년 치 기사에서 이음표를 포함한 어절 49,000여 개를 임의 추출하여 분석하였고, 분석된 자질을 자동추출하여 결정 트리를 구성하였다. 실험 결과, 96.2%~97.7%의 정확도를 보였다.

  • PDF

Exploring Change of The Main Key Words in Nanum Broadcast News of the Koryeinmaeul Enclave in Gwangju (광주고려인마을 나눔방송의 주요 핵심어 변화 탐색)

  • Lee, Hyoung-Ha;Kwon, Choong Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.185-186
    • /
    • 2019
  • 본 연구는 광주고려인마을 나눔방송의 나눔뉴스(2010년부터 2018년까지) 기사제목에 나타난 주요 핵심어와 그들간의 관계성을 탐색하기 위해 텍스트 마이닝(text mining) 방법론을 활용하여 분석하였다. 고려인마을 지원조례 제정(2013년) 후 고려인마을지원종합지원센터 개소(2015년)하면서 이주초기와는 다르게 다양한 나눔방송 뉴스가 생산되고 있다. 본 연구에서는 나눔방송의 나눔뉴스 분석을 1기(2010년부터 2014년), 2기(2015년부터 2018년까지)로 구분하여 그 주요 핵심어의 변화를 탐색하고자 한다.

  • PDF

A Service of Map Information based on Android (안드로이드 기반 지도 정보 서비스)

  • Song, Myeongjin;Kim, Sangwook
    • Annual Conference of KIPS
    • /
    • 2010.04a
    • /
    • pp.355-358
    • /
    • 2010
  • 모바일 환경이 발전하고 보편화됨에 따라 사용자의 상황정보를 인식하고 추론하여 서비스를 제공하는 상황인식 서비스에 대해 관심이 높아지고 있다. 상황인식 서비스는 사용자 및 주변 환경의 상황을 알아내고 공유하여 그에 맞는 서비스를 제공한다. 이를 위한 상황정보는 사용자의 요구와 주변 상황이 수시로 변화하는 이동통신 환경에서 중요하게 활용된다. 본 논문에서는 컨텍스트의 수집과 공유를 위해 안드로이드 기반의 컨텍스트폰 플랫폼과 컨텍스트 서버를 구현하여 사용자 상황 정보를 시각화 하고 서로 공유할 수 있게 하였다. 상황인식에 대한 연구에는 주로 위치 및 이동에 관한 연구가 많은 부분을 차지하고 있는데, 위치정보는 상황인식을 위해 반드시 필요한 정보이며 이를 통해 사용자의 현재 상황을 파악할 수 있는 중요한 정보로 활용되고 있다. 안드로이드 기반의 컨텍스트폰 플랫폼과 컨텍스트 서버, GPS를 이용하여 사용자의 위치를 추적하거나 찾아내어 실시간으로 상대방의 위치 정보와 사용자 간의 거리를 알아내어 공유하고 맵을 통해 사용자 위치를 파악하여 위치와 관련된 서비스를 제공하려 한다.

Improving Performance of Sentiment Classification using Korean Style Transfer based Data Augmentation (한국어 스타일 변환 기반 데이터 증강을 이용한 감성 분류 성능 향상)

  • Eunwoo Go;Eunchan Lee;Sangtae Ahn
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.480-484
    • /
    • 2022
  • 텍스트 분류는 입력받은 텍스트가 어느 종류의 범주에 속하는지 구분하는 것이다. 분류 모델에 있어서 좋은 성능을 나타내기 위해서는 충분한 양의 데이터 셋이 필요함을 많은 연구에서 보이고 있다. 이에 따라 데이터 증강기법을 소개하는 많은 연구가 진행되었지만, 실제로 사용하기 위한 모델에 곧바로 적용하기에는 여러 가지 문제점들이 존재한다. 본 논문에서는 데이터 증강을 위해 스타일 변환 기법을 이용하였고, 그 결과 기존 방법 대비 한국어 감성 분류의 성능을 높였다.

  • PDF

A Study on the Development of Automatic Schedule Management System through Speech Recognition Text Analysis (음성인식 텍스트 분석을 통한 자동 일정 관리 시스템 개발에 관한 연구)

  • Lee, Hae-Mi;Cho, We-Duke
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.279-282
    • /
    • 2022
  • 컴퓨터가 마이크 등의 소리 센서를 통해 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술인 음성 인식 기술과 인공지능 기술을 결합한 음성 대화 시스템에 대한 연구 진행 및 제품 출시가 활발하게 이루어지고 있다. 기존의 시스템을 사용하면서 날짜와 시간 외의 정보 추출 정도가 빈약하거나 자동 등록이 되지 않는 문제점을 확인하였다. 음성 인식 기술을 통해 얻은 텍스트에서 보다 많은 정보를 추출하고, 자동 등록 및 알림과 맛집 등 추가 정보 제공 시스템을 구축하는 것을 목표로 하였다.

Efficient Approximate String Searches using Bitmap Filter (비트맵 필터를 이용한 효율적인 유사 문자열 검색 기법)

  • Kwon, In-Teak;Kim, Jong-Ik
    • Annual Conference of KIPS
    • /
    • 2011.04a
    • /
    • pp.1298-1301
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 역 리스트 병합 과정에서 역 리스트의 탐색 비용을 줄이기 위해 비트맵 필터를 사용하는 기법을 제안한다. 비트맵 필터를 사용하여 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 역 리스트 병합 알고리즘의 성능을 30~40% 정도 개선함을 보인다.

Tutorial user interface analysis in virtual reality games (가상현실 게임에서의 튜토리얼 사용자 인터페이스 분석)

  • LEE, Yuryeon;Kim, Guyeop;KIM, Hyun K.;Lee, Danbi;Kim, Gayoung;Lee, Juwan;Park, Sunyoung
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.54-56
    • /
    • 2021
  • 본 연구는 교육용 가상현실 게임 튜토리얼 인터페이스 구성 요소와 고려사항을 파악하여 튜토리얼 인터페이스를 디자인하는 것을 목적으로 한다. 현재 개발 중인 가상현실 교육용 게임 콘텐츠를 기반으로 튜토리얼이 제공되어야 하는 사용자 과업을 도출하였다. 그 후 상용화된 가상현실 게임을 직접 사용해 봄으로써 가상현실 게임 튜토리얼의 구성 요소를 파악하였다. 대부분의 가상현실 게임 튜토리얼은 텍스트 형태의 게임 방식과 컨트롤러 그림 기반의 인터페이스 설명으로 구성되어 있었다. 문헌조사를 통해 가상현실 게임에서 튜토리얼 인터페이스 설계 시 고려되어야 하는 디자인 요소를 분석하였고, 중앙으로부터 콘텐츠를 편안하게 볼 수 있는 범위는 좌우 약 -77도 ~ 77도에 위치되어야 함을 확인하였다. 또한, 텍스트, 버튼, 색상 요소에 관한 가상현실 인터페이스 디자인 원칙도 함께 수집하여 정리함으로써, 최종적으로 사용자 과업에 따른 가상현실 게임 튜토리얼 인터페이스를 디자인하였다. 본 연구는 추후 가상현실 게임 튜토리얼 인터페이스 제작 시 유용할 것으로 기대된다.

  • PDF

Analysis of Automatic Topic Classification using Youtube Meta Information (유튜브 메타정보를 이용한 자동 주제 분류 고찰)

  • Kim, Yong-Woo;Jeon, Seong-Bae;Jung, Yuchul
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.349-351
    • /
    • 2021
  • Youtube 동영상 업로드 시, 사용자가 직접 주제를 설정해야 하는 어려움이 있다. 본 연구에서는 사용자가 입력하는 제목과 설명정보를 이용하여 자동으로 주제를 분류하는 연구를 진행하였다. 이를 위해 한국어기반의 컨텐츠 중 고빈도의 8개 주제 카테고리를 선정하고, 이를 1.3만건의 학습데이터를 크롤링을 통해 구축하였다. 또한, 다양한 알고리즘들에 대한 최대성능을 확인하기 위해 대표적인 텍스트 분류 방법인 SVM과 LSTM기법 및 BERT 모델기반 미세적용(fine-tuning)을 시도하였다. 결과적으로 Bert-multiligual (base)를 fine-tuning한 실험에서 최대 94%의 정확도를 확인하였다. 하지만, Youtube 동영상 특성상 여러 주제를 가진 것들이 상당수 존재하기에, 실제 체감정확도는 더 높을 것으로 기대된다.

  • PDF

A Study For Developing ESG Indicators Through Text Mining And Deriving A Correlation Between ESG Indicators And Stock Prices (텍스트 마이닝을 통한 ESG 지표 개발 및 ESG 지표-주가 상관관계 도출 연구)

  • Cheong, Gae Jun;Lee, Kang San;Cho, Eun Hak
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.1273-1276
    • /
    • 2021
  • 기업의 전통적인 역할은 "이익 추구"였다. 현대 사회에 이르러서는 기업이 기존의 역할을 벗어나 새로운 사회적 기구가 되어야 한다는 주장이 떠오르며 CSR(기업의 사회적 책임)이 대두되었다. 최근 기업과 사회는 ESG 경영(환경, 사회, 지배구조를 고려한 지속가능경영)에 많은 관심을 보이고 있고 이는 더 이상 관심으로 그칠 수 없는 필수적인 요소가 되었다. 이에 본 연구는 텍스트 마이닝을 통해 ESG 지표를 개발하고 [ESG 지표 - 주가]의 상관관계를 도출하였다.

Chunking Annotation Corpus Construction for Keyword Extraction in News Domain (뉴스 기사 키워드 추출을 위한 구묶음 주석 말뭉치 구축)

  • Kim, Tae-Young;Kim, Jeong Ah;Kim, Bo Hui;Oh, Hyo Jung
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.595-597
    • /
    • 2020
  • 빅데이터 시대에서 대용량 문서의 의미를 자동으로 파악하기 위해서는 문서 내에서 주제 및 내용을 포괄하는 핵심 단어가 키워드 단위로 추출되어야 한다. 문서에서 키워드가 될 수 있는 단위는 복합명사를 포함한 단어가 될 수도, 그 이상의 묶음이 될 수도 있다. 한국어는 언어적 특성상 구묶음 개념이 적용되는 데, 이를 통해 주요 키워드가 될 수 있는 말덩이 추출이 가능하다. 따라서 본 연구에서는 문서에서 단어뿐만 아니라 다양한 단위의 키워드 묶음을 태깅하는 가이드라인 정의를 비롯해 태깅도구를 활용한 코퍼스 구축 방법론을 고도화하고, 그 방법론을 실제로 뉴스 도메인에 적용하여 주석 말뭉치를 구축함으로써 검증하였다. 본 연구의 결과물은 텍스트 문서의 내용을 파악하고 분석이 필요한 모든 텍스트마이닝 관련 기술의 기초 작업으로 활용 가능하다.

  • PDF