• 제목/요약/키워드: 텍스트 인식

검색결과 771건 처리시간 0.034초

보전문화체학 접근방식을 통한 생태계교란 생물인 담수 외래종의 대중인식 평가 (Assessment of Public Awareness on Invasive Alien Species of Freshwater Ecosystem Using Conservation Culturomics)

  • 박웅배;도윤호
    • 한국습지학회지
    • /
    • 제23권4호
    • /
    • pp.364-371
    • /
    • 2021
  • 담수 외래종에 대한 대중의 인식은 시대나 외래종과 관련된 특정 사건에 따라 달라진다. 인식차이는 관리계획을 수립하고 이해하는데 영향을 미쳐 외래종을 관리하는데 대중들의 인식을 이해하는 것이 중요하다. 본 연구에서는 보전문화체학 (Conservation culturomics)에서 사용하는 소셜 네트워크 플렛폼의 디지털 텍스트, 언론보도, 인터넷 검색량을 분석하여 담수 외래종에 대한 대중의 관심도와 감성을 파악하고자 하였다. 11종의 담수 외래종을 대상으로 트위터 게시글 수와, 언론보도량, 검색량을 추출하여 대중의 관심도를 파악하였다. 또한 이 자료들의 시간에 따른 추세와 계절 변동성여부, 자료의 반복 주기를 확인하였다. 수집된 자료를 텍스트마이닝 기법 기반의 감성분석을 통해 감성지수(sentiment score)로 산출해 각 종에 대한 대중들의 감성을 분석하였다. 연구결과 황소개구리와 뉴트리아, 파랑볼우럭, 큰입우럭은 다른 종들보다 상대적으로 많은 대중의 관심을 받는 것으로 확인되었다. 일부 종에서는 특정 시기에 따라 반복되고 변화하는 트윗량과, 언론보도량, 검색량을 나타냈다. 한편 텍스트마이닝 분석 결과, 대부분의 사람들이 담수 외래종에 대해 부정적인 감성을 가지고 있었다. 특히 생태계교란 생물이 지정된 이후 연도가 갈수록 부정적인 감성은 증가하였다. 하지만 과학적 근거가 없는 정보가 확산되거나 혐오를 증대시켜 담수 외래종을 관리하는 것은 한계가 있다. 따라서 외래종에 대한 대중들의 인식을 과학적으로 파악하여 관리방안이 수립되어야 한다.

한국어 및 영어 이미지 캡션이 가능한 범용적 모델 및 목적에 맞는 텍스트를 생성해주는 기법 (A general-purpose model capable of image captioning in Korean and Englishand a method to generate text suitable for the purpose)

  • 조수현;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1111-1120
    • /
    • 2022
  • Image Captioning은 이미지를 보고 이미지를 언어로 설명하는 문제이다. 해당 문제는 이미지 처리와 자연어 처리 두 가지의 분야를 하나로 묵고 이해하고 하나로 묶어 해결할 수 있는 중요한 문제이다. 또한, 이미지를 자동으로 인식하고 텍스트로 설명함으로써 시각 장애인을 위해 이미지를 텍스트로 변환 후 음성으로 변환하여 주변 환경을 이해하는 데 도움을 줄 수 있으며, 이미지 검색, 미술치료, 스포츠 경기 해설, 실시간 교통 정보 해설 등 많은 곳에 적용할 수 있는 중요한 문제이다. 지금까지의 이미지 캡션 구 방식은 이미지를 인식하고 텍스트화시키는 데에만 집중하고 있다. 하지만 실질적인 사용을 하기 위해 현실의 다양한 환경이 고려되어야 하며 뿐만 아니라 사용하고자 하는 목적에 맞는 이미지 설명을 할 수 있어야 한다. 본 논문에서는 범용적으로 사용 가능한 한국어 및 영어 이미지 캡션 모델과 이미지 캡션 목적에 맞는 텍스트 생성 기법을 제한한다.

해운산업의 다면적 역할에 대한 인식조사 및 국민인식 제고방안 (Survey on Multifaceted Role of Shipping Industry and Measures to Improve Public Perception)

  • 이동현
    • 한국항만경제학회지
    • /
    • 제28권3호
    • /
    • pp.127-150
    • /
    • 2012
  • 해운산업의 일반적 이미지, 경제적 역할, 다면적 역할 등에 대해 일반인을 대상으로 설문 조사를 시행한 결과 해운산업에 대한 일반적 인식과 해운산업의 경제적 역할에 대한 인식은 비교적 긍정적인 것으로 나타났다. 반면 해운산업의 다면적 역할에 대해서는 긍정적 인식과 부정적 인식이 혼재하고 있는 것으로 조사되었다. 또한 직업적 매력도와 고용창출에 해서도 낮은 인식을 보임으로써 해운산업을 개인의 체험 속에서 인식하기보다는 막연하게 남의 일(none of my business)로 인식하고 있음을 보여주었다. 이와 함께 해운산업의 이미지가 방송, 신문 등 언론매체를 통해 형성된 것으로 나타났다. 해운산업에 대한 인식제고의 방안으로 관계적, 상품 및 서비스, 텍스트 접근법 등 3가지 접근법이 논의되었다. 관계적 전략으로 도시민을 위한 해운체험 교육기관의 설립, 일반인 대상 다양한 행사 실시, 해운기념관 설립, 해운산업과 관련한 문화관광 컨텐츠 개발, 해운문화운동을 통한 해운산업 이미지 재창조, 학교교육을 통한 해운관 조성 등이 제시되었다. 상품 및 서비스 전략으로는 해운서비스에 대한 기업브랜드 부여, B2C 서비스의 제공, 해운서비스에 국가이미지 활용, 해운산업의 대외협력사업 참여 등이 논의되었다. 텍스트 전략으로는 B2B 광고의 전개, 해운산업의 국가경제적 다면적 역할 광고, 해운산업과 연관산업의 융합광고, 첨단매체의 활용, 다면적 역할 홍보에 대한 정부의 주도적 역할, 해운산업의 공고 및 홍보를 위한 기금 신설 등이 검토되었다.

형태소 분석기를 이용한 키워드 검색 기반 한국어 텍스트 명령 시스템 (Keyword Retrieval-Based Korean Text Command System Using Morphological Analyzer)

  • 박대근;이완복
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.159-165
    • /
    • 2019
  • 딥러닝을 기반으로 한 음성 인식 기술이 상용 제품에 적용되기 시작했지만, 음성 인식으로 분석된 텍스트를 효율적으로 처리할 방법이 없기 때문에 VR 컨텐츠에서 그 적용 예를 찾아 보기는 쉽지 않다. 본 논문은 문장의 형태소를 분석하는 형태소 분석기와 챗봇 개발에 주로 이용되는 검색 기반 모델(Retrieval-Based Model)을 활용하여 명령어를 효율적으로 인식하고 대응할 수 있는 한국어 텍스트 명령 시스템을 제안하는 것을 목적으로 한다. 실험 결과 제안한 시스템은 문자열 비교 방식과 같은 동작을 하기 위해 16%의 명령어만 필요했으며, Google Cloud Speech와 연동하였을 때 60.1%의 성공률을 보였다. 실험 결과를 통해 제안한 시스템이 문자열 비교 방식보다 효율적이라는 것을 알 수 있다.

네트워크 텍스트 분석을 통한 대운하 문화유산에 대한 관광객 인식 연구 : 쑤저우시 핑장역사문화지구의 예 (Research on Tourist Perception of Grand Canal Cultural Heritage Based on Network Text Analysis : The Pingjiang Historical and Cultural District of Suzhou City as an example)

  • 정청캉;징치웨이;남경현
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.215-231
    • /
    • 2023
  • 본 논문은 쑤저우의 핑장 역사문화 지구을 예로 들어 Python 기술을 적용한 Ctrip.com에서 1436개의 관광객 댓글 데이터를 수집하고, 네트워크 텍스트 분석 방법을 사용하여 빈도 단어, 의미 네트워크 및 감정을 분석하여 대운하 문화의 관광객 인식 특성과 수준을 평가하였다유산.연구 결과: 평강역사문화지구 관광객들의 인식에 자연인문경관, 역사문화축적, 강남운하 풍경이 잘 나타나 있다 ; 관광객들은 평강로 역사문화지구에 대해 비교적 긍정적인 감정을 가지고 있지만, 지구의 개조와 개선은 여전히 큰 여지가 있다.마지막으로 보호우선, 문화통합, 혁신적 활용 등의 측면에서 대운하 문화유산에 대한 관광객의 인식을 높이기 위한 대책을 제시했다.

텍스트 인식 기법에 기반한 화장품 성분 자동 분석 시스템 (An Automatic Cosmetic Ingredient Analysis System based on Text Recognition Techniques)

  • 김예원;홍선미;엄성용
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.565-570
    • /
    • 2023
  • 임산부나 피부질환자 등 화장품 성분에 예민한 사람들이 있다. 또 화장품으로 인한 부작용을 경험하는 사람들이 있다. 이를 피하기 위해, 쇼핑 시에 일일이 화장품에 유해 성분이 있는지 검색하는 것은 번거롭다. 또한 본인에게 잘 맞는 기능성 성분을 알고 기억하는 것은 새로운 화장품을 구매할 때 도움이 된다. 사진 촬영을 통해 현장에서 즉시 화장품 성분을 알 수 있는 시스템이 필요하다. 본 논문은 화장품에 표기된 성분을 촬영해 즉각적으로 화장품 성분을 알 수 있는 스마트폰용 애플리케이션 <화안>을 소개한다. 본 시스템은 효과적인 텍스트 인식 기법을 적용하여, 카메라를 화장품 성분에 비추거나 앨범에서 화장품 성분 사진을 불러올 경우, 해당 화장품의 성분을 자동 인식 및 자동 분류하여 그 화장품의 성분을 현장에서 즉시 제공한다는 점에서 기존의 시스템에 비해 효과적이고 편리하다. 이 시스템이 널리 활용된다면, 일상생활 속 화장품으로 인한 피부 질환을 예방하고 본인에게 맞지 않는 화장품 구매를 줄일 수 있을 것으로 기대된다.

시간축 스케일링에 의한 화자 식별 개선에 관한 연구 (A Study on Improvement of Speaker Identification with Time axis Scaling)

  • 정형교
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.123-126
    • /
    • 1998
  • 기존의 DTW를 이용한 화자 인식 시스템은 DTW의 단점이라 할 수 있는 과다한 계산량을 갖는다는 문제점을 갖고 있다. 따라서 본 논문은 텍스트 종속 화자 인식 시스템에서 피치 분포도를 갖는 개별 화자의 lDTW를 수행하기 전에 시간축 스케일링을 이용한 전처리로 인식시의 계산량을 감소시키는 과정을 미리 수행할 후 감소된 기준패턴들의 입력신호에 대해서만 DTW를 수행하는 방법을 제안하고자 한다. 제안한 방법을 실험하였을 경우 87.5%의 평균 처리 시간이 감소하였고, 더불어 인식률 감소는 거의 없었다.

  • PDF

문형정보와 N-gram 단어정보를 이용한 연속음성인식 후처리 (A post processing of continuous speech recognition using N-gram words and sentence patterns)

  • 엄한용;황도삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.324-326
    • /
    • 2000
  • 본 논문에서는 항공편 예약이라는 제한 영역에서의 연속음성인식 시스템을 위한 후처리 본 논문에서는 항공편 예약이라는 제한 영역에서의 연속음성인식 시스템을 위한 후처리 방안을 제시한다. 제안하는 후처리 방안은 200 문장의 항공편 예약 텍스트 데이터를 이용하여 문형 정보를 추출한 뒤 특정 문형별로 분류하였다. 분류된 문형과 음성인식 후의 문장을 비교하여 가장 유사한 문형을 추론한다. 추론한 특정 문형에서 나올 수 있는 형태소를 형태소들간의 N-gram 정보가 수록된 데이터베이스를 이용하여 형태소를 수정하고 보완한 결과를 최종 문장으로 출력한다.

  • PDF

상호텍스트성을 활용한 디지털 자화상 창작 (A Study on the Creation of Digital Self-portrait with Intertextuality)

  • 임수연
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.427-434
    • /
    • 2022
  • 본 연구의 목적은 관람자에게 자아 인식의 문제에 천착하게 하는 몰입의 경험을 제공하는 자화상을 창작하는 것이다. 우리는 관람자로부터 획득한 음성과 이미지 정보를 활용하여 인터랙티브 자화상을 구현하는 방안을 제시한다. 관람자의 음성 정보는 텍스트로 변환되어 시각화되는데, 텍스트 시각화를 위한 픽셀 정보로 관람자의 얼굴 이미지가 활용된다. 텍스트는 개인의 경험과 기억을 바탕으로 자신만의 감성, 상상, 의도 등이 다양하게 혼합되어 있는 결과물이다. 사람들은 각자 다른 방식으로 특정 텍스트에 대한 상이한 해석력을 발휘한다. 제안한 디지털 자화상은 텍스트가 가진 상호텍스트성을 활용하여 내적인 면에서 관람자의 자의식을 재현할 뿐 아니라 텍스트에 내재된 의미들을 확장한다. 넓은 의미에서의 상호텍스트성은 텍스트와 텍스트, 주체와 주체 사이에서 일어나는 모든 지식의 총체를 가리킨다. 따라서 텍스트로 표현된 자화상은 관객과 텍스트, 관객과 관객, 텍스트와 텍스트 사이에서 다양한 관계를 파생시키며 확장해간다. 또한 본 연구는 제안한 자화상이 외적인 면에서도 텍스트가 가진 조형성을 확인하고 시공간성을 재창조할 수 있다는 것을 보여준다. 이 동적 자화상은 실시간으로 관람자들의 관심사를 반영하고 갱신되며 창작되는 특성을 지닌다.

텍스트마이닝을 통한 고용허가제 트렌드 분석과 정책 제안 : 텍스트마이닝과 소셜네트워크 분석을 중심으로 (A Trend Analysis and Policy proposal for the Work Permit System through Text Mining: Focusing on Text Mining and Social Network analysis)

  • 하재빈;이도은
    • 융합정보논문지
    • /
    • 제11권9호
    • /
    • pp.17-27
    • /
    • 2021
  • 본 연구에서는 고용허가제에 대한 이슈와 국민적 인식을 확인하고 정책을 제언하기 위해 소셜데이터를 기반으로 한 텍스트마이닝 기법을 활용하고자 하였다. 이를 위해 2020년 1월부터 2020년 12월까지 1년 동안 온라인상에서 '고용허가제'가 언급되는 6,217개의 문서의 텍스트 1,453,272개를 텍스톰(Textom)을 통해 수집하여 텍스트마이닝과 소셜네트워크 분석을 수행하였다. 데이터 상위 키워드 빈도, TF-IDF(Term Frequency - Inverse Document Frequency) 분석, 연결중심성 분석으로 언급량이 많은 키워드 100개를 도출하였으며, 일자리 문제, 정책과정의 중요성, 산업관점의 경쟁력, 외국인근로자 생활 개선을 주요한 키워드로 구성하였다. 또한, 의미연결망 분석을 통해 '고용정책'과 같은 주요인식과 '국제협력', '노동자 인권', '법률', '외국인 채용', '기업 경쟁력', '이주민 문화', '외국인력 관리'와 같은 주변인식을 파악하였다. 끝으로 고용허가제에 관한 정책 수립과 관련 연구를 진행하는데 있어서 고려해야 할 요소를 제안하였다.