• 제목/요약/키워드: media text

검색결과 825건 처리시간 0.025초

모바일 시스템에서 텍스트 인식 위한 적응적 문자 분할 (Adaptive Character Segmentation to Improve Text Recognition Accuracy on Mobile Phones)

  • 김정식;양형정;김수형;이귀상;;김선희
    • 스마트미디어저널
    • /
    • 제1권4호
    • /
    • pp.59-71
    • /
    • 2012
  • Since mobile phones are used as common communication devices, their applications are increasingly important to human's life. Using smart-phones camera to collect daily life environment's information is one of targets for many applications such as text recognition, object recognition or context awareness. Studies have been conducted to provide important information through the recognition of texts, which are artificially or naturally included in images and movies acquired from mobile phones. In this study, a character segmentation method that improves character-recognition accuracy in images obtained from mobile phone cameras is proposed. The proposed method first classifies texts in a given image to printed letters and handwritten letters since segmentation approaches for them are different. For printed letters, rough segmentation process is conducted, then the segmented regions are integrated, deleted, and re-segmented. Segmentation for the handwritten letters is performed after skews are corrected and the characters are classified by integrating them. The experimental result shows our method achieves a successful performance for both printed and handwritten letters as 95.9% and 84.7%, respectively.

  • PDF

A Computer-Aided Text Analysis to Explore Recruitment and Intellectual Polarization Strategies in ISIS Media

  • Khafaga, Ayman Farid
    • International Journal of Computer Science & Network Security
    • /
    • 제22권8호
    • /
    • pp.87-96
    • /
    • 2022
  • This paper employs a computer-aided text analysis (CATA) and a Critical Discourse Analysis (CDA) to explore the strategies of recruitment and intellectual polarization in ISIS (Islamic State in Iraq and Syria) media. The paper's main objective is to shed light on the efficacy of employing computer software in the linguistic analysis of texts, and the extent to which CATA software contribute to deciphering hidden meanings of texts as well as to arrive at concise and authentic results from these texts. More specifically, this paper attempts to demonstrate the contribution of CATA software represented in the two variables of Frequency Distribution Analysis (FDA) and Content Analysis (CA) in decoding the strategies of recruitment and intellectual polarization in one of ISIS 's digital publication: Rumiyah (a digital magazine published by ISIS). The analytical focus is on three strategies of recruitment and intellectual polarization: (i) lexicalization, (ii) intertextual religionisation, and (iii) justification. Two main findings are revealed in this study. First, the application of CATA software into the linguistic investigation of texts contributes effectively to the understanding of the thematic and ideological messages pertaining to the analyzed text. Second, the computational analysis guarantees concise, credible, authentic and ample results than is the case if the analysis is conducted without the work of computer software. The paper, therefore, recommends the integration of CATA software into the linguistic analysis of the various types of texts.

소비자불매운동 참여 경험에 관한 연구: 텍스트마이닝 분석과 심층면접기법의 활용 (A Study on the Consumer Boycott Participation Experience: Using Text Mining Analysis and In-depth Interview)

  • 한준오;이욱;황혜선
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.88-106
    • /
    • 2022
  • 본 연구는 매스미디어와 소셜미디어 데이터의 텍스트마이닝 분석과 심층면접을 활용하여 소비자불매운동에 대한 사회적 담론을 확인하고 구체적인 소비자경험을 탐색하고자 하였다. 분석결과, 불매운동 관련 온라인 뉴스의 토픽은 불매운동 원인과 불매운동 과정에서 나타난 각 주체들의 대응, 불매운동 효과의 내용을 포괄하는 것으로 나타났다. 심층면접 결과, 참여자들은 자체적으로 정보를 탐색하고 검증을 하며 탈중심화된 불매운동 참여 경험을 가지는 것으로 나타났다. 불매운동 과정에서 대체재 부재, 불매기업의 마케팅 영향으로 인한 혼란스러운 경험과, 불매행동으로 자신의 생각을 표현하고 신념을 강화하는 긍정적 경험이 함께 나타났다.

Korean Text to Gloss: Self-Supervised Learning approach

  • Thanh-Vu Dang;Gwang-hyun Yu;Ji-yong Kim;Young-hwan Park;Chil-woo Lee;Jin-Young Kim
    • 스마트미디어저널
    • /
    • 제12권1호
    • /
    • pp.32-46
    • /
    • 2023
  • Natural Language Processing (NLP) has grown tremendously in recent years. Typically, bilingual, and multilingual translation models have been deployed widely in machine translation and gained vast attention from the research community. On the contrary, few studies have focused on translating between spoken and sign languages, especially non-English languages. Prior works on Sign Language Translation (SLT) have shown that a mid-level sign gloss representation enhances translation performance. Therefore, this study presents a new large-scale Korean sign language dataset, the Museum-Commentary Korean Sign Gloss (MCKSG) dataset, including 3828 pairs of Korean sentences and their corresponding sign glosses used in Museum-Commentary contexts. In addition, we propose a translation framework based on self-supervised learning, where the pretext task is a text-to-text from a Korean sentence to its back-translation versions, then the pre-trained network will be fine-tuned on the MCKSG dataset. Using self-supervised learning help to overcome the drawback of a shortage of sign language data. Through experimental results, our proposed model outperforms a baseline BERT model by 6.22%.

딥러닝 기반 소셜미디어 한글 텍스트 우울 경향 분석 (A Deep Learning-based Depression Trend Analysis of Korean on Social Media)

  • 박서정;이수빈;김우정;송민
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.91-117
    • /
    • 2022
  • 국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

미디어 동기화를 지원하는 웹기반 멀티미디어 전자사전 시스템 (A Web-Based Multimedia Dictionary System Supporting Media Synchronization)

  • 최용준;황도삼
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1145-1161
    • /
    • 2004
  • 본 연구는 인터넷에 분산되어 있는 언어자원들의 미디어 데이터를 통합하여 멀티미디어 전자사전 시스템을 구축하는 기법을 연구하는 것으로, 텍스트 데이터를 기반으로 한 기존 전자사전 시스템을 멀티미디어 환경으로 발전시킨다. 이를 위하여 인터넷에 분산되어 있는 언어자원들의 미디어 데이터를 웹 브라우저 환경에서 통합하는 기법을 제안한다. 제안하는 기법은 미디어 통합데이터에 의해 웹 브라우저가 모든 작업을 수행하므로 복잡한 서버 시스템을 필요로 하지 않는다. 구현하는 전자사전은 웹 브라우저 환경에서 작동하며, 텍스트와 이미지 및 음성을 통합하여 합성하거나 움직임을 재생한다. 통합과 움직임의 데이터를 기술하기 위하여 각 미디어의 의미를 분석하여 SMIL 문서를 생성하고 웹 브라우저에서 실행하도록 하였다. 제안하는 멀티미디어 전자사전 시스템은 단순한 미디어 데이터들을 통합하는 방식으로 작동하므로 전용 서버 시스템을 필요로 하지 않는다. 또한, 각 미디어 데이터는 분산되어 있는 데이터를 공유하는 형태이므로 저장 공간을 절약하게 되며, 최근의 데이터로 갱신하는 것이 간단하게 이루어진다.

  • PDF

추천을 위한 키워드 가중치를 이용한 멀티모달 미디어 콘텐츠 분류 (Multimodal Media Content Classification using Keyword Weighting for Recommendation)

  • 강지수;백지원;정경용
    • 융합정보논문지
    • /
    • 제9권5호
    • /
    • pp.1-6
    • /
    • 2019
  • 모바일 시장의 확장과 함께 멀티모달 미디어 콘텐츠의 제공을 위한 플랫폼이 다양해지고 있다. 멀티모달 미디어 콘텐츠에는 이종데이터들이 복합적으로 포함되어 있어 사용자들이 선호 콘텐츠를 선택하기 위해 시간과 노력이 요구된다. 따라서 본 논문에서는 추천을 위한 키워드 가중치를 이용한 멀티모달 미디어 콘텐츠 분류를 제안한다. 제안하는 방법은 멀티모달 미디어 콘텐츠의 텍스트 데이터에서 키워드 가중치를 통해 콘텐츠를 가장 잘 나타내는 키워드를 추출한다. 추출된 키워드를 기반으로 서브클래스를 갖는 장르 클래스를 생성하고 이에 적절한 멀티모달 미디어 콘텐츠를 분류한다. 또한 개인화된 추천을 위해 사용자의 선호도 평가를 진행하여 사용자의 콘텐츠 선호도 분석 결과를 기반으로 멀티모달 콘텐츠를 추천한다. 성능평가는 추천 결과의 정확도와 만족도를 통해 우수함을 검증한다. 이는 사용자가 선호하는 장르와 키워드를 모두 고려하여 추천하기 때문에 정확도는 74.62%, 만족도는 69.1%로 높게 나타난다.

메시지 조절목표와 메시지 형식 간 적합성이 메시지 설득력에 미치는 영향 (The Persuasive Impact of Fit between Message Goals(Promotion vs. Prevention) and Modality of Message on Social Media)

  • 김동후;송영아
    • 한국콘텐츠학회논문지
    • /
    • 제21권2호
    • /
    • pp.604-621
    • /
    • 2021
  • 커뮤니케이션 수단으로서의 소셜미디어의 성장은 소비자가 영양학적 선택과 건강한 음식 소비를 하는 데 소셜미디어의 영향력 역시 증가시켰다. 이 연구는 소셜미디어 상에서 건강한 식습관과 관련한 메시지 목표(향상 vs. 예방)와 메시지 형식(텍스트 vs. 이미지)이 메시지 설득력에 미치는 영향력을 알아보는 데 그 목적이 있다. 연구 결과에 따르면, 향상메시지에 노출된 참가자들은 소셜미디어 메시지 형식에 따른 차이를 보이지 않았으나, 예방메시지에 노출된 참가자들은 텍스트 (vs. 이미지) 형식의 메시지에 노출되었을 때, 메시지에 대한 더 긍정적인 태도를 보였으며, 해당 메시지에 대해 더 높은 클릭 의도를 보였다. 본 연구의 결과는 소셜미디어 상 건강메시지의 형식과 메시지 목표의 적합성이 메시지 효과에 영향을 미침을 이론적으로 증명하였다. 더불어 효과적인 건강메시지 작성 및 전달 방식에 대한 실무적 지침 역시 제공하리라 예상한다.

COVID-19 발생 전·후 언론보도에 나타난 간호사 이미지에 대한 텍스트 네트워크 분석 및 토픽 모델링 (Images of Nurses Appeared in Media Reports Before and After Outbreak of COVID-19: Text Network Analysis and Topic Modeling)

  • 박민영;정석희;김희선;이은지
    • 대한간호학회지
    • /
    • 제52권3호
    • /
    • pp.291-307
    • /
    • 2022
  • Purpose: The aims of study were to identify the main keywords, the network structure, and the main topics of press articles related to nurses that have appeared in media reports. Methods: Data were media articles related to the topic "nurse" reported in 16 central media within a one-year period spanning July 1, 2019 to June 30, 2020. Data were collected from the Big Kinds database. A total of 7,800 articles were searched, and 1,038 were used for the final analysis. Text network analysis and topic modeling were performed using NetMiner 4.4. Results: The number of media reports related to nurses increased by 3.86 times after the novel coronavirus (COVID-19) outbreak compared to prior. Pre- and post-COVID-19 network characteristics were density 0.002, 0.001; average degree 4.63, 4.92; and average distance 4.25, 4.01, respectively. Four topics were derived before and after the COVID-19 outbreak, respectively. Pre-COVID-19 example topics are "a nurse who committed suicide because she could not withstand the Taewoom at work" and "a nurse as a perpetrator of a newborn abuse case," while post-COVID-19 examples are "a nurse as a victim of COVID-19," "a nurse working with the support of the people," and "a nurse as a top contributor and a warrior to protect from COVID-19." Conclusion: Topic modeling shows that topics become more positive after the COVID-19 outbreak. Individual nurses and nursing organizations should continuously monitor and conduct further research on nurses' image.

Dysarthric speaker identification with different degrees of dysarthria severity using deep belief networks

  • Farhadipour, Aref;Veisi, Hadi;Asgari, Mohammad;Keyvanrad, Mohammad Ali
    • ETRI Journal
    • /
    • 제40권5호
    • /
    • pp.643-652
    • /
    • 2018
  • Dysarthria is a degenerative disorder of the central nervous system that affects the control of articulation and pitch; therefore, it affects the uniqueness of sound produced by the speaker. Hence, dysarthric speaker recognition is a challenging task. In this paper, a feature-extraction method based on deep belief networks is presented for the task of identifying a speaker suffering from dysarthria. The effectiveness of the proposed method is demonstrated and compared with well-known Mel-frequency cepstral coefficient features. For classification purposes, the use of a multi-layer perceptron neural network is proposed with two structures. Our evaluations using the universal access speech database produced promising results and outperformed other baseline methods. In addition, speaker identification under both text-dependent and text-independent conditions are explored. The highest accuracy achieved using the proposed system is 97.3%.