• 제목/요약/키워드: media text

검색결과 831건 처리시간 0.031초

텍스트 요약 품질 향상을 위한 의미적 사전학습 방법론 (Semantic Pre-training Methodology for Improving Text Summarization Quality)

  • 전민규;김남규
    • 스마트미디어저널
    • /
    • 제12권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 최근 사용자에게 의미있는 정보만을 자동으로 간추리는 텍스트 자동 요약이 꾸준히 연구되고 있으며, 특히 인공신경망 모델인 트랜스포머를 활용한 텍스트 요약 연구가 주로 수행되고 있다. 다양한 연구 중 특히 문장 단위 마스킹을 통해 모델을 학습시키는 GSG 방식이 가장 주목을 받고 있지만, 전통적인 GSG는 문장의 의미가 아닌 토큰의 중복 정도에 기반을 두어 마스킹 대상 문장을 선정한다는 한계를 갖는다. 따라서 본 연구에서는 텍스트 요약의 품질을 향상시키기 위해, 문장의 의미를 고려하여 GSG의 마스킹 대상 문장을 선정하는 SbGSG(Semantic-based GSG) 방법론을 제안한다. 뉴스기사 370,000건과 요약문 및 레포트 21,600건을 사용하여 실험을 수행한 결과, ROUGE와 BERT Score 측면에서 제안 방법론인 SbGSG가 전통적인 GSG에 비해 우수한 성능을 보임을 확인하였다.

텍스트마이닝을 이용한 약물유해반응 보고자료 분석 (Analysis of Adverse Drug Reaction Reports using Text Mining)

  • 김현희;유기연
    • 한국임상약학회지
    • /
    • 제27권4호
    • /
    • pp.221-227
    • /
    • 2017
  • Background: As personalized healthcare industry has attracted much attention, big data analysis of healthcare data is essential. Lots of healthcare data such as product labeling, biomedical literature and social media data are unstructured, extracting meaningful information from the unstructured text data are becoming important. In particular, text mining for adverse drug reactions (ADRs) reports is able to provide signal information to predict and detect adverse drug reactions. There has been no study on text analysis of expert opinion on Korea Adverse Event Reporting System (KAERS) databases in Korea. Methods: Expert opinion text of KAERS database provided by Korea Institute of Drug Safety & Risk Management (KIDS-KD) are analyzed. To understand the whole text, word frequency analysis are performed, and to look for important keywords from the text TF-IDF weight analysis are performed. Also, related keywords with the important keywords are presented by calculating correlation coefficient. Results: Among total 90,522 reports, 120 insulin ADR report and 858 tramadol ADR report were analyzed. The ADRs such as dizziness, headache, vomiting, dyspepsia, and shock were ranked in order in the insulin data, while the ADR symptoms such as vomiting, 어지러움, dizziness, dyspepsia and constipation were ranked in order in the tramadol data as the most frequently used keywords. Conclusion: Using text mining of the expert opinion in KIDS-KD, frequently mentioned ADRs and medications are easily recovered. Text mining in ADRs research is able to play an important role in detecting signal information and prediction of ADRs.

MBC의 미디어AI 서비스

  • 성시훈
    • 방송과미디어
    • /
    • 제28권2호
    • /
    • pp.53-59
    • /
    • 2023
  • (주)문화방송(MBC)은 콘텐츠 제작 및 유통 워크플로우에 인공지능(Artificial Intelligence, AI) 기술을 적용한 미디어AI 서비스를 운영하고 있다. 영상아카이브에 보관되어 있는 수십만 개의 아날로그와 SD급 콘텐츠를 대상으로 HD급 수준의 영상화질로 품질을 향상시키기 위해서 AI영상화질개선시스템을 2020년에 개발 구축해서 여러 목적에 활용하고 있으며, HD급 콘텐츠를 대상으로 4K 초고화질급으로 변환하는 기술로 고도화해서 실서비스 적용을 눈앞에 두고 있다. 그리고 2년의 STT(Speech-To-Text, 음성문자변환) 베타서비스를 통해 얻어진 사용성 검증과 운영 경험을 바탕으로 STT HUB 서비스를 개발 구축해서 2022년부터 보도와 시사교양 프로그램의 제작 워크플로우에 적용하고 있다. 이들 서비스의 주요 기능들과 기술적 요소들의 구현, 미디어AI 서비스 운영의 경험을 나누고자 한다.

  • PDF

Midjourney와 Stable Diffusion을 이용한 AI 생성 이미지의 차이 비교 (Comparison of the Differences in AI-Generated Images Using Midjourney and Stable Diffusion)

  • 부이두엉화이린;이강희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.563-564
    • /
    • 2023
  • Midjourney and Stable Diffusion are two popular AI-generated image programs nowadays. With AI's outstanding image-generation capabilities, everyone can create artistic paintings in just a few minutes. Therefore, "Comparison of differences between AI-generated images using Midjourney and Stable Diffusion" will help see each program's advantages and assist the users in identifying the tool suitable for their needs.

  • PDF

A Content Analysis for Website Usefulness Evaluation: Utilizing Text Mining Technique

  • Kwon, Do Young;Jeong, Seung Ryul
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.71-81
    • /
    • 2015
  • With the increasing influence of online media, company websites have become important communication channels between companies and customers. Companies use their websites as a marketing tool for a variety of purposes, including enhancing their image and selling products or services. Many researchers have examined the criteria, methods, and tools for website evaluation, but most have focused on usability. Prior content analyses have focused not on text content but on website components, an approach likely to produce subjective evaluations. This study attempts to objectively evaluate company websites by utilizing text mining. We analyze the usefulness of company websites by presenting visualized outputs from a business perspective, allowing practitioners to easily understand the results of the website evaluation and use them in decision making. To demonstrate our method empirically, we selected a company with a number of affiliates in Korea and analyzed the text content of their websites to assess their usefulness using natural language processing and graphics packages in R. Practitioners can easily employ our objective evaluation method, and researchers can use it to gain a new perspective on website evaluation.

정치 도메인에서 신조어휘의 효과적인 추출 및 의미 분석에 대한 연구 (Study on Effective Extraction of New Coined Vocabulary from Political Domain Article and News Comment)

  • 이지현;김재홍;조예성;이민구;최혜봉
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.149-156
    • /
    • 2021
  • 정치적 사안에 대한 대중의 의견과 인식을 객관적으로 이해하기 위한 방법으로 텍스트 마이닝을 통한 빅데이터 분석을 수행할 수 있다. 기존 어휘 사전에 기반한 텍스트 마이닝 알고리즘은 신조어와 같이 사전에 수록되지 않은 어휘를 분석하는데 한계가 나타난다. SNS를 통해 나타나는 사용자들의 의견은 많은 경우 신조어와 비속어를 포함하는데, 이러한 어휘들을 효과적으로 분석하지 못한다면 정확한 대중의 인식과 의견을 파악하기 어렵게 된다. 본 논문은 정치 섹션의 뉴스 댓글로부터 정치적 의미성을 지니는 신조어와 비속어를 효과적으로 추출하는 방법을 제안하고, 추출한 신조어휘들의 의미와 맥락을 이해하기 위한 다양한 방법을 제시하였음.

Enhancing the Text Mining Process by Implementation of Average-Stochastic Gradient Descent Weight Dropped Long-Short Memory

  • Annaluri, Sreenivasa Rao;Attili, Venkata Ramana
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.352-358
    • /
    • 2022
  • Text mining is an important process used for analyzing the data collected from different sources like videos, audio, social media, and so on. The tools like Natural Language Processing (NLP) are mostly used in real-time applications. In the earlier research, text mining approaches were implemented using long-short memory (LSTM) networks. In this paper, text mining is performed using average-stochastic gradient descent weight-dropped (AWD)-LSTM techniques to obtain better accuracy and performance. The proposed model is effectively demonstrated by considering the internet movie database (IMDB) reviews. To implement the proposed model Python language was used due to easy adaptability and flexibility while dealing with massive data sets/databases. From the results, it is seen that the proposed LSTM plus weight dropped plus embedding model demonstrated an accuracy of 88.36% as compared to the previous models of AWD LSTM as 85.64. This result proved to be far better when compared with the results obtained by just LSTM model (with 85.16%) accuracy. Finally, the loss function proved to decrease from 0.341 to 0.299 using the proposed model

디지털 교육매체의 기초 컨셉디자인 동향 파악을 위한 선진국 사례 분석 - 영국과 스웨덴의 사용자 니즈를 중심으로 - (Case Study Analysis of Digital Education Design to Basic Concept Design Trend by Target of Education Needs in UK and Sweden)

  • 김정희
    • 만화애니메이션 연구
    • /
    • 통권34호
    • /
    • pp.345-366
    • /
    • 2014
  • 2007년 수학 교과서의 공교육 최초 디지털 교과서 적용을 시작으로 영어, 과학 등 다양한 분야에 디지털 교과서를 활용한 교육이 실시되고 있다. 초반에 아날로그 형식의 종이 교과서를 그대로 스캔하여서 사용했던 수준을 넘어 이제는 디지털 교과서만을 위한 전문화된 디자인 및 콘텐츠가 기획 단계부터 실시되어 적용되고 있으며 국립 교과서 및 검정 교과서에서도 엄체 경쟁을 통해서 보다 수준 높은 디자인 및 콘텐츠를 엄선하고 있다. 그러나 이는 디지털 교과서 하나의 매체에 국한된 것이며 국외 교육 선진국의 다양한 디지털 교육매체의 활용에는 뒤쳐져 있는 게 현실이다. 이에 본 연구는 LG 전자 유럽 디자인센터를 기점으로 영국 및 스웨덴의 선진 교육을 통해 디지털 교육매체를 수년간 접하여 이에 따른 사용자 경험과 니즈가 쌓인 사용자들을 타겟으로 휴리스틱 분석, 설문 등의 사용자 조사를 실시한다. 이에 교육 주체의 디지털 교과서 디자인의 니즈를 대입하여 세분화한 후 이를 현재 영국 및 스웨덴 선진국에서 사용하고 있는 디지털 교육매체 디자인에 간단하게 접목시켜본다. 디지털 교과서만을 접한 국내 사용자의 니즈와 사용자 경험에 비교한 결과 설문타겟 사용자들은 상당히 수준 높고 현실적이며 교육의 개별화에 치중하는 사용자 니즈(customer needs) 즉 사용자들이 원하는 것을 보여주고 있었으며 이는 디지털 매체가 적응해 나가는 초기 적용단계의 요구사항에서는 볼 수 없던 것이다. 본 논문의 결과는 선진국의 설문 조사를 통한 사용자들의 요구 즉 니즈를 파악하고 이를 적용한 디자인 교육매체의 동향을 파악하는데 기초 자료로 활용하고자 한다. 단순히 예쁘고 화려하며 디지털화 하는데서 만족하는 게 아니라 디지털 교육매체 디자인의 사용자 요구의 방향성을 미리 파악하고 이를 기획 단계부터 적용하여 교육 선진국과의 사용자 편의성의 차이를 줄이는데 도움이 되고자 한다.

뉴스 비디오 시퀀스에서 텍스트 시작 프레임 검출 방법의 비교 (Comparison of Text Beginning Frame Detection Methods in News Video Sequences)

  • 이상희;안정일;조강현
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.307-318
    • /
    • 2016
  • Overlay texts are artificially superimposed on the broadcasting videos by human producers. These texts provide additional information to the audiovisual content. Especially, the overlay texts in news video contain concise and direct description of the content. Therefore, it is most reliable clue for constructing a news video indexing system. To make this indexing system in the TV news program, it is important to detect and recognize the texts. This paper proposes the identification of the overlay text beginning frame to help the detection and recognition of the overlay text in news videos. Since all frames in the video sequences do not contain the overlay texts, the overlay text extraction from every frame is unnecessary and time-wasting. Therefore, to focus on only the frame containing the overlay text can be enhanced the accuracy of the overlay text detection. The comparative experiments of the text beginning frame identification methods were carried out with respect to Korean television news videos. Then the appropriate processing method is proposed.

Collaborative Filtering기반 추천 시스템에 관한 연구 (A Study on Recommendation System Using Collaborative Filtering)

  • 이재황;김용구;장정록;엄태광
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.231-232
    • /
    • 2008
  • 본 논문은 협업 필터링(Collaborative Filtering)기반의 추천시스템에 필요한 알고리즘을 제안한다. 제안한 알고리즘은 사용자의 선호도를 Implicit Feedback을 통해 예측하는 Implicit Rating과 사용자 선호도와 컨텐츠의 정보를 바탕으로 사용자의 프로파일을 형성하는 Tag 기반의 사용자 프로파일과 P2P망 내에서 자신과 유사한 사용자 그룹을 형성하는 알고리즘으로 구성되어 있다. 제안한 알고리즘을 적용하여 Web Text 기반의 CF기반의 개인화 추천시스템을 구현하였으며 구현된 프로그램을 실제 사용자에게 배포하여 Feasibility를 검증하였다.

  • PDF