• 제목/요약/키워드: Text Reuse

검색결과 22건 처리시간 0.024초

한의학 고문헌 텍스트에서의 인용문 추정과 탐색 (Detecting Local Text Reuse in the Texts of East Asian Traditional Medicine)

  • 오준호
    • 대한한의학원전학회지
    • /
    • 제34권1호
    • /
    • pp.37-45
    • /
    • 2021
  • Objectives : The purpose of this paper was to examine quantitative methods for estimating and detecting local text reuse in the texts of East Asian Traditional Medicine. Methods : We introduce techniques that estimate the volume of local text reuse with n-gram and those that directly detect the reuse with the Smith-Waterman algorithm (SW algorithm). Based on this, the estimation and detection of local text reuse were carried out for 『Donguibogam』 and 『Huangdineijing·Suwen』. Results : Estimates with n-gram had more errors than methods with SW algorithms. SW algorithms detected suspected strings directly with local text reuse, resulting in more accurate results. Conclusions : Although n-gram does not accurately find local text reuse, its high speed makes it a preferable method for certain purposes, such as screening similar documents. On the other hand, SW algorithms have the advantage of being relatively good at finding similar phrases suspected as local text reuse even if the strings do not completely match. However, due to its excessive consumption of time and computing resources, its benefits are limited to cases where precise results are required.

Query Formulation for Heuristic Retrieval in Obfuscated and Translated Partially Derived Text

  • Kumar, Aarti;Das, Sujoy
    • Journal of Information Science Theory and Practice
    • /
    • 제3권1호
    • /
    • pp.24-39
    • /
    • 2015
  • Pre-retrieval query formulation is an important step for identifying local text reuse. Local reuse with high obfuscation, paraphrasing, and translation poses a challenge of finding the reused text in a document. In this paper, three pre-retrieval query formulation strategies for heuristic retrieval in case of low obfuscated, high obfuscated, and translated text are studied. The strategies used are (a) Query formulation using proper nouns; (b) Query formulation using unique words (Hapax); and (c) Query formulation using most frequent words. Whereas in case of low and high obfuscation and simulated paraphrasing, keywords with Hapax proved to be slightly more efficient, initial results indicate that the simple strategy of query formulation using proper nouns gives promising results and may prove better in reducing the size of the corpus for post processing, for identifying local text reuse in case of obfuscated and translated text reuse.

OTT 서비스 정보시스템 품질이 재사용의도에 미치는 영향 (The effects of OTTservice information system quality on reuse intention)

  • 엄지연;임영우;곽기영
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권3호
    • /
    • pp.63-83
    • /
    • 2023
  • Purpose With the continuous growth of the OTT services market, trust issues are becoming increasingly important, but research on this topic is still in its infancy. The purpose of this study is to identify the structural relationship between information system quality and reuse intention of OTT services and to analyze the impact of trust and user satisfaction. Design/methodology/approach This study proposed a research model based on the information system success model. In this study, a survey was conducted among 236 Korean users who have used OTT services within the last six months. Findings The results of the analysis showed that text quality and visual quality had a significant impact on trust in OTT services, with text quality having the largest impact. System quality and text quality also had a significant impact on trust in OTT service providers. However, visual quality did not have a statistically significant effect on trust in the service provider. Trust in the OTT service and the service provider was analyzed to have a significant impact on user satisfaction. However, it did not have a statistically significant impact on reuse intention. These findings have important implications for improving trust in OTT services to increase users' reuse intentions. It is also expected to contribute to further expanding the field of OTT service research.

The relationship between public acceptance of nuclear power generation and spent nuclear fuel reuse: Implications for promotion of spent nuclear fuel reuse and public engagement

  • Roh, Seungkook;Kim, Dongwook
    • Nuclear Engineering and Technology
    • /
    • 제54권6호
    • /
    • pp.2062-2066
    • /
    • 2022
  • Nuclear energy sources are indispensable in cost effectively achieving carbon neutral economy, where public opinion is critical to adoption as the consequences of nuclear accident can be catastrophic. In this context, discussion on spent nuclear fuel is a prerequisite to expanding nuclear energy, as it leads to the issue of radioactive waste disposal. Given the dearth of study on spent nuclear fuel public acceptance, we use text mining and big data analysis on the news article and public comments data on Naver news portal to identify the Korean public opinion on spent nuclear fuel. We identify that the Korean public is more interested in the nuclear energy policy than spent nuclear fuel itself and that the alternative energy sources affect the position towards spent nuclear fuel. We recommend relating spent nuclear fuel issue with nuclear energy policy and environmental issues of alternative energy sources to further promote spent nuclear fuel.

장애인도서관 원문서비스 모바일 앱의 특성이 사용자의 만족도 및 재사용 의도에 미치는 영향요인 연구 (A Study on the Factors Affecting the Characteristics of Mobile App for Disabled Libraries' Full-text Service on User's Satisfaction and Reuse Intention)

  • 장보성
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.329-347
    • /
    • 2020
  • 본 연구는 시각장애인의 독서 및 정보활용을 위한 장애인도서관 원문서비스 모바일 앱의 특성(혁신성, 편의성, 접근성, 정확성, 신뢰성, 즉시 접속성, 상호작용성)과 기술수용모델의 지각된 유용성, 지각된 용이성을 활용하여 앱의 특성이 사용자의 만족도와 재사용 의도에 미치는 영향을 분석하고자 하였다. 조사는 국립장애인 도서관 국가대체자료공유시스템 앱을 대상으로, 사용 경험이 있는 시각장애인에게 설문지를 배포하여, 유효한 345부의 표본을 분석하였다. 분석 결과, 앱의 접근성, 편의성, 혁신성, 신뢰성이 지각된 유용성에 유의미한 영향을 미치며, 즉시접속성, 정확성, 상호작용성은 유의미한 영향이 없는 것으로 나타났다. 모든 앱의 특성은 지각된 용이성에 유의미한 영향을 미치는 것으로 분석되었다. 지각된 용이성이 지각된 유용성에 미치는 회귀모형은 통계적으로 유의미하였으며, 지각된 용이성과 지각된 유용성은 이용자의 만족도에, 만족도는 재사용 의도에 긍정적 영향을 미치는 것으로 나타났다.

연구소프트웨어의 공유, 재사용 및 인용과 관련된 현재 관행의 의미 (The Implications of Current Practices Relating to the Sharing, Reuse, and Citation of Research Software for the Future of Research)

  • 박형주
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.65-82
    • /
    • 2021
  • 이 연구의 목적은 연구소프트웨어의 공유, 재사용, 인용 현황을 분석하는 것이다. 학술커뮤니케이션에서 연구소프트웨어는 최근 들어 더욱 중요한 역할을 하고 있다. 현재 연구소프트웨어의 인용이 일반적인 관행이 아니거나, 적어도 데이터인용색인(DCI)이 연구소프트웨어의 인용과 재사용을 제대로 인덱싱하지 못하는 것으로 관찰되었다. 소프트웨어인용은 주요 레포지토리(prominent repositories)에서 발견되었다. 소프트웨어인용이 많은 레포지토리는 CRAN(Comprehensive R Archive Network)과 Zenodo였다. 연구소프트웨어가 재사용되는 경우, 비공식 소프트웨어인용(informal software citation)과 공식 소프트웨어인용(formal software citation)이 동시에 관찰되었다. 비공식 소프트웨어인용은 연구소프트웨어가 논문의 본문에서는 언급되지만 참고문헌에는 없는 경우였고, 공식 소프트웨어인용은 참고문헌에도 있는 경우였다. 또한, 이 연구의 결과는 연구소프트웨어의 자기 인용(self-citation) 현황을 설명했다.

텍스트 마이닝과 토픽모델링 활용한 사회서비스 품질의 학술연구 동향 분석 (The Analysis of Research Trends in Social Service Quality Using Text Mining and Topic Modeling)

  • 이혜정;윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제8권3호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 연구는 텍스트 마이닝과 토픽모델링을 활용하여 우리나라에 사회서비스가 본격적으로 도입된 2007년부터 2020년 까지의 사회서비스 품질에 대한 학술연구 동향을 분석하였다. 이를 토대로 사회서비스 품질에 관한 논문의 패턴 및 전체 데이터 속에 의미를 파악하여 사회서비스 발전방향에 대한 기초자료를 제공하고자 함에 목적이 있다. 자료수집은 학술연구정보서비스(RISS)에서 사회서비스, 사회복지서비스, 품질 키워드로 97편의 논문을 선정하였고, 2개 구간으로 구분하여 텍스트 마이닝을 활용하여 데이터를 분석하였다. 본 연구의 결과는 첫째, 본 연구에서 활용된 97개의 논문 중 1구간은 38편, 2구간은 59편으로 나타났고, 연 평균 6.9개의 논문이 발표되었다. 둘째, 단어빈도 분석 결과 1구간과 2구간의 공통 키워드는 서비스, 품질, 사회서비스, 만족도, 이용자, 품질관리, 재이용, 정책, 바우처 등의 순으로 나타났다. TF-IDF 분석 결과 1구간과 2구간의 공통 키워드는 사회서비스, 만족도, 이용자, 고객만족, 재이용, 바우처, 품질, 노인요양시설, 품질관리, 지역사회서비스투자사업 등의 순으로 나타났다. 셋째, 토픽 모델링 분석 결과 1구간의 주요 토픽은 서비스 제공유형, 서비스 비용, 재이용, 이용자 중심, 일자리 창출로 나타났고, 2구간은 품질관리체계, 공공성, 제공인력 관리체계, 공급방식체계, 서비스 만족도로 나타났다. 본 연구 결과를 바탕으로 사회서비스 품질 학술연구의 방향성을 제시하였다.

비디오 영상에서 시공간적 문자영역 제거방법 (Spatiotemporal Removal of Text in Image Sequences)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.113-130
    • /
    • 2004
  • 많은 시각적 정보를 포함한 비디오 데이터들의 자동화된 처리 기술 중, 비디오 데이터들의 시청자적인 정보를 보강시키고, 부가적인 정보를 첨가하기 위한 일환으로 자막을 삽입하는 경우가 많다. 이러한 자막은 때로 영상자료의 재사용성(reusability)을 저해하고, 원 영상을 훼손하는 경우가 발생한다. 본 논문에서는 영상의 재사용성을 높이고 원 영상 복원을 위해 Support Vector Machines(SVM)과 시공간적 영상복원 방법(spatiotemporal restoration)을 이용한 비디오 영상에서의 자동 문자 검출과 제거 방법을 제안한다. 연속적인 두 프레임 이상의 영상을 입력받아, 현재 프레임 영상에서 SVM을 이용하여 문자 영역을 검출한 다음, 검출된 문자 영역을 제거하고, 문자 영역에 의해 가려졌던 원 영상을 복원하기 위한 두 단계- 시간적 복원(temporal restoration)과 공간적 복원(spatial restoration)접근방법을 제안한다. 제안된 복원 방법은 글자 모션(text motion) 정보와 두 영상의 배경 차이(background difference)를 이용하여 영상을 그 특징에 따라 분류하고, 각 영상의 특징에 맞는 복원 방법을 적용한다. 제안된 방법은 다양한 종류의 영상에서 문자뿐만 아니라 관심의 대상이 되는 객체의 자동 검출 및 복원 등 다양한 응용분야를 포함한다.