• 제목/요약/키워드: Duplicate word

검색결과 9건 처리시간 0.018초

LR 테크닉을 이용한 형태소 분석 (Morphological Processing with LR Techniques)

  • 이강혁
    • 인지과학
    • /
    • 제4권2호
    • /
    • pp.115-143
    • /
    • 1994
  • 본 논문은 LR 파싱기법을 이용한 확장된 두단계(two-level)형태소분석 모델을 제시한다.LA기법을 이용한 두단계 모델은 효율적 형태소분석 뿐만 아니라 Koskenniemi(1983)의 모델보다 형태론적 현상에 대한 보다 높은 기술성(descriptive adequacy)을 획득한다.이를 위해 두단계 모델은 자질기반의 문맥자유문법(feature-based CF grammar)에 근거한 독립적인 형태/통사모듈에 의해 확장된다.문맥자유문법에 근거한 단어문법(word grammar)을 채택함으로써 확장 모델은 하위사전의 중복현상을 피하면서 비연속적 의존관계(discontinuous dependencies) 를 가지는 복합어 등을 처리할 수 있다.또한 파싱테이블에 명시된 LR 예측은 형태소분석기로 하여금 사전탐색시간을 줄일 수 있도록 도와준다.

1:1 발표력 코칭 애플리케이션의 개발 (Development of a 1:1 Presentation Coaching Application)

  • 위승현;문미경
    • 전기전자학회논문지
    • /
    • 제22권4호
    • /
    • pp.992-998
    • /
    • 2018
  • 발표력이란 다른 사람 앞에서 자신의 생각과 주장을 논리적으로 자신감 있게 전달하는 기술로 학교나 직장에 다닐 경우 필수적이다. 그러나 발표력을 향상시키기 위해서는 많은 시간과 돈, 그리고 노력이 필요하다. 본 논문에서는 프레젠테이션 연습 비디오를 분석하는 프레젠테이션 코칭 응용 프로그램 개발에 대해 설명한다. 응용 프로그램은 프레젠테이션 시간, 화자의 표정, 중복 단어 사용 등을 분석해서 사용자에게 분석결과를 제공함으로 발표력 향상에 도움을 줄 수 있다.

Does Cloned Template Text Compromise the Information Integrity of a Paper, and is it a New Form of Text Plagiarism?

  • Jaime A. Teixeira da Silva
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제13권2호
    • /
    • pp.23-35
    • /
    • 2023
  • Word templates exist for select journals, and their primary objective is to facilitate submissions to those journals, thereby optimizing editors' and publishers' time and resources by ensuring that the desired style (e.g., of sections, references, etc.) is followed. However, if multiple unrelated authors use the exact same template, a risk exists that some text might be erroneously cloned if template-based papers are not carefully screened by authors, journal editors or proof copyeditors. Elsevier Procedia® was used as an example. Select cloned text, presumably derived from MS Word templates used for submissions to Elsevier Procedia® journals, was assessed using Science Direct. Typically, in academic publishing, identical text is screened using text similarity software during the submission process, and if detected, may be flagged as plagiarism. After searching for "heading should be left justified, bold, with the first letter capitalized", 44 Elsevier Procedia® papers were found to be positive for vestigial template text. The integrity of the information in these papers has been compromised, so these errors should be corrected with an erratum, or in the case of extensive errors and vast tracts (e.g., pages long) of template text, papers should be retracted and republished.

소액 지불 전자상거래 환경을 위한 프로토콜의 설계 및 구현 (Design and Implementation of a Micropayment Protocol in Electronic Commerce Environments)

  • 손병록;박기현;유상진
    • 경영과학
    • /
    • 제18권1호
    • /
    • pp.69-78
    • /
    • 2001
  • An electronic micropayment system, one of electronic payment systems, is suitable especially when a small amount of money is to be paid frequently in order to purchase on-line goods (i.e. database search, software distribution, electronic news service, etc). In addition, since the amount of payment is small, possible damages caused by system failures are lower than other payment system. In this paper, a micropayment protocol in electronic commerce environments on the Internet is proposed, based on the PayWord system. And a micropayment electronic commerce system which executes the protocol proposed is implemented. Unlike the PayWord system, however, the micropayment protocol proposed in this paper is designed in such a way that a merchant does not need to request a payment at the end of every business day since a customer cannot purchase goods beyond length of hash chains, which is specified on a certificate. In addition, the system is able to check the validity as well as the duplicate spending of hash chains. The electronic micropayment system with the proposed protocol is consists of Customers, Merchants, and Brokers. Customers are implemented on Windows NT 4.0 using VC++. Merchants are implemented on Solaris 2.5.1 and gcc 2.8.0 using Netscape Web Server and CGI Methods. HP UX 10.20 is used for Brokers.

  • PDF

트위터에서 형태소 분석과 PageRank 기반 화제단어 추출 방법 제안 (Proposal of keyword extraction method based on morphological analysis and PageRank in Tweeter)

  • 이원형;조성일;김동회
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.157-163
    • /
    • 2018
  • SNS를 이용하는 사람들은 매일 자신의 다양한 생각을 SNS에 게시한다. SNS에 게시된 데이터는 수많은 사람들의 생각과 의견이 담겨있다고 할 수 있다. 특히 트위터에서 서비스되는 인기 화제어는 사용자가 올린 글에서 자주 등장한 단어의 횟수를 집계해 순위를 결정한다. 하지만 이와 같은 방법은 단순히 중복된 단어가 나열된 불필요한 데이터에 민감하다. 제안하는 방법은 단어간의 관계도를 이용한 단어의 화제성을 기반으로 순위를 결정하므로 불필요한 데이터의 영향을 적게 받고 주요단어를 안정적으로 추출할 수 있다. 성능 비교를 위하여 내림차순 화제어 순위와 상위 20개중에서 의미 없는 화제어의 비율 측면에서 형태소 분석과 PageRank 기반의 제안 방식과 단순 등장 횟수 기반의 기존 방식을 비교한다. 제안하는 방안과 기존 방안은 상위 20개중에서 무의미한 화제어를 각각 55%과 70%를 순위권에 포함시켰으며 제안한 방법이 기존 방법과 비교할 때 15% 정도 향상된다.

악안면 보철 연구: 체계적 고찰 (A study on maxillofacial prosthesis: systematic considerations)

  • 황성식;임용운
    • 대한치과기공학회지
    • /
    • 제43권4호
    • /
    • pp.139-144
    • /
    • 2021
  • Purpose: This study aimed to provide basic data to identify the current status of use of maxillofacial prosthesis across the world and discuss its application and research directions in Korea. Methods: Existing literature (study period, 2010 to 2020) from international studies was collected from PsycINFO, CINAHL, and PubMed, whereas domestic studies were searched using KISS and RISS. Maxillofacial prosthesis was used as the search word. A total of three foreign and two domestic articles were searched, and as a result, a total of 12 documents were selected for analysis. Results: A total of 3,311 studies were searched in this study. Among them, 3,253 articles contained in duplicate inspection and exclusion criteria were removed, and 12 articles were selected by removing literature that did not meet the research criteria through title and green and text reviews. Finally, two researchers selected the final 12 articles through handwritten searches. Eleven of them were case studies, and the remaining one was a descriptive study. Conclusion: This study identified the current status of studies that implemented maxillofacial prosthesis, published from January 2010 to January 2020. Facial prosthetics improve the quality of life of patients by restoring defects that appear on different types of mouth and face and promote both function and aesthetics. Therefore, they can be used to treat various conditions and have a positive impact on the future.

Analysis of University Unification Education Research Trends Using Text Network Analysis and Topic Modeling

  • Do-Young LEE
    • 웰빙융합연구
    • /
    • 제6권4호
    • /
    • pp.27-31
    • /
    • 2023
  • Purpose: This study analyzed papers identified by entering the two keywords 'unification education' and 'university' during research from 2013 to 2022 in order to identify trends and key concepts in unification education research at domestic universities. Research design, data, and methodology: The study analyzed 224 papers, excluding those on primary, middle, and high school unification education, as well as unrelated and duplicate papers. The analysis included developing a co-occurrence network of keywords, utilizing topic modeling to categorize research types, and confirming visualizations such as word clouds and sociograms. Results: In the final analysis, the research identified 1,500 keywords, with notable ones like 'Korea,' 'education,' 'unification.' Centrality analysis, measuring influence through connected keywords, revealed that 'Korea,' 'education,' 'north,' and 'unification' held significant positions. Keywords with high centrality compared to their frequency included 'learning,' 'development,' 'training,' 'peace,' and 'language,' in that order. Conclusions: This study investigated trends and structures in university-level unification education by analyzing papers identified with the keywords 'unification education' and 'university.' The use of keyword network analysis aimed to elucidate patterns and structures in university-level unification education. The significance of the study lies in offering foundational data for future research directions in the field of unification education at universities.

텍스트 기준점 기반의 저작권 침해 판단 시스템 구현 (System Implement to Identify Copyright Infringement Based on the Text Reference Point)

  • 최경웅;박순철;양승원
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.77-84
    • /
    • 2015
  • 기존 문서 저작물의 저작권 침해 판단 방법은 문서를 처음부터 끝까지 문장 단위로 자른 후, 문장 안에서 6어절 단위로 이동하면서 색인키를 생성하여 비교한다. 그러나 이 방법은 문서의 크기가 클 때 색인키가 대량으로 생산되어 표절 검사의 시간이 길어지는 단점이 있다. 이러한 단점을 제거하기 위하여, 본 논문에서 제안하는 방법은 일정한 크기의 윈도우를 문자 단위로 이동하면서 각 윈도우 내에 있는 가장 큰 어절을 선택하여 특징블록을 색인키로 정하는 것이다. 이 방법은 윈도우를 이동하는 과정에서 중복된 특징 블록을 제거하여 색인키의 수를 획기적으로 줄일 수 있다. 이를 적용한 시스템은, 상대적으로 적게 추출된 특징블록간 유사도를 비교함으로써, 두 문서 저작물사이에서 표절된 저작물의 침해 위치를 정확하고 빠르게 검색할 수 있다.

트위터 트랜딩 토픽을 이용한 HBase 기반 자동 요약 시스템 (HBase-based Automatic Summary System using Twitter Trending Topics)

  • 이상훈;문승진
    • 인터넷정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.63-72
    • /
    • 2014
  • 트위터는 사용자들이 140개 정도의 문자들로 이루어진 짧은 메시지를 웹에 포스팅 할 수 있도록 제공하는 인기 있는 소셜 미디어 플랫폼이다. 해시태그는 이러한 트위터 사용자들이 특정한 주제에 대해서 토론을 하거나 높은 트랜딩을 가지는 이슈를 나타내고자 할 때 사용하는 특정한 단어나 두음문자이다. 하지만 동일한 해시태그를 포함하는 포스트들은 관련 있는 문장이 아닌 시간 순서에 의해서 처리되기 때문에, 처음 사용자가 그 해시태그와 관련된 내용을 이해하기 위해서는 다른 불필요한 내용까지 읽어야 하는 어려움이 있다. 본 논문에서는, 이러한 문제점을 해소하기 위한 HBase 기반 자동 요약 시스템을 제안한다. 제안된 시스템은 트위터 API에서 제공하는 스트리밍 데이터를 HBase에 저장한 후 퍼지 시스템과 접목하여 자동 요약 방법을 시행하였다. 이를 통해서 해시태그를 포함한 포스트내의 중복된 내용을 제거하고, 각 포스트들의 중요도를 계산해서 사용자가 트랜딩 토픽내에 관련 있는 주제에 쉽게 접근할 수 있도록 하였다.