• 제목/요약/키워드: TypeScript

검색결과 70건 처리시간 0.027초

Designing a large recording script for open-domain English speech synthesis

  • Kim, Sunhee;Kim, Hojeong;Lee, Yooseop;Kim, Boryoung;Won, Yongkook;Kim, Bongwan
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.65-70
    • /
    • 2021
  • This paper proposes a method for designing a large recording script for open domain English speech synthesis. For read-aloud style text, 12 domains and 294 sub-domains were designed using text contained in five different news media publications. For conversational style text, 4 domains and 36 sub-domains were designed using movie subtitles. The final script consists of 43,013 sentences, 27,085 read-aloud style sentences, and 15,928 conversational style sentences, consisting of 549,683 tokens and 38,356 types. The completed script is analyzed using four criteria: word coverage (type coverage and token coverage), high-frequency vocabulary coverage, phonetic coverage (diphone coverage and triphone coverage), and readability. The type coverage of our script reaches 36.86% despite its low token coverage of 2.97%. The high-frequency vocabulary coverage of the script is 73.82%, and the diphone coverage and triphone coverage of the whole script is 86.70% and 38.92%, respectively. The average readability of whole sentences is 9.03. The results of analysis show that the proposed method is effective in producing a large recording script for English speech synthesis, demonstrating good coverage in terms of unique words, high-frequency vocabulary, phonetic units, and readability.

정적 오염 분석을 활용한 타입스크립트 코드의 보안 취약점 탐지 (Detecting Security Vulnerabilities in TypeScript Code with Static Taint Analysis)

  • 문태근;김형식
    • 정보보호학회논문지
    • /
    • 제31권2호
    • /
    • pp.263-277
    • /
    • 2021
  • 자바스크립트로 작성된 웹 어플리케이션에서 Cross-Site Scripting (XSS), SQL Injection과 같은 검증되지 않은 사용자 입력 데이터로 인해 발생하는 취약점을 탐지하기 위해 오염 분석 기법이 널리 사용되고 있다. 이러한 취약점을 탐지하기 위해서는 사용자 입력 데이터에 영향을 받는 변수들을 추적하는 것이 중요하지만, 자바스크립트의 동적인 특성으로 인해 웹 어플리케이션을 실행해 보지 않고 그러한 변수들을 식별하는 것은 매우 어렵다. 때문에, 기존의 오염 분석 도구들은 대상 어플리케이션을 실행하는 오버헤드가 존재하는 동적 오염 분석을 사용하도록 개발되었다. 본 논문에서는 타입스크립트(자바스크립트의 상위집합) 컴파일러를 활용해 얻은 심볼 정보를 기반으로 데이터의 흐름을 정확히 추적하고, 타입스크립트 코드에서 보안 취약점을 발견하는 새로운 정적 오염 분석 기법을 제안하였다. 제안한 기법은 개발자가 검증되지 않은 사용자 입력 데이터를 포함할 수 있는 변수에 표시를 할 수 있도록 하며, 이를 활용해 사용자 입력 값에 영향을 받는 변수와 데이터를 추적한다. 제안한 기법은 TypeScript 컴파일러에 원활히 통합될 수 있기 때문에, 별도의 도구로 작동하는 기존 분석 도구와 달리 개발자가 개발 과정에서 취약점을 발견할 수 있게 한다. 제안한 기법의 유효성을 확인하기 위해 프로토타입을 구현하였으며, 취약점이 보고된 8개의 웹 어플리케이션을 선정하여 분석을 수행하여 성능을 평가한 결과 기존의 취약점을 모두 탐지할 수 있음을 확인하였다.

Detection of Malicious PDF based on Document Structure Features and Stream Objects

  • Kang, Ah Reum;Jeong, Young-Seob;Kim, Se Lyeong;Kim, Jonghyun;Woo, Jiyoung;Choi, Sunoh
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권11호
    • /
    • pp.85-93
    • /
    • 2018
  • In recent years, there has been an increasing number of ways to distribute document-based malicious code using vulnerabilities in document files. Because document type malware is not an executable file itself, it is easy to bypass existing security programs, so research on a model to detect it is necessary. In this study, we extract main features from the document structure and the JavaScript contained in the stream object In addition, when JavaScript is inserted, keywords with high occurrence frequency in malicious code such as function name, reserved word and the readable string in the script are extracted. Then, we generate a machine learning model that can distinguish between normal and malicious. In order to make it difficult to bypass, we try to achieve good performance in a black box type algorithm. For an experiment, a large amount of documents compared to previous studies is analyzed. Experimental results show 98.9% detection rate from three different type algorithms. SVM, which is a black box type algorithm and makes obfuscation difficult, shows much higher performance than in previous studies.

스토리 정보의 검색을 위한 웹 기반의 협업적 스크립트 분석 플랫폼 개발 (Development of Collaborative Script Analysis Platform Based on Web for Information Retrieval Related to Story)

  • 박승보;김현식;백영태;유은순
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.93-101
    • /
    • 2014
  • 영화의 스토리에 대한 분석은 영화의 설계도와 같은 스크립트를 분석하여 용이하게 이루어질 수 있다. 영화의 스크립트는 파이널 드래프트(Final Draft)의 형식화된 구조로 기술되어 있지만, 웹상에 공개된스크립트들은 대부분 형식이 파괴되어 문장 내용에 대한 분석이 없으면 형식을 복원하기 힘든 상황이다. 이를 위해 자동으로 스크립트를 파싱한 후에 사용자들이 협업적으로 결과물의 오류를 자유롭게 점검하고 수정할 수 있도록 웹기반의 스크립트 분석 소프트웨어를 개발하고 제공할 필요가 있다. 따라서 본 논문에서는 사용자에 의해 스크립트의 형식 오류가 수정되고 걸러지게 하여 완성도 높은 영화 데이터 축적을 가능케 하는 웹 기반의 협업적 스크립트 분석 플랫폼의 구조를 제시하고, 구현 결과에 대한 성능평가를 진행하였다. 실험을 통해 자동 파싱 성공률이 64.95%로 나타났고, 협업적 오류 수정은 5단계를 거친 후에 대부분의 오류가 수정되어 99.58%의 파싱 정확도를 보여주었다.

개념지식의 유형에 따른 표상차이: 범주와 각본의 위계성과 전형성 비교1) (Knowledge Representation Characteristics of Categories and Scripts: An Investigation on Hierarchy and Typicality Effects)

  • 이재호;이정모
    • 인지과학
    • /
    • 제11권3_4호
    • /
    • pp.73-81
    • /
    • 2000
  • 이 연구는 지식유형에 따른 표상 차이를 확인하기 위해서 범주지식과 각본지식의 위계성과 전형성에 대한 점화효과를 측정하였다. 실험 1에서는 상위개념을 점화단어로 제시하고 하위개념을 목표단어로 제시한 다움 목표단어의 어휘판단시간을 측정하였다. 그 결과, 범주지식은 전형단어가 비전형단어보다 반응시간이 빨랐지만, 각본지식은 두 조건간의 차이가 없었다. 실험 2에서는 하위개념을 점화단어로 제시하고 상위개념을 목표단어로 제시한 다음 목표단어의 어위판단시간을 측정하였다. 범주지식이 각본지식보다 반응시간이 빨랐으며, 두 지식 모두 전형성 효과는 관찰되지 않았다. 이러한 결과는 범주지식은 전형성에 따른 위계구조를 구성하지만 각본지식은 범주지식에 비해서 위계성과 전형성이 약회된 구조로 표상될 가능성을 시사하는 것이다.

  • PDF

스크립트 임베딩을 활용한 수중운동체 M&S 전술처리기의 기능 확장 (The Functional Extension of the Underwater Vehicle Modeling and Simulation Tactics Manager using the Script Embedding Method)

  • 손명조;김태완;나영인
    • 한국군사과학기술학회지
    • /
    • 제12권5호
    • /
    • pp.590-600
    • /
    • 2009
  • In the simulation of underwater vehicles such as a submarine or a torpedo, various type of simulations like an engineering level simulation for predicting the performance precisely and an engagement level simulation for examining the effectiveness of a certain tactic is required. For this reason, a tactics manager which can change the behavior of a simulation model according to external tactics is needed. In this study the tactics manager supporting a script language and engine which can represent various tactics and can help users define external input tactics for the tactic manager easily is suggested. Python and Lua which are representative among script languages have been compared and analyzed from the viewpoint of a tactic manage, and the tactic manger using the script engines of those script languages was implemented. To demonstrate the effectiveness of the tactic manager, a target motion analysis simulation of the warfare between a submarine and a surface ship.

Study of Cursive Calligraphy of wu zhen(吳鎮)'s Ink bambooo Collection

  • Deng, Zhuoren;Lee, Jaewoo
    • International Journal of Advanced Culture Technology
    • /
    • 제10권2호
    • /
    • pp.69-78
    • /
    • 2022
  • The purpose of this paper is to summarize the cursive script of traditional calligraphy and develop further possibilities based on the study of the painting and postscript of Ink bambooo, which was painted by wu zhen(吳鎮) during the Yuan Dynasty. The second section in this paper provides a summary of wu zhen(吳鎮)'s life, in addition to "Ink bambooo" and its painting postscript. The third and fourth sections are focused on analyzing the cursive script in the painting postscript of Ink bambooo, including the left-and-right structure, head prefix symbols, and bottom prefix symbols. The aim of this paper is the study of cursive script, and the theories and methods of the characters proposed by Dr. Cai Yonggui (from Fujian Normal University) and Dr. Liu Dongqin (from Southeast University) will be used to provide a summary. The presentation of the research results of this paper is designed to develop further possibilities for this type of traditional calligraphy.

일본어의 단어인지과정에서 표기형태의 역할:연결주의 모형 (The Role of Script Type in Janpanese Word Recognition:A Connectionist Model)

  • 이광오
    • 인지과학
    • /
    • 제2권2호
    • /
    • pp.487-513
    • /
    • 1990
  • 일본어의 단어인지과정에서 표기형태의 역할을 개관하였다. 인지심리학적 연구결과를 종합한 결과, 어휘근접과정에서 카나와 한자의 서로 다른 역할을 확인하였다. 이것은 일본어 난독증의 사례에서 관찰되는 한자와 카나의 선택적 장애와도 일치한다. 이러한 사실들을 설명하기 위하여 McClelland 와 Rumelhart(1981)의 상호작용활성화 모형을 개정한 JIA(Japanese I nteractive Activation)모형을 제안하였다. 이 제안에는 카나문자단원과 한자단원의 추가, 그리고 문자노드-단어노드 연결형태의 세분화가 포함되었다. 또한 JIA모형의 컴퓨터 시뮬레이션 프로그램을 작성하여 실행하였다.

성인 포먼트 측정에서의 최적 세팅 구현: Praat software와 관련하여 (The implementation of Korean adult's optimal formant setting by Praat scripting)

  • 박지연;성철재
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.97-108
    • /
    • 2019
  • 한국인 성인을 대상으로 최적의 포먼트 분석이 가능하도록 자동화된 프랏 스크립트를 구현하였다. 최적의 포먼트 분석이란 프랏에서 포먼트 분석 시 설정하는 2가지 세팅 파라미터(최대 포먼트, 포먼트 개수)를 조합하여 측정된 제1, 제2 포먼트의 편차합이 최소일 때를 가리킨다. 포먼트 분석의 신뢰성을 높이기 위해서는 성별이나 모음의 종류에 따라 LPC 차수를 다르게 설정해야 하는데 프랏 매뉴얼에서는 최대 포먼트 설정 값으로 남성 5,000 Hz, 여성 5,500 Hz, 측정개수는 5개를 권고한다. 그러나 이렇게 권고된 포먼트 세팅 설정이 한국어 모음에 대해서도 타당한지 검증이 필요하다. 본 연구에서 구현한 4가지 스크립트를 적용한 결과, 각 모음별 포먼트 산점도로 확인하였을 때 특히 여성의 경우 스크립트에 따라 측정된 포먼트 변이의 폭이 두드러지는 차이를 보였다. 포먼트 산점도와 통계 결과를 통해 linear_script와 qtone_script가 포먼트 측정에서 더 신뢰성이 높은 것을 알 수 있었다. Linear_script, qtone_script에서 최적의 세팅으로 설정된 최대 포먼트와 포먼트 개수의 데이터 경향성을 살펴보면, 전설 모음 [이, 에]의 경우 권고 설정보다 최대 포먼트 값은 높게, 포먼트 개수의 값은 적게 설정되었다. 반면 후설모음 [오, 우]의 경우, 권고 설정보다 최대 포먼트 값은 낮게, 포먼트 개수의 값은 많게 설정되는 것을 확인할 수 있었다.

Cartesian Product Algorithm을 사용한 JavaScript-to-C++ 타입 추론 컴파일러 (JavaScript-to-c++ Type Inferencing Transcompiler Using Cartesian Product Algorithm)

  • 김재주;한환수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.910-913
    • /
    • 2015
  • 자바스크립트는 웹 페이지를 제어하기 위한 표준적인 스크립트 언어로 오랫동안 사용되어 왔다. 최근 웹 앱이나 서버사이드 응용 프로그램을 자바스크립트로 작성하게 되면서, 자바스크립트 프로그램을 더욱 빠르게 동작하도록 만드는 것이 중요한 이슈가 되었다. 본 논문에서는 암시적인 동적 타입 시스템을 사용하는 자바스크립트 언어에 Cartesian Product Algorithm을 적용하여 타입을 추론하고, 이 정보를 바탕으로 정적 타입 시스템인 C++ 코드로 변환하는 컴파일러의 구조와 알고리즘을 제시한다.