• Title/Summary/Keyword: 언어적 탐색

Search Result 345, Processing Time 0.028 seconds

Modelling Grammatical Pattern Acquisition using Video Scripts (비디오 스크립트를 이용한 문법적 패턴 습득 모델링)

  • Seok, Ho-Sik;Zhang, Byoung-Tak
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.127-129
    • /
    • 2010
  • 본 논문에서는 다양한 코퍼스를 통해 언어를 학습하는 과정을 모델링하여 무감독학습(Unsupervised learning)으로 문법적 패턴을 습득하는 방법론을 소개한다. 제안 방법에서는 적은 수의 특성 조합으로 잠재적 패턴의 부분만을 표현한 후 표현된 규칙을 조합하여 유의미한 문법적 패턴을 탐색한다. 본 논문에서 제안한 방법은 베이지만 추론(Bayesian Inference)과 MCMC (Markov Chain Mote Carlo) 샘플링에 기반하여 특성 조합을 유의미한 문법적 패턴으로 정제하는 방법으로, 랜덤하이퍼그래프(Random Hypergraph) 모델을 이용하여 많은 수의 하이퍼에지를 생성한 후 생성된 하이퍼에지의 가중치를 조정하여 유의미한 문법적 패턴을 탈색하는 방법론이다. 우리는 본 논문에서 유아용 비디오의 스크립트를 이용하여 다양한 유아용 비디오 스크립트에서 문법적 패턴을 습득하는 방법론을 소개한다.

  • PDF

A clustering algorithm of statistical langauge model and its application on speech recognition (통계적 언어 모델의 clustering 알고리즘과 음성인식에의 적용)

  • Kim, Woo-Sung;Koo, Myoung-Wan
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.145-152
    • /
    • 1996
  • 연속음성인식 시스템을 개발하기 위해서는 언어가 갖는 문법적 제약을 이용한 언어모델이 요구된다. 문법적 규칙을 이용한 언어모델은 전문가가 일일이 문법 규칙을 만들어 주어야 하는 단점이 있다. 통계적 언어 모델에서는 문법적인 정보를 수작업으로 만들어 주지 않는 대신 그러한 모든 정보를 학습을 통해서 훈련해야 하기 때문에 이를 위해 요구되는 학습 데이터도 엄청나게 증가한다. 따라서 적은 양의 데이터로도 이와 유사한 효과를 보일 수 있는 것이 클래스에 의거한 언어 모델이다. 또 이 모델은 음성 인식과 연계시에 탐색 공간을 줄여 주기 때문에 실시간 시스템 구현에 매우 유용한 모델이다. 여기서는 자동으로 클래스를 찾아주는 알고리즘을 호텔예약시스템의 corpus에 적용, 분석해 보았다. Corpus 자체가 문법규칙이 뚜렷한 특성을 갖고 있기 때문에 heuristic하게 클래스를 준 것과 유사한 결과를 보였지만 corpus 크기가 커질 경우에는 매우 유용할 것이며, initial map을 heuristic하게 주고 그 알고리즘을 적용한 결과 약간의 성능향상을 볼 수 있었다. 끝으로 음성인식시스템과 접합해 본 결과 유사한 결과를 얻었으며 언어모델에도 음향학적 특성을 반영할 수 있는 연구가 요구됨을 알 수 있었다.

  • PDF

Language Variation and World Englishes (언어변이와 세계영어들)

  • Kim, Yangsoon
    • The Journal of the Convergence on Culture Technology
    • /
    • v.7 no.1
    • /
    • pp.234-239
    • /
    • 2021
  • The purpose of this paper is to find out the nature of language variation by exploring the ways of the progress of the language variation that produces all English-lects, i.e., the World Englishes. The study of language variation in linguistics is a hybrid enterprise, so the study of World Englishes has led to the recognition of a highly diverse set of all English-lects, encompassing regional dialects, sociolects, ethnolects and (post-)colonial dialects of World Englishes. In this paper, we propose a hybrid language variation model with three interacting factors of social distancing, on/off-contact, and linguistic diversity to examine the characteristics of language variation. In the context of World Englishes, the social distance is typically low in terms of their local location (country/speech) for local purposes. The social distance also varies based on online/offline communication modes and other social factors like gender, age and ethnic groups, resulting in all English-lects. To clarify the nature of World Englishes, the core Englishes, BrE, AmE and CanE are discussed here.

Hypernetwork Memory-Based Model for Infant's Language Learning (유아 언어학습에 대한 하이퍼망 메모리 기반 모델)

  • Lee, Ji-Hoon;Lee, Eun-Seok;Zhang, Byoung-Tak
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.12
    • /
    • pp.983-987
    • /
    • 2009
  • One of the critical themes in the language acquisition is its exposure to linguistic environments. Linguistic environments, which interact with infants, include not only human beings such as its parents but also artificially crafted linguistic media as their functioning elements. An infant learns a language by exploring these extensive language environments around it. Based on such large linguistic data exposure, we propose a machine learning based method on the cognitive mechanism that simulate flexibly and appropriately infant's language learning. The infant's initial stage of language learning comes with sentence learning and creation, which can be simulated by exposing it to a language corpus. The core of the simulation is a memory-based learning model which has language hypernetwork structure. The language hypernetwork simulates developmental and progressive language learning using the structure of new data stream through making it representing of high level connection between language components possible. In this paper, we simulates an infant's gradual and developmental learning progress by training language hypernetwork gradually using 32,744 sentences extracted from video scripts of commercial animation movies for children.

The extended longest match strategy for efficient Korean analysis (효율적인 한국어 분석을 위한 확장된 최장일치법)

  • Lee, Gi-O;Lee, Keun-Yong;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.255-261
    • /
    • 1996
  • 한국어 형태소 분석 방법중 최장일치법은 영어의 분석처럼 one-pass로 한국어를 분석할 수 있도록 하는 기법에 가장 적절하다. 그러나 최장일치법은 매우 많은 분석 후보를 생성하여 탐색 회수가 많아 시스템의 성능을 떨어뜨린다. 또한 대부분의 한국어 형태소 분석 시스템들은 형태소 자체에만 중점을 두어 한국어 분석 시스템 전체의 성능은 고려하지 않아 형태소 분석 시스템의 결과가 파서의 입력에 적절치 못한 결과를 생성한다. 본 논문에서는 형태소 분석의 원형복원 규칙과 사전 탐색을 통합하여 과분석 후보에 대한 탐색 회수를 줄이고 전체 시스템의 성능을 향상시키기 위해 파서에 적합한 입력을 제공하는 확장된 최장일치법을 제안한다.

  • PDF

A Study on Automatic Generation of Fuzzy Controller by Genetic Algorithm (진화적 방법을 이용한 퍼지제어기의 자동 생성에 관한 연구)

  • 이지형;이광형
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1995.10b
    • /
    • pp.203-210
    • /
    • 1995
  • 본 논문에서는 주어진 입출력 데이터로부터 유전자 알고리즘을 이용하여 퍼지제어 기를 자동 생성하는 방법에 대하여 기술한다. 주어진 입출력 데이터를 표현하는 퍼지제어기 는 각 유전자에 암호화되고, 퍼지제어기를 표현하는 각 유전자들은 서로 정보를 교환함으로 써 주어진 데이터를 적절히 표현하는 퍼지제어기를 탐색하게 된다. 유전자는 각 입력 변수 의 언어항을 정의하고, 퍼지제어규칙은 정의된 언어항과 주어진 데이터로부터 생성된다. 탐 색과정에서 퍼지제어기의 제어규칙과 각 입력변수의 언어항의 개수와 위치는 계속 변화하여 주어진 입출력 데이터를 잘 설명하는 퍼지제어기를 찾는다.

  • PDF

Exploration on possibility of finding gifted underachievers with high spatial ability and low verbal ability in elementary science field: Focused on "Light Propagation" (높은 공간능력과 낮은 언어능력을 가진 초등 미성취 과학영재의 발견가능성 탐색 - 빛의 직진 개념을 중심으로 -)

  • Jung, Yeon-su;Lee, Jiwon;Kim, Jung Bog
    • Journal of Gifted/Talented Education
    • /
    • v.26 no.1
    • /
    • pp.101-122
    • /
    • 2016
  • The purpose of this study is to explore a possibility finding gifted underachievers who have high spatial ability, but low verbal ability in elementary science field. In Korea, because teachers used to refer students' academic achievement only when they recommend gifted students, underachievers used to be excluded. The participants are 5th-grade students in elementary school. In this research, developed teaching materials were given to students to find underachievers. Results of spatial ability test, verbal ability test, science academic achievement, non-verbal test, and interviews about light propagation concept were obtained. By analyzing results of this study, we found that spatial ability is the most important factors to understand light propagation. And there are some features to understand light propagation according to spatial ability. Lastly, this study shows the possibility of non-verbal test to find gifted underachievers with high spatial ability and low verbal ability.

Design and Implementation of A Computer-virus Detection System with Host Load Conditions using Mobile Agents Heterogeneous Environments (이동 에이전트를 이용한 이기종 환경에서의 호스트 부하를 고려한 컴퓨터 바이러스 탐색 시스템의 설계 및 구현)

  • 최종욱;김영균;오길호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.817-819
    • /
    • 2002
  • 최근 컴퓨터 바이러스와 해킹 기법의 기술적인 향상으로 인하여 바이러스로 인한 피해가 확산되고 있다. 이에 따른 바이러스와 해킹 피해들로부터 시스템과 사용자 데이터를 보호하기 위한 다양한 방법들이 연구 및 적용되어 있다. 하지만 기존의 연구는 이기종으로 구성된 서로 이질적인 네트워크 환경에 적용하고 사용하기 위해서는 많은 수동적인 노력과 시간을 필요로 하고 있다. 본 논문에서는 이기종으로 구성된 네트워크상에서 이동 에이전트를 이용한 바이러스 탐색 기법에 대해 연구하였다. 제시한 방법은 사용자들에게 바이러스 탐색 에이전트와 관련된 해당 호스트상에서의 탐색업무 수행 투명성을 제공하여 호스트의 부하에 큰 영향을 주지 않는 방안으로써 자바 언어 특성인 플랫폼의 독립성이라는 이점을 지원하고 있는 자바 기반의 바이러스 탐색 시스템을 설계하였다. 이는 중앙 집중 관리 형태의 서버기반 방식으로 등록된 지역 네트워크 내의 이질적인 호스트에서 각 호스트의 부하를 고려하여 바이러스 탐색 업무를 수행함으로써 사용자로 하여금 능동성과 자율성, 바이러스 탐색 업무에 있어서의 투명성을 제공할 수 있는 컴퓨터 바이러스 탐색 업무를 수행하는 이동 에이전트 기반의 탐색 시스템을 새롭게 제안한다.

  • PDF

A Case Study of Therapeutic Song Making to Enhance the Self-identity of Adolescents in Residential Treatment Facility (시설보호청소년의 자아정체감 증진을 위한 치료적 노래만들기 사례)

  • Hwang, Hyejin;Song, Inryoeng
    • Journal of Music and Human Behavior
    • /
    • v.19 no.1
    • /
    • pp.43-67
    • /
    • 2022
  • This is a case study of therapeutic song making activities aimed at improving the self-identity of adolescents in residential treatment facility. The participants were three male teenagers (16 to 18 years of age). The song making intervention was conducted individually with the participants once a week over 13 weeks, and each session lasted 60 minutes. The participants took the lead in making songs by discussing on the self-image and his/her role in the relationship and using musical elements to reflect his/her perception. For analysis, an evaluation method was used to analyze the pre- and post-test results for each sub-domain of the self-identity scale, and changes in the verbal and musical responses during each session. Two of the participants demonstrated higher post-test results compared to their pre-test performance, and their highest post-test scores were for the subdomains of intimacy and initiative respectively. In terms of verbal and musical responses per session, all three participants improved their subjectivity through the self-exploration process, which contributed to the establishment of a more positive self-image. This study suggests that facility youth engaging in making creative songs can positively change their perception of their present and future selves and have a positive effect on their sense of identity.

An Efficient Dictionary for Syllable-based Korean Morphological Analyzer (음절 기반 형태소 분석을 위한 효율적인 사전 구성)

  • Kim, Nam-Churl;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.411-415
    • /
    • 1997
  • 형태소 분석기의 처리 속도는 분석 알고리즘과 형태소 사전의 탐색 기법에 따라 크게 좌우된다. 형태소 분석 성능의 향상을 위하여 많은 형태소 분석 방법이 제안되었으며, 음절 정보를 이용하는 형태소 분석기는 한국어 음절의 통계적 특성 정보를 이용함으로써, 분석 후보의 개수를 최대한 적게 하여 처리 속도를 향상시켰다. 본 논문은 형태소 분석시 발생하는 분석 후보들의 특성을 고려하여 사전 탐색 요구시 가장 많은 처리 시간을 필요로 하는 디스크 읽기 횟수를 줄일 수 있도록 음절별 블록 인덱싱한 사전 구성 방법을 제안한다. 이 방법은 형태소 사전을 첫 음절별로 블록화하고 인덱싱하여 3개의 추가적인 인덱스 테이블을 구축하는 사전 구성 방법으로, 인덱스 테이블을 모두 주기억장치에 적재하였을 때에는 평균 61.6%, 크기가 작은 두 개의 인덱스 테이블만 주기억장치에 적재하였을 때에는 평균 25%의 디스크 읽기 횟수를 줄일 수 있다.

  • PDF