• 제목/요약/키워드: 언어적 탐색

검색결과 343건 처리시간 0.031초

비디오 스크립트를 이용한 문법적 패턴 습득 모델링 (Modelling Grammatical Pattern Acquisition using Video Scripts)

  • 석호식;장병탁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.127-129
    • /
    • 2010
  • 본 논문에서는 다양한 코퍼스를 통해 언어를 학습하는 과정을 모델링하여 무감독학습(Unsupervised learning)으로 문법적 패턴을 습득하는 방법론을 소개한다. 제안 방법에서는 적은 수의 특성 조합으로 잠재적 패턴의 부분만을 표현한 후 표현된 규칙을 조합하여 유의미한 문법적 패턴을 탐색한다. 본 논문에서 제안한 방법은 베이지만 추론(Bayesian Inference)과 MCMC (Markov Chain Mote Carlo) 샘플링에 기반하여 특성 조합을 유의미한 문법적 패턴으로 정제하는 방법으로, 랜덤하이퍼그래프(Random Hypergraph) 모델을 이용하여 많은 수의 하이퍼에지를 생성한 후 생성된 하이퍼에지의 가중치를 조정하여 유의미한 문법적 패턴을 탈색하는 방법론이다. 우리는 본 논문에서 유아용 비디오의 스크립트를 이용하여 다양한 유아용 비디오 스크립트에서 문법적 패턴을 습득하는 방법론을 소개한다.

  • PDF

통계적 언어 모델의 clustering 알고리즘과 음성인식에의 적용 (A clustering algorithm of statistical langauge model and its application on speech recognition)

  • 김우성;구명완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-152
    • /
    • 1996
  • 연속음성인식 시스템을 개발하기 위해서는 언어가 갖는 문법적 제약을 이용한 언어모델이 요구된다. 문법적 규칙을 이용한 언어모델은 전문가가 일일이 문법 규칙을 만들어 주어야 하는 단점이 있다. 통계적 언어 모델에서는 문법적인 정보를 수작업으로 만들어 주지 않는 대신 그러한 모든 정보를 학습을 통해서 훈련해야 하기 때문에 이를 위해 요구되는 학습 데이터도 엄청나게 증가한다. 따라서 적은 양의 데이터로도 이와 유사한 효과를 보일 수 있는 것이 클래스에 의거한 언어 모델이다. 또 이 모델은 음성 인식과 연계시에 탐색 공간을 줄여 주기 때문에 실시간 시스템 구현에 매우 유용한 모델이다. 여기서는 자동으로 클래스를 찾아주는 알고리즘을 호텔예약시스템의 corpus에 적용, 분석해 보았다. Corpus 자체가 문법규칙이 뚜렷한 특성을 갖고 있기 때문에 heuristic하게 클래스를 준 것과 유사한 결과를 보였지만 corpus 크기가 커질 경우에는 매우 유용할 것이며, initial map을 heuristic하게 주고 그 알고리즘을 적용한 결과 약간의 성능향상을 볼 수 있었다. 끝으로 음성인식시스템과 접합해 본 결과 유사한 결과를 얻었으며 언어모델에도 음향학적 특성을 반영할 수 있는 연구가 요구됨을 알 수 있었다.

  • PDF

언어변이와 세계영어들 (Language Variation and World Englishes)

  • 김양순
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.234-239
    • /
    • 2021
  • 본 연구는 언어의 본질인 언어변이의 주된 방향성을 탐색하고 언어변이의 결과로 나타나는 영어의 모든 방언들, 즉 세계영어들을 연구하는 것이다. 특정지역에서 사용되는 지역적, 사회적 방언의 연구인 언어변이의 특성을 규명하기 위하여 하이브리드 언어변이모델을 제안한다. 사회적 거리두기, 대면과 비대면 소통모드, 그리고 언어적 다양성이라는 세 가지 상호영향자의 관점에서 하이브리드 언어변이모델을 제안하고 언어변이의 결과로 나타나는 세계적 영어방언 현상인 세계영어들의 다양성 특질을 연구한다. 세계영어들의 문맥에서 지역화 목적으로 영어가 어떻게 사용되는가를 살펴보면, 사회적 거리두기가 높은 비대면의 상황에서는 다양성이 감소하여 좀 더 표준적이며 글로벌한 영어가 사용되며 변이가 줄어 세계영어들의 확장 속도가 완만해진다. 동시에 지역적인 사용이 줄어들어 의사소통의 오류도 줄어든다. 반면 사회적 거리두기가 낮은 대면의 상황에서는 세계영어들의 확장 속도가 빨라지고 변이의 형태가 다양해지며 의사소통의 오류 또한 증가한다. 이러한 영어변이 현상의 특성을 살펴보기 위하여 세계영어들의 핵심 원이라고 할 수 있는 영국영어, 미국영어, 그리고 캐나다영어의 언어적, 사회적 변이의 사례를 비교 분석한다.

유아 언어학습에 대한 하이퍼망 메모리 기반 모델 (Hypernetwork Memory-Based Model for Infant's Language Learning)

  • 이지훈;이은석;장병탁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.983-987
    • /
    • 2009
  • 유아들의 언어습득에 있어서 중요한 점 하나는 학습자에 대한 언어환경의 노출이다. 유아가 접하는 언어환경은 부모와 같은 인간뿐만 아니라 각종 미디어와 같은 인공적 환경도 포함되며, 유아는 이러한 방대한 언어환경을 탐색하면서 언어를 학습한다. 본 연구는 대용량의 언어 데이터 노출이 영향을 미치는 유아언어학습을 유연하고 적절하게 모사하는 인지적 기제에 따른 기계학습 방식을 제안한다. 유아의 초기 언어학습은 문장수준의 학습과 생성 같은 행동들이 수반되는데, 이는 언어 코퍼스에 대한 노출만으로 모사가 가능하다. 모사의 핵심은 언어 하이퍼망 구조를 가진 기억기반 학습모델이다. 언어 하이퍼망은 언어구성 요소들 간의 상위차원 관계 표상을 가능케 함으로써 새로운 데이터 스트림에 대해 유사구조의 적용과 이용을 도모하여 발달적이고 점진적인 학습을 모사한다. 본 연구에서는 11 개의 유아용 비디오로부터 추출한 문장 32744개를 언어 하이퍼망을 통한 점진적 학습을 수행하여 문장을 생성해 유아의 점진적, 발달적 학습을 모사하였다.

효율적인 한국어 분석을 위한 확장된 최장일치법 (The extended longest match strategy for efficient Korean analysis)

  • 이기오;이근용;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-261
    • /
    • 1996
  • 한국어 형태소 분석 방법중 최장일치법은 영어의 분석처럼 one-pass로 한국어를 분석할 수 있도록 하는 기법에 가장 적절하다. 그러나 최장일치법은 매우 많은 분석 후보를 생성하여 탐색 회수가 많아 시스템의 성능을 떨어뜨린다. 또한 대부분의 한국어 형태소 분석 시스템들은 형태소 자체에만 중점을 두어 한국어 분석 시스템 전체의 성능은 고려하지 않아 형태소 분석 시스템의 결과가 파서의 입력에 적절치 못한 결과를 생성한다. 본 논문에서는 형태소 분석의 원형복원 규칙과 사전 탐색을 통합하여 과분석 후보에 대한 탐색 회수를 줄이고 전체 시스템의 성능을 향상시키기 위해 파서에 적합한 입력을 제공하는 확장된 최장일치법을 제안한다.

  • PDF

진화적 방법을 이용한 퍼지제어기의 자동 생성에 관한 연구 (A Study on Automatic Generation of Fuzzy Controller by Genetic Algorithm)

  • 이지형;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1995년도 추계학술대회 학술발표 논문집
    • /
    • pp.203-210
    • /
    • 1995
  • 본 논문에서는 주어진 입출력 데이터로부터 유전자 알고리즘을 이용하여 퍼지제어 기를 자동 생성하는 방법에 대하여 기술한다. 주어진 입출력 데이터를 표현하는 퍼지제어기 는 각 유전자에 암호화되고, 퍼지제어기를 표현하는 각 유전자들은 서로 정보를 교환함으로 써 주어진 데이터를 적절히 표현하는 퍼지제어기를 탐색하게 된다. 유전자는 각 입력 변수 의 언어항을 정의하고, 퍼지제어규칙은 정의된 언어항과 주어진 데이터로부터 생성된다. 탐 색과정에서 퍼지제어기의 제어규칙과 각 입력변수의 언어항의 개수와 위치는 계속 변화하여 주어진 입출력 데이터를 잘 설명하는 퍼지제어기를 찾는다.

  • PDF

높은 공간능력과 낮은 언어능력을 가진 초등 미성취 과학영재의 발견가능성 탐색 - 빛의 직진 개념을 중심으로 - (Exploration on possibility of finding gifted underachievers with high spatial ability and low verbal ability in elementary science field: Focused on "Light Propagation")

  • 정연수;이지원;김중복
    • 영재교육연구
    • /
    • 제26권1호
    • /
    • pp.101-122
    • /
    • 2016
  • 공간능력이 과학의 발전을 위해 중요한 요소임에도 불구하고 사회문화적 인식으로 인해 높은 공간능력과 낮은 언어능력을 가진 영재학생들이 미성취하는 경향을 보이고 있다. 국내에서는 영재 선발을 위한 관찰 추천 시에 교사들이 여전히 학업성취도를 많이 반영하고 있으며 높은 공간능력과 낮은 언어능력을 가진 미성취영재에 대한 관심이 부족한 실정이다. 본 연구에서는 초등학교 5학년 학생들을 대상으로 공간능력과 언어능력에 따른 빛의 직진에 대한 이해 정도와 과학학업성취도 간의 차이를 살펴보고 빛의 직진 이해에서 보이는 특징을 질적으로 분석함으로써 높은 공간능력을 가진 미성취 과학영재1)의 발견가능성을 탐색하고자 한다. 연구결과는 과학영재 추천 시 과학학업성취도를 중요하게 반영할 때 발생할 수 있는 문제점을 보여주며, 교육현장에서 높은 공간능력과 낮은 언어능력을 가진 미성취 과학영재의 발견가능성과 그들의 과학적 잠재력을 확인하기 위한 방법으로써 비언어성 검사의 활용 가능성을 보여준다.

이동 에이전트를 이용한 이기종 환경에서의 호스트 부하를 고려한 컴퓨터 바이러스 탐색 시스템의 설계 및 구현 (Design and Implementation of A Computer-virus Detection System with Host Load Conditions using Mobile Agents Heterogeneous Environments)

  • 최종욱;김영균;오길호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.817-819
    • /
    • 2002
  • 최근 컴퓨터 바이러스와 해킹 기법의 기술적인 향상으로 인하여 바이러스로 인한 피해가 확산되고 있다. 이에 따른 바이러스와 해킹 피해들로부터 시스템과 사용자 데이터를 보호하기 위한 다양한 방법들이 연구 및 적용되어 있다. 하지만 기존의 연구는 이기종으로 구성된 서로 이질적인 네트워크 환경에 적용하고 사용하기 위해서는 많은 수동적인 노력과 시간을 필요로 하고 있다. 본 논문에서는 이기종으로 구성된 네트워크상에서 이동 에이전트를 이용한 바이러스 탐색 기법에 대해 연구하였다. 제시한 방법은 사용자들에게 바이러스 탐색 에이전트와 관련된 해당 호스트상에서의 탐색업무 수행 투명성을 제공하여 호스트의 부하에 큰 영향을 주지 않는 방안으로써 자바 언어 특성인 플랫폼의 독립성이라는 이점을 지원하고 있는 자바 기반의 바이러스 탐색 시스템을 설계하였다. 이는 중앙 집중 관리 형태의 서버기반 방식으로 등록된 지역 네트워크 내의 이질적인 호스트에서 각 호스트의 부하를 고려하여 바이러스 탐색 업무를 수행함으로써 사용자로 하여금 능동성과 자율성, 바이러스 탐색 업무에 있어서의 투명성을 제공할 수 있는 컴퓨터 바이러스 탐색 업무를 수행하는 이동 에이전트 기반의 탐색 시스템을 새롭게 제안한다.

  • PDF

시설보호청소년의 자아정체감 증진을 위한 치료적 노래만들기 사례 (A Case Study of Therapeutic Song Making to Enhance the Self-identity of Adolescents in Residential Treatment Facility)

  • 황혜진;송인령
    • 인간행동과 음악연구
    • /
    • 제19권1호
    • /
    • pp.43-67
    • /
    • 2022
  • 본 연구는 시설에 거주하는 청소년의 자아정체감 향상을 목적으로 한 노래만들기 활동의 개별 음악치료 사례연구로 연구 대상자는 쉼터에 거주하는 만 16~18세 남자 청소년 3명이다. 노래만들기 프로그램은 각 대상자별 자아정체감을 구성하는 하위요인 중 낮은 영역을 중심으로 선율과 가사 등의 음악적 요소를 활용하여 구성되었다. 프로그램은 주 1회, 각 회기별 60분씩 총 13회기에 걸쳐 진행되었고 자발적으로 참여의사를 밝힌 대상자들에게 시행되었다. 자료분석은 자아정체감 척도에 따른 하위영역별 사전, 사후 검사 결과와 회기별 언어적, 음악적 반응에 따른 변화, 사후 대상자들의 언어적 반응을 분석하는 평가 방법을 사용하였다. 연구 결과 대상자 A를 제외한 대상자 B, 대상자 C는 자아정체감 사전 척도 검사 결과에 비해 사후 결과가 향상하였으며 하위영역 별로 대상자 B는 친밀성이, 대상자 C는 주도성이 가장 많이 향상되었다. 회기별 언어적, 음악적 반응에서 참여 대상자 모두 자아 탐색 과정을 통해 주체성이 향상되었으며 이는 긍정적 자아상 확립에 기여하였다. 또한 사후 언어적 반응에서 대상자 3명 모두 '나'를 주제로 한 창작곡이 자아를 탐색하고 자아정체감을 확립하는 데 실질적으로 도움이 되었다고 표현하였다. 결과적으로 치료적 노래만들기는 시설보호청소년의 자아정체감 확립에 긍정적 영향을 미치는 것으로 사료된다.

음절 기반 형태소 분석을 위한 효율적인 사전 구성 (An Efficient Dictionary for Syllable-based Korean Morphological Analyzer)

  • 김남철;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.411-415
    • /
    • 1997
  • 형태소 분석기의 처리 속도는 분석 알고리즘과 형태소 사전의 탐색 기법에 따라 크게 좌우된다. 형태소 분석 성능의 향상을 위하여 많은 형태소 분석 방법이 제안되었으며, 음절 정보를 이용하는 형태소 분석기는 한국어 음절의 통계적 특성 정보를 이용함으로써, 분석 후보의 개수를 최대한 적게 하여 처리 속도를 향상시켰다. 본 논문은 형태소 분석시 발생하는 분석 후보들의 특성을 고려하여 사전 탐색 요구시 가장 많은 처리 시간을 필요로 하는 디스크 읽기 횟수를 줄일 수 있도록 음절별 블록 인덱싱한 사전 구성 방법을 제안한다. 이 방법은 형태소 사전을 첫 음절별로 블록화하고 인덱싱하여 3개의 추가적인 인덱스 테이블을 구축하는 사전 구성 방법으로, 인덱스 테이블을 모두 주기억장치에 적재하였을 때에는 평균 61.6%, 크기가 작은 두 개의 인덱스 테이블만 주기억장치에 적재하였을 때에는 평균 25%의 디스크 읽기 횟수를 줄일 수 있다.

  • PDF