• 제목/요약/키워드: 언어적 탐색

검색결과 343건 처리시간 0.026초

GAN에서 그래프 탐색을 이용한 유창한 문장 생성 (Fluent Text Generation Using GANs with Graph-search)

  • 오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.404-408
    • /
    • 2019
  • 비지도 학습 모델인 GAN은 학습 데이터 구축이 어려운 여러 분야에 활용되고 있으며, 알려진 문제점들을 보완하기 위해 다양한 모델 결합 및 변형으로 발전하고 있다. 하지만 문장을 생성하는 GAN은 풀어야 할 문제가 많다. 그중에서도 문제가 되는 것은 완성도가 높은 문장을 생성하는데 어려움이 있다는 것이다. 본 논문에서는 단어 그래프를 구성하여 GAN의 학습에 도움을 주며 완성도가 높은 문장을 생성하는 방법을 제안한다.

  • PDF

통사적 복잡성과 분석적 척도의 언어 사용 점수간의 관계 탐색 (The Relationship between Syntactic Complexity Indices and Scores on Language Use in the Analytic Rating Scale)

  • 이영주
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.229-235
    • /
    • 2023
  • 본 연구는 자동화된 통사 구문 분석 프로그램인 TAASSC를 활용하여 통사적 복잡성 지표와 분석적 척도의 언어 사용 점수 간의 관계를 살펴본다. 본 연구에서는 ICNALE 코퍼스에서 영어를 외국어로 학습하는 EFL 학생이 작성한 에세이 440개를 분석하였고, 언어 사용 점수와 Lu의 전통적인 통사적 복잡성 지표, 구 복잡성 지표, 절 복잡성지표 간의 관계를 탐색하였다. 단계적 회귀분석 결과, 구 복잡성 지표가 분석적 척도의 언어 사용 점수를 가장 잘 예측하는 것으로 나타났으나 선행연구와는 달리 언어 사용 점수를 차지하는 변량은 낮았다. 본 연구결과를 토대로 구수준에서의 통사구문에 대한 지도와 연습이 필요하다는 쓰기 교육의 시사점을 제시한다.

대화체 연속음성인식을 위한 확장 다중발음 사전에 관한 연구 (A Study on the Multiple Pronunciation Dictionary for Spontaneous Speech Recognition)

  • 강병옥
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.65-68
    • /
    • 2003
  • 본 논문에서는 대화체 연속음성인식 과정에서 사용되는 다중발음사전의 개념을 확장하여 대화체 발화에 빈번하게 나타나는 불규칙한 발음변이 현상을 포용하도록 한 확장된 발음사전의 방법을 적용하여 대화체 연속음성인식에서 인식성능의 향상을 가져오게 됨을 실험을 통해 보여준다. 대화체 음성에서 빈번하게 나타나는 음운축약 및 음운탈락, 전형적인 오발화, 양성음의 음성음화 등의 발음변이는 언어모델의 효율성을 떨어뜨리고 어휘 수를 증가시켜 음성인식의 성능을 저하시키고, 또한 음성인식 결과로 나타나는 출력형태가 정형화되지 못하는 단점을 가지고 있다. 이에 이러한 발음변이들을 발음사전에 수용할 때 각각의 대표어휘에 대한 변이발음으로 처리하고, 언어모델과 어휘사전은 대표어휘만을 이용해 구성하도록 한다. 그리고, 음성인식기의 탐색부에서는 각각의 변이발음의 발음열도 탐색하되 대표어휘로 언어모델을 참조하도록 하고, 인식결과를 출력하도록 하여 결과적으로 인식성능을 향상시키고, 정형화된 출력패턴을 얻도록 한다. 본 연구에서는 어절단위 뿐 아니라 의사형태소[2] 단위의 발음사전에도 발음변이를 포용하도록 하여 실험을 하였다. 실험을 통해 어절단위의 다중발음사전 구성을 통해 ERR 10.9%, 의사형태소 단위의 다중발음 사전의 구성을 통해 ERR 4.3%의 성능향상을 보였다.

  • PDF

가변 탐색범위를 적용한 움직임 예측 모듈 구현 (Implementation of Motion Estimation Module with Variable Search Range)

  • 최덕영;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.316-319
    • /
    • 2005
  • 현재 상용화 되고 있는 DMB에서는 176$^*$144의 작은 영상 사이즈를 표준으로 서비스하고 있다. 뿐만 아니라 서비스 되고 있는 콘텐츠들은 주로 움직임이 많은 영화나 스포츠 그리고 드라마 등이 주류를 이루고 있다. 따라서 시간적 압축 방식을 사용하는 움직임 예측 모듈이 더욱더 중요한 위치를 차지하게 됐으며 기존의 영상 표준안과 다르게 4$^*$4와 같은 작은 블록 사이즈가 중요한 정보를 갖게 되었다. 본 논문은 DMB에서 서비스 하는 여러 가지 영화나 스포츠를 대상으로 실험한 결과 4$^*$4와 같은 작은 사이즈의 블록이 움직임 예측시 많이 나타날 뿐 아니라 중요한 정보들로 이루어져 있다는 결과를 얻었으며 이를 토대로 좀 더 정확한 움직임 예측을 수행하기 위하여 가변 탐색범위를 제안하였다. 제안된 방법은 C언어를 통하여 검증하였으며 그 결과 고정의 탐색범위를 적용한 것보다 좋은 효율을 얻었다. 그리고 이를 다시 하드웨어 언어인 VHDL로 구현하였다.

  • PDF

문자의 구조적 제약과 동적 격자 탐색을 이용한 필기 한글 문자 인식 (Handwritten Hangul Recognition by Dynamic Lattice Search with Structural Constraints)

  • 강경원;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.359-364
    • /
    • 2001
  • 필기 한글문자 인식은 다양한 필기 변형, 자모 간의 접촉과 같은 문제들을 내포하고 있다. 최근 이를 해결하기 위한 방법으로 랜덤 그래프를 이용한 필기 한글 모델링이 제안되었으나, 상향식 정보처리의 한계인 시간 복잡도 문제를 겪고 있다. 영어 단어인식에 관한 인지과학적 연구에서는 하향식 정보처리의 주요한 역할 중 하나로 인식 과정에서의 계산 중복을 없애는 필터링의 역할을 들고 있다. 본 논문에서는 랜덤 그래프를 이용한 필기 한글 모델링을 기반으로 하여 필기체에 나타나는 다양한 변형을 흡수하며, 시간 복잡도를 해결하기 위한 한글 문자의 구조에 바탕을 둔 하향식 정보처리 방법을 제안한다. 제안하는 방법은 모델 발화를 이용한 자모 후보 추출 DP 정합과 동적 격자 탐색을 이용한 문자 후보 탐색, 그리고 문자의 구조적 제약을 이용한 후보 제거 기법을 포함한다. 필기 한글 데이터베이스인 SERI-DB에 대한 예비 실험 결과, 제안한 방법은 인식률의 큰 저하 없이 상향식 정보 처리에 바탕을 둔 기존 방법에 비해 높은 속도 향상을 가져 왔다.

  • PDF

한국어 방송 음성 인식에 관한 연구 (A Study on the Korean Broadcasting Speech Recognition)

  • 김석동;송도선;이행세
    • 한국음향학회지
    • /
    • 제18권1호
    • /
    • pp.53-60
    • /
    • 1999
  • 이 논문은 한국 방송 음성 인식에 관한 연구이다. 여기서 우리는 대규모 어휘를 갖는 연속 음성 인식을 위한 방법을 제시한다. 주요 관점은 언어 모델과 탐색 방법이다. 사용된 음성 모델은 기본음소 Semi-continuous HMM이고 언어 모델은 N-gram 방법이다. 탐색 방법은 음성과 언어 정보를 최대한 활용하기 위해 3단계의 방법을 사용하였다. 첫째로, 단어의 끝 부분과 그에 관련된 정보를 만들기 위한 순방향 Viterbi Beam탐색을 하였으며, 둘째로 단어 의 시작 부분과 그에 관련된 정보를 만드는 역방향 Viterbi Beam탐색, 그리고 마지막으로 이들 두 결과와 확률적인 언어 모델을 결합하여 최종 인식결과를 얻기 위해 A/sup */ 탐색을 한다. 이 방법을 사용하여 12,000개의 단어에 대한 화자 독립으로 최고 96.0%의 단어 인식률과 99.2%의 음절 인식률을 얻었다.

  • PDF

하이퍼네트워크를 이용한 EEG 신호의 시공간적 패턴 탐색 (Searching for Spatio-Temporal Pattern in EEG Signal with Hypernetwork)

  • 김은솔;이충연;이기석;이현민;김준식;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.331-334
    • /
    • 2011
  • 입력 데이터의 공통적인 특징을 찾아내는 방법은 기계 학습 분야의 중요한 분야이다. 일반적으로 입력 데이터의 형태적 패턴을 찾아내는 알고리즘들이 많이 연구되었는데, 최근에는 데이터의 입력 순서 또는 데이터 사이의 시간적 인과 관계와 같이 시간에 연관된 패턴을 찾는 방법이 주목을 받고 있다. 우리는 형태적 혹은 공간적 패턴 탐색에 뛰어난 성능을 보이는 하이퍼네트워크 모델을 확장하여 입력 데이터의 시공간적 패턴을 찾는 방법을 제시한다. 하이퍼네트워크는 두 개 이상의 변수를 하나의 엣지로 연결하여 문제공간을 탐색하는 모델로, 시간과 공간의 변수를 동시에 고려하여 데이터의 특성을 찾아내는 데에 적합하다. 이를 확인하기 위하여 사람의 EEG 신호를 분석하였는데, 시각적인 정보를 처리할 때와 언어적 정보를 처리할 때의 특징적인 패턴들을 찾았다.

비즈니스 아키텍처에 대한 기술 언어의 비교 분석 (Comparative Analysis of Description Language for Business Architecture)

  • 심군보;정승렬
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2003년도 추계학술대회
    • /
    • pp.479-484
    • /
    • 2003
  • 기업 내 외적으로 끊임없이 변화하는 상황에 발맞추어 조직, 시스템, 기술, 프로세스의 진화관리는 큰 문제점으로 나타나고 있다. 이들을 관리하기 위한 전사적인 비즈니스 아키텍처(EBA)는 조직의 변화와 기술의 개발, 비즈니스 프로세스와 정보의 흐름에 따른 애플리케이션 솔루션의 통제와 기술 인프라의 가버런스 내용에 대하여 계획과 분석에 대한 원칙을 담고 있다. 이러한 내용이 설계와 구현으로 이어지는 단계를 기술하기 위하여, XML 혹은 HTML기반의 기술 언어(Description Language)가 역할을 담당하고 있다. 이러한 기술언어들로 BPEL, BPMI, XBRL, WSDL, ADML에 대한 비교 분석을 통해 전사적으로 각 기업의 특수성에 맞는 기술 언어로 프로세스를 통합하여 웹 서비스를 구현한다. 이러한 EBA는 계획과 분석을 하여, 기술언어는 EBA의 스팩 설정과 아울러, 설계 구현을 실행하는 것으로 본 논문은 기술언어를 비교하는 EBA와 연결하는 탐색적인 연구이다.

  • PDF

검색 언어가 웹 정보검색행위에 미치는 영향에 관한 연구 - 웹 정보검색행위의 양상 차이를 중심으로 - (A Study on the Effects of Search Language on Web Searching Behavior: Focused on the Differences of Web Searching Pattern)

  • 변제연
    • 한국문헌정보학회지
    • /
    • 제52권3호
    • /
    • pp.289-334
    • /
    • 2018
  • 웹상에서 영어 이외의 언어들로 이루어진 정보가 빠르게 증가하고 있지만, 여전히 영어 정보가 가장 큰 비중을 차지함에 따라 공통어(lingua franca)로서의 지배적인 영향을 미치고 있다. 따라서 영어가 비모어인 이용자들이 보다 다양하고 풍부한 정보를 획득할 수 있도록 하기 위해서는 비영어권 화자의 모어 정보검색행위와 영어 정보검색행위에 대한 조사를 통해 주요 특징 및 차이점을 살펴볼 필요가 있다. 본 연구에서는 국내 한 사립대학의 대학생 24명을 대상으로 동시적 사고구술 기법을 적용한 정보검색 실험을 실시해 한글 정보검색행위 및 영어 정보검색행위와 인지과정을 조사하였다. 관찰데이터 및 사고구술데이터의 정성적 데이터를 기반으로, 검색 언어에 따른 웹 정보검색행위의 양상 차이에 대한 빈도분석을 실시하였다. 연구 결과, 한글 검색에서 능동적이고 적극적이며 독립적인 특성의 양상이, 영어 검색에서 수동적이고 소극적이며 의존적인 특성의 양상이 나타났다. 한글 검색에서는 이용자, 태스크, 시스템 등 다양한 출처에서 용어를 추출 조합한 검색어 구성, 여러 수준에서의 검색범위 조정, 검색엔진 검색결과페이지 내 탐색대상 아이템의 선택과 관련한 원활한 필터링, 다수 아이템의 탐색 및 비교, 웹 페이지의 전체 내용 브라우징 등이 주요 특징으로 확인되었다. 반면, 영어 검색에서는 주로 태스크 추출 용어 중심 검색어 구성, 제한된 검색범위 선호, 카테고리나 링크 등 아이템과 아이템 간 관련성에 의존한 탐색 대상 아이템 선택, 동일 아이템의 반복적 탐색, 웹 페이지의 일부 내용 브라우징, 그리고 사전 및 번역기와 같은 언어지원도구의 빈번한 사용 등이 두드러진 특징으로 파악되었다.

Finite State Transducer를 이용한 한국어 전자 사전의 구조 (A Structure of Korean Electronic Dictionary using the Finite State Transducer)

  • 백대호;이호;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.181-187
    • /
    • 1995
  • 한국어 형태소 해석기와 같은 한국어 정보 치리 시스템은 많은 전자 사진 검색 작업을 요구하기 때문에 전자 사전의 성능은 전체 시스템의 성능에 많은 영향을 미친다. 이에 본 논문은 적은 기억 장소를 차지하면서 탐색 속도가 빠른 Finite State Transducer(FST)를 이용한 전자 사전 구조를 제안한다. 제안된 전자 사진은 Deterministic Finite State Automata(DFA)로 표제어를 표현하고 DFA 상태수 최소화 알고리즘으로 모든 위치에 존재하는 중복된 상태를 제거하여 필요한 기억 장소가 적으며, FST를 일차원 배열에 매핑하고 탐색시 이 배열내에서의 상태 전이만으로 탐색을 하기 때문에 탐색 속도가 매우 빠르다. 또한 TRIE 구조에서와 같이 한번의 탐색으로 입력된 단어로 가능한 모든 표제어들을 찾아 줄 수 있다. 실험 결과 표제어 수가 증가하여도 FST를 이용한 전자 사전의 크기는 표제어 수에 비례하여 커지지 않고, 전자 사전 탐색 시간은 표제어 수에 영향을 받지 않으며, 약 237만 단어를 검색하는 실험에서 TRIE나 $B^+-Tree$구조를 사용한 전자 사전보다 빠름을 알 수 있었다.

  • PDF