• Title/Summary/Keyword: 언어적 탐색

Search Result 343, Processing Time 0.038 seconds

Fluent Text Generation Using GANs with Graph-search (GAN에서 그래프 탐색을 이용한 유창한 문장 생성)

  • Oh, Jinyoung;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.404-408
    • /
    • 2019
  • 비지도 학습 모델인 GAN은 학습 데이터 구축이 어려운 여러 분야에 활용되고 있으며, 알려진 문제점들을 보완하기 위해 다양한 모델 결합 및 변형으로 발전하고 있다. 하지만 문장을 생성하는 GAN은 풀어야 할 문제가 많다. 그중에서도 문제가 되는 것은 완성도가 높은 문장을 생성하는데 어려움이 있다는 것이다. 본 논문에서는 단어 그래프를 구성하여 GAN의 학습에 도움을 주며 완성도가 높은 문장을 생성하는 방법을 제안한다.

  • PDF

The Relationship between Syntactic Complexity Indices and Scores on Language Use in the Analytic Rating Scale (통사적 복잡성과 분석적 척도의 언어 사용 점수간의 관계 탐색)

  • Young-Ju Lee
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.5
    • /
    • pp.229-235
    • /
    • 2023
  • This study investigates the relationship between syntactic complexity indices and scores on language use in Jacobs et al.(1981)' analytic rating scale. Syntactic complexity indices obtained from TAASSC program and 440 essays written by EFL students from the ICNALE corpus were analyzed. Specifically, this study explores the relationship between scores on language use and Lu(2011)'s traditional syntactic complexity indices, phrasal complexity indices, and clausal complexity indices, respectively. Results of the stepwise regression analysis showed that phrasal complexity indices turned out to be the best predictor of scores on language use, although the variance in scores on language use was relatively small, compared with the previous study. Implications of the findings of the current study for writing instruction (i.e., syntactic structures at the phrase level) were also discussed.

A Study on the Multiple Pronunciation Dictionary for Spontaneous Speech Recognition (대화체 연속음성인식을 위한 확장 다중발음 사전에 관한 연구)

  • Kang ByungOk
    • Proceedings of the KSPS conference
    • /
    • 2003.10a
    • /
    • pp.65-68
    • /
    • 2003
  • 본 논문에서는 대화체 연속음성인식 과정에서 사용되는 다중발음사전의 개념을 확장하여 대화체 발화에 빈번하게 나타나는 불규칙한 발음변이 현상을 포용하도록 한 확장된 발음사전의 방법을 적용하여 대화체 연속음성인식에서 인식성능의 향상을 가져오게 됨을 실험을 통해 보여준다. 대화체 음성에서 빈번하게 나타나는 음운축약 및 음운탈락, 전형적인 오발화, 양성음의 음성음화 등의 발음변이는 언어모델의 효율성을 떨어뜨리고 어휘 수를 증가시켜 음성인식의 성능을 저하시키고, 또한 음성인식 결과로 나타나는 출력형태가 정형화되지 못하는 단점을 가지고 있다. 이에 이러한 발음변이들을 발음사전에 수용할 때 각각의 대표어휘에 대한 변이발음으로 처리하고, 언어모델과 어휘사전은 대표어휘만을 이용해 구성하도록 한다. 그리고, 음성인식기의 탐색부에서는 각각의 변이발음의 발음열도 탐색하되 대표어휘로 언어모델을 참조하도록 하고, 인식결과를 출력하도록 하여 결과적으로 인식성능을 향상시키고, 정형화된 출력패턴을 얻도록 한다. 본 연구에서는 어절단위 뿐 아니라 의사형태소[2] 단위의 발음사전에도 발음변이를 포용하도록 하여 실험을 하였다. 실험을 통해 어절단위의 다중발음사전 구성을 통해 ERR 10.9%, 의사형태소 단위의 다중발음 사전의 구성을 통해 ERR 4.3%의 성능향상을 보였다.

  • PDF

Implementation of Motion Estimation Module with Variable Search Range (가변 탐색범위를 적용한 움직임 예측 모듈 구현)

  • Choi, Dug-Young;Sonh, Seung-Il
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.316-319
    • /
    • 2005
  • 현재 상용화 되고 있는 DMB에서는 176$^*$144의 작은 영상 사이즈를 표준으로 서비스하고 있다. 뿐만 아니라 서비스 되고 있는 콘텐츠들은 주로 움직임이 많은 영화나 스포츠 그리고 드라마 등이 주류를 이루고 있다. 따라서 시간적 압축 방식을 사용하는 움직임 예측 모듈이 더욱더 중요한 위치를 차지하게 됐으며 기존의 영상 표준안과 다르게 4$^*$4와 같은 작은 블록 사이즈가 중요한 정보를 갖게 되었다. 본 논문은 DMB에서 서비스 하는 여러 가지 영화나 스포츠를 대상으로 실험한 결과 4$^*$4와 같은 작은 사이즈의 블록이 움직임 예측시 많이 나타날 뿐 아니라 중요한 정보들로 이루어져 있다는 결과를 얻었으며 이를 토대로 좀 더 정확한 움직임 예측을 수행하기 위하여 가변 탐색범위를 제안하였다. 제안된 방법은 C언어를 통하여 검증하였으며 그 결과 고정의 탐색범위를 적용한 것보다 좋은 효율을 얻었다. 그리고 이를 다시 하드웨어 언어인 VHDL로 구현하였다.

  • PDF

Handwritten Hangul Recognition by Dynamic Lattice Search with Structural Constraints (문자의 구조적 제약과 동적 격자 탐색을 이용한 필기 한글 문자 인식)

  • Kang, Kyung-Won;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.359-364
    • /
    • 2001
  • 필기 한글문자 인식은 다양한 필기 변형, 자모 간의 접촉과 같은 문제들을 내포하고 있다. 최근 이를 해결하기 위한 방법으로 랜덤 그래프를 이용한 필기 한글 모델링이 제안되었으나, 상향식 정보처리의 한계인 시간 복잡도 문제를 겪고 있다. 영어 단어인식에 관한 인지과학적 연구에서는 하향식 정보처리의 주요한 역할 중 하나로 인식 과정에서의 계산 중복을 없애는 필터링의 역할을 들고 있다. 본 논문에서는 랜덤 그래프를 이용한 필기 한글 모델링을 기반으로 하여 필기체에 나타나는 다양한 변형을 흡수하며, 시간 복잡도를 해결하기 위한 한글 문자의 구조에 바탕을 둔 하향식 정보처리 방법을 제안한다. 제안하는 방법은 모델 발화를 이용한 자모 후보 추출 DP 정합과 동적 격자 탐색을 이용한 문자 후보 탐색, 그리고 문자의 구조적 제약을 이용한 후보 제거 기법을 포함한다. 필기 한글 데이터베이스인 SERI-DB에 대한 예비 실험 결과, 제안한 방법은 인식률의 큰 저하 없이 상향식 정보 처리에 바탕을 둔 기존 방법에 비해 높은 속도 향상을 가져 왔다.

  • PDF

A Study on the Korean Broadcasting Speech Recognition (한국어 방송 음성 인식에 관한 연구)

  • 김석동;송도선;이행세
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.1
    • /
    • pp.53-60
    • /
    • 1999
  • This paper is a study on the korean broadcasting speech recognition. Here we present the methods for the large vocabuary continuous speech recognition. Our main concerns are the language modeling and the search algorithm. The used acoustic model is the uni-phone semi-continuous hidden markov model and the used linguistic model is the N-gram model. The search algorithm consist of three phases in order to utilize all available acoustic and linguistic information. First, we use the forward Viterbi beam search to find word end frames and to estimate related scores. Second, we use the backword Viterbi beam search to find word begin frames and to estimate related scores. Finally, we use A/sup */ search to combine the above two results with the N-grams language model and to get recognition results. Using these methods maximum 96.0% word recognition rate and 99.2% syllable recognition rate are achieved for the speaker-independent continuous speech recognition problem with about 12,000 vocabulary size.

  • PDF

Searching for Spatio-Temporal Pattern in EEG Signal with Hypernetwork (하이퍼네트워크를 이용한 EEG 신호의 시공간적 패턴 탐색)

  • Kim, Eun-Sol;Lee, Chung-Yeon;Lee, Ki-Seok Kevin;Lee, Hyun-Min;Kim, Joon-Shik;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.331-334
    • /
    • 2011
  • 입력 데이터의 공통적인 특징을 찾아내는 방법은 기계 학습 분야의 중요한 분야이다. 일반적으로 입력 데이터의 형태적 패턴을 찾아내는 알고리즘들이 많이 연구되었는데, 최근에는 데이터의 입력 순서 또는 데이터 사이의 시간적 인과 관계와 같이 시간에 연관된 패턴을 찾는 방법이 주목을 받고 있다. 우리는 형태적 혹은 공간적 패턴 탐색에 뛰어난 성능을 보이는 하이퍼네트워크 모델을 확장하여 입력 데이터의 시공간적 패턴을 찾는 방법을 제시한다. 하이퍼네트워크는 두 개 이상의 변수를 하나의 엣지로 연결하여 문제공간을 탐색하는 모델로, 시간과 공간의 변수를 동시에 고려하여 데이터의 특성을 찾아내는 데에 적합하다. 이를 확인하기 위하여 사람의 EEG 신호를 분석하였는데, 시각적인 정보를 처리할 때와 언어적 정보를 처리할 때의 특징적인 패턴들을 찾았다.

Comparative Analysis of Description Language for Business Architecture (비즈니스 아키텍처에 대한 기술 언어의 비교 분석)

  • Shim, Goon-Bo;Jeong, Seung-Ryul
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2003.11a
    • /
    • pp.479-484
    • /
    • 2003
  • 기업 내 외적으로 끊임없이 변화하는 상황에 발맞추어 조직, 시스템, 기술, 프로세스의 진화관리는 큰 문제점으로 나타나고 있다. 이들을 관리하기 위한 전사적인 비즈니스 아키텍처(EBA)는 조직의 변화와 기술의 개발, 비즈니스 프로세스와 정보의 흐름에 따른 애플리케이션 솔루션의 통제와 기술 인프라의 가버런스 내용에 대하여 계획과 분석에 대한 원칙을 담고 있다. 이러한 내용이 설계와 구현으로 이어지는 단계를 기술하기 위하여, XML 혹은 HTML기반의 기술 언어(Description Language)가 역할을 담당하고 있다. 이러한 기술언어들로 BPEL, BPMI, XBRL, WSDL, ADML에 대한 비교 분석을 통해 전사적으로 각 기업의 특수성에 맞는 기술 언어로 프로세스를 통합하여 웹 서비스를 구현한다. 이러한 EBA는 계획과 분석을 하여, 기술언어는 EBA의 스팩 설정과 아울러, 설계 구현을 실행하는 것으로 본 논문은 기술언어를 비교하는 EBA와 연결하는 탐색적인 연구이다.

  • PDF

A Study on the Effects of Search Language on Web Searching Behavior: Focused on the Differences of Web Searching Pattern (검색 언어가 웹 정보검색행위에 미치는 영향에 관한 연구 - 웹 정보검색행위의 양상 차이를 중심으로 -)

  • Byun, Jeayeon
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.52 no.3
    • /
    • pp.289-334
    • /
    • 2018
  • Even though information in many languages other than English is quickly increasing, English is still playing the role of the lingua franca and being accounted for the largest proportion on the web. Therefore, it is necessary to investigate the key features and differences between "information searching behavior using mother tongue as a search language" and "information searching behavior using English as a search language" of users who are non-mother tongue speakers of English to acquire more diverse and abundant information. This study conducted the experiment on the web searching which is applied in concurrent think-aloud method to examine the information searching behavior and the cognitive process in Korean search and English search through the twenty-four undergraduate students at a private university in South Korea. Based on the qualitative data, this study applied the frequency analysis to web search pattern under search language. As a result, it is active, aggressive and independent information searching behavior in Korean search, while information searching behavior in English search is passive, submissive and dependent. In Korean search, the main features are the query formulation by extract and combine the terms from various sources such as users, tasks and system, the search range adjustment in diverse level, the smooth filtering of the item selection in search engine results pages, the exploration and comparison of many items and the browsing of the overall contents of web pages. Whereas, in English search, the main features are the query formulation by the terms principally extracted from task, the search range adjustment in limitative level, the item selection by rely on the relevance between the items such as categories or links, the repetitive exploring on same item, the browsing of partial contents of web pages and the frequent use of language support tools like dictionaries or translators.

A Structure of Korean Electronic Dictionary using the Finite State Transducer (Finite State Transducer를 이용한 한국어 전자 사전의 구조)

  • Baek, Dae-Ho;Lee, Ho;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.181-187
    • /
    • 1995
  • 한국어 형태소 해석기와 같은 한국어 정보 치리 시스템은 많은 전자 사진 검색 작업을 요구하기 때문에 전자 사전의 성능은 전체 시스템의 성능에 많은 영향을 미친다. 이에 본 논문은 적은 기억 장소를 차지하면서 탐색 속도가 빠른 Finite State Transducer(FST)를 이용한 전자 사전 구조를 제안한다. 제안된 전자 사진은 Deterministic Finite State Automata(DFA)로 표제어를 표현하고 DFA 상태수 최소화 알고리즘으로 모든 위치에 존재하는 중복된 상태를 제거하여 필요한 기억 장소가 적으며, FST를 일차원 배열에 매핑하고 탐색시 이 배열내에서의 상태 전이만으로 탐색을 하기 때문에 탐색 속도가 매우 빠르다. 또한 TRIE 구조에서와 같이 한번의 탐색으로 입력된 단어로 가능한 모든 표제어들을 찾아 줄 수 있다. 실험 결과 표제어 수가 증가하여도 FST를 이용한 전자 사전의 크기는 표제어 수에 비례하여 커지지 않고, 전자 사전 탐색 시간은 표제어 수에 영향을 받지 않으며, 약 237만 단어를 검색하는 실험에서 TRIE나 $B^+-Tree$구조를 사용한 전자 사전보다 빠름을 알 수 있었다.

  • PDF