• 제목/요약/키워드: 언어성

검색결과 4,756건 처리시간 0.032초

한국어 노인 음성 데이터 증강 및 인식 연구 (A Study of Data Augmentation and Auto Speech Recognition for the Elderly)

  • 김건희;박서윤;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.56-60
    • /
    • 2023
  • 기존의 음성인식은 청장년 층에 초점이 맞추어져 있었으나, 최근 고령화가 가속되면서 노인 음성에 대한 연구 필요성이 증대되고 있다. 그러나 노인 음성 데이터셋은 청장년 음성 데이터셋에 비해서는 아직까지 충분히 확보되지 못하고 있다. 본 연구에서는 부족한 노인 음성 데이터셋 확보에 기여하고자 희소한 노인 데이터셋을 증강할 수 있는 방법론에 대해 연구하였다. 이를 위해 노인 음성 특징(feature)을 분석하였으며, '주파수'와 '발화 속도' 특징을 일반 성인 음성에 합성하여 데이터를 증강하였다. 이후 Whisper small 모델을 파인 튜닝한 뒤 노인 음성에 대한 CER(Character Error Rate)를 구하였고, 기존 노인 데이터셋에 증강한 데이터셋을 함께 사용하는 것이 가장 효과적임을 밝혀내었다.

  • PDF

지연 함수형 프로그래밍 언어의 항 개서 의미 (Term Rewriting Semantics of Lazy Functional Programming Languages)

  • 변석우
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권3호
    • /
    • pp.141-149
    • /
    • 2008
  • 대부분의 함수형 프로그래밍 언어에서는 '위에서 아래쪽, 왼쪽에서 오른쪽 방향으로' 패턴 매칭(pattern matching)을 한다는 전략에 따라, 모호한(ambiguous) 특성을 갖는 룰의 정의를 허용하고 있다. 이 방법은 함수형 프로그래머에게 디폴트 룰을 정의할 수 있게 하는 직관적인 편리함을 제공하지만, 한편으로 모호한 룰 때문에 함수형 언어의 의미는 불명확해 질 수 있다. 좀 더 구체적으로, 함수형 언어가 갖는 대표적인 특성인 등식 추론(equational reasoning) 원리의 적용을 불가능하게 할 수 있으며, 함수형 언어를 람다 계산법으로 변환하는 데 있어서도 정형적인 방법이 아닌 임시방편적인(ad hoc) 방법에 의존할 수밖에 없게 한다. 본 연구에서는 지연(lazy) 함수형 언어의 패턴 매칭의 의미를 순수 선언적 특성을 갖는 항 개서 시스템(Term Rewriting Systems)의 분리성(separability) 이론과 연관시키고, 분리성 이론에 따라 지연 함수형 언어가 람다 계산법으로 변환될 수 있음을 보인다.

정보 입자에 근거한 개선된 언어적인 모델의 설계 (A Design of an Improved Linguistic Model based on Information Granules)

  • 한윤희;곽근창
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.76-82
    • /
    • 2010
  • 본 논문은 수치적인 입출력데이터로부터 언어적인 규칙을 생성시키기 위한 체계적인 접근방법으로써 정보입자(information granules)에 근거한 언어적인 모델(LM: Linguistic Model)을 발전시킨다. Pedrycz에 의해 소개된 언어적인 모델은 컨텍스트 기반 퍼지 클러스터링(CFC: Context-based Fuzzy Clustering)으로부터 얻어지는 퍼지 정보입자에 의해 수행되어지며, 이는 입력과 출력공간과 연관된 클러스터 된 데이터들의 동질성을 보존하도록 클러스터를 추정한다. 언어적인 모델의 효능성은 이전 연구에서 이미 증명되었음에도 불구하고 성능 측면에서 개선시킬 필요성이 있다. 따라서, 본 논문에서는 기존 언어적인 모델의 근사화와 일반화 성능을 모두 향상시키기 위해 언어적인 컨텍스트의 자동적인 생성, 바이어스항의 추가, 결론부 파라미터의 변형된 구조를 통해 이루어진다. 실험결과는 자동차 연료소비량 예측문제와 보스턴 housing 데이터를 통해 제안된 방법이 언어적인 모델뿐만 아니라 기존 방법들보다 우수함을 증명한다.

대구·경북지역 언어재활사의 공감능력과 직무만족도 간의 관련성에 대한 융합 연구 (A Convergence Study on the Relationship between Empathy Abilities and Job Satisfaction of Speech and Language Rehabilitation in Daegu and Gyeongbuk)

  • 김선희
    • 한국융합학회논문지
    • /
    • 제12권6호
    • /
    • pp.57-63
    • /
    • 2021
  • 본 연구는 대구·경북지역 언어재활사의 개인적 특성과 공감능력 및 직무만족도 간의 관계와 특히 인지적 및 정서적 공감능력과 직무만족도 간의 관계를 파악하여 언어재활사의 직무만족도 향상을 위한 기초 자료를 제공하기 위한 융합연구이다. 연구대상은 대구·경북지역에서 근무하는 언어재활사를 대상으로 총 111명의 설문조사를 분석하였다. 자료분석은 연구 목적에 따라 SPSS/PC 21.0 통계 프로그램을 이용하여 t-test와 ANOVA 및 상관분석을 실시하였다. 연구결과 개인적 특성과 공감능력 및 직무만족도 간의 관련성이 높게 나타났고, 공감능력의 하위 요인인 인지적 및 정서적 공감능력과 직무만족도 간의 관련성이 높은 것으로 나타났다. 이러한 결과를 토대로 추후 집체 및 소집단이나 온·오프라인 교육 등 다양한 교육 프로그램 연계와 대학에서의 공감능력 향상을 위한 비교과 및 교과목 개설이 필요하다는 것을 알 수 있었다. 그리고 향후 공감능력 향상을 위한 전국 단위 언어재활사를 대상으로 한 비교과 및 교과목 이수여부에 따른 언어재활사의 공감능력과 직무만족도를 알아보기 위한 후속연구가 필요하다.

질의 언어 및 복잡성이 대학생의 웹 정보탐색에 미치는 영향에 관한 연구 (Exploring the Effects of Task Language and Complexity in College Students' Web Searching)

  • 심원식;안혜연;변제연
    • 한국문헌정보학회지
    • /
    • 제49권2호
    • /
    • pp.51-73
    • /
    • 2015
  • 인터넷은 20-30년 전에는 상상할 수 없었던 엄청난 양의 정보에 대한 즉각적인 접근을 가능하게 하고 있다. 하지만 정보를 표현한 언어가 다양한 국가의 언어로 제공됨으로 이용자는 인터넷상에서 제공되는 컨텐츠를 온전히 사용하기 위해 반드시 외국어에 대한 이해를 수반해야 한다. 2015년 한 통계에 따르면 전 세계 웹사이트의 약 55%가 영어로 제작되어 있다고 한다. 따라서 정보탐색에 있어 웹 컨텐츠의 절반 이상에서 사용되고 있는 영어의 중요성을 간과할 수 없는 것이다. 본 연구는 인터넷을 활용한 정보문제 해결에 있어 검색 질의의 언어와 질의문의 복잡성이 검색 성과에 어떤 영향을 미치는지 살펴보고자 하였다. 실험은 서울 시내 종합사립대학교에 재학 중인 30명의 학생들을 대상으로 실시하였다. 연구자는 피험자들에게 각각 총 8개의 검색과제를 무선방식으로 제공하였다. 이들 과제는 각각 4개씩의 한글과 영어로 된 질의로, 이는 다시 같은 수의 단순 질의와 복합 질의로 나누어진다. 실험 결과 단순 질의와 복합 질의 간 검색에 소요된 시간, 검색 횟수, 정답률에 있어 통계적으로 유의미한 차이를 보였다. 하지만 질의 언어가 검색 성과 지표에는 영향을 미치지 않는 것으로 나타났다. 또 학생들의 영어구사수준 역시 검색성과에 영향을 미치지 않았다. 그러나 검색과 관련된 다른 지표(검색 언어의 사용 및 검색엔진 선택)에 있어서는 검색 언어와 검색 복잡성이 영향을 미치는 것으로 나타났다.

언어 지식과 통계 정보의 보완적 특성을 이용한 품사 태깅 (Part-of-Speech Tagging Using Complemental Characteristics of Linguistic Knowledge and Stochastic Information)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-108
    • /
    • 1997
  • 기존의 품사 태깅 방법에서 독립적으로 사용해온 언어 지식과 통계 정보는 품사 태깅의 정확도와 처리 범위의 향상을 위해서 상호 보완적인 특성을 갖는다. 이에 본 논문은 언어 지식과 통계 정보의 보완적 특성을 이용한 규칙 우선 직렬 품사 태깅 방법을 제안한다. 제안된 방법은 언어 지식에 의한 품사 태깅 결과를 선호함으로써 규칙 기반 품사 태깅의 정확도를 유지하며, 언어 지식에 의해서 모호성이 해소되지 않은 어절에 통계 정보에 의한 품사 태깅 결과를 할당함으로써 통계 기반 품사 태깅의 처리 범위를 유지한다. 또한, 수정 언어 지식에 의해 태깅 결과의 오류를 보정함으로써 품사 태깅의 정확도를 향상시킨다. 약 2만 어절 크기의 외부 평가 코퍼스에 대해 수행된 실험 결과, 규칙 우선 직렬 품사 태깅 시스템은 통계 정보만을 이용한 품사 태깅의 정확도보다 32.70% 향상된 95.43%의 정확도를 보였다.

  • PDF

분산환경을 지원하는 웹 기반의 프로그래밍 언어 실습 시스템 (A Web-based Programming Language Practice System supporting Distributed Environment)

  • 노미라;이수현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.568-570
    • /
    • 2001
  • 현재 다양한 패러다임의 수많은 프로그래밍 언어가 존재하고 있으며, 각각의 프로그래밍 언어를 실습하려면 해석기(interpreter)나 컴파일러(compiler) 같은 언어처리기를 갖추는 것이 필요하다. 언어처리기를 개별적으로 갖추는 것은 설치에 대한 시간적 부담, 시스템 자원 낭비 업그레이드의 필요성 등으로 인해서 언어 학습과 직접적인 관련이 없는 부분에 대한 부담이 커진다. 본 논문에서는 WWW 환경에서 프로그래밍 언어를 실습할 수 있는 시스템을 구축하였다. 실습하는 프로그래밍 언어는 특정 서버에 제한적이지 않고, 네트워크를 통한 분산환경에서 확장이 용이하다. 또한 실습환경을 설정하는 구성 파일은 구조화된 문서의 작성을 지원하는 XML을 이용하여 관리자가 쉽게 구성파일을 작성할 수 있도록 했고, 자바의 정책(policy)파일을 이용해 시스템 자원 사용 허가를 투명하게 했다.

  • PDF

언어적 접근에 의한 수학적 기호의 교수-학습지도 방법 연구

  • 한길준;정승진
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제14권
    • /
    • pp.43-60
    • /
    • 2001
  • 수학적 기호는 수학이라는 특수한 분야에 한정되어 사용되는 언어라고 할 수 있다. Usiskin(1996)은 수학을 쓰고 수학적 의미를 의사 소통하는 데에 기호가 그 수단이 되기 때문에 수학 또한, 수학적 기호로 만들어진 언어라고 말하였다. 그러나, 수학적 언어와 일상 언어사이의 이중성 때문에 언어로써 수학 기호는 학생들을 힘들게 만든다. 교사에게는 의미 있는 기호일지라도 학생들에게는 친숙하지 않을 수 있기 때문에, 많은 학생들이 자신들의 수학적 사고를 표현하거나 개념을 반영하거나 또는 아이디어를 확장하기 위해, 수학을 말하고, 읽고, 이해하고 쓰는 데에 어려움을 겪고 있다. 따라서, 본 연구는 학생들이 기호체계에 능숙해지도록 도와주고, 수학 학습과 문제 해결을 위해 수학 기호 언어가 의미 있고 접근하기 쉬운 의사소통 매체가 되게 하기 위하여 언어적 접근에 의하여 수학적기호의 교수-학습지도 방법에 대하여 살펴보고자 한다.

  • PDF

남북한 방송언어의 차이에 대한 기초 분석 (Preliminary analysis about the differences between South and North Korean Broadcasting Languages)

  • 이창환;김경일;박종민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 2부
    • /
    • pp.622-625
    • /
    • 2010
  • 본 연구는 장기간의 남북한 분단으로 인한 언어적 이질성의 정도를 가늠해보기 위하여 남북한 방송언어 비교하였다. 연구의 주 목적은 남북한 언어간 차이에 대한 데이터가 부족한 상황에서 언어사용 실태에 대한 토대 데이터를 제공하는 것이었다. 남북한의 주요 방송사 뉴스 동영상에서 추출한 텍스트를 대상으로 한국어분석프로그램 KLIWC (Korean Linguistic Inquiry and Word Count)으로 분석하였다. 분석 결과, 북한 방송언어는 KLIWC의 각 차원에서 남한 언어와 유의미한 차이를 나타냈으며, 특히 정서적 단어, 인지적 단어, 사회적 단어 등에서 유의미한 차이가 발견되었다. 또한 북한 방송에서는 인칭대명사나 품사와 같은 언어학적 기능어에 있어서도 남한방송보다 사용빈도가 높았다. 이러한 차이에 대한 예비적인 심리학적 신문방송학적 해석을 제공하였다.

  • PDF

패킷 처리 프로그래밍을 위한 언어의 설계와 컴파일러의 구현 (Design and Implementation of Packet Processing Programming Language and Compiler)

  • 최예지;고방원;신경희;유재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.510-513
    • /
    • 2012
  • 본 논문은 하드웨어에 독립적이고 패킷 처리 프로그래밍 개발의 효율성을 높이기 위하여 eFlowC 언어와 eFlowC 컴파일러를 제안한다. eFlowC 언어는 C 언어 기반의 고급언어이다. 그리고 기존의 C 문법에 패킷 처리 관련 기능을 위한 새로운 라이브러리를 추가하였다. eFlowC 컴파일러는 eFlowC 언어로 작성된 프로그램을 입력으로 받는다. 그리고 결과물로 가상 기계 목적 코드를 생성한다. 가상 기계 목적 코드는 언어 번역기의 입력 파일로 언어 번역기를 통하여 다양한 하드웨어 기계어로 번역이 가능하다.