• 제목/요약/키워드: speech analysis

검색결과 1,585건 처리시간 0.026초

소셜미디어 및 면접 영상 분석 기반 온라인 채용지원시스템 프로토타입 설계 및 구현 (Prototype Design and Development of Online Recruitment System Based on Social Media and Video Interview Analysis)

  • 조진형;강환수;유우창;박규태
    • 디지털융복합연구
    • /
    • 제19권3호
    • /
    • pp.203-209
    • /
    • 2021
  • 본 연구에서는 구직자의 채용지원 서류에 대한 진정성 검증 및 잠재 직무역량과 성향에 대한 정보여과 기능을 기반으로 효과적인 원격 채용 및 적정한 업무배치 의사결정을 지원할 수 있는 온라인 채용지원시스템 프로토타입 설계 및 구현 사례를 제안하고자 하였다. 이를 위해 구직자의 공개된 소셜미디어 정보에 대해 다차원적으로 자동 크롤링 및 분석하는 기능을 접목하여 구직자의 성향과 직무역량 정보를 도출하고, 텍스트마이닝 기법을 적용하여 채용지원 서류에 표현된 텍스트 정보 및 면접 영상 정보에 대한 지능적인 분석기능이 포함된 시스템 모델을 제안하였다. 제안하는 채용지원시스템의 효용성 검증을 위하여 프로토타입을 기반으로 주요 성능지표인 텍스트마이닝 정확도 및 면접 음성문자변환 기능 인식률 등에 대한 성능평가 실험을 진행하고 결과를 분석하였다. 제안하는 시스템은 효율적인 맞춤형 채용지원 기능이 가능하도록 지능형 웹/앱 개발에 필요한 요소기술을 융합하여 설계하였으며, 도출된 설계 사양 및 프로토타입 개발 결과를 바탕으로 상용화 구현이 된다면 인재 채용시장에서 필요한 지능형 온라인 채용시스템 기술로 확대 활용이 기대될 수 있다.

비후성 비염환자에서 음성검사 및 음향비강통기도검사를 이용한 수술전후 비교 (Postoperative Change in Hypertrophic Rhinitis(Study Using Nasometer, CSL and Acoustic Rhinometer))

  • 유영삼;우훈영;윤자복;최정환;조경래
    • 대한후두음성언어의학회지
    • /
    • 제12권1호
    • /
    • pp.34-38
    • /
    • 2001
  • Background and Objectives : With the development of computerized systems, an objective evaluation methods of nasal speech and nasal geometry have become readily available by means of a simple, noninvasive technique. In this study, we assessed the nasality, nasal formant, nasal volume and nasal area in patients with hypertrophic rhinitis before and after turbinate surgery. Material and Method : With the nasometer, we measured nasalance, which reflects the ratio of acoustic energy output of nasal sounds from the nasal and oral cavities. With CSL 4300B, we measured nasal formants. We used acoustic rhinometer to measure nasal area and nasal volume. Postoperative changes of above factors were compared with preoperative values. Paired t-test and Pearson's correlation were used for statistical analysis. Results : The first nasal formant frequency, nasalance scores of three passages(baby, mamma and rabbit passages), minimal cross sectional area(MCA) of narrow side, nasal volume of narrow side and nasal volume of wide side had increased significantly after turbinate surgery (p <0.05). The MCA and nasal volume of narrow side and MCA of wide side showed significant correlation with nasalance score of rabbit passage and baby passage showed significant correlation with nasal volume of narrow side(p<0.05). Conclusion : There were significant increases in nasalance scores, first nasal formant frequency, MCA and nasal volume after turbinate surgery. Thus, we must consider the possibility of voice changes postoperatively in professional voice users.

  • PDF

가우시안 입력신호에 대한 Signed Regressor 최소 평균자승 적응 방식의 동작 특성 (On the Behavior of the Signed Regressor Least Mean Squares Adaptation with Gaussian Inputs)

  • 조성호
    • 한국통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1028-1035
    • /
    • 1993
  • Signed Regressor 적응 알고리즘은 한 비트 양자화를 이용하여 탭 입력이 +1또는 -1이 되도록 양자화한다. 따라서 이미 널리 사용되고 있는 Least Mean Square (LMS) 알고리즘에 비하여 계산량 측면에서 효율적이다. 그러나 SR 알고리즘의 동작특성은 입력신호의 특성에 매우 종속적이며, 효율성을 위하여 성능을 약간 희생한다. 본 논문에서는 이 SR 알고리즘의 동작특성에 대하여 통계적 분석을 하였다. 이를 위해, 사용되는 신호가 평균이 제로인 가우시안 신호라는 가정과 이러한 분석에 이미 널리 통용되어 사용되는 독립가정을 이용하여, SR 알고리즘의 평균 및 평균자승 특성을 나타내는 일련의 비선형 관계식을 유도하였다. 그리고 유도된 이론적 결과가 실험적 결과와 매우 일치함을 보였다.

  • PDF

연하장애가 있는 뇌졸중 환자의 영양상태, 자각증상 및 정보요구도 (A Study on the Nutritional Status, Symptoms, and Information Needs in Stroke Patients with Dysphagia)

  • 김나현;권영숙;이경희;곽혜원;김명애
    • Journal of Korean Biological Nursing Science
    • /
    • 제13권1호
    • /
    • pp.72-80
    • /
    • 2011
  • Purpose: The purposes of this study were to reveal the nutritional status and symptoms related to dysphagia and to identify the information needs of the patient with post-stroke dysphagia for self care. Methods: Fifty one subjects were selected among patients being admitted from 3 tertiary hospitals. Data were collected using questionnaires, interview, and medical record. Data analysis was done using descriptive statistics with SPSS. Results: 1) The mean hemoglobin, serum albumin, and hematocrit level of the subjects were $11.2{\pm}1.8g/dL$, $3.2{\pm}0.6g/dL$, and $33.5{\pm}2.3%$, respectively. 2) The most common symptom due to dysphagia was 'slurred speech (86.3%)', followed by 'less flexible in tongue and mouth movement (80.4%)', 'difficulty chewing and swallowing (74.5%)'. 3) The highest score of information needs for patients/caregivers was to know which foods are suitable for dysphagic patients or not ($2.67{\pm}0.48$ of 3.0 score). They also want to know how to swallow safely ($2.65{\pm}0.59$), to administer medication safely ($2.63{\pm}0.59$), and to learn rehabilitative techniques ($2.61{\pm}0.57$). Conclusion: These findings would be useful information for staffs to do multidisciplinary approach and they would be necessary for stroke patients to manage their symptoms.

지역 환경에 따른 경관 색채분석에 관한 연구 - 전라남도 담양군을 중심으로 - (A Study on a Landscape Color Analysis according to Regional Environment - Centering on Damyang County, Jeollnamdo -)

  • 최성경;문정민
    • 한국실내디자인학회논문집
    • /
    • 제21권4호
    • /
    • pp.146-154
    • /
    • 2012
  • As Damyang has preserved both beautiful natural environment and tradition very well, it needs colors which can coexist with Damyang while preserving it as it is rather than colorful and refined colors. However, the present Damyang deteriorates the quality of beautiful natural scenes by chaotic uses of colors. Therefore, colors which can represent symbolism based on the present colors of Damyang should be used so that everyone can be pleased with them. Finally, the basic colors decided were classified into main, supplement and highlight colors in consideration of characteristics of each scene and they were effectively arranged based on the colors decided. If such colors and color schemes are properly applied according to characteristics of scenes, ecological, historical, cultural and traditional scenes of Damyang can be preserved consistently. Academic literature uses the abstract to succinctly communicate complex research. An abstract may act as a stand-alone entity instead of a full paper. As such, an abstract is used by many organizations as the basis for selecting research that is proposed for presentation in the form of a poster, platform/oral presentation or workshop presentation at an academic conference. Most literature database search engines index only abstracts rather than providing the entire text of the paper. Full texts of scientific papers must often be purchased because of copyright and/or publisher fees and therefore the abstract is a significant selling point for the reprint or electronic version of the full-text. Abstracts are protected under copyright law just as any other form of written speech is protected. However, publishers of scientific articles invariably make abstracts publicly available, even when the article itself is protected by a toll barrier. For example, articles in the biomedical literature are available publicly from medline which is accessible through design. It is a common misconception that the abstracts in medline provide sufficient information for medical practitioners, students, scholars and patients. The abstract can convey the main results and conclusions of a scientific article but the full text article must be consulted for details of the methodology.

  • PDF

다문화가정 이주여성의 운율구 경계짓기와 억양패턴 (Prosodic Phrasing and Intonation Patterns in the Speech of Migrant Women from Multicultural Families)

  • 정진숙;이숙향
    • 한국음향학회지
    • /
    • 제31권7호
    • /
    • pp.461-471
    • /
    • 2012
  • 본 연구는 다문화가정 이주여성의 운율구 경계짓기와 억양패턴에 대한 음향학적인 분석을 통하여 이주여성대상 한국어교육 프로그램 개발의 기초자료를 제공하고자 하였다. 대부분의 운율 특성에서 이주집단이 한국집단과 차이를 보였다. 한국집단은 첫 어절을 100% 강세구로 읽은 반면, 이주집단은 거의 억양구로 실현하였으며 이주여성들은 첫 분절음에 따라 달라지는 강세구의 첫 음조의 패턴 습득이 아직 제대로 이루어지지 않아 한국집단보다 훨씬 다양한 첫 어절의 억양패턴들을 보였다. 몇몇 운율 특성에서는 이주집단 간에도 차이를 보였으며 한국에서의 거주기간이 상대적으로 긴 필리핀집단이 베트남집단에 비해 상대적으로 한국집단에 가까운 특성을 보였다. 문장 내 평균 억양구수는 베트남집단이 필리핀집단보다 많았으며 가부의문문의 문미 경계음조는 필리핀집단은 한국집단처럼 'H%'로만 실현한 반면, 베트남집단은 'H%'뿐만 아니라 'HL%'로도 실현하였다.

영어 학습자의 중간 언어 단어 수준 강세 비교 (Comparison of Word Level Stress Features between Korean, English and the Interlanguage of Korean Learners of English)

  • 이윤현
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.378-390
    • /
    • 2020
  • 영어 강세는 발화된 영어 단어를 이해하는 데 상당히 중요한 역할을 하며 잘못된 강세의 위치는 의사소통의 실패로 이어질 수 있다. 강세가 없는 것으로 알려진 한국어를 모국어로 둔 영어 학습자는 영어 운율체계를 습득하는 데 어려움을 겪을 것으로 예상된다. 본 연구는 한국어가 단어 수준에서 이러한 강세를 실현하는 것이 영어와 어떻게 다른지 그리고 한국인 영어 학습자의 중간언어가 이 두 언어와 어떻게 다른지 연구하였다. 다음 절로 이루어진 4개의 영어 외래어와 그들의 영어 원어 4개가 실험단어로 사용되었다. 10명의 영어 원어민이 영어 원어를 읽었으며 10명의 한국인 영어 학습자가 먼저 영어 외래어를 한국어로 그리고 나중에는 영어 원어를 영어로 읽었다. 120개의 발화 샘플을 분석한 결과 한국어에는 모든 강세 자질로 (즉, 조음 길이, 조음 크기, 조음의 높이) 실현되는 두드러진 음절이 없었다. 반면에 영어는 모든 강세 자질에 의해 일관되게 실현되는 상대적으로 두드러진 음절을 가지고 있었다. 흥미롭게도 영어 강세 실현에 있어 한국인 영어 학습자의 중간언어는 모국어보다도 영어와 비슷한 특징을 보여 주었다.

세스릭스 발성법과 벨칸토의 비교분석 (A Comparing and Analysis of Bel canto and Seth Riggs vocalization methods)

  • 서정환
    • 한국산학기술학회논문지
    • /
    • 제17권6호
    • /
    • pp.262-268
    • /
    • 2016
  • 국내에서 최근 보컬에 대한 관심은 주목할 만하다. 학계를 포함하여 일반인들조차 보컬에 많은 관심을 갖고 있지만 이에 대한 체계적인 연구는 부족하다고 볼 수 있다. 이러한 가운데 세스릭스의 저서가 많은 관심을 받고 있다는 사실은 흥미롭다. 대중음악에서 세스릭스는 뛰어난 보컬 트레이너로 평가되고 있지만 실제 그는 성악을 전공했다. 이에 연구자는 세스릭스의 발성법을 벨칸토와 비교, 분석하였다. 세스릭스의 기법은 크게 SLS 등으로 요약할 수 있다. 세스릭스가 주장하는 이런 독창적인 기법들은 성악의 벨칸토 발성법과 밀접하게 연결되어 있다. 세부적으로는 차이점이 있으나 세스릭스(발성법)와 벨칸토의 발성법은 많은 부분을 공유하고 있다. 두 발성법 모두 당시 그 시대에 맞는 방법으로 개선, 발전하는 모습을 보인다는 점에서 공통적이라 할 수 있을 것이다. 본 비교연구를 통해 연구자는 통과지역에 대한 접근법이 개개인의 신체적 조건과 특징을 고려하여 더 바람직한 방법으로 제시되어야 함을 주장하였다. 세스릭스 발성법은 지대한 영향력을 갖고 있으나 이에 대한 평가 역시 체계적으로 이루어져야한다.

신경망을 이용한 고립단어에서의 피치변화곡선 발생기에 관한 연구 (A Study on the Pitch Contour Generator with Neural Network in the Isolated Words)

  • 임운천;곽진구;장석왕
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 2월 학술대회지
    • /
    • pp.137-155
    • /
    • 1996
  • The purpose of this paper is to generate a pitch contour which is affected by tile phonetic environment and the number of syllables in each Korean isolated word using a neural network. To do this, we analyzed a set of 513 Korean isolated words, consisting of 1-4 syllables and extracted the pitch contour and the duration of each phoneme in all the words. The total number of phonemes we analyzed is about 3800. After that we approximated the pitch contour with a 1st order polynominal by a regression analysis. We could get the slope, the initial pitch and the duration of each phoneme. We used these 3 parameters as the target pattern of the neural network and let the neural network learn the rule of the variation of the pitch and duration, which was affected by the phonetic environment of each phoneme. We used 7 consecutive phoneme strings as an input pattern for a neural network to make the network learn the effect of phonetic environment around the center phoneme. In the learning phase, we used 3545 items(463 words) as target patterns which contained the phonetic environment of front and rear 3 phonemes and the neural network showed the correctness rate of 98.43%, 98.59%, 97.7% in the estimation of the duration, the slope, the initial pitch. In the recall phase, we tested the performance of tile neural network with 251 items(50 words) which weren't need as learning data and we could get the good correctness rate of 97.34%, 95.45%, 96.3% in the generation of the duration, the slope, and the initial pitch of each phoneme.

  • PDF

주변 잡음 환경에 강한 화자인식 알고리즘 연구 (A study on the robust speaker recognition algorithm in noise surroundings)

  • 정종순
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.47-54
    • /
    • 2005
  • 대부분의 화자인식 시스템은 음성 분석을 통해 화자의 특징을 음향 파라미터 형태로 추출하여 화자의 표준패턴을 만든 후, 입력된 미지의 음성패턴과의 차이를 계산하여 허용 여부를 최종적으로 판단한다. 화자인식에 사용하는 파라미터는 화자의 특징을 충분히 표현함과 더불어 발성 시마다 변동이 작은 것이 바람직하다. 따라서 본 논문에서도 이를 위해서 다음과 같이 제안하였다. 벡터 양자화모델에 비잡음 환경에 강한 스펙트럼 특징과 잡음 환경에 강한 운율정보를 화자인식 시스템에 이용할 것을 제안하였다. 훈련과정에서 코드북 형성시 실제 데이터를 스펙트럼 특징과 운을 특징을 조합하여 원하는 모델 수만큼 만들었다. 인식과정에서는 입력된 테스트패턴을 각 모델간에 거리 측도로 비교하여 가부를 결정하였다. 실험결과 스펙트럼 특징과 운을 특징을 각각 이용할 경우 보다 좋은 인식율을 얻었으며, 특히 잡음 환경에서 안정된 인식율을 확보하므로 상용화의 가능성을 한층 높였다.

  • PDF