통합 검색 | Korea Science

AI면접 대상자에 대한 다면적 평가방법론 -얼굴인식, 음성분석, 자연어처리 영역의 융합 (Multifaceted Evaluation Methodology for AI Interview Candidates - Integration of Facial Recognition, Voice Analysis, and Natural Language Processing)

지현욱;이상진;문성민;이재열;이동은;임규상
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
- /
- pp.55-58
- /
- 2024
최근 각 기업의 AI 면접시스템 도입이 증가하고 있으며, AI 면접에 대한 실효성 논란 또한 많은 상황이다. 본 논문에서는 AI 면접 과정에서 지원자를 평가하는 방식을 시각, 음성, 자연어처리 3영역에서 구현함으로써, 면접 지원자를 다방면으로 분석 방법론의 적절성에 대해 평가하고자 한다. 첫째, 시각적 측면에서, 면접 지원자의 감정을 인식하기 위해, 합성곱 신경망(CNN) 기법을 활용해, 지원자 얼굴에서 6가지 감정을 인식했으며, 지원자가 카메라를 응시하고 있는지를 시계열로 도출하였다. 이를 통해 지원자가 면접에 임하는 태도와 특히 얼굴에서 드러나는 감정을 분석하는 데 주력했다. 둘째, 시각적 효과만으로 면접자의 태도를 파악하는 데 한계가 있기 때문에, 지원자 음성을 주파수로 환산해 특성을 추출하고, Bidirectional LSTM을 활용해 훈련해 지원자 음성에 따른 6가지 감정을 추출했다. 셋째, 지원자의 발언 내용과 관련해 맥락적 의미를 파악해 지원자의 상태를 파악하기 위해, 음성을 STT(Speech-to-Text) 기법을 이용하여 텍스트로 변환하고, 사용 단어의 빈도를 분석하여 지원자의 언어 습관을 파악했다. 이와 함께, 지원자의 발언 내용에 대한 감정 분석을 위해 KoBERT 모델을 적용했으며, 지원자의 성격, 태도, 직무에 대한 이해도를 파악하기 위해 객관적인 평가지표를 제작하여 적용했다. 논문의 분석 결과 AI 면접의 다면적 평가시스템의 적절성과 관련해, 시각화 부분에서는 상당 부분 정확도가 객관적으로 입증되었다고 판단된다. 음성에서 감정분석 분야는 면접자가 제한된 시간에 모든 유형의 감정을 드러내지 않고, 또 유사한 톤의 말이 진행되다 보니 특정 감정을 나타내는 주파수가 다소 집중되는 현상이 나타났다. 마지막으로 자연어처리 영역은 면접자의 발언에서 나오는 말투, 특정 단어의 빈도수를 넘어, 전체적인 맥락과 느낌을 이해할 수 있는 자연어처리 분석모델의 필요성이 더욱 커졌음을 판단했다.
PDF

음성정보기술 국제 표준화 동향

홍기형
- 정보처리학회지
- /
- 제11권2호
- /
- pp.33-41
- /
- 2004
언제, 어디서, 어떤 장치를 사용하더라도 정보의 검색이나 접근이 가능해지는 유비쿼터스 환경이 가시화되고 있어, 음성을 사용한 사용자 인터페이스의 중요성이 증대하고 있다. 음성인식, 합성, 화자인증 등 음성 등의 음성처리엔진의 기술 수준이 상용화 단계에 접어들고, 이동 중과 같이 모니터 등 시각적 인터페이스의 사용이 용이하지 않은 상황에서도 정보 접근기 요구가 증대함에 따라 음성은 정보시스템 의 중요한 인터페이스로 자리매김 하고 있다. 음성정보기술은 인간의 가장 자연스러운 상호작용 수단인 음성을 이용하여. 시스템에 명령을 내리고, 시스템의 명령 수행 결과를 음성으로 전달하는 음성을 이용한 정보 시스템 인터페이스를 구현하기 위 한 기술을 의미한다. 또한, 음성정보시스템은 음성을 이용한 사용자인터페이스가 가능한 정보시스템을 뜻하며, (그림 1)과 같이 음성처리엔진, 사용자 접속망, 사용자 프로파일 및 음성응용시스템으로 구성된다.(중략)
PDF

스마트폰 자이로센서를 이용한 시각장애인용 광학문자인식 방법 (An Optical Character Recognition Method using a Smartphone Gyro Sensor for Visually Impaired Persons)

권순각;김흥준
- 한국산업정보학회논문지
- /
- 제21권4호
- /
- pp.13-20
- /
- 2016
현대 사회에서 스마트폰은 장착된 고화질의 카메라를 이용하여 광학문자인식시스템을 구현할 수 있다. 광학문자시스템으로부터 인식된 문자들은 또한 TTS를 이용하여 시각장애인들에게 음성 서비스를 제공할 수 있다. 문자 정보가 들어있는 객체에 대하여 스마트 폰 카메라를 사용하여 촬영하는 것도 시각장애인들에게는 다소 어려운 일이다. 왜냐하면 피사체의 촬영 이미지를 볼 수가 없기 때문이다. 이러한 문제점을 해결하기 위하여 본 논문에서는 스마트폰의 자이로 센서를 사용하여 시각장애인들의 올바른 촬영을 유도하는 방법을 제안한다. 구현된 프로그램을 사용하여 모의 실험한 결과, 제안된 방법은 같은 객체로부터 보다 많은 문자를 인식하는 것을 확인할 수 있었다.
https://doi.org/10.9723/jksiis.2016.21.4.013 인용 PDF KSCI

장애인복지를 위한 정보통신의 발전방향 (New developmental direction of telecommunications for Disabilities Welfare)

박민수
- 한국정보통신학회논문지
- /
- 제4권1호
- /
- pp.35-43
- /
- 2000
본 연구는 장애인이 일반인과 똑같이 정보사회에 적응시키기 위해 장애인복지를 위한 정보통신의 발전방향을 연구하였다. 연구의 방법으로는 델파이기법을 도입하였으며, 조사방법으로는 문헌적조사방법과 면담조사방법을 병행하여 연구분석의 틀에 의해 분석하였다. 정보통신에 대한 장애인의 문제점을 살펴보면, 정보통신 접근의 불편, 보편적 서비스 저하, 장애인의 PC 통신 이용 저조, 장애인복지의 낙후, 정보통신요금의 부담, 정보화교육의 부족, 장애인정보의 부족, 장애인복지 정책결정에 장애인 미참여 등으로 분석되었다. 장애인에 필요한 정보통신기술을 살펴보면, 지체장애인에게는 음성인식기술ㆍ화상인식기술ㆍ호흡압력감지기술, 시각장애인에게는 표시기술ㆍ음성인식기술ㆍ문자인식기술ㆍ지적변환처리기술ㆍ화상인식음성합성기술, 청각ㆍ언어장애인에게는 음성신호처리기술ㆍ음성인식기술ㆍ기적변환처리기술ㆍ문자인식기술ㆍ화상인식기술ㆍ음성합성기술이 필요하다. 장애인복지를 위한 정보통신을 발전시키기 위해서는 장애인정보통신위원회의 구성, 보편적 서비스의 제공, 정보화교육의 실시, 연구개발의 지원, 중소정보통신기업의 지원 육성, 소프트웨어산업의 육성, 장애인용 표준화 작업 추진이 요구된다.
PDF

음성인식시스템과 다목적 시각 언어를 연동한 실시간 쇼핑 시스템 (The Real-time Shopping System using Multipurpose Visual Language with Voice Recognize)

김영종
- 한국산학기술학회논문지
- /
- 제16권6호
- /
- pp.4164-4169
- /
- 2015
본 논문에서는 다목적 시각 언어 시스템(MVLS, Multipurpose Visual Language System)에 음성인식 리모컨을 연동한 실시간 쇼핑 시스템을 설계하였다. 이 시스템은 기존의 일반적인 온라인 및 오프라인 쇼핑 시스템을 그대로 이용하면서, 사용자가 원하는 편리한 방법으로 추가 시킨 MVLS 데이터를 이용함으로써, 전체 쇼핑 시스템의 구조를 큰 변화 없이 활용할 수 있는 장점을 가지고 있다. 또한, 사용자 관점에서는, 국가기관 및 민간단체의 각종 보고서와 시장동향을 토대로 조사한 방법에 의해, 키보드나 마우스 등 상대적으로 사용하기 어려운 매체가 아닌, 음성인식 리모컨 또는 스마트폰을 활용하여 원하는 상품을 구매할 수 있다는 장점도 가지고 있다. 이는 특히, IT 매체 소외 계층으로 볼 수 있는, 노약자나 장애우 등도 쉽고 편리하게 원하는 제품을 구매할 수 있는 특징을 포함하고 있다. 또한, 쇼핑몰이나 판매자 입장에서도 구매자의 쇼핑 정보의 수집을 보다 쉽고 빠르며 효율적으로 수집할 수 있어서, 차후 판매 전략을 수립하는데 큰 도움이 될 수 있다.
https://doi.org/10.5762/KAIS.2015.16.6.4164 인용 PDF KSCI

딥러닝 기반 사용자 친화형 키오스크 시스템 (An User-Friendly Kiosk System Based on Deep Learning)

강수연;이유진;정현아;조승아;이형규
- 한국산업정보학회논문지
- /
- 제29권1호
- /
- pp.1-13
- /
- 2024
본 연구는 키오스크 사용 증가로 인한 변화에 대응하기 위해 사용자 특성을 고려한 맞춤형 동적 키오스크 화면을 제공하는 것을 목표로 한다. 디지털 취약계층인 시각장애인, 노인, 어린이, 휠체어 사용자 등의 특성에 따른 화면 구성의 최적화를 위해 객체 탐지, 걸음걸이 인식, 음성발화 인식기술을 종합하여 사용자의 특성(휠체어 사용 여부, 시각 장애, 연령 등)을 실시간으로 분석하고, 이를 기반으로 9개의 카테고리로 사용자를 분류한다. 키오스크 화면은 사용자의 특성에 따라 동적으로 조정되어 효율적인 서비스 제공이 가능하다. 본 연구는 임베디드 환경에서 시스템 통신 및 운용이 이루어졌으며, 사용된 객체 탐지, 걸음걸이 인식, 음성발화 인식 기술은 각각 74%, 98.9%, 96%의 정확도를 보여준다. 제안된 기술은 프로토타입을 구현하여 그 효용성을 검증하였으며, 이를 통해 본 연구가 디지털 격차의 축소와 사용자 친화적인 "배리어 프리 키오스크" 서비스 제공의 가능성을 보였다.
https://doi.org/10.9723/jksiis.2024.29.1.001 인용 PDF

입술 움직임 영상 선호를 이용한 음성 구간 검출 (Speech Activity Detection using Lip Movement Image Signals)

김응규
- 융합신호처리학회논문지
- /
- 제11권4호
- /
- pp.289-297
- /
- 2010
본 논문에서는 음성인식을 위한 음성구간 검출과정에서 유입될 수 있는 동적인 음향에너지 이외에 화자의 입술움직임 영상신호까지 확인함으로써 외부 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위한 한 가지 방법이 제시된다. 우선, 연속적인 영상이 PC용 영상카메라를 통하여 획득되고 그 입술움직임 여부가 식별된다. 다음으로, 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세서와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서 공유메모리에 저장되어진 데이터를 확인함으로써 화자의 발성에 의한 음향에너지인지의 여부가 입증된다. 최종적으로, 음성인식기와 영상처리기를 연동시켜 실험한 결과, 영상카메라에 대면해서 발성하면 음성인식 결과의 출력에 이르기까지 연동처리가 정상적으로 진행됨을 확인하였고, 영상카메라에 대면치 않고 발성하면 연동처리시스템이 그 음성인식 결과를 출력치 못함을 확인하였다. 또한, 오프라인하의 입술움직임 초기 특정값 및 템플릿 초기영상을 온라인하에서 추출된 입술움직임 초기특정값 및 템플릿 영상으로 대체함으로써 입술움직임 영상 추적의 변별력을 향상시켰다. 입술움직임 영상 추적과정을 시각적으로 확인하고 실시간으로 관련된 패러미터를 해석하기 위해 영상처리 테스트베드를 구축하였다, 음성과 영상처리 시스템의 연동결과 다양한 조명환경 하에서도 약 99.3%의 연동율을 나타냈다.
PDF KSCI

음성 인식 사용자 인터페이스를 통한 가전기기 제어 기법 (Home Appliance Control through Speech Recognition User Interface)

송욱;장현수;엄영익
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 추계학술발표대회
- /
- pp.265-268
- /
- 2006
유비쿼터스 컴퓨팅 환경이 확대됨에 따라, 기존의 키보드와 마우스만을 사용자 인터페이스로 주로 사용했던 방법에서 벗어나 좀 더 사용자 중심의 멀티모달 유저 인터페이스 적응이 요구되고 있다. 이에 XHTML+Voice는 음성 및 시각을 모두 제공할 수 있는 새로운 서비스 패러다임으로서 기존의 음성정보만을 제공하거나 시각적인 정보만을 제공하는 시스템과는 달리 XHTML내에 VoiceXML을 삽입함으로써 두 언어의 장점을 모두 활용할 수 있다. 본 논문에서는 VoiceXML의 이러한 장점을 살려 스마트 홈을 구성하는 여러 가전기기들의 인터페이스를 미리 템플릿으로 만들어 두어 모바일 디바이스를 통해 이것들을 제어하는 시나리오를 제안하고 구현하는 방법에 대해 실험하였다.
PDF

가상비콘을 이용한 시각장애인 대상 간판 음성 안내 구현 (Implementation of Signboard Voice Guidance Service for Visually Impaired Person Using Virtual Beacon)

이윤호;박광중;권순각
- 한국산업정보학회논문지
- /
- 제23권6호
- /
- pp.1-8
- /
- 2018
본 논문에서는 가상비콘을 이용한 시각 장애인 대상 간판 음성 안내 서비스를 구현한다. 물리적으로 위치를 측정하는 물리적 비콘 방식 대신, Wi-Fi, GPS 등의 여러 수단을 통해 위치를 측정하는 가상비콘을 이용하여 물리적인 설치비용 없이 손쉽게 위치를 추가하고, 해당 위치 기반의 서비스를 제공할 수 있다. 본 논문에서는 이러한 가상비콘으로 등록된 지점에 시각장애인이 도착하였을 때, 사진촬영을 유도하여 촬영된 간판에 대한 다양한 정보를 전달하는 서비스를 제공한다.
https://doi.org/10.9723/jksiis.2018.23.6.001 인용 PDF KSCI HTML

시각장애인을 위한 ICT융합 자율주행 서비스 로봇 설계 및 구현 (Design and Implementation of ICT Convergence Autonomous Driving Service Robot for the Visually Impaired)

구예찬;권세진;남가빈;이웅기
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2022년도 추계학술발표대회
- /
- pp.1003-1005
- /
- 2022
코로나-19의 여파와 기술의 발전으로 비대면 거래가 증가하고 있는 추세다. 비대면 거래가 증가하면서 무인점포도 늘어나고 있고, 늘어남에 따라서 시각장애인들은 무인점포를 이용하는데 어려움을 겪고 있다. 본 논문에서는 자율주행 로봇에 음성인식 기술과 딥러닝 기술을 적용하여 시각장애인에게 도움을 줄 수 있도록 ICT융합 로봇을 구현하였다. 무인점포 뿐만이 아니라 안내가 필요한 다양한 장소에서도 적용될 수 있을 것으로 기대한다.
https://doi.org/10.3745/PKIPS.y2022m11a.1003 인용 PDF

검색결과 130건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)