• 제목/요약/키워드: human-machine communication

검색결과 222건 처리시간 0.11초

가사 텍스트의 감성분석에 기반 한 음악 시각화 콘텐츠 개발 (Development of the Artwork using Music Visualization based on Sentiment Analysis of Lyrics)

  • 김혜란
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.89-99
    • /
    • 2020
  • 본 연구에서는 음악 가사의 감성분석을 통한 영상작품의 제작을 시도하였다. 가사 텍스트의 감성분석에는 구글(Google)의 자연어 처리 API를 활용하였고 그 결과를 영상 시각화 규칙과 연결하였다. 기존의 공학적 연구들에서의 텍스트 기반 감성분석은 소셜 미디어에서의 사용자 댓글과 리뷰를 분석해서 사용자들의 감정과 태도를 이해하도록 하는 연구들이 많았다. 본 연구에서는 감성분석 데이터가 예술작품 창작의 재료가 되어 심미적 표현에 활용될 수 있도록 하였다. 기계의 관점에서 볼 때 감정은 숫자로 치환되어 나타나므로 규격화, 표준화 될 수밖에 없다는 한계점이 있다. 이에 가사 데이터의 감성분석 결과를 시각예술에서의 조형요소들의 규칙과 연결하여 이러한 한계를 일부 극복해보자 하였다. 본 연구는 인공지능이 인간의 고도화 된 정신적 산물인 예술작품의 창작까지 시도하는 현 시대를 반영하며 문학, 음악, 회화, 무용 등 기존의 전통적인 예술작품을 기계를 통해 바라본 새로운 형태의 예술작품으로 만들어 보고자 하는 목표를 가지고 있다. 더불어 감정표현에 어려움을 겪는 발달 장애인들의 창작활동과 심리분석 및 의사소통을 용이하게 해주는 예술창작 및 교육 플랫폼으로 확장되기를 기대한다.

EEG기반 언어 인식 시스템을 위한 국제음성기호를 이용한 모음 특징 추출 연구 (EEG based Vowel Feature Extraction for Speech Recognition System using International Phonetic Alphabet)

  • 이태주;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.90-95
    • /
    • 2014
  • 인간과 기계를 연결하는 새로운 인터페이스인 Brain-computer interface (BCI)를 이용해 휠체어를 제어하거나 단어를 입력하는 등, 사용자를 위한 다양한 장치를 개발하는 연구들이 진행되어 왔다. 특히 최근에는 뇌파를 이용한 음성인식을 구현하고 이를 통해 무음통신 등에 적용하려는 시도들이 있었다. 본 논문에서는 이러한 연구의 일환으로 electroencephalogram (EEG) 기반의 언어 인식 시스템을 개발하기 위한 기초 단계로서, 국제음성기호에 기반을 둔 모음들의 특징을 추출하는 방법에 대한 연구를 진행하였다. 실험은 건장한 세 명의 남성 피험자를 대상으로 진행되었으며, 한 개의 모음을 제시하는 첫 번째 실험 과정과 두 개의 연속된 모음을 제시하는 두 번째 실험 과정으로 두 단계에 나누어서 실험이 진행되었다. 습득된 64개의 채널중 선택적으로 32개의 채널만을 사용해 특징을 추출하였으며, 사고 활동과 관련된 전두엽과 언어활동에 관련된 측두엽을 기준으로 영역을 선택하였다. 알고리즘 적용을 위해서 특징으로는 신호의 고유 값을 사용하였고, support vector machine (SVM)을 이용하여 분류를 수행하였다. 실험 결과, 첫 번째 단계의 실험을 통해서, 언어의 뇌파를 분석하기 위해서는 10차원 이상의 특징 벡터를 사용해야 됨을 알게 되었고, 11차원의 특징 벡터를 사용할 경우, 평균분류율은 최고 95.63 %로 /a/와 /o/를 분류할 때 나타났고, 가장 낮은 분류율을 보이는 모음은 /a/와 /u/로 86.85 %였다. 두 번째 단계의 실험에서는 두 개 이상의 모음을 발음하는 것이 단일 모음 발음과 어떤 차이가 있는지 확인해 보았다.

감성판별을 위한 생체신호기반 특징선택 분류기 설계 (The Design of Feature Selection Classifier based on Physiological Signal for Emotion Detection)

  • 이지은;유선국
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.206-216
    • /
    • 2013
  • 감성은 학습, 행동, 의사결정, 상호대화를 포함한 인간의 일상생활에 중요한 요소이다. 본 논문에서는 시스템의 복잡도를 줄이기 위하여 생체신호로부터 최소한의 중요한 특징만을 추출하여 사용하는 감성 분류기를 설계하고자 한다. 생체신호는 맥파, 피부온도, 피부전도도, 뇌파신호(전두엽, 두정엽)를 사용하였으며, 4가지 감정(보통, 슬픔, 공포, 행복)은 영화 관람을 통하여 유도하였다. 측정한 생체신호로부터 추출한 24개의 특징으로부터 최적의 특징 집합의 결정은 서포트벡터머신 기반 적합도 함수를 사용하는 유전알고리즘을 적용하였다. 최적의 4감정 분류 정확도는 96.4%이었으며, 서포트벡터머신만을 사용하였을 경우보다 17% 높았다. 선택된 최소에러 특징은 맥파 심박변이도의 평균, NN50, 맥파 유도 맥파 전달 시간의 평균, 피부전도도의 평균과 두정엽 뇌파의 ${\delta}$, ${\beta}$ 주파수 대역에너지였다. 실험을 통하여 두정엽 뇌파, 맥파, 피부전도도의 조합이 고정밀 감정 장비에 적합하였으며, 79% 성능을 보인 맥파와 피부전도도의 조합이 간단한 감성장비에 적절하게 적용할 수 있다.

사람 걸음 탐지 및 배경잡음 분류 처리를 위한 도플러 레이다용 딥뉴럴네트워크 (Human Walking Detection and Background Noise Classification by Deep Neural Networks for Doppler Radars)

  • 권지훈;하성재;곽노준
    • 한국전자파학회논문지
    • /
    • 제29권7호
    • /
    • pp.550-559
    • /
    • 2018
  • 본 논문은 딥뉴럴네트워크(deep neural network: DNN)를 이용해 사람 걸음 및 배경잡음원에 의해 발생한 마이크로 도플러 신호를 탐지 및 분류 처리하는 연구를 제안한다. 기존 분류처리 연구는 경험 및 통계적인 방법을 통해 분류기 성능에 직접적으로 영향을 미치는 의미있는 특징을 추출하기 위한 복잡한 과정을 포함한다. 그러나 딥뉴럴네트워크는 다수의 레이어 층을 단계적으로 통과하는 과정을 통해 점진적으로 특징을 재구성 및 생성하므로, 별도의 특징 추출과정을 생략할 수 있으며, 자연스럽게 네트워크상에서 특징을 생성할 수 있는 이점이 있다. 따라서 본 논문에서는 마이크로 도플러 신호 인식을 위한 딥뉴럴네트워크 효과성 입증을 위해, 이진분류기와 다층클래스 분류기를 다층퍼셉트론과 딥뉴럴네트워크를 통해 설계하고 비교분석한다. 실험 결과, 다층퍼셉트론은 이진분류기의 경우 테스트세트에 대한 분류 정확도가 90.3 %로 측정되었고, 다층클래스 분류기의 경우 테스트세트에 대한 분류정확도가 86.1 %로 측정되었다. 딥뉴럴네트워크는 이진분류기의 경우 테스트세트에 대한 분류 정확도가 97.3 %로 측정되었고, 다층클래스 분류기의 경우 테스트세트에 대한 분류정확도가 96.1 %로 측정되었다.

MVA 알고리즘을 이용한 ATM 기반 통합 서비스 교환기 내 워크스테이션의 성능 평가 (Performance Evaluation of Workstation System within ATM Integrated Service Switching System using Mean Value Analysis Algorithm)

  • 장승주;김길용;이재흠;박호진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.421-429
    • /
    • 2000
  • 현재 ATM(Asynchronous Transfer Mode) 기반 통합 서비스 교환 시스템 개발 추세는 복합 교환 시스템에서의 운용, 보전 기능 및 ATM 기반 인터넷/협대역 통합 서비스 등을 수용하기 위하여 워크스테이션에 멀티플러그-인 개념을 도입하여 시스템이 설계, 구현되고 있다. 한편, 기존 워크스테이션에서는 교환 시스템을 운용하기 위해 HMI(Human Machine Interface) 운용 시스템 기능과 함께 파일 관리 기능, 시간 관리 기능, 그래픽 처리 기능 및 TMN(Telecommunication Management Network)의 에이전트 기능 등이 설정되어 교환 시스템과의 많은 인터페이스를 통하여 기능들이 수행되고 있다. 이러한 기능들은 프로세스 혹은 프로세서간 많은 메시지 통신을 필요로 하고 있으며, 워크스테이션내 입출력 장치 파일, 일반 파일, 그리고 메시지 전송을 위한 메시지 큐, 소켓 자원 등을 사용하고 있다. 따라서, 현재 개발 중인 시스템의 정상 동작 여부를 확인하고 파악된 문제점들에 대한 성능 개선과 함께 추후 지속적인 기능 추가 시에도 시스템의 정상 동작을 보장하기 위해서는 사전에 개발될 교환 시스템에 대한 성능 평가가 선행되어야 한다. 본 논문은 이러한 ATM 기반 통합 서비스 교환 시스템 개발 작업에서 사전에 시스템의 성능 평가를 했다. 성능 평가는 MVA(Mean Value Analysis) 알고리즘을 이용한다. 모델은 큐잉 네트워크 모델을 사용하고 모델링된 시스템을 이용하여 PDQ(Pretty Damn Quick) 시뮬레이션 패키지와 C 언어를 사용하여 시뮬레이션 하였다.

  • PDF

기계공학과에서 제시하는 Hands-on Experience 중심의 "엔지니어링 디자인" 교과목의 강의사례 (A Case Study of "Engineering Design" Education with Emphasize on Hands-on Experience)

  • 김홍찬;김지훈;김관주;김정수
    • 공학교육연구
    • /
    • 제10권2호
    • /
    • pp.44-61
    • /
    • 2007
  • 본 논문은 공학 교육에서 강조하고 있는 창의력, 협업 능력 및 의사소통능력의 함양을 주 목적으로 홍익대학교 기계 시스템디자인공학과에서 새로이 개발한 교과목에 관하여 소개하고자 한다. '기계 시스템 디자인공학과'는 엔지니어링 디자인을 강조하는 새로운 교과목을 갖춘, 기존 홍익대학교 기계공학과의 새로운 이름이다. 급변하는 교육환경과 산업계의 요구에 부응하기위해서 기계공학과는 아날로그 기반, 산업중심의 하드한 관점에서 디지털 기반, 인간 중심의 소프트한 가치 중심으로 그 교육 접근방식을 전환하였다. 이러한 관점에서 새로이 개설된 세 가지 학과목인 기계 시스템디자인 개론, 창의적 공학 설계, 제품디자인은 공통적으로 팀 프로젝트를 통해서 손으로 직접 만들고 대화하고 표현하는(이하 Hands-on experience)경험을 중요시 하고 있다. 또한 이들 과정에서는 브레인스토밍(Brain Storming)과 스케치를 통한 시제작(Prototyping) 과정을 강조하고 있으며, 전통적으로 다루기 힘들고 무거운 금속 소재 대신에 폴리스티렌 블록이나 카드보드와 같은 가볍고 유연성 있는 소재를 사용하여 가능한 다양하고 창의적인 원형(Prototype)을 만들고, 팀원들간의 활발한 의사소통을 체험 할 수 있도록 유도하였다. Hands-on experience 중심 프로그램들은 학생들로 하여금 협업능력을 강조한 학과목들을 통해 시각적이며 구체적인 체험을 하게 하여 전통적으로 분석적이고 수학적이며 추상적인 사고에 초점을 맞춘 공학과목들을 균형적으로 보완하는 역할을 할 것으로 보이며, 졸업 후 그들이 산업현장에서 접하게 될 복잡하고 구체적인 엔지니어링 과제들을 해결하는 엔지니어링 감각과 창의력을 개발하는데 중요한 역할을 할 수 있을 것으로 예상된다.

3D-CNN에서 동적 손 제스처의 시공간적 특징이 학습 정확성에 미치는 영향 (Effects of Spatio-temporal Features of Dynamic Hand Gestures on Learning Accuracy in 3D-CNN)

  • 정영지
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.145-151
    • /
    • 2023
  • 3D-CNN은 시계열 데이터 학습을 위한 딥 러닝 기법 중 하나이다. 이러한 3차원 학습은 많은 매개변수를 생성할 수 있으므로 고성능 기계학습이 필요하거나 학습 속도에 커다란 영향을 미칠 수 있다. 본 연구에서는 손의 동적인 제스처 동작을 시공간적으로 학습할 때, 3D-CNN 모델의 구조적 변화 없이 입력 영상 데이터의 시공간적 변화에 따른 학습 정확성을 분석함으로써, 3D-CNN을 이용한 동적 제스처 학습의 효율성을 높이기 위한 입력 영상 데이터의 최적 조건을 찾고자 한다. 첫 번째로 동적 손 제스처 영상 데이터에서 동적 이미지 프레임의 학습구간을 설정함으로써 제스처 동작간 시간 비율을 조정한다. 둘째로는 클래스간 2차원 교차 상관 분석을 통해 영상 데이터의 이미지 프레임간 유사도를 측정하여 정규화 함으로써 프레임간 평균값을 얻고 학습 정확성을 분석한다. 이러한 분석을 통하여, 동적 손 제스처의 3D-CNN 딥 러닝을 위한 입력 영상 데이터를 효과적으로 선택하는 두 가지 방법을 제안한다. 실험 결과는 영상 데이터 프레임의 학습구간과 클래스간 이미지 프레임간 유사도가 학습 모델의 정확성에 영향을 미칠 수 있음을 보여준다.

다중 분류기의 판정단계 융합에 의한 얼굴인식 (Multi-classifier Decision-level Fusion for Face Recognition)

  • 염석원
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.77-84
    • /
    • 2012
  • 얼굴인식 기술은 지능형 보안, 웹에서 콘텐츠 검색, 지능로봇의 시각부분, 머신인터페이스 등, 활용이 광범위 하다. 그러나 일반적으로 대상자의 표정과 포즈 변화, 주변의 조명 환경과 같은 문제가 있으며 이와 더불어 원거리에서 획득한 영상의 경우 저해상도를 비롯하여 블러와 잡음에 의한 영상의 열화 등의 여러 가지 어려움이 발생한다. 본 논문에서는 포톤 카운팅(Photon-counting) 선형판별법(Linear Discriminant Analysis)을 이용한 다중 분류기(Classifier)에 의한 판정을 융합하여 얼굴 영상 인식을 수행한다. Fisher 선형판별법은 집단 간 분산을 최대로 하고 집단 내 분산을 최소로 하는 공간으로 선형 투영하는 방법으로, 학습영상의 수가 적을 경우 특이행렬 문제가 발생하지만 포톤카운팅 선형 판별법은 이러한 문제가 없으므로 차원축소를 위한 전 처리 과정이 필요 없다. 본 논문의 다중 분류기는 포톤 카운팅 선형판별법의 유클리드 거리(Euclidean Distance) 또는 정규화된 상관(Normalized Correlation)을 적용하는 판정규칙에 따라 구성된다. 다중분류기의 판정의 융합은 각 분류기 cost의 정규화(Normalization), 유효화(Validation), 그리고 융합규칙(Fusion Rule)으로 구성된다. 각 분류기에서 도출된 cost는 같은 범위로 정규화된 후 유효화 과정에서 선별되고 Minimum, 또는 Average, 또는 Majority-voting의 융합규칙에 의하여 융합된다. 실험에서는 원거리에서 획득한 효과를 구현하기 위하여 고해상도 데이터베이스 영상을 인위적으로 Unfocusing과 Motion 블러를 이용하여 열화하여 테스트하였다. 실험 결과는 다중분류기 융합결과의 인식률은 단일분류기보다 높다는 것을 보여준다.

사용자 경험을 위한 플렉시블 디스플레이 인터페이스 디자인 (Flexible display interface design for user experience)

  • 이영주;강재신
    • 디지털융복합연구
    • /
    • 제16권1호
    • /
    • pp.287-292
    • /
    • 2018
  • ICT(Information and Communications Technologies)기술이 중심이 되는 디지털 멀티미디어 환경은 우리의 상상을 현실의 다양한 경험으로 바꾸어주었다. 고도의 정보화 사회에서 요구되는 인간과 기계의 커뮤니케이션 수단으로 탄생한 플렉시블 디스플레이(Flexible display)는 시장을 다변화시키고, 사물인터넷등과의 연계를 통해 새로운 시장을 창출해 내고 있다. 플렉시블 디스플레이의 인터페이스는 입력 또는 출력의 결과로 물리적 형태를 제공할 수 있기 때문에 사용자 중심의 인터페이스 디자인이 무엇보다 중요하다. 이에 본 논문의 연구자는 플렉시블 디스플레이의 사용자 조작에 따른 물리적 변형과 특성에 대해 문헌과 사례조사를 통해 연구했다. 연구 결과 사용자 경험을 위한 플렉시블 디스플레이 인터페이스 디자인 가이드라인을 다음과 같이 제시한다. 첫째, 다양한 형태의 디스플레이 환경에서 사용자에게 필요한 기능을 최대한 제공할 수 있도록 디자인되어야 한다. 둘째, 인터페이스를 활용함에 있어서 다중 사용자의 시야각에 방해 요소는 제거되어야 한다. 셋째 터치와 접촉 이외에 플렉시블 디스플레이에서 가능한 사용자의 모든 조작행위가 고려되어야 한다. 넷째 플렉시블 디스플레이의 가변적 상황에 따라 사용자 경험을 위한 인터페이스디자인도 달라져야 한다. 위 가이드라인은 향후 다양한 플렉시블 디스플레이가 출시된 후, 실증적인 사용자 경험에 대한 분석과 연구에 도움이 될 것으로 기대된다.

속성 그래프 및 GraphQL을 활용한 지식기반 공간 쿼리 시스템 설계 (Design of Knowledge-based Spatial Querying System Using Labeled Property Graph and GraphQL)

  • 장한메;김동현;유기윤
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.429-437
    • /
    • 2022
  • 최근 사람과 기계의 소통을 위해 QA (Question Answering) 시스템에 대한 요구가 증가하였다. QA 시스템 중 공간에 관련된 질문을 처리할 수 있는 폐쇄 도메인 QA 시스템을 GeoQA라 하는데 본 연구는 GeoQA 분야에서 주로 사용되던 RDF (Resource Description Framework)기반의 데이터베이스가 데이터 입출력 및 변형에 한계를 보인다는 점을 극복하기 위해 최근 주목받고 있는 새로운 형태의 그래프 데이터베이스인 LPG (Labeled Property Graph)를 사용하였다. 또한, LPG 쿼리(query)언어가 표준화되지 않아 GeoQA 시스템이 특정 제품에 의존할 수 있다는 점 때문에 API 형태의 쿼리 언어인 GraphQL (Graph Query Language)을 도입하여 다양한 LPG를 사용할 방안을 제시하였다. 본 연구에서는 공간 관련 질문이 입력되었을 때 답변을 검색할 수 있도록 대한민국 중심의 별도 데이터베이스를 구축하였는데 각 데이터는 국가공간정보포털 및 지방행정 인허가데이터개방 서비스에서 취득하였으며 각 공간 객체 간 공간적 관계는 미리 계산되어 그래프의 엣지(edge) 형태로 입력되었다. 사용자의 질문은 먼저 FOL (First Order Logic)형태를 거쳐 최종적으로 GraphQL로 변환되며 GraphQL 서버를 통해 데이터베이스에 전달되었다. 실험에 사용한 LPG로는 현재 가장 높은 점유율을 보이는 그래프 데이터베이스인 Neo4j를 선택하였고 내장 함수와 QGIS 일부가 공간 연산에 사용되었다. 시스템 구축 결과 사용자의 질문을 변환, Apollo GraphQL 서버를 통해 처리하고 데이터베이스로부터 적합한 답변을 얻을 수 있음을 확인하였다.