• 제목/요약/키워드: Facial recognition

검색결과 711건 처리시간 0.027초

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

로컬 와핑 및 윤곽선 추출을 이용한 캐리커처 제작 (Caricaturing using Local Warping and Edge Detection)

  • 최성진;배현;김성신;우광방
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.403-408
    • /
    • 2003
  • 캐리커처의 일반적인 의미는 어떤 사람이나 사물의 특징을 추출하여 익살스럽게 풍자한 그림이나 글이다. 다시 말해, 캐리커처는 사람의 얼굴에서 특징을 잡아 과장하거나 왜곡하여 그린 데생이라고 한다. 컴퓨터를 이용한 기존의 캐리커처 제작 방법으로는, 입력 이미지 좌표의 통계적인 차이 값을 이용하는 PICASSO 시스템 방법, 제작자의 애매한 느낌을 퍼지 논리를 이용하여 표현하는 방법, 이미지론 와핑하는 방법, 여러 단계의 벡터 필드 변환을 이용하는 방법 등이 연구되어 왔다. 본 논문에서는 실시간 또는 준비된 영상을 입력으로 받아 저장한 후, 네 단계의 과정으로 처리한 후 최종적으로 캐리커처 된 이미지를 생성하게 된다. 각 단계별 처리 내용으로는 첫 번째 단계에서는 영상에서 얼굴을 검출하고 두 번째 단계에서는 특정 얼굴부위의 기하학적 정보를 좌표 값으로 추출한다. 세 번째 단계에서는 전 단계에서 얻은 좌표 값으로 로컬 와핑 기법을 이용하여 영상을 변환한다. 네 번째 단계에서는 변형된 영상으로 퍼지 논리를 이용하여 보다 개선된 윤곽선 이미지로 변환하여 캐리커처 이미지를 얻는다. 본 논문에서는 영상 인식, 변환 및 윤곽선 검출 및 등의 여러 가지 영상 처리 기법을 이용하여 기존의 캐리커처 제작 방식보다 간단하고, 복잡한 연산 과정이 없는 캐리커처 제작 시스템을 구현하였다.

감성기반 인물사진 선호도 측정 프로그램 개발 연구 (Study on the Development of Program for Measuring Preference of Portrait based on Sensibility)

  • 이창섭;하동환
    • 한국콘텐츠학회논문지
    • /
    • 제18권2호
    • /
    • pp.178-187
    • /
    • 2018
  • 본 연구는 인물사진의 화질 평가 요소들과 선호도와의 관계를 기반으로 감상자 중심의 인물사진 선호도 측정 프로그램의 모형을 제작하여 일반인 사용자의 높은 사용률을 목적으로 하는 제조사들에게 자동화된 제품설계 및 평가 모델을 개발하는 것을 목적으로 하였다. 이미지 평가를 진행하기 위하여 이미지의 화질 측정 항목을 객관적, 주관적 항목으로 나누고, 영상처리와 통계적 방법을 통하여 정확한 평가를 진행하였다. 이미지의 화질 측정 항목은 객관적 평가항목과 주관적 평가 항목으로 나눌 수 있다. 객관적 평가 항목에는 RSC 콘트라스트, 다이내믹 레인지, 노이즈를 선정하였고, 프로그램을 통해 그 수치 값을 통계적으로 분석하여 평가하였다. 주관적 평가 항목에는 노출, 컬러 톤, 인물의 구도, 인물의 위치, 아웃포커스를 선정하였고, 영상처리 방법을 적용하여 평가하였다. 본 연구에서 개발된 프로그램을 통해 측정된 결과와 실제 육안으로 확인한 결과가 동일하게 나타남으로서 정확도가 매우 높은 것으로 확인할 수 있었다. 하지만 개발된 프로그램은 인물의 안면이 인식 되어야 평가를 진행할 수 있기 때문에, 향후 연구를 통해 이미지 내에 사람이 존재하는 모든 종류의 인물사진을 평가할 수 있는 프로그램을 개발해야할 필요가 있을 것이다.

자폐 범주성 학생을 위한 가상현실 기반 중재 연구동향 및 중재 특성 고찰 (Review of Research Trends on Virtual Reality-Based Intervention for Students with Autism Spectrum Disorders and Intervention Characteristics)

  • 양일;이숙향;서민경
    • 한국콘텐츠학회논문지
    • /
    • 제17권2호
    • /
    • pp.623-636
    • /
    • 2017
  • 자폐 범주성 장애(ASD) 학생을 위한 증거기반의 실제로서 가상현실 기술의 가능성, 유용성, 적합성이 여러 연구를 통해 입증되었다. 하지만 국내에서는 ASD 학생을 위한 가상현실 기반 중재 관련 연구가 아직 없는 상황이다. 따라서 본 연구는 ASD 학생을 위한 가상현실 기반 중재의 활성화를 위해 국외 가상현실 중재 관련 연구를 고찰하고자 1990년부터 2016년까지 ASD 학생(18세 이하)을 대상으로 가상현실 중재를 적용한 국외 실험연구 총 13편을 선정하였다. ASD 학생의 핵심 특징을 고려한 가상현실 기반 중재의 적합성을 논의함과 아울러 선정된 논문의 연구동향(발표연도, 연구 참여자, 실험설계, 독립변인, 종속변인, 연구 결과)과 중재 특성을 분석하였다. 분석결과, ASD 학생에 적합한 전략으로 가상현실 중재는 주로 학교에서 다양한 연령대의 학생을 대상으로, 다양한 방식으로 폭넓은 사회적 의사소통 능력(표정 이해, 공감, 공동관심, 사회 맥락 이해 등) 증진에 적용되었으며 아울러 인지적인 능력의 부족으로 인한 문제를 극복하는데도 효과적인 것으로 나타났다. 마지막으로 연구 결과를 바탕으로 추후 중재 및 연구의 활성화를 위한 방향과 후속 연구 과제를 위해 가상현실 중재의 간학문적 접근, ASD의 특성 및 지원요구를 고려한 지원, 습득된 기술의 일반화 및 유지 방안, 참여자의 문화적 배경을 고려한 접근 필요성에 대한 제언을 제시하였다.

Log-Polar 사상의 크기와 회전 불변 특성을 이용한 얼굴과 눈 검출 (Automatic Face and Eyes Detection: A Scale and Rotation Invariant Approach based on Log-Polar Mapping)

  • 최일;진성일
    • 전자공학회논문지S
    • /
    • 제36S권8호
    • /
    • pp.88-100
    • /
    • 1999
  • 얼굴과 얼굴 구성 요소를 자동으로 검출하는 것은 얼굴 인식 시스템에서 반드시 필요한 과정이다. 본 논문에서는 얼굴의 크기와 회전 변화가 동시에 존재하는 영상에서 log-polar 사상(mapping)에 기반한 단일 log-polar 얼굴 탬플릿(template)을 사용하는 밝기 기반 템플릿 정합(matching)으로 얼굴과 눈을 자동으로 검출하는 새로운 방법을 제안한다. 템플릿 정합에서는 입력 영상의 크기와 회전 변화를 템플릿의 크기와 회전 각도에 대하여 정규화시키는 과정이 필요하다. 그런데 인간 시각 시스템의 space-variant 특성과 유사한 구조를 가지는 log-polar 사상은 입력 영상의 크기와 회전 변화를 log-polar 평면상에서 수평과 수직 순환 이동으로 변화시키는 특성을 갖는다. 이러한 특성을 이용하여 입력 상반신 영상의 fixation point들에서 사상된 후보 log-polar 얼굴들은 log-polar 얼굴들을 log-polar 평면상에서 수평과 수직 이동시켜 템플릿과 정합한다. 따라서 제안한 방법은 얼굴의 크기와 회전 변화에 대응하기 위하여 계산량이 증대되는 multitemplate와 multiresolution 기법들은 적용할 필요성이 없게된다. 이러한 크기와 회전 불변 정합을 이용하여 제안된 방법은 얼굴과 눈을 동시에 검출할 수 있다. 얼굴의 크기와 회전 변화가 존재하는 상반신 영상 795장에 제안한 방법을 적용하여 98.7%의 얼굴과 눈의 검출율을 달성하였다.

  • PDF

공감훈련프로그램 참여아동의 공감표현 변화과정 분석 (An Analysis on the Empathic Changing Process of the Members in Empathy Training Program)

  • 김미영
    • 초등상담연구
    • /
    • 제7권1호
    • /
    • pp.205-226
    • /
    • 2008
  • The purpose of the study you have seen is to verify the effectiveness of existing quantitative research and to put the Empathy Training Program to practical use for participating children. From looking into this, the changes in empathic understanding that came to light in relationships between teacher and children and children and children are sure to have that effect. For this work, I established the following subject of inquiry: What kind of changing processes can be seen in the empathic understanding of participating children in the Empathy Training Program? To resolve the above line of inquiry, six female sixth grade elementary school students were chosen and they progressed through twelve sessions of the Empathy Training Program. The children were given a sentence completion exam, recognition work, neat writing exam and a school adaptation exam both before and after participation in the program, making data for analysis. To analyze, first, participants had one or two meetings of forty to fifty minutes each. Progress through the program's curriculum was recorded and through the repeating and copying method, to be sure participating children's empathic understanding was revealed, empathic language and behavior was routinely chosen. Next, according the above criteria I looked into visible changes of the participating children's empathic expressions, classifying and analyzing changes in empathic understanding and six instances of common changes in the emphatic understanding of the participants relationships were analyzed and put together. Next I will summarize the findings we have seen in this research: First, if we look into changes in common empathic understanding from the beginning, using the criteria of empathic language, each individual showed understanding at the beginning and passed and progressed through stages of care, insight and emotional expressions. Second, when we looked at the criteria of empathic behavior from the beginning to the end, one's line of vision and ability to concentrate one's attention was connected. Next, the act of nodding one's head looked like a brief nod at first but at the end, it was not just a simple nod but rather they could feel deep empathy. The condition and substance of the facial expression was seen to match and at the very end the child was expressive and stretched out arms to hold and pat the other person and the act of holding hands could also be seen. Among lots of empathic behavior the final stage was shown by half of the children. Third, from the first stage to the last stage there were many cases revealed. The more the children went the more complete their empathic language became. Their vocabulary increased and became more diverse with empathic actions. Also, when comparing actions and expressions from the beginning with the end, visible expressions became more natural and sincere at the end. The result of the research we have seen is that through receiving experience of empathic understanding, participating children showed a sense of self-confidence and they looked to make peaceful expressions while not being aggressive or defensive about problems. In addition, from understanding empathic expressions, participating children's relationships felt closer. This outcome within this group in this case will be applied and the formation of empathic understanding can be used by the children internally to solve their own problems, acquire close relationships with their teachers and others. It will also contribute to smooth classroom management.

  • PDF

Texture Analyzer (TA)를 이용한 화장품 크림의 In Vivo 끈적임 평가법의 최적화 (Optimization of In Vivo Stickiness Evaluation for Cosmetic Creams Using Texture Analyzer)

  • 류주연;배정은;강내규
    • 대한화장품학회지
    • /
    • 제46권4호
    • /
    • pp.371-382
    • /
    • 2020
  • 화장품의 사용감을 관계 있는 물성의 측정을 통해 정량화하려는 시도가 이어져오고 있다. 그 중 끈적임은 texture ananlyzer를 이용하여 수직 힘을 측정하는 방식이 대표적이며, 시간에 따른 수직 힘의 그래프에서 음의 면적인 area under curve (AUC)와 상관관계를 갖는 것으로 알려져 있다. 최근 노르망디 대학에서는 이러한 특성에 피부의 특성을 함께 고려하여 TA를 이용한 in vivo 끈적임 평가법을 개발하였다[8]. 본 연구에서는 이를 확장하여 화장품 크림의 in vivo 끈적임 평가법을 최적화하고자 하였다. 페이셜 크림 5 종을 대상으로 크림의 도포량 및 도포 횟수, 탐침의 모양과 소재를 바꾸어 보면서 실험을 진행하였고, 관능 평가 결과를 기준으로 가장 부합하는 조건을 최적의 평가법으로 설정하였다. 그 결과, 3.4 cm의 원 내부에 70 μL의 크림을 7 s 동안 10 회 문지르고 측정하는 방식이 가장 적합한 것으로 판단되었다. 탐침의 경우, 원기둥형보다 구형의 탐침이 재현성이 높게 나타나 구형의 금속 탐침을 택하였다. 최적의 평가법을 확보하여 10 인의 피험자를 대상으로 인체 평가를 진행한 결과, 사람에 따른 절대값에는 차이가 있으나 AUC의 순위는 모두 같게 얻어졌다. 마지막으로 AUC의 끈적임 표준화의 시도로 PVP를 표준 물질로 설정하여 농도 별로 AUC를 측정하고, 5종의 크림 별 끈적임 인지율을 확인하여 AUC와 끈적임의 상관관계에 대해 알아보았다.

AI면접 대상자에 대한 다면적 평가방법론 -얼굴인식, 음성분석, 자연어처리 영역의 융합 (Multifaceted Evaluation Methodology for AI Interview Candidates - Integration of Facial Recognition, Voice Analysis, and Natural Language Processing)

  • 지현욱;이상진;문성민;이재열;이동은;임규상
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.55-58
    • /
    • 2024
  • 최근 각 기업의 AI 면접시스템 도입이 증가하고 있으며, AI 면접에 대한 실효성 논란 또한 많은 상황이다. 본 논문에서는 AI 면접 과정에서 지원자를 평가하는 방식을 시각, 음성, 자연어처리 3영역에서 구현함으로써, 면접 지원자를 다방면으로 분석 방법론의 적절성에 대해 평가하고자 한다. 첫째, 시각적 측면에서, 면접 지원자의 감정을 인식하기 위해, 합성곱 신경망(CNN) 기법을 활용해, 지원자 얼굴에서 6가지 감정을 인식했으며, 지원자가 카메라를 응시하고 있는지를 시계열로 도출하였다. 이를 통해 지원자가 면접에 임하는 태도와 특히 얼굴에서 드러나는 감정을 분석하는 데 주력했다. 둘째, 시각적 효과만으로 면접자의 태도를 파악하는 데 한계가 있기 때문에, 지원자 음성을 주파수로 환산해 특성을 추출하고, Bidirectional LSTM을 활용해 훈련해 지원자 음성에 따른 6가지 감정을 추출했다. 셋째, 지원자의 발언 내용과 관련해 맥락적 의미를 파악해 지원자의 상태를 파악하기 위해, 음성을 STT(Speech-to-Text) 기법을 이용하여 텍스트로 변환하고, 사용 단어의 빈도를 분석하여 지원자의 언어 습관을 파악했다. 이와 함께, 지원자의 발언 내용에 대한 감정 분석을 위해 KoBERT 모델을 적용했으며, 지원자의 성격, 태도, 직무에 대한 이해도를 파악하기 위해 객관적인 평가지표를 제작하여 적용했다. 논문의 분석 결과 AI 면접의 다면적 평가시스템의 적절성과 관련해, 시각화 부분에서는 상당 부분 정확도가 객관적으로 입증되었다고 판단된다. 음성에서 감정분석 분야는 면접자가 제한된 시간에 모든 유형의 감정을 드러내지 않고, 또 유사한 톤의 말이 진행되다 보니 특정 감정을 나타내는 주파수가 다소 집중되는 현상이 나타났다. 마지막으로 자연어처리 영역은 면접자의 발언에서 나오는 말투, 특정 단어의 빈도수를 넘어, 전체적인 맥락과 느낌을 이해할 수 있는 자연어처리 분석모델의 필요성이 더욱 커졌음을 판단했다.

  • PDF

인공지능 기술 기반 인슈어테크와 디지털보험플랫폼 성공사례 분석: 중국 평안보험그룹을 중심으로 (Analysis of Success Cases of InsurTech and Digital Insurance Platform Based on Artificial Intelligence Technologies: Focused on Ping An Insurance Group Ltd. in China)

  • 이재원;오상진
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.71-90
    • /
    • 2020
  • 최근 전 세계 보험업계에도 기계학습, 자연어 처리, 딥러닝 등의 인공지능 기술 활용을 통한 디지털 전환이 급속도로 확산하고 있다. 이에 따라 인공지능 기술을 기반으로 한 인슈어테크와 플랫폼 비즈니스 성공을 이룬 해외 보험사들도 증가하고 있다. 대표적으로 중국 최대 민영기업인 평안보험그룹은 '금융과 기술', '금융과 생태계'를 기업의 핵심 키워드로 내세우며 끊임없는 혁신에 도전한 결과, 인슈어테크와 디지털플랫폼 분야에서 괄목할만한 성과를 보이며 중국의 글로벌 4차 산업혁명을 선도하고 있다. 이에 본 연구는 평안보험그룹 인슈어테크와 플랫폼 비즈니스 활동을 ser-M 분석 모델을 통해 분석하여 국내 보험사들의 인공지능 기술기반 비즈니스 활성화를 위한 전략적 시사점을 제공하고자 했다. ser-M 분석 모델은 기업의 경영전략을 주체, 환경, 자원, 메커니즘 관점에서 통합적으로 해석이 가능한 프레임으로, 최고경영자의 비전과 리더십, 기업의 역사적 환경, 다양한 자원 활용, 독특한 메커니즘 관계가 통합적으로 해석되도록 연구하였다. 사례분석 결과, 평안보험은 안면·음성·표정 인식 등 핵심 인공지능 기술을 활용하여 세일즈, 보험인수, 보험금 청구, 대출 서비스 등 업무 전 영역을 디지털로 혁신함으로써 경비 절감과 고객서비스 발전을 이루었다. 또한 '중국 내 온라인 데이터'와 '회사가 축적한 방대한 오프라인 데이터 및 통찰력'을 인공지능, 빅데이터 분석 등 신기술과 결합하여 금융 서비스와 디지털 서비스 사업이 통합된 디지털 플랫폼을 구축하였다. 이러한 평안보험그룹의 성공 배경을 ser-M 관점에서 분석해 보면, 창업자 마밍즈 회장은 4차 산업혁명 시대의 디지털 기술발전, 시장경쟁 및 인구 구조의 변화를 빠르게 포착하여 새로운 비전을 수립하고 디지털 기술중시의 민첩한 리더십을 발휘하였다. 환경변화에 대응한 창업자 주도의 강력한 리더십을 바탕으로 인공지능 기술 투자, 우수 전문인력 확보, 빅데이터 역량 강화 등 내부자원을 혁신하고, 외부 흡수역량의 결합, 다양한 업종 간의 전략적 제휴를 통해 인슈어테크와 플랫폼 비즈니스를 성공적으로 끌어냈다. 이와 같은 성공사례 분석을 통하여 인슈어테크와 디지털플랫폼 도입을 본격 준비하고 있는 국내 보험사들에게 디지털 시대에 필요한 경영 전략과 리더십에 대한 시사점을 줄 수 있다.

비외상성 피질하 뇌혈관 질환 환자에서 인지기능, 정신행동 증상 및 일상 생활 기능간의 상관에 대한 연구 (A Study on Correlations Among Cognitive Functions, Neurobehavioral Symptoms and Daily Living Functions in Patients with Non-Traumatic Subcortical Cerebrovascular Disease)

  • 이영호;박영수;최홍;최영희;고대관;정영조;박병관;김수지;정숙희;고병희;송일병;박건우;이대희
    • 정신신체의학
    • /
    • 제4권2호
    • /
    • pp.170-181
    • /
    • 1996
  • Objective : This study was tried to investigate the specific relationships among cognitve function, neurbehavioral symptoms, and daily living functions, as well as provide the guidline of more proper clinical approches for patients with subcortical cerebrovascular disease. Objects and Methods Subjects were 85 patients whose diagnosis was confirmed by brain CT or MRI and controls were 195 normal persons matched by educational level with the subjects. The cognitive functions were evaluated by BNA(Benton neuropsychiatric assessment), subjective neurobehavioral symptoms by SCL-90-R(Sympton Check List-90-Revised), objective neurobehavioral symptoms by NRS(Neurobehavioral Rating Scale), and daily living function symptoms by NRS(Neurobehavioral Rating Scale), and daily living function by GERRI(Geriatric Evaluation by Relative's Rating Instrument) and IADL(Instrumental Activities of Daily Living Scale). Results: 1) Subjects showed significantly lower cognitive functions than controls in all tests of BNA except Lt-Rt Orientation Test(p=0.09) and facial Recognition Test(p=0.186). 2) In subjective neurobehavioral symptoms, subjects showed significantly lower scores in all symptoms except anxiety(p=0.059), hostility(p=0.159), and phobic anxiety(p=0.849). But in objects neurobehavioral symptoms, subjects showed significantly higher in scores in psychoticism (p=0.000) and neuroticism(p=0.025) of NRS. 3) The score of social functioning of GERRI(p=0.000) and that of IADL(p=0.000) were significantly higher in subjects than in controls. 4) for correlation between cognitive and daily living functions, there were significant correlations between the scores of all items on BNA and the score of cognitive or social function of GERRI and the socre of MDL in corntrols, whereas in subjects, there were significant correlations only between the scores of BNA and the score of IADL. 5) for correlation between neuroehavioral symptoms and daily living functions, there were significant correlatons between the socre of subjective neurobehavioral symptoms and the scores of all subscales of GERRI and the score of MDL in controls. On the contrary, in subjects, there were significant correlations between the score of social function of GERRI and the score of objective neurobehavioral symptoms such as psychoticism, agitiation-hostility, and decrease d motivation-emotional withdrawl. Conclusion : Above results suggest that disturbances in specific function of brain may play a role as a predictor of impairments with specific daily living functions and also suggest that specific correlations among various functions may be useful as clinical parameters for setting of the treatment goal and for assessing the ongoing process in the treatment and rehavilitation of the patients with subcortical cerebrovascular disease.

  • PDF