• 제목/요약/키워드: 인공 처리

검색결과 2,949건 처리시간 0.029초

영상기반 인체행위분류를 위한 전이학습 중추네트워크모델 분석 (Transfer Learning Backbone Network Model Analysis for Human Activity Classification Using Imagery)

  • 김종환;류준열
    • 한국시뮬레이션학회논문지
    • /
    • 제31권1호
    • /
    • pp.11-18
    • /
    • 2022
  • 최근 공공장소 및 시설에서 범죄예방 및 시설 안전을 목적으로 영상정보 기반의 인체의 행위를 분류하는 연구가 활발히 진행되고 있다. 이러한 인체 행위분류의 성능을 향상하기 위해서 대부분의 연구는 전이학습 기반의 딥러닝을 적용하고 있다. 그러나 딥러닝의 기반이 되는 중추 네트워크 모델(Backbone Network Model)의 수가 증가하고 아키텍처가 다양해짐에도 불구하고, 소수의 모델만 사용하는 분위기 때문에 운용목적에 적합한 중추 네트워크 모델을 찾는 연구는 미흡한 실정이다. 본 연구는 영상정보를 기초로 인체 행위를 분류하는 인공지능 모델을 개발하기 위해 최근에 개발된 5가지의 딥러닝 중추 네트워크 모델을 대상으로 전이학습을 적용하고 각 모델의 정확도 및 학습효율 측면에서 비교 및 분석하여 가장 효율이 높은 모델을 제안하였다. 이를 위해, 기본적인 인체 행위가 아닌 운동 종목 기반의 활동적이고 신체접촉이 높은 12가지의 인체 활동을 선정하고 관련된 7,200개의 이미지를 수집하였으며, 5가지의 중추 네트워크 모델에 총 20회의 전이학습을 균등하게 적용하고 학습과정과 결과성능을 통해 인체 행위를 분류하는데 적합한 중추 네트워크 모델을 정량적으로 비교 및 분석하였다. 그 결과 XceptionNet 모델이 학습 및 검증 정확도에서 0.99 및 0.91로, Top 2 및 평균 정밀도에서 0.96 및 0.91로 나타났으며 학습 소요시간은 1,566초, 모델용량의 크기는 260.4MB로 정확도와 학습효율 측면에서 다른 모델보다 높은 성능이 나타남을 확인할 수 있었다. 이러한 결과는 전이학습을 적용하여 인체 행위분류를 진행하는 다양한 연구 분야에 활용되기를 기대한다.

공예품 이커머스 데이터베이스 구축을 위한 공예품 조형 디자인 분류체계 개발 (Form Based Classification System for Building Database of Handmade Product E-Commerce)

  • 조익현;이사야;김채희;이중섭;이은종
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.54-62
    • /
    • 2021
  • 온라인 이커머스의 거래량이 증가함에 따라 품목이 다양해지고 그 분류가 복잡해지고 있다. 이에 전문적으로 한 분야에 대해서만 거래하는 이커머스 플랫폼이 등장하고 있고, 그 분야가 다양해지고 있다. 여러 전문 이커머스 플랫폼 종류중 하나인 공예품 온라인 이커머스 플랫폼을 살펴본 결과 세 가지 문제를 확인할 수 있었다. 첫 번째로, 플랫폼 내에서 공예품의 품목이 다양해지고 분류가 복잡해지고 있으나 기존 공예품 이커머스의 분류체계는 다양하고 복잡해진 공예품을 분류하기에는 구조가 단편적이어 서로 다른 사용자가 고려하는 다양한 기준을 충족하는 검색결과를 정확히 제시하기 어렵다. 두 번째로, 공예품의 경우 외형이 구매동기의 주요인임에도 불구하고 외형을 기준으로 분류하는 경우가 드물어 사용자가 작품 하나하나를 직접 눈으로 판단하며 필터링 해야 한다. 마지막으로, 공예분야의 전문가가 아닌 사용자가 공예품을 검색할 때 입력하는 언어가 분류체계에서 공예품을 분류하는 언어에 반영되지 않아 검색시 사용되어야하는 언어의 정밀도가 높다. 이에 본 연구에서는 다양한 사용자들의 검색 기준에 맞출 수 있도록 공예 분야의 복잡한 속성을 추가하여 고려하고자 한다. 추가하는 속성에는 공예품 검색에 있어서 주요인인 외형을 반드시 포함한다. 또한 인공지능의 자연어처리 기술로 비전문가의 검색 언어를 작품 검색에 반영할 수 있는 분류체계를 개발하고자 한다.

AI를 활용한 시추주상도 자동 디지털 DB화 방안에 관한 연구 (A Study on the Automatic Digital DB of Boring Log Using AI)

  • 박가현;한진태;윤영노
    • 한국지반공학회논문집
    • /
    • 제37권11호
    • /
    • pp.119-129
    • /
    • 2021
  • 국토지반정보 포털시스템에서 관리되는 지반정보는 사람이 직접 PDF 파일을 보고 일일이 타이핑을 해서 구축하고 있기 때문에 인적·시간적 자원 소모가 크며, 정확도 문제가 빈번하게 발생한다. 본 연구에서는 다양한 지반정보 중에서 국내에서 가장 일반적이고 널리 활용되고 있는 시추주상도를 대상으로 인공지능(Artificial Intelligence, AI)을 활용하여 자동 디지털 데이터베이스 구축하는 방안에 대해 제안하였다 우선, 다양한 시추주상도 양식에 대해서도 예외없이 데이터를 자동으로 데이터베이스화 하기 위해서 딥러닝모델 ResNet 34를 이용하여 시추주상도 양식분류를 하였으며, 총 6가지 시추주상도 양식에 대해 이미지 분류를 진행하여 전체 정확도(accuracy)는 99.7, ROC_AUC score는 1.0의 매우 높은 정확도로 시추주상도 양식을 분리할 수 있었다. 이 후, 각각의 양식에 대하여 미세조정(fine-tuning)된 로보틱 처리 자동화 기법을 이용하여 PDF 내 텍스트를 자동으로 읽어 들인 후 시추주상도 내 일반정보, SPT 시험정보 및 지층정보에 대해 데이터를 추출, 분리하여 이 값들을 기존 국토지반정보 포털시스템에서 제공하는 형태와 동일한 형태의 DB로 구축하도록 구현하였다. 최종적으로 기존 국토지반정보 포털시스템에서 제공하는 형태와 동일한 형태로 시추주상도내 정보를 초당 140페이지의 속도로 자동으로 DB화 할 수 있었다.

좌표계산을 통해 동영상의 안면 특징점 분석을 중심으로 한 웹 기반 발표 태도 교정 프로그램 개발 (Development of a Web-based Presentation Attitude Correction Program Centered on Analyzing Facial Features of Videos through Coordinate Calculation)

  • 권기현;안수호;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.10-21
    • /
    • 2022
  • 학생들의 취업을 위한 면접 발표와 회사에서의 프로젝트 결과 발표 등과 같은 형식적인 발표 태도가 개선되려면 동료나 교수자의 관찰에 의한 방법 이외에 자동화된 방법은 드물다. 기존 연구에 따르면, 발표자의 안정적인 발화와 시선 처리가 발표에서의 전달력에 영향을 미친다고 한다. 또한, 본인 발표에 대한 적절한 피드백이 발표자의 발표 역량을 늘이는 효과가 있다는 연구도 있다. 본 연구에서는 이와 같은 교정의 긍정적 측면을 고려하여 대학생들의 잘못된 발표 습관과 태도를 동영상의 안면 분석을 통해 지능적으로 교정해 주는 프로그램을 개발하고 성능을 분석하였다. 개발하는 프로그램은 웹 기반으로 군말 사용 여부를 확인하고 안면 인식과 발표 내용 텍스트화를 통해 개발되었다. 이를 위해 군말 분류 인공지능 모델을 개발하였고, 동영상 객체 추출 후, 좌표에 기반으로 얼굴 특징점을 인식하였다. 이후 4,000개 안면 데이터를 이용해 Teachable Machine에서 안면 인식한 경우와 본 연구의 알고리즘 성능을 비교·분석하였다. 프로그램을 이용해 발표 태도를 자기스스로 교정하여 발표자들에게 도움을 준다.

인공신경망 기계번역에서 말뭉치 간의 균형성을 고려한 성능 향상 연구 (A study on performance improvement considering the balance between corpus in Neural Machine Translation)

  • 박찬준;박기남;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.23-29
    • /
    • 2021
  • 최근 딥러닝 기반 자연언어처리 연구들은 다양한 출처의 대용량 데이터들을 함께 학습하여 성능을 올리고자 하는 연구들을 진행하고 있다. 그러나 다양한 출처의 데이터를 하나로 합쳐서 학습시키는 방법론은 성능 향상을 막게 될 가능성이 존재한다. 기계번역의 경우 병렬말뭉치 간의 번역투(의역, 직역), 어체(구어체, 문어체, 격식체 등), 도메인 등의 차이로 인하여 데이터 편차가 발생하게 되는데 이러한 말뭉치들을 하나로 합쳐서 학습을 시키게 되면 성능의 악영향을 미칠 수 있다. 이에 본 논문은 기계번역에서 병렬말뭉치 간의 균형성을 고려한 Corpus Weight Balance (CWB) 학습 방법론을 제안한다. 실험결과 말뭉치 간의 균형성을 고려한 모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 더불어 단일 말뭉치로도 고품질의 병렬 말뭉치를 구축할 수 있는 휴먼번역 시장과의 상생이 가능한 말뭉치 구축 프로세스를 추가로 제안한다.

Generative optical flow based abnormal object detection method using a spatio-temporal translation network

  • Lim, Hyunseok;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.11-19
    • /
    • 2021
  • 이상 객체란 일반적이고 평범한 행동을 취하는 객체가 아닌 비정상적이고 흔하지 않은 행동을 하여 관찰이나 감시·감독을 필요로 하는 사람, 물체, 기계 장치 등을 뜻한다. 이를 사람의 지속적인 개입 없이 인공지능 알고리즘을 통해 탐지하기 위해서 광학 흐름 기법을 활용한 시간적 특징의 특이도를 관찰하는 방법이 많이 활용되고 있으며, 이 기법은 정해진 표현 범위가 없는 수많은 이상 행동을 식별하기에 적합하다. 본 연구에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)으로 입력 영상 프레임을 광학 흐름 영상으로 변환하는 알고리즘을 학습시켜 비정상적인 상황을 식별한다. 특히 생성적 적대 신경망 모델이 입력 영상에 대한 중요한 특징 정보를 학습하고, 그 외 불필요한 이상치를 제외시키기 위한 전처리 과정과 학습 후 테스트 데이터셋에서 식별 정확도를 높이기 위한 후처리 과정을 고도화하여 전체적인 모델의 이상 행동 식별 성능을 향상시키는 기법을 제안한다. 이상 행동을 탐지하기 위한 학습 데이터셋으로 UCSD Pedestrian, UMN Unusual Crowd Activity를 활용하였으며, UCSD Ped2 데이터셋에서 프레임 레벨 AUC 0.9450, EER 0.1317의 수치를 보이며 이전 연구에서 도출된 성능 지표 대비 성능 향상이 확인되었다.

전단파 토모그래피를 활용한 철도 콘크리트 궤도 슬래브 층분리 결함 평가 (Evaluation of Debonding Defects in Railway Concrete Slabs Using Shear Wave Tomography)

  • 이진욱;기성훈;이강석
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제26권3호
    • /
    • pp.11-20
    • /
    • 2022
  • 이 연구의 주요 목적은 고속철도 콘크리트 궤도 슬래브의 콘크리트 슬래브(track concrete layer, TCL)와 도상안정층(hydraulically stabilized based course, HSB) 사이 층분리를 평가하기 위한 비파괴검사법으로 전단파 토모그래피 기술의 활용가능성을 실험적으로 확인하는 것이다. 이를 위하여 다채널 전단파 측정 장치(MIRA)를 활용하여 실물 크기로 제작된 고속철도 콘크리트 궤도 슬래브 실험체 내부의 층분리 결함을 평가하였다. 실물실험체는 Rheda 2000 시스템에 따라 설계 및 시공되었으며, 노반 위에 HSB를 타설하고, 그 위에 TCL이 타설된 2층 슬래브 구조를 갖는다. 실물실험체는 일부구간의 HSB상부에 스티로폼으로 제작된 인공결함(가로 및 세로가 각각 400mm이고 두께가 각각 5mm, 15mm인 압출폴리스티렌폼(XPS)보드 2개)을 삽입하여, TCL과 HSB 사이에 층분리 결함이 생기도록 시공하였다. 시험체의 층분리 구간에서 얻은 콘크리트 단층이미지는 층분리에 따른 균열 및 HSB와 지반사이의 계면에서 반사되는 신호를 효과적으로 보여 주었다. 한편 초음파 토모그래피 이미지에서 TCL 콘크리트의 매입물(철근, 트러스, 인서트 등)에서 반사된 신호와 층분리 결함 신호를 구분하기 위한 노이즈 제거를 위한 이미지 처리방법을 적용하여 층분리 결함을 효과적으로 분리하였다. 토모그래피 이미지에서 추출된 층분리 결함의 크기정보와 공간정보를 통합하여 층분리 지도로 재구성하였으며, 층분리 결함의 위치 및 크기를 시각화하는데 효과적인 것을 확인하였다.

표면파 탐사 II: 수동 탐사법을 중심으로 (Surface Wave Method II: Focused on Passive Method)

  • 조성오;정인석;김빛나래;장한나;장성형;;남명진
    • 지구물리와물리탐사
    • /
    • 제25권1호
    • /
    • pp.14-25
    • /
    • 2022
  • 수동 표면파 탐사는 인공 송신원 없이 생활잡음 또는 자연 발생 소음 등을 송신원으로 이용해 탄성파 신호를 측정한다. 수동 송신원은 낮은 진동수 대역에서 발생하기 때문에 수동 표면파 탐사는 일반적인 능동 탐사법 보다 더 깊은 심도의 지질 정보를 확보할 수 있어 심부 부지 평가 분야에 많이 활용되고 있다. 수동 표면파 탐사 자료는 능동 표면파 탐사 자료 해석과 마찬가지로 자료 획득 후 진동수 분산곡선을 구하여 1차원으로 가정한 속도구조를 해석한다. 하지만 수동 표면파 탐사 자료는 송신원이 무작위로 발생한다는 특성 때문에 여러 수신기에서 측정된 신호들의 공간자기상관을(spatial autocorrelation) 이용해 수신 자료들의 일관성(coherence) 곡선을 구하고 이로부터 분산곡선을 구하게 된다. 이 기술보고에서는 수동 표면파 탐사 이론, 탐사 방법, 자료처리 기법을 살펴보고 실제 적용 사례를 분석한다.

Classification of Diabetic Retinopathy using Mask R-CNN and Random Forest Method

  • Jung, Younghoon;Kim, Daewon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 논문에서는 딥러닝 기법의 하나인 Mask R-CNN과 랜덤포레스트 분류기를 이용해 당뇨병성 망막병증의 병리학적인 특징을 검출하고 분석하여 자동 진단하는 시스템을 연구하였다. 당뇨병성 망막병증은 특수장비로 촬영한 안저영상을 통해 진단할 수 있는데 밝기, 색조 및 명암은 장치에 따라 다를 수 있으며 안과 전문의의 의료적 판단을 도울 인공지능을 이용한 자동진단 시스템 연구와 개발이 가능하다. 이 시스템은 미세혈관류와 망막출혈을 Mask R-CNN 기법으로 검출하고, 후처리 과정을 거쳐 랜덤포레스트 분류기를 이용하여 안구의 정상과 비정상 상태를 진단한다. Mask R-CNN 알고리즘의 검출 성능 향상을 위해 이미지 증강 작업을 실시하여 학습을 진행하였으며 검출 정확도 측정을 위한 평가지표로는 다이스 유사계수와 Mean Accuracy를 사용하였다. 비교군으로는 Faster R-CNN 기법을 사용하였고 본 연구를 통한 검출 성능은 평균 90%의 다이스 계수를 통한 정확도를 나타내었으며 Mean Accuracy의 경우 91% 정확도의 검출 성능을 보였다. 검출된 병리증상을 토대로 랜덤포레스트 분류기를 학습하여 당뇨병성 망막 병증을 진단한 경우 99%의 정확도를 보였다.

디지털 휴먼 컨텐츠 생성 시스템의 설계 (The Design of Digital Human Content Creation System)

  • 이상윤;이대식;유영모;이계훈;유현수
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권4호
    • /
    • pp.271-282
    • /
    • 2022
  • 본 논문에서는 디지털 휴먼 컨텐츠 생성 시스템을 제안한다. 디지털 휴먼 컨텐츠 생성 시스템은 전신 스케닝을 통해 3D AI 모델링 작업을 하고, 3D 모델링 후처리와 텍스쳐링, 리깅 작업으로 제작된다. 이를 가상현실 컨텐츠 정보와 결합함으로써 가상현실 내에서 가상 모델의 자연스러운 동작이 이뤄질 수 있고, 하나의 시스템에서 효율적으로 디지털 휴먼 컨텐츠를 생성할 수 있다. 따라서 자원을 최소화하는 가상현실 기반의 디지털 휴먼 컨텐츠 생성이 가능하도록 하는 효과가 있다. 또한 사람에 의한 3D 모델링 및 텍스쳐링 작업은 전처리 과정을 필요로 하지 않는 자동화된 전처리 공정을 제공하며, 다양한 디지털 휴먼 컨텐츠를 효율적으로 관리하는 기술을 제공고자 한다. 특히 가상 모델을 구성하기 위한 3D 모델링 및 텍스쳐링 등의 전처리 공정은 인공지능에 의해 자동으로 수행되도록 함으로써 신속하고 효율적인 가상 모델 구성이 이뤄질 수 있다는 장점이 있다. 또한 시그니처 모션을 통해 디지털 휴먼 컨텐츠 구성 및 관리가 용이하게 이뤄질 수 있다는 장점이 있다.