• 제목/요약/키워드: 미디어 기반 학습

검색결과 1,016건 처리시간 0.024초

UbiController: 스마트 홈 환경의 가전기기 제어를 위한 통합 모바일 시스템 (UbiController: Universal Mobile System for Controlling Appliances in Smart Home Environment)

  • 윤효석;김혜진;우운택;이상국
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1059-1071
    • /
    • 2008
  • 유비쿼터스 컴퓨팅 환경에서 사용자는 많은 수의 장치 및 서비스를 언제, 어디서나 손쉽게 사용할 수 있다. 이를 위해서 사용자에게 대상 장치 및 서비스의 사용자 인터페이스를 쉽고 직관적으로 제공할 필요가 있다. 기존의 방법에서는 각각의 장치 및 서비스를 위해 개별적인 사용자 인터페이스를 제공하기 때문에 사용자는 사용법을 학습하기 위해 많은 시간을 투자해야했다. 또한 지금까지 개발된 시스템은 제한된 시나리오에서만 검증되어, 일반적인 사용자 인터페이스로써의 확장성에 대한 고려가 부족하다. 본 논문에서는 유비쿼터스 컴퓨팅 환경에서 개인 모바일 단말기를 사용하여 확장된 모바일 상호작용을 지원하는 시스템인 UbiController를 제시한다. 먼저, 유비쿼터스 컴퓨팅 환경에서의 모바일 시스템의 기능을 정의하기 위해, 기존의 관련연구를 분석하고 세 가지 필수 기능인 서비스 발견, 선택 및 상호작용을 지원할 수 있는 시스템 구조를 설계하고, 이를 통해 UbiController는 스마트 홈 환경의 다수의 서비스를 자동으로 발견하고, 직/간접적 선택된 서비스에 대응하는 GUI 인터페이스를 통해 홈 환경의 가전기기를 직관적으로 제어하는 방법을 제공한다. 마지막으로, UbiController의 보편성과 확장성을 검증하기 위하여, 스마트 홈 테스트베드에서 다양한 응용 시나리오를 가지고 UMPC기반의 프로토타입을 구현하고 사용자 스터디를 통해 UbiController를 정성적으로 평가한다.

  • PDF

큐싱 공격 탐지를 위한 AutoML 머신러닝 기반 악성 URL 분류 기술 연구 및 서비스 구현 (AutoML Machine Learning-Based for Detecting Qshing Attacks Malicious URL Classification Technology Research and Service Implementation)

  • 김동영;황기성
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.9-15
    • /
    • 2024
  • 최근 정부 기관을 사칭한 가짜 QR(Quick Response)코드를 이용하여 개인정보와 금융정보를 탈취하는 QR코드와 스미싱을 결합한 '큐싱(Qshing)' 공격이 증가하는 추세이다. 특히, 이 공격 방식은 사용자가 단지 QR코드를 인식하는 것만으로 스미싱 페이지에 연결되거나 악성 소프트웨어를 다운로드하게 만들어 피해자가 자신이 공격당했는지조차 인지하기 어려운 특징이 있다. 본 논문에서는 머신러닝 알고리즘을 활용해 QR 코드 내 URL의 악성도를 파악하는 분류 기술을 개발하고, 기존의 QR 코드 리더기와 결합하는 방식에 관해 연구를 진행하였다. 이를 위해 QR코드 내 악성 URL 128,587개, 정상 URL 428,102개로부터 프로토콜, 파라미터 등 각종 특징 35개를 추출하여 데이터셋을 구축한 후, AutoML을 이용하여 최적의 알고리즘과 하이퍼파라미터를 도출한 결과, 약 87.37%의 정확도를 보였다. 이후 기존 QR코드 리더기와 학습한 분류 모델의 결합을 설계하여 큐싱 공격에 대응할 수 있는 서비스를 구현하였다. 결론적으로, QR코드 내 악성 URL 분류 모델에 최적화된 알고리즘을 도출하고, 기존 QR코드 리더기에 결합하는 방식이 큐싱 공격의 대응 방안 중 하나임을 확인하였다.

Adaboost와 깊이 맵 기반의 블록 순위 패턴의 템플릿 매칭을 이용한 얼굴검출 (Face Detection Using Adaboost and Template Matching of Depth Map based Block Rank Patterns)

  • 김영곤;박래홍;문성수
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.437-446
    • /
    • 2012
  • 흑백 혹은 컬러 영상과 같은 2차원 정보를 사용한 얼굴 검출 알고리즘에 관한 연구가 수십 년 동안 이루어져 왔다. 최근에는 저가 range 센서가 개발되어, 이를 통해 3차원 정보 (깊이 정보: 카메라와 물체사이의 거리를 나타냄)를 손쉽게 이용함으로써 얼굴의 특징을 높은 신뢰도로 추출하는 것이 가능해졌다. 대부분 사람 얼굴에는 3차원적인 얼굴의 구조적인 특징이 있다. 본 논문에서는 흑백 영상과 깊이 영상을 사용하여 얼굴을 검출하는 알고리즘을 제안한다. 처음에는 흑백 영상에 adaboost를 적용하여 얼굴 후보 영역을 검출한다. 얼굴 후보 영역의 위치에 대응되는 깊이 영상에서의 얼굴 후보 영역을 추출한다. 추출된 영역의 크기를 $5{\times}5$ 영역으로 분할하여 깊이 값의 평균값을 구한다. 깊이 값들의 평균값들 간에 순위를 매김으로써 블록 순위 패턴이 생성된다. 얼굴 후보 영역의 블록 순위 패턴과 학습 데이터를 사용하여 미리 학습된 템플릿 패턴을 매칭함으로써 최종 얼굴 영역인지 아닌지를 판단할 수 있다. 제안하는 방법의 성능을 Kinect sensor로 취득한 실제 영상으로 실험하였다. 실험 결과 true positive를 잘 보존하면서 많은 false positive들을 효과적으로 제거하는 것을 보여준다.

휴대폰에서의 홍채인식을 위한 고속 홍채검출에 관한 연구 (A Study on Fast Iris Detection for Iris Recognition in Mobile Phone)

  • 박현애;박강령
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.19-29
    • /
    • 2006
  • 최근 휴대폰에서 개인 정보 보안의 중요성이 대두되고 있으며, 이에 따라 생체인식 기능이 내장된 휴대폰에 관심이 집중되고 있다. 그러므로 본 논문에서는 휴대용 기기에 홍채인식기술을 적용하기 위한 방법을 제안한다 기존의 홍채 인식 알고리즘에서는 고 배율의 줌 렌즈(zoom lens)와 초점렌즈(focus lens)를 사용하여 홍채인식에 사용될 확대된 홍채영상을 획득하였다. 이와 같이 이 전에 휴대폰에 홍채인식기술을 적용하기 위해서는 줌 렌즈와 초점렌즈를 추가 장착하여야 했으며, 이는 가격 상승과 부피 증가의 문제를 발생시켰다. 그러나 최근 휴대폰의 멀티미디어 기기 융 복합 추세로 인해 휴대폰 내에 장착된 메가픽셀 카메라(Mega-pixel Camera)의 성능이 급속히 발전함에 따라, 고 배율의 줌 렌즈 및 초점렌즈(zoom & focus lens) 없이도 확대된 홍채영상의 획득이 가능하게 되었다. 즉, 메가 픽셀 카메라 폰을 사용하여 사용자로부터 원거리에서 취득한 얼굴영상에서의 홍채영역이 홍채인식을 수행하기 위한 충분한 픽셀정보를 가지게 되었다. 본 논문에서는 이러한 얼굴영상에서 각막에 반사된 조명 반사광을 기반으로 휴대폰에서의 홍채인식을 위한 고속 홍채검출 방법을 제안한다. 또한 눈, 카메라, 조명 모델을 기반으로 각막에 반사된 조명반사광의 밝기와 크기를 추정하는 이론적 배경을 제안하며, 입력영상에서 태양광의 존재 유무와 광학적으로 또는 피사체의 움직임에 의해 반사된 흐림 현상 (Optical & Motion blur)을 판별하기 위해 조명을 연속적으로 On/Off 시키는 방법을 제안한다. 실험결과, 삼성 SCH-S2300(150MHz의 ARM 9 CPU) 휴대폰에서 홍채 영역 추출 총 수행시간은 평균 65ms이었고, 홍채 검출 성공률은 태양광이 존재하지 않는 실내에서 99%, 태양광이 존재하는 실외에서 98.5%였다._{SSH}$ 전압이 약 1.1V 일 때까지 오류 없이 동작함을 관측하였다. 본 논문의 SRAM 스위칭 전력감소는 I/O의 bit width가 증가하면 더욱 더 중요해질 것으로 예상할 수 있다.어 자료 형태를 32.4%의 순으로 개발을 희망하였다. 다섯째, 주로 사용하는 웹 사이트는 가정과 교사나 교과 연구회에서 운영하는 사이트를 46.2%, 에듀넷이나 한국교육학술정보원(KERIS) 사이트는 30.8%가 활용하는 것으로 나타났다. 또한 학습 자료 개발은 제작 능력이 있는 가정과 교사들이 교과 연구회를 만들어 공동으로 제작 할 수 있기를 희망하고 있었다. 시대적인 변화와 교육 환경의 변화로 웹 콘텐츠 자료를 활용한 교수 학습 방법이 중요한 도구로 인식되고 있다. 특히 가정 교과는 일상생활에 필요한 기초적인 경험을 실생활과 접목시켜 종합적으로 다루는 교과이기 때문에 다양하고 창의적인 콘텐츠가 절실히 요구되는 실정이다. 본 연구의 결과들에서 제시한 여러 가지 사항들을 고려하여 웹 콘텐츠 자료 활용과 개발이 이루어진다면 보다 효율적인 교수 학습이 이루어질 것으로 기대된다.변연계통과 대뇌겉질 전체에 영향을 미칠 것으로 여겨지는데, 본 실험에서는 네 종류의 바닥핵들, 즉 꼬리핵, 줄무늬체바닥핵, 중격옆핵 및 중격핵과 관련된 신경연접들을 관찰하였으며, 그 결과를 문헌 고찰한 결과 변연계통과 줄무늬체계통이 앞뇌의 바닥에 있는 신경핵들에서 형태학적 교차연결을 통해 정서와 마음의 상태를 행동과 대응으로 표현하는 중요한 신경회로가 존재함을 제안하였다.腎臟組織)에서 더많이 발생되었다. 틸라피아의 신사구체(腎絲球體)는 담수(淡水)에서 10%o의 해수(海水)로 이주된지 14일(日) 이후에 신장(腎臟)에서 수축된 것으로 나타났다. 30%o의 해수(海水)에 적응(適應)된 틸라피아의 평균 신사구체(腎絲球體)의 면적은 담수(淡水)에 적응된 개체의 면적보다

회의 소집을 위한 다중 에이전트 시스템의 구현 (Implementation of A Multiple-agent System for Conference Calling)

  • 유재홍;노승진;성미영
    • 지능정보연구
    • /
    • 제8권2호
    • /
    • pp.205-227
    • /
    • 2002
  • 이 연구는 웹 기반 협동작업 시스템에서 지능적인 에이전트들을 이용하여 원격 회의의 소집을 자동화함으로써 여러 참여자들에게 보다 편리한 형태의 협동작업 환경을 지원해 주는 시스템에 대한 것이다 회의 일정을 잡는 작업을 자동화하는 것은 각 개인의 공적인 일정 뿐만 아니라 개인의 사정과 선호도 등에 대한 세심한 배려를 요구한다. 그러므로, 회의 소집 자동화는 신뢰성과 병렬성을 높이기 위해서 각 개인의 일정을 병렬적으로 별도 관리하는 작업을 지원하는 분산 처리 작업이 요구된다. 이 논문에서는 회의 소집에 들이는 시간과 노력을 최소로 줄여주는 다중 에이전트 시스템의 설계와 구현에 대하여 자세하게 소개한다. 이 시스템은 서버-를라이언트 모델에 기반하며, 서버 측에서는 스케줄 에이전트, 협상 에이전트, 개인정보 관리 에이전트, 그룹 정보 관리 에이전트, 세션관리 에이전트와 조정 에이전트가 활동한다. 클라이언트 측에서는 인터페이스 에이전트, 미디어 에이전트와 협동 에이전트가 활동한다. 이들 에이전트들은 통신은 표준화된 지식 표현 언어를 이용하여 통신하므로 분산 협동 처리를 위한 에이전트들 간의 통신에 있어 가장 큰 문제점인 이형질성을 극복할 수 있도록 해준다. 본 시스템의 회의소집 지원 에이전트들은 전진연결 알고리즘으로 추론하고 역전파 네트워크 알고리즘으로 학습하여 가장 많은 사람이 참여할 수 있는 날짜를 제안해줌으로써 회의 소집자가 회의 소집에 들이는 노력을 최소로 줄일 수 있게 해 준다.

  • PDF

인공신경망을 이용한 샷 사이즈 분류를 위한 ROI 탐지 기반의 익스트림 클로즈업 샷 데이터 셋 생성 (Generating Extreme Close-up Shot Dataset Based On ROI Detection For Classifying Shots Using Artificial Neural Network)

  • 강동완;임양미
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.983-991
    • /
    • 2019
  • 본 연구는 영상 샷의 크기에 따라 다양한 스토리를 갖고 있는 영상들을 분석하는 것을 목표로 한다. 따라서 영상 분석에 앞서, 익스트림 클로즈업 샷, 클로즈업 샷, 미디엄 샷, 풀 샷, 롱 샷 등 샷 사이즈에 따라 데이터셋을 분류하는 것이 선행되어야 한다. 하지만 일반적인 비디오 스토리 내의 샷 분포는 클로즈업 샷, 미들 샷, 풀 샷, 롱 샷 위주로 구성되어 있기 때문에 충분한 양의 익스트림 클로즈업 샷 데이터를 얻는 것이 상대적으로 쉽지 않다. 이를 해결하기 위해 본 연구에서는 관심 영역 (Region Of Interest: ROI) 탐지 기반의 이미지 크롭핑을 통해 익스트림 클로즈업 샷을 생성함으로써 영상 분석을 위한 데이터셋을 확보 방법을 제안한다. 제안 방법은 얼굴 인식과 세일리언시(Saliency)를 활용하여 이미지로부터 얼굴 영역 위주의 관심 영역을 탐지한다. 이를 통해 확보된 데이터셋은 인공신경망의 학습 데이터로 사용되어 샷 분류 모델 구축에 활용된다. 이러한 연구는 비디오 스토리에서 캐릭터들의 감정적 변화를 분석하고 시간이 지남에 따라 이야기의 구성이 어떻게 변화하는지 예측 가능하도록 도움을 줄 수 있다. 향후의 엔터테인먼트 분야에 AI 활용이 적극적으로 활용되어질 때 캐릭터, 대화, 이미지 편집 등의 자동 조정, 생성 등에 영향을 줄 것이라 예상한다.

Vizrt 엔진 기반 가상현실 그래픽 알고리즘과 기초 실습 교육 방식의 연구 (Vizrt Engine-Based Virtual Reality Graphics Algorithm A Study on the Basic Practical Training Method)

  • 조현경
    • 문화기술의 융합
    • /
    • 제5권3호
    • /
    • pp.197-202
    • /
    • 2019
  • 4차 혁명 시대에는 Vizrt와 같이 방송 분야에서 입증된 엔진을 이용한 콘텐츠 제작에 대한 관심이 높아진다. 5G 시대에 요구되는 새로운 시각 효과는 콘텐츠 제작 훈련에 매우 중요하다. Vizrt는 방송 및 미디어 콘텐츠에 대한 생산 시간 유틸리티와 가성비가 좋다. 본 논문에서는 이를 활용하여 가상 콘텐츠 제작 기본 교육 코스의 정리 적용에 관한 실질적인 사례를 제시하고, 기본 교육 방향을 제시하고자 한다. 도입부에서 그래픽 알고리즘은 Vizrt 엔진의 특성과 환경 요인을 분석하여 연구하였다. 본 논문에서는 생산 공정을 분리하여 연구하였으며, 엔진 시행을 통해 실천된 작업을 제시하였다. VS Studio Foundation은 각 단계에서 실용적인 프로덕션 케이스로 제공되었다. Vizrt 엔진 운영자 프로세스는 그래픽 접근과 응용에서 중요하며, 강의 결과를 통해 기본 학습에 적합한 가상현실 시각의 알고리즘 이해와 구현 방법을 연구하였다. 실습을 바탕으로 한 본론의 연구방법은 부문별 5G 콘텐츠 작업에 특화된 Vizrt 콘텐츠를 만들고, 콘텐츠 이미지에서 새로운 영역의 그래픽 제작을 실천하는 것이었다. 본 연구를 통해 주제에 따라 콘텐츠 제작을 연습함으로써 Vizrt에 기반한 가상현실 콘텐츠 작업을 통해 기본 훈련 방법의 결론에 도달했다. 또한, Vizrt 콘텐츠 제작의 효과와 Vizrt 기본 교육 과정 구축 방향을 제안한다.

주의 모듈 기반 Mask R-CNN 경량화 모델을 이용한 도로 환경 내 객체 검출 방법 (Object Detection on the Road Environment Using Attention Module-based Lightweight Mask R-CNN)

  • 송민수;김원준;장래영;이용;박민우;이상환;최명석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.944-953
    • /
    • 2020
  • 객체 검출 알고리즘은 자율주행 시스템 구현을 위한 핵심 요소이다. 최근 심층 합성곱 신경망 (Deep Convolutional Neural Network) 기반의 영상 인식 기술이 발전함에 따라 심층 학습을 이용한 객체 검출 관련 연구들이 활발히 진행되고 있다. 본 논문에서는 객체 검출에 가장 널리 사용되고 있는 Mask R-CNN의 경량화 모델을 제안하여 도로 내 다양한 객체들의 위치와 형태를 효율적으로 예측하는 방법을 제안한다. 또한, 주의 모듈(Attention Module)을 Mask R-CNN 내 각각 다른 역할을 수행하는 신경망 계층에 적용함으로써 특징 지도를 적응적으로 재교정(Re-calibration)하여 검출 성능을 향상시킨다. 실제 주행 영상에 대한 다양한 실험 결과를 통해 제안하는 방법이 기존 방법 대비 크게 감소된 신경망 매개변수만을 이용하여 고성능 검출 성능을 유지함을 보인다.

MF sampler: 동영상 기반 패션 검색 모델의 성능 향상을 위한 샘플링 방법 (MF sampler: Sampling method for improving the performance of a video based fashion retrieval model)

  • 백상훈;박종혁
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.329-346
    • /
    • 2022
  • 최근 소셜 미디어의 숏폼(Short form) 동영상(인스타그램, 틱톡, 유튜브) 시장이 점차 증가하면서 인공지능 영역에서는 이를 활용한 연구가 활발히 진행되고 있다. 대표적인 연구분야로 동영상 내의 패션 상품을 탐지하고 상품 이미지를 검색하는 Video to shop 을 들 수 있다. 이와 같은 동영상 기반 인공지능 모델에서는 Convolution 연산을 사용하여 상품의 특징을 추출한다. 하지만 연산 자원의 제한으로 인해, 동영상의 모든 프레임을 사용하여 특징을 추출하는 것은 현실적으로 불가능하다. 이로 인해, 기존 연구에서는 전체 프레임 중 일부만 샘플링해서 사용하거나, 주제의 특성을 활용한 샘플링 방법을 개발하여 이를 통해 위 문제점을 개선하고, 모델의 성능도 향상시켰다. 기존의 Video to shop 연구에서는 프레임을 샘플링 할 때, 무작위로 일부분의 프레임을 샘플링하거나 균등한 간격으로 샘플링 한다. 하지만 이러한 샘플링 방법은 상품이 존재하지 않는 노이즈 프레임을 샘플링 하면서 패션 상품 검색 모델의 성능을 저하시킨다. 이에 본 연구는 노이즈 프레임을 제거하고 검색 모델의 성능을 향상시키는 샘플링 방법 MF(Missing Fashion items on frame) sampler를 제안한다. MF sampler는 키 프레임 메커니즘(Mechanism)을 발전시켜 자원 한계의 문제점을 개선했다. 또한, 노이즈 탐지 모델을 활용한 노이즈 프레임 제거를 통해 검색 모델의 성능을 향상시켰다. 이와 같은 결과는 실험을 통해 확인되었고, Video to shop 패션 상품 검색에 있어 성능 향상과 효과적인 학습이 가능하다는 것을 확인할 수 있었다.

CNN 기반 감성 변화 패턴을 이용한 가짜뉴스 탐지 (Fake News Detection Using CNN-based Sentiment Change Patterns)

  • 이태원;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.179-188
    • /
    • 2023
  • 최근 가짜뉴스는 뉴스 콘텐츠 형식을 가장하고 중요한 사건이 발생할 때마다 등장하여 사회적 혼란을 초래한다. 이에 가짜뉴스를 탐지하기 위한 연구로 인공지능 기술이 사용된다. 자연어 처리를 통해 가짜뉴스를 자동으로 인지 및 차단하거나, 네트워크 인과 추론과 결합함으로써 허위 정보를 확산시키는 소셜미디어 인플루언스 계정을 감지하는 등의 가짜뉴스 탐지 접근법이 딥러닝을 통해 구현될 수 있었다. 그러나 가짜뉴스 탐지는 여러 자연어 처리 분야 중에서도 해결이 어려운 문제로 분류된다. 가짜뉴스가 가지는 형식 및 표현의 다양성으로 특성 추출의 난도가 높고, 뉴스가 속한 범주에 따라 하나의 특성이 서로 다른 의미를 가질 수도 있는 등 다양한 한계점이 존재한다. 본 논문에서는 가짜뉴스를 탐지하기 위한 추가적인 식별 기준으로 감성 변화 패턴을 제시한다. 합성곱 신경망을 가짜뉴스 데이터 세트에 적용하여 콘텐츠 특성에 기반한 분석을 수행하고, 감성 변화 패턴을 추가로 분석함으로써 성능이 개선된 모델을 제안한다. 뉴스를 구성하는 문장에 대하여 감성 극성을 산출하고 장단기 메모리를 적용함으로써 문장 순서에 의존적인 결괏값을 얻을 수 있다. 이를 감성 변화의 패턴으로 정의하고 뉴스의 콘텐츠 특성과 결합하여 가짜뉴스 탐지를 위한 제안 모델의 독립변수로 활용한다. 제안 모델과 비교 모델을 딥러닝으로 학습시키고 가짜뉴스 데이터 세트를 이용한 실험을 진행하여 감성 변화 패턴이 가짜뉴스 탐지 성능을 개선할 수 있음을 확인한다.