• Title/Summary/Keyword: 학습영상

검색결과 2,580건 처리시간 0.029초

영상 인식을 위한 생리학적 퍼지 신경망 (Physiological Fuzzy Neural Networks for Image Recognition)

  • 김광백;문용은;박충식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.169-185
    • /
    • 2005
  • 신경계의 뉴런 구조는 흥분 뉴런과 억제 뉴런으로 구성되며 각각의 흥분 뉴런과 억제 뉴런은 주동근 뉴런(agonistic neuron)에 의해 활성화되며 길항근 뉴런(antagonist neuron)에 의해 비활성화 된다. 본 논문에서는 인간 신경계의 생리학적 뉴런 구조를 분석하여 퍼지 논리를 이용한 생리학적 퍼지 신경망을 제안한다. 제안된 구조는 주동근 뉴런에 의해 흥분 뉴런이 될 수 있는 뉴런들을 선택하여 흥분시켜 출력층으로 전달하고 나머지 뉴런들을 억제시켜 출력층에 전달시키지 않는다. 신경계를 기반으로 한 제안된 생리학적 퍼지 신경망의 학습구조는 입력층, 학습 데이터의 특징을 분류하는 중간층, 그리고 출력층으로 구성된다. 제안된 퍼지 신경망의 학습 및 인식 성능을 평가하기 위해 정확성이 요구되는 의학의 한 분야인 기관지 편평암 영상인식과 영상 인식의 주요 응용 분야인 차량 번호판 인식에 적용하여 기존의 신경망과 성능을 비교 분석하였다. 실험 결과에서는 제안된 생리학적 퍼지 신경망이 기존의 신경망보다 학습 시간과 수렴성이 개선되었을 뿐만 아니라, 인식에 있어서도 우수한 성능이 있음을 확인하였다.

  • PDF

소표본 의료 영상의 전이 학습을 위한 Feature Extractor 기법의 성능 비교 및 분석 (Performance Analysis of Feature Extractor for Transfer Learning of a Small Sample of Medical Images)

  • 이동호;홍대용;이연;신병석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.405-406
    • /
    • 2018
  • 본 논문은 소표본 의료용 영상 분석의 정확도 향상을 위해 전이학습 모델을 feature extractor로 구축하여 학습시키는 방법을 연구하였으며 성능 평가를 위해 선학습모델로 AlexNet, ResNet, DenseNet을 사용하여 fine tuning 기법을 적용하였을 때와의 성능을 비교 분석하였다. 그 결과 실험에 사용된 3개의 모델에서 fine tuning 기법보다 향상된 정확도를 보임을 확인하였고, 또한 ImageNet으로 학습된 AlexNet, ResNet, DenseNet이 소표본 의료용 X-Ray 영상에 적용될 수 있음을 보였다.

컨볼루셔널 뉴럴 네트워크를 이용한 주인공 식별 기반의 영상장면 탐색 기법 (A scene search method based on principal character identification using convolutional neural network)

  • 권명규;양형식
    • 융합정보논문지
    • /
    • 제7권2호
    • /
    • pp.31-36
    • /
    • 2017
  • 본 논문은 대량의 영상에서 특정 출연자가 나오는 영상부분을 탐색하여 재생하고자 한다. TV영상 프로그램에서 주인공이나 특정 장면을 탐색 하려면 영상을 플레이하거나 코너를 설정하여 시청한다. 기존 방식은 장면 탐색이나 코너별 시청시 수동으로 offset값을 설정 하여야만 한다. 그러나 본 논문에서 제안하는 방식은 주인공 얼굴을 학습 시킨후 영상인식으로 주인공을 찾고 주인공이 등장하는 장면으로 이동하여 영상을 재생 하게 된다. 특정 출연자에 대한 데이터는 크롤링 기법을 활용하여 추출 및 수집한다. 수집된 데이터를 기반으로 컨볼루셔널 뉴럴 네트워크 알고리즘을 사용하여 학습하고 이를 이용하여 성능 평가를 진행한다. 성능 평가는 드라마를 재생하면서 추출된 키 프레임에서 학습 된 특정 출연자를 추출, 판단하는 방법으로 정확도를 측정한다. 학습된 장면을 얼마나 빨리 그리고 정확하게 탐색 하는지 성능 확인결과 약 93%의 정확도를 확보하였다. 도출된 성능을 기반으로 특정 장면만을 시청하는 코너별 시청, 인물 탐색 및 상세정보 retrieval 등 영상서비스에 응용 하고자 한다.

보안 감시를 위한 심층학습 기반 다채널 영상 분석 (Multi-channel Video Analysis Based on Deep Learning for Video Surveillance)

  • 박장식;마르셀 위라네가라;손금영
    • 한국전자통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.1263-1268
    • /
    • 2018
  • 본 논문에서는 영상 보안 감시를 위한 심층학습 객체 검출과 다중 객체 추적을 위한 확률적 데이터연관 필터를 연계한 영상분석 기법을 제안하고, GPU를 이용하여 구현하는 방안을 제시한다. 제안하는 영상분석 기법은 객체 검출과 추적으로 순차적으로 수행한다. 객체 검출을 위한 심층학습은 ResNet을 이용하고, 다중 객체 추적을 위하여 확률적 데이터 연관 필터를 적용한다. 제안하는 영상분석 기법은 임의의 영역으로 불법으로 침입하는 사람을 검출하거나 특정 공간에 출입하는 사람을 계수하는데 응용할 수 있다. 시뮬레이션을 통하여 약 25fps의 속도로 48채널의 영상을 분석할 수 있음을 보이고, RTSP 프로토콜을 통하여 실시간 영상분석이 가능함을 보인다.

GAN 알고리즘 개선을 위한 히스토그램 분석 기반 파손 영상 선별 방법 (A Broken Image Screening Method based on Histogram Analysis to Improve GAN Algorithm)

  • 조진환;장종욱;장시웅
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.591-597
    • /
    • 2022
  • 최근 데이터셋을 효율적으로 구축하는 방법으로 데이터 증강 기법과 관련하여 많은 연구가 이루어지고 있다. 이 중 대표적인 데이터 증강 기법은 생성적 적대 신경망(Generative Adversarial Network:GAN)을 활용하는 방법이며, 이는 생성자와 판별자를 서로 경쟁 학습시킴으로써 진짜 데이터와 유사한 데이터를 생성해내는 기법이다. 그러나, GAN을 학습할 때 환경 및 진행 정도에 따라 생성되는 유사 데이터 중에서 픽셀이 깨지는 파손 영상이 발생하는 경우가 있으며, 이러한 영상은 데이터셋으로 활용할 수 없고 학습 시간을 증가시키는 원인이 된다. 본 논문에서는 GAN 학습 과정에서 생성되는 영상 데이터의 히스토그램을 분석하여 이러한 파손 영상을 선별해내는 알고리즘을 개발하였으며, 기존 GAN에서 생성되는 영상과 비교해 본 결과 파손 영상의 비율을 33.3배(3,330%) 감소시켰다.

칼라 유방암조직영상에서 질감 특성과 신경회로망을 이용한 양성세포핵과 음성세포핵의 자동 분할 (Automatic Segmentation of Positive Nuclei and Negative Nuclei on Color Breast Carcinoma Cell Image Using Texture Feature and Neural Network Classification)

  • 최현주;허민권;최흥국;김상균;최항묵;박세명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.422-424
    • /
    • 1999
  • 본 논문에서는 질감 특징과 신경회로망을 이용한 유방암조직영상의 분할 방법을 제안한다. 신경회로망의 입력 노드에 사용될 질감 특징을 얻기 위해 10개의 영상에 대해 각 영역(양성세포핵, 음성세포핵, 배경)에서 10개씩의 화소를 선택하고, 그 화소를 중심으로 하는 5$\times$5 영역 30개를 획득, 총 300개의 영역에 대해 R, G, B 각각의 밴드에서 18개의 질감특징을 추출한다. 54개의 입력노드, 28개의 은닉노드, 3개의 출력노드의 구조를 가진 신경회로망을 구성하고, 역전파 학습 알고리즘을 사용하여 신경회로망을 최대오차율이 10-3보다 작을 때까지 학습시킨다. 학습에 의해 획득되어진 분류기를 이용하여 유방암 조직 세포영상을 양성세포핵, 음성세포핵, 배경부분으로 자동 분할한다.

  • PDF

시트콤 동영상에서 MPEG-7 시각 기술자를 이용한 Scene 배경의 자동 분류 방법 (An Automatic Scene Background Classification Scheme for Sitcom Videos Using MPEG-7 Visual)

  • 전재욱;손대온;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.505-507
    • /
    • 2004
  • 시트콤 동염상은 고정된 배경을 갖는 중 아웃에 연이어 오는 줌 인으로 구성되어 있고, 또한 활영되는 배경의 수는 한정되어 있는 특성이 때문에, 이러한 배경의 시각적 특성을 사용하여 배경들을 학습시키고 자동으로 분리시킬 수 있다. 본 논문에서는 신경망의 일종인 LVQ[1]를 사용하여 이러한 증류의 비디오 동영상에 대한 자동 배경 분류 방법을 제안한다. 우선, MPEG-7 시각 기술자를 이용하여 신(scene) 배경의 시각적인 특성을 추출하고 이러한 시각적 특성을 미리 제작자에 의해서 주어진 배경 점보로서 LVQ를 학습시킨다. 학습이 진행되면서 특정 배경의 시각적 특성은 LVQ의 가중치로서 표현되며, 다른 배경을 자동으로 분류하는데 사용된다 제안된 LVQ기반의 분류 방법을 사용한 두 종류의 시트콤 동영상에 대한 실험 결과는 분류에 대한 어떠한 하드코딩 없이 80-90%의 정확도로 시트콤 동영상의 배경을 자동으로 분류한다.

  • PDF

GAN 기반 고해상도 의료 영상 생성을 위한 연구 (GAN-based research for high-resolution medical image generation)

  • 고재영;조백환;정명진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.544-546
    • /
    • 2020
  • 의료 데이터를 이용하여 인공지능 기계학습 연구를 수행할 때 자주 마주하는 문제는 데이터 불균형, 데이터 부족 등이며 특히 정제된 충분한 데이터를 구하기 힘들다는 것이 큰 문제이다. 본 연구에서는 이를 해결하기 위해 GAN(Generative Adversarial Network) 기반 고해상도 의료 영상을 생성하는 프레임워크를 개발하고자 한다. 각 해상도 마다 Scale 의 Gradient 를 동시에 학습하여 빠르게 고해상도 이미지를 생성해낼 수 있도록 했다. 고해상도 이미지를 생성하는 Neural Network 를 고안하였으며, PGGAN, Style-GAN 과의 성능 비교를 통해 제안된 모델이 양질의 고해상도 의료영상 이미지를 더 빠르게 생성할 수 있음을 확인하였다. 이를 통해 인공지능 기계학습 연구에 있어서 의료 영상의 데이터 부족, 데이터 불균형 문제를 해결할 수 있는 Data augmentation 이나, Anomaly detection 등의 연구에 적용할 수 있다.

NeRF 기반 3차원 모델링을 통한 자세 추정 (Pose Estimation through 3D modeling based on NeRF)

  • 박찬;김형주;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.600-602
    • /
    • 2022
  • 2차원 이미지 또는 영상을 통한 자세 추정의 경우, 영상 내에서 발생할 수 있는 탐지 오류, 피사체 잘림, 폐색(Occlusion) 등으로 인해 자세 추정 정확도가 감소할 수 있다. 본 논문에서는 4장 이상의 다양한 각도로 촬영한 이미지를 NeRF(Neural Radiance Fields)를 통해 이미지 합성(Image synthesis)을 진행하여 3차원 모델을 생성한다. 이후 DeepLabCut을 사용하여 관절 좌표와 골격(Skeleton)을 구축한다. 구축한 골격을 인공지능에 학습시킨 뒤 2차원 영상에서의 관절 좌표 인식, 골격 구축, 자세 추정을 진행한다. 2차원 영상 테스트 데이터를 통해, 3차원 모델을 사전 학습한 인공지능 모델과 기존 2차원 이미지를 사용하여 학습한 인공지능 모델의 자세 추정 정확도를 비교한다.

온라인 수업의 상호작용 향상을 위한 웹 기반 에듀테크 시스템의 설계 (Design of Web-based Edutech System for Improving Interaction in Online Class)

  • 장의영;조대수;박승민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.723-724
    • /
    • 2022
  • 지난 코로나 상황 동안 비대면 수업을 진행했고, 학생들은 빠르게 적응했다. 온라인 수업은 학습자가 이해될 때까지 반복 학습이 가능하고, 시간과 공간의 제약 없이 자기 주도적으로 학습할 수 있다는 장점이 있지만, 온라인상이라는 특징 때문에 교수자와 학습자 간 상호작용이 부족하다는 한계점이 존재한다. 하지만 이점은 차후에 비대면 수업의 지속적인 활용 및 확대를 제한하는 요인이 될 수 있다. 본 논문에서는 상호작용을 높일 수 있는 웹 기반 에듀테크 시스템을 제안한다. 온라인 수업의 강의 영상을 세부적인 내용을 나누는 Section을 통해 다른 학생들이 질문했던 Q&A 데이터를 모아서 생성된 Section-FAQ를 열람할 수 있고, 그 Q&A에 반응해서 상호작용이 가능하다. 또한 교수자에게 Q&A를 보낼 때 영상의 Section 정보와 강의시간 정보를 같이 전송하여 강의 영상을 확인하지 않고, 빠른 답변이 가능하도록 설계했다. 본 논문에서 제안하는 온라인 수업의 상호작용 향상을 위한 웹 기반 에듀테크 시스템을 통해 온라인상에서 교수자의 역할을 대신해주고 비대면 수업의 단점을 해소해주면서, 교수자과 학습자 간의 상호작용을 높여 수업의 이해도를 높이고 학습자들의 학업성취를 높일 수 있을 것이다.

  • PDF