• 제목/요약/키워드: image annotation

검색결과 114건 처리시간 0.022초

Object Detection Model 적용성 확대를 위한 BoundingBox 이미지 증강 GUI 프로그램 연구 (Implementation and Design of Bounding Box Image Augmentation GUI Program for expanding Object Detection Models' applicability)

  • 전진영;민연아
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.539-540
    • /
    • 2022
  • 본 논문에서는 Bounding Box가 포함된 증강 이미지 데이터셋을 손쉽게 생성할 수 있는 독립형 GUI 프로그램을 제안한다. 본 논문의 연구를 통하여 직관적인 마우스 클릭 동작만으로 적은 수의 이미지 파일과 annotation 파일로부터 필요한 만큼의 증강 이미지 데이터셋을 짧은 시간 내에 생성하고, 다양한 아키텍처의 학습용 이미지 데이터셋 증강에 적용할 수 있다.

  • PDF

독점 멀티 분류기의 심층 학습 모델을 사용한 약지도 시맨틱 분할 (Weakly-supervised Semantic Segmentation using Exclusive Multi-Classifier Deep Learning Model)

  • 최현준;강동중
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.227-233
    • /
    • 2019
  • 최근 딥러닝 기술의 발달과 함께 신경 네트워크는 컴퓨터 비전에서도 성공을 거두고 있다. 컨볼루션 신경망은 단순한 영상 분류 작업뿐만 아니라 객체 분할 및 검출 등 난이도가 높은 작업에서도 탁월한 성능을 보였다. 그러나 그러한 많은 심층 학습 모델은 지도학습에 기초하고 있으며, 이는 이미지 라벨보다 주석 라벨이 더 많이 필요하다. 특히 semantic segmentation 모델은 훈련을 위해 픽셀 수준의 주석을 필요로 하는데, 이는 매우 중요하다. 이 논문은 이러한 문제를 해결하기 위한 네트워크 훈련을 위해 영상 수준 라벨만 필요한 약지도 semantic segmentation 방법을 제안한다. 기존의 약지도학습 방법은 대상의 특정 영역만 탐지하는 데 한계가 있다. 반면에, 본 논문에서는 우리의 모델이 사물의 더 다른 부분을 인식하도 multi-classifier 심층 학습 아키텍처를 사용한다. 제안된 방법은 VOC 2012 검증 데이터 세트를 사용하여 평가한다.

인공지능 학습용 토공 건설장비 영상 데이터셋 구축 및 타당성 검토 (Building-up and Feasibility Study of Image Dataset of Field Construction Equipments for AI Training)

  • 나종호;신휴성;이재강;윤일동
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.99-107
    • /
    • 2023
  • 최근 건설 현장의 안전사고 비율은 전체 산업에서 가장 높은 비중을 차지한다. 인공지능 기술을 건설 현장에 접목하기 위해서는 기초 학습 자료로 활용될 수 있는 데이터셋 확보가 필수적이다. 본 논문에서는 실제 현장 확보를 통해 원천 데이터를 수집하였으며, 토목 현장에서 주로 운용되고 있는 주요 건설장비 객체를 선정하고 약 9만장의 정지영상 데이터셋 가공을 통해 최적의 학습 데이터셋 구축을 완료하였다. 또한, 객체 인식분야의 대표적인 모델인 YOLO를 활용하여 구축된 데이터의 검증 작업을 수행하였고 90 % 근접한 검출 성능을 확인해 데이터 신뢰성을 확보하였다. 본 연구에서 사용되는 학습 데이터셋은 공공데이터포털에서 활용 가능하도록 공개를 완료하였다. 본 데이터셋은 향후 건설안전 분야의 객체 인식 기술의 건설현장 적용을 위한 기반 데이터로 활용 가능하리라 판단된다.

이미지의 질과 왜곡을 고려한 적대적 생성 신경망과 이를 이용한 비정상 검출 (Anomaly Detection of Generative Adversarial Networks considering Quality and Distortion of Images)

  • 서태문;강민국;강동중
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.171-179
    • /
    • 2020
  • 최근 연구 결과에 따르면, 컨볼루션 신경 회로망은 이미지 분류, 객체 검출, 이미지 생성 등의 문제에서 최고의 성능을 보여주고 있다. 비전 카메라를 사용한 결함 검사는 다른 결함 검사보다 경제적이기 때문에 공장 자동화에 있어서 아주 중요하고, 딥러닝의 지도학습은 전통 기계학습 방식의 결함 검사 성능을 월등히 뛰어넘었다. 하지만, 딥러닝의 지도학습은 엄청난 양의 데이터 주석 작업을 요구하기 때문에, 이를 실제 산업 현장에 적용하는 것은 효율적이지 않다. 따라서 본 연구는 최근 이미지 생성 과업에서 큰 성공을 보여주고 있는 변분 오토인코더와 적대적 생성 신경망을 활용하여 비지도 방식의 비정상 검출을 위한 신경망 회로 구조를 제안하였고, 이를 MNIST, 용접 결함 데이터에 적용하여 비정상 검출 성능을 검증하였다.

한국 고문헌 정보시스템의 구축 및 전망 (The Project and Prospects of Old Documents Information Systems in Korea)

  • 강순애
    • 한국문헌정보학회지
    • /
    • 제31권4호
    • /
    • pp.83-112
    • /
    • 1997
  • 본 논문은 고문헌에 적합한 최선의 정보시스템을 구축하기 위해, 고문헌의 개념, 특성과 정리현황, 전산화의 범위와 제도적인 장치, 정보시스템의 구축, 시스템의 사례, 평가와 전망 등을 중심으로 고찰하였다. 고문헌시스템의 구축에 있어서는 국립중앙도서관을 중심으로 하여 정보전산망을 형성하고, 그에 따라 목록정보, 해제, 원은, 검색정보시스템의 통합시스템을 구축하는 방향으로 전개하였다. 사례분석에서는 현재 디지털시스템으로 구축하고 있는 국립중앙도서관고문헌시스템과 자체적으로 DB를 개발하여 공용정보로 활용하고 있는 성균관대학교 고문헌정보시스템을 비교 평가하였으며. 고문헌시스템을 구축하려는 도서관에는 전체적인 지침을 제시하였다.

  • PDF

교육 분야 응용을 위한 가상 현미경 시스템 (A Virtual Microscope System for Educational Applications)

  • 조승호
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.117-124
    • /
    • 2003
  • 본 논문에 의해 구현된 시스템은 광학 현미경을 통해 캡춰된 조직 샘플들에 대한 데이터들을 분산/병렬 시스템 상에 분한 저장한다. 사용자들은 컴퓨터 상에서 마치 현미경을 사용하듯이 이들 이미지들을 관찰할 수 있다. 이 시스템은 고객 서버 모델에 의거 고객, 조정자 노드, 데이터 관리자 노드로서 구성되고, 메시지를 통해 데이터를 송수신한다. 본 연구에서는 이미지 표시나 텍스트 주석 등 교육용 응용에 필요한 기능들을 갖춘 이미지 검색용 고객 프로그램을 구현하였고, 세 요소간 통신 규약을 정의하였다. 또한 대용량 데이터들을 저장하는 테이프 장치 도입을 위한 실험을 수행하였으며, 이러한 실험은 데이터 분할 및 인덱싱 기법에 의해 성능 향상을 나타내었다.

적합성 피드백을 적용한 효율적인 자동 이미지 키워드 연결 (Efficient Automatic Image Annotation with Relevance Feedback)

  • 송지영;김우철;김승우;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.31-34
    • /
    • 2005
  • 디지털 이미지의 양이 증가함에 따라 원하는 이미지를 정확하고 빠르게 찾을 수 있는 방법의 필요성이 증가하고 있다. 이미지 검색 방법으로는 이미지의 색상이나 명암과 같은 시각적 특성을 검색 조건으로 이용하는 내용 기반 검색과 이미지를 설명하는 키워드를 검색 조건으로 이용하는 키워드 기반 검색이 있다. 하지만 이러한 방법만으로는 사용자가 원하는 이미지를 정확하게 찾기 힘들다는 문제점이 제기되어 왔다. 따라서 최근에는 검색 도중 사용자의 응답을 받아 사용자의 요구를 파악함으로써 향상된 검색 결과를 제공하는 적합성 피드백에 대한 연구가 많이 진행되고 있다. 하지만 적합성 피드백을 이용하는 방법들도 원하는 결과를 얻기 위해서는 여러 번의 피드백을 필요로 하고 질의 수행이 완료된 후에는 얻어진 피드백 정보를 재사용하지 못한다는 단점이 있다. 따라서 본 논문에서는 이미지에 키워드를 연결한 후 사용자의 피드백 정보를 반영하여 키워드의 신뢰도를 조절함으로써 키워드 기반 이미지 검색의 정확도를 높일 수 있는 모델을 제안한다. 제안된 모델에서는 사용자로부터 피드백을 받은 이미지뿐만 아니라 긍정적 피드백을 받은 이미지들이 공통적으로 가지는 시각적 특성과 유사한 시각적 특성을 가지는 다른 이미지들까지도 키워드의 신뢰도를 조정함으로써 좀 더 빠른 시간 내에 검색 결과의 정확도를 높이도록 한다.

  • PDF

WordNet기반 주석확장을 이용한 이미지 검색 (Image Retrieval using Annotation Expansion based on WordNet)

  • 황광수;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.165-168
    • /
    • 2007
  • 이미지 데이터를 의미적으로 검색하기 위한 가장 중요한 요소는 이미지의 정보를 표현하고 있는 주석이라고 할 수 있다. 이미지의 주석은 관리자가 사용자 입장에서 검색이 가능한 이미지를 표현할 수 있는 키워드를 선별하여 데이터화한 것이다. 그러다보니 이미지내 의미를 모두 표현하기위해 주석에 수는 증가되고, 증가된 주석은 각각에 이미지에서 차지하고 있는 의미량을 고려하지않고 동일한 크기를 가지게 된다. 이러한 경우 실제적으로 검색하였을 때 의미량에 상관없이 질의어와 주석이 일치한 모든 이미지를 검색하므로 사용자가 검색 결과에서 의미량이 큰 이미지를 다시 재검색하거나 주석입력자와 사용자와 어휘 표현에 차이 때문에 검색에 재검색해야한다. 따라서 본 논문에서는 의미량을 이용하여 효율적인 이미지 검색을 하기 위해 각 키워드 간에 의미적인 관계를 어휘 온톨로지인 WordNet을 이용하여 유사도 측정을 하고, 측정한 데이터를 이용하여 전체 이미지 의미량에서 해당 키워드가 갖는 의미량을 측정한다. 의미량은 이미지 검색시 질의어가 이미지에서 차지하고 있는 비율을 비교하여 가장 높은 의미량을 갖는 이미지를 우선 검색하고 의미량이 가장 큰 키워드를 대표키워드로 추출하여 WordNet상에서 동일한 의미를 갖는 계층에 단어들로 주석을 확장한다.

안과 PACS의 지능형 영상진단 및 치료지원 시스템 (Ophthalmology PACS of Interlligent Image Diagnosis and Theraphy-Support System)

  • 배석환;김용권;이무식;김기진;이보우;유세종
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 1부
    • /
    • pp.72-75
    • /
    • 2012
  • 본 연구는 2011년 8월 12일부터 8월 17일까지 일개 광역시에 대학병원에서 근무하는 안과인턴, 레지던트, 전문의, 방사선사, 안경사, 간호사를 대상으로 안과 PACS의 지능형 영상진단 및 치료지원 시스템 구축을 위한 사용자 요구도 조사를 실시하였다. 구성 대상은 의사 7명(38.9%), 의료기술직 4명(22.2%) 간호사 3명(16.7%), 기타 4명(22.2%)로 나타났다. 안과 PACS 도입 시 가장 중요한 부분으로 8(44.4%)명이 편리성이라고 하였고, 안과 PACS Viewer 중요분야는 9(50.0%)명이 편리한 기능이라고 하였다. 안과 PACS Viewer 필요분야에서 가장 필요한 분야는 14(77.8%)명이 망막분야라고 하였다. 이는 망막 검사의 대부분이 영상을 이용한 진단이 활용되어 있어 나타나 결과로 볼 수 있었다. 안과 PACS Viewer의 환경 관련 문항에서 검사 환자 리스트에서 가장 중요한 것은 생년월일, 부위 ,장비명이었으며, Annotation 및 사진 편집기능에서는 길이측정, 선 및 화살표 삽입, 글자입력으로 진료 및 치료에 직접적인 영향을 미치는 부분을 가장 중요한 환경 구성으로 응답하였다. 안과 PACS의 지능형 영상진단 및 치료에 대한 지원 시스템 구성은 기존 PACS에서 이루어져 있는 Viewer 형태의 UI 구성보다는 더 세밀하고 정확한 진단을 요하는 길이, marking, 장비의 특성, Color Palette 변화, Multi Modality Image Display를 요구하고 있다. 앞으로 방사선 분야의 기존 Viewer 형태의 PACS UI 구성보다는 각 분야에 맞는 PACS UI를 구축함으로써 더 정확하고 지능화된 영상 진단 및 치료 지원을 할 수 있어야 하겠다.

  • PDF

전기 영화가 인물과 역사를 소환하는 한 방식에 대해 - 영화 <황금시대>를 중심으로 (On a Way in which Biographical Film Summons Character and History - Focusing on the Film, The Golden Era -)

  • 진성희
    • 비교문화연구
    • /
    • 제39권
    • /
    • pp.287-308
    • /
    • 2015
  • Biographical film is a genre narrativizing the actual person and history, and reproducing the character and history in a biographical film is in a dimension different from a film focused on a fiction. Discussion between these methods of narrative composition and image reproduction in a biographical film is also, in line with artistic/aesthetic problems and ethical/philosophical theses of the film text. This study discusses the phase of the way of reproduction of the actual person, $Xi{\bar{a}}o$ $H{\acute{o}}ng$ in the biographical film, The Golden Era and the time she lived in a biographical film and how the audience's discussion of the film and socio-cultural discourse differ depending on their attitude towards the cinematic introspection of the text. The narrative structure, the method of image reproduction and cinematic devices of the film, The Golden Era are completely off the point of the general format of the traditional biographical film. In The Golden Era, $Xi{\bar{a}}o$ $H{\acute{o}}ng$ and the history which she lived in did not revive depending on an omniscient subject's selective statement and meta-film structure. Ann Hui removed general, mythic images of $Xi{\bar{a}}o$ $H{\acute{o}}ng$ formed in the field of traditional Chinese culture and reproduced her through multilateral visions of a real, fictional narrator. Each spectator's judgment and interpretation of the film intervene in the multi-layered and sparse descriptions of the actual person's images and the era of the characters. Through this, it is possible to approach the uniqueness and authenticity a historical character, $Xi{\bar{a}}o$ $H{\acute{o}}ng$ and to have an opportunity of multi-layered reflection on how to secure a critical distance and make a perception in historical judgment.