• 제목/요약/키워드: 이미지 생성 시스템

검색결과 462건 처리시간 0.026초

이미지 검색 시스템을 위한 Spark 기반의 이미지 벡터 추출 기법 (Image Vector Extraction Method using Spark Framework for Image Retrieval System)

  • 김태연;서호진;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.726-729
    • /
    • 2015
  • 최근 네트워크 및 카메라 모듈의 발전으로 인해 생성되는 이미지 데이터의 양이 대용량화 되고 있으며, 이미지 데이터를 이용한 이미지 검색 서비스가 제공되고 있다. 이미지 검색 서비스를 제공하기 위해 이미지 데이터베이스 구축이 요구된다. 효율적인 데이터베이스 구축을 위해 Bow 기법을 이용하여 데이터의 차수를 낮춘 후 이미지 벡터를 저장하는 방식을 사용한다. 그러나 이미지 데이터의 수가 급격히 증가하여 오랜 수행 시간을 요구한다. 본 논문에서 인-메모리 기반 분산 프레임워크인 스파크를 이용한 이미지 벡터 생성 과정을 분산 설계하였다. 실험을 통해 제안하는 분산 처리 기법이 기존방법에 비해 효율적임을 보인다.

다각형 이미지의 방향 결정을 이용한 새로운 CAPTCHA 시스템의 설계 (Design of A New CAPTCHA System using Detecting Orientation of Polygonal Image)

  • 정우근;김종우;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.766-769
    • /
    • 2010
  • CAPTCHA 시스템은 스팸이나 로봇에 의한 자동 가입, 계정 생성 방지도구로써 인간의 우수한 가독성을 통해 특정 언어 또는 그림을 해독할 수 있는 특성을 이용한 것으로 일반적으로 컴퓨터 프로그램이 해독하기 어려운 기호, 글자 등을 재입력하도록 하여 스팸을 위한 자동화 도구 등을 무력화 시키는 보안 기술이다. 하지만 기존에 존재하였던 텍스트 기반의 시스템은 웹봇이나 머신 러닝등을 통하여 쉽게 통과할 수 있는 단점을 나타냈다. 우리는 이러한 단점을 보완하고자 새로운 이미지 기반의 CAPTCHA 시스템을 제안하였다. 제안된 시스템은 일반적인 사진에서 부분 이미지를 출력, 무작위 회전을 가하여 사용자에게 올바른 교정을 요하는 시스템이었다. 본 논문에서는 일반적인 사진에서 출력되는 부분 이미지의 형태를 다각형으로 추출하여, 사용자에게 좀 더 인식률을 높일 수 있는 서브 이미지의 형태를 찾고, 좀 더 효과적이고 실용적일수 있는 CAPTCHA 시스템을 제안하고자 한다. 본 논문에서 제공하는 다각형의 형태는 정사각형, 정오각형, 정육각형, 정칠각형 그리고 정팔각형이다. 총 5가지 형태의 다각형 중에서 사용자에게 가장 효과적인 다각형을 실험을 통하여 찾을 것이다.

연속적인 이미지를 이용한 3차원 물체의 복원 (3D Reconstruction from an Image Sequence)

  • 김성진;김강현;전희성
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.487-490
    • /
    • 2002
  • 이미지를 기반으로 3차원 모델을 생성하기 위한 방법은 많은 사람들의 연구의 대상이 되어 왔다. 본 연구에서는 연속적으로 획득된 여러 장의 이미지로부터 특징점을 추출한 후, 사영복원과 유클리디언 복원을 이용하여 특징점에 대응되는 3차원 데이터를 계산하는 방법을 구현하였고, 이렇게 얻은 3차원 데이터에 텍스쳐 매핑을 결합하여, 보다 사실적인 3차원 모델을 생성할 수 있는 시스템을 구현하였다.

  • PDF

XAI 기반의 공공시설물 건전도 안전검사 평가시스템 연구 (XAI based public facility safety evaluation system research)

  • 박예슬;경선재;김민준;오찬미;이재성;이재환;이현승;이철희;문현준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.705-708
    • /
    • 2020
  • 공공시설에 대한 안전점검은 공공시설의 노후화에 따라 정기적인 검사의 필요성이 요구되고 있다. 기존의 안전점검 방식은 대부분 육안으로 점검하는 것에 의존하는데 이는 점검자의 숙련도에 따라 결과의 품질이 달라지게 된다. 본 논문에서는 XAI 기반의 공공시설물 건전도 안전검사 평가시스템을 제안하며, 이는 점검자의 숙련도와 무관하게 항상 같은 결과를 도출해 내며 XAI 를 통해 사용자에게 안전점검에 대한 결과를 제시해준다. 공공시설물 중 터널 시설물의 안전검사 평가시스템을 기반으로 하는 연구를 진행하였으며 이는 수정없이 교량 시설물 등 다른 공공시설물에 적용이 가능하다. 본 논문은 5 가지로 구분된다. 1) 터널 이미지와 균열에 마스크를 적용한 이미지 두 가지의 데이터 셋을 448x448 로 생성한다. 2) UNet 과 Resnet152 의 두 모델을 적용한 혼합 모델을 이용하여 생성한 데이터 셋을 훈련시킨다. 3) 훈련된 혼합 모델에서 생성된 분할 이미지에 대해 노이즈 제거 과정을 진행한다. 4) 노이즈 제거가 끝난 이미지에 스켈레톤화(Skeletonization)를 적용시켜 균열 이미지의 뼈대를 구한다. 뼈대 이미지 기반으로 균열의 길이, 두께, 위치등의 정보를 얻는다. 5) XAI 부분에서는 뼈대 이미지의 정보를 토대로 균열의 위치, 두께, 길이 등에 대해 계산을 진행한 후 사용자에게 제시해준다.

  • PDF

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

Open Source GIS를 이용한 고해상도 영상의 Tile Map Service 시스템 구축에 관한 연구 (A Study on Tile Map Service of High Spatial Resolution Image Using Open Source GIS)

  • 정명훈;서용철
    • 대한공간정보학회지
    • /
    • 제17권1호
    • /
    • pp.167-174
    • /
    • 2009
  • Tile Map Service는 정적인 이미지들을 모아둔 저장소를 이용하여 매우 빠르게 지도 서비스를 수행하는 서비스이다. 지도 이미지 저장소는 특정 축척별로 지도 영역을 Tile 이미지로 저장한 디렉토리 구조이다. 따라서 디렉토리 구조로부터 이미지를 불러오는 것은 사용자의 요구에 따라서 지도를 데이터베이스로부터 직접 생성하는 것보다 훨씬 시간 단축이 이루어진다. 이와 같은 Tile Map Service를 이용하면 사용자가 복잡한 지도를 생성할 때 획기적으로 지도 생성 시간을 단축시키는 효과와 성능 향상을 위한 제반 노력을 제거할 수 있다. 본 논문은 Open Source GIS를 사용하여 고해상도 영상의 Tile Map Service 시스템을 구축하는 방안을 제시하는 것이다. Open Source GIS중 GDAL(Geospatial Data Abstraction Library)을 사용하여 Tile Map Image를 생성하였으며, OpenLayers를 이용하여 웹브라우저를 통한 서비스를 구축하였다. 또한 Tile Map Service 시스템을 구축 한 후 전통적인 방식으로 지도 렌더링을 수행하는 시스템과 성능테스트를 수행하여 결과를 비교 분석하였다. 수행 결과 본 연구를 통하여 제안된 방법으로 고해상도의 영상 데이터를 상용소프트웨어의 도입 없이 고가용성의 Tile Map Service 시스템을 구축할 수 있었다.

  • PDF

다중 레이블 이미지를 활용한 CNN기반 이미지 어노테이션 시스템의 개선 (Improving a CNN-based Image Annotation System Using Multi-Labeled Images)

  • 김택수;김상범
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.99-103
    • /
    • 2015
  • 최근 딥러닝 기술의 발전에 힘입어 이미지로부터 자동으로 관련된 단어 혹은 문장을 생성하는 연구들이 진행되고 있는데, 많은 연구들은 이미지와 단어가 1:1로 대응된 잘 정련된 학습 집합을 필요로 한다. 한편 스마트폰 보급의 확산으로 인스타그램, 폴라 등의 이미지 기반 SNS가 급속하게 성장함에 따라 인터넷에는 한 이미지의 복수개의 단어(태그)가 부착되어있는 데이터들이 폭증하고 있는 것이 현실이다. 본 논문에서는 소규모의 잘 정련된 학습 집합뿐 아니라 이러한 대규모의 다중 레이블 데이터를 같이 활용하여 이미지로부터 태그를 생성하는 개선된 CNN구조 및 학습알고리즘을 제안한다. 기존의 분류 기반 모델에 은닉층을 추가하고 새로운 학습 방법을 도입한 결과, 어노테이션 성능이 기존 모델보다 11% 이상 향상되었다.

  • PDF

이미지 객체 및 메타정보 기반 GPT 활용 SNS 문장 작성 보조 시스템 (GPT-enabled SNS Sentence writing support system Based on Image Object and Meta Information)

  • 이동희;문미경;최봉준
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.160-165
    • /
    • 2023
  • 본 연구에서는 SNS와 같이 이미지와 함께 글을 작성하는 활동을 보조하기 위해 YOLO와 GPT를 활용한 SNS 문장 작성 보조 시스템을 제안한다. YOLO 모델을 활용하여 글 작성 시 삽입되는 이미지에서 객체를 추출하고 메타정보인 GPS 정보, 생성 시간 정보도 추출하여 함께 GPT의 프롬프트 값으로 사용한다. YOLO 모델을 사용하기 위해 양식 이미지 데이터로 학습하여 사용했으며 해당 모델의 mAP score는 평균 약 0.25이다. GPT는 '맛집 리뷰' 주제의 1,000개의 블로그 텍스트 데이터를 학습하였으며, 본 연구에서 학습된 모델을 사용하여 이미지에서 추출한 2가지 타입의 키워드로 문장을 생성하였다. 생성된 문장의 실용성을 평가하기 위해 설문을 진행하였으며 설문 결과의 명확한 분석을 위해 폐쇄형 설문을 진행하였다. 삽입한 이미지와 키워드 문장을 제공하여 질문에 대해 3가지 평가 항목을 두어 진행하였다. 설문 결과 이미지의 핵심 키워드 경우 유의미한 문장을 생성한다는 결과를 얻을 수 있었다. 본 연구를 통해서 이미지 기반 문장 생성 시 이미지 키워드와 GPT 학습 내용과의 관계에 따라 결과물의 정확성이 달라진다는 결과를 얻을 수 있었다.

영역기반 이미지 검색을 위한 칼라 이미지 세그멘테이션 (Color Image Segmentation for Region-Based Image Retrieval)

  • 황환규
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.11-24
    • /
    • 2008
  • 효율적인 저차원의 인덱싱을 제공하기 위해 이미지를 유사한 성질을 갖는 영역으로 나누고, 나누어진 영역에 대해 유사성을 비교하는 영역 기반 이미지 검색이 제안되었다. 그러나 영역 기반 이미지 검색은 이미지를 유사한 영역으로 나누기 위한 이미지 세그멘테이션 기술이 추가적으로 필요하다. 일반적인 칼라 자연 이미지의 경우 다양한 칼라와 질감 성분을 갖는 영역으로 나누는 것은 많은 어려움이 있다. 본 논문에서는 자동적인 칼라 이미지 세그멘테이션 알고리즘을 제안한다. 제안하는 세그멘테이션 방법은 양자화를 통해 칼라수를 줄이고 양자화 된 이미지를 Fisher의 클래스 선형 판별식을 이용하여 이미지의 전체적인 에지를 보여주는 그레이 레벨 이미지를 생성한다. 이렇게 얻은 그레이 레벨 에지 이미지를 지역적 임계치 비교를 통해 이진 에지 이미지로 변환하고 이진 에지의 끊어진 부분을 찾아내어 인접 에지에 연결하여 영역을 생성한다. 마지막으로 나누어진 영역간의 유사성을 비교하고 유사한 영역을 병합하여 최종 세그멘테이션 결과 이미지를 생성한다. 본 논문에서는 세그멘테이션 알고리즘을 이용한 영역 기반 이미지 검색 시스템을 구현하였으며, 다양한 실험에 의하면 제안한 세그멘테이션 방법이 다양한 이미지에 대하여 양질의 세그멘테이션 결과를 보이는 것으로 나타났다.

의미기반 전자 카탈로그 이미지 검색을 위한 XML 데이타베이스 시스템 구현 (An Implementation of XML Database System for Semantic-Based E-Catalog Image Retrieval)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1219-1232
    • /
    • 2004
  • 최근 e-비즈니스나 인터넷 쇼핑몰 사이트에서 는 많은 양의 상품 이미지 정보와 컨텐츠를 취급하고 있으며 ,이로 인하여 이미지에 대한 효율적인 의미기반 검색의 필요성이 대두되고 있다. 본 논문에서는 XML과 퍼지기술을 이용하여 웹상의 상품 이미지를 의미적으로 검색할 수 있는 시스템에 대해 설명한다. 상품 카탈로그와 같은 다중 객체를 보유하고 있는 이미지에 대하여 의미 기반 검색을 수행할 수 있도록 상품 정보나 의미등의 메타데이타를 표현하는 다계층 메타데이타 구조를 사용한다. 이미지에 대한 의미기반 검색을 수행할 수 있도록 하기 위해 메타데이타를 저장하기 위한 XML 데이타베이스를 설계하고 퍼지 데이타를 적용할 수 있는 방법을 연구하였다. 본 논문에서 제시한 시스템은 이미지에 대한 메타데이타를 이용하여 퍼지 데이터를 자동 생성하고, 생성된 퍼지 데이타를 의미기반 이미지 검색에 사용한다. 따라서 의미기반 상품 이미지 검색에 대하여 사용자의 검색질의에 대한 정확성과 만족도를 증대 시킬 수 있다.

  • PDF