• 제목/요약/키워드: Images, processing

검색결과 4,224건 처리시간 0.029초

터널 콘크리트 라이닝 균열 분석을 위한 의미론적 분할 모델 학습 (Training a semantic segmentation model for cracks in the concrete lining of tunnel)

  • 함상우;배수현;김휘영;이임평;이규필;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.549-558
    • /
    • 2021
  • 터널과 지하시설물을 비롯한 콘크리트 토목구조물을 안전하게 관리하려면 균열 발생 여부를 정기적인 점검을 통해 알아내야 한다. 터널의 콘크리트 라이닝 표면에 발생한 균열의 위치와 형태를 검사하는 일은 주로 고소작업차를 투입하여 이루어진다. 이러한 작업은 차로를 통제한 채 이루어지므로 교통 체증을 일으키며, 점검 종사자가 위험한 환경에 노출되며, 매번 같은 종사자가 같은 터널의 같은 부위를 조사하기 어려우므로 검사 결과의 일관성이 저해된다. 본 연구는 기존 터널 영상 취득 시스템을 대상으로 딥러닝 기술을 적용해 터널 내 콘크리트 라이닝의 균열을 자동으로 탐지하는 방법을 다음과 같이 제시한다. 구체적으로는 의미론적 분할(semantic segmentation)을 수행하는 딥러닝 모델을 공개 데이터셋으로 학습시키고, 터널 영상 취득 시스템으로 취득한 데이터셋을 딥러닝 모델에 입력했을 때 성능을 알아본다. 첫 번째, 공개 데이터셋을 전부 학습시켰을 경우, 두 번째, 공개 데이터셋 중 기존 터널 영상 취득 시스템 데이터셋과 관련성이 높은 데이터셋만 선택하여 학습시켰을 경우, 마지막으로 관련성이 높은 데이터셋과 균열이 없는 영상(negative example)을 선택하여 학습시켰을 경우에 대하여 성능을 비교하여 효율적인 모델 학습 방안을 모색한다. 그 결과 공개 데이터셋에서 관련성이 높은 영상과 균열이 없는 영상을 골라 학습시켰을 경우의 성능이 가장 좋았다. 향후 딥러닝 알고리즘을 터널 영상 취득 시스템에 적용할 때 효율적인 모델 학습 방안을 수립하는데 기여할 것으로 기대한다.

에지와 컬러 정보를 결합한 안면 분할 기반의 손실 함수를 적용한 메이크업 변환 (Makeup transfer by applying a loss function based on facial segmentation combining edge with color information)

  • 임소현;전준철
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.35-43
    • /
    • 2022
  • 메이크업은 사람의 외모를 개선하는 가장 보편적인 방법이다. 하지만 메이크업의 스타일이 매우 다양하기 때문에 한 개인이 본인에게 직접 메이크업을 하는 것에는 많은 시간적, 비용적 문제점이 존재한다. 이에 따라 메이크업 자동화에 대한 필요성이 증가하고 있다. 메이크업의 자동화를 위해 메이크업 변환(Makeup Transfer)가 연구되고 있다. 메이크업 변환은 메이크업이 없는 얼굴 영상에 메이크업 스타일을 적용시키는 분야이다. 메이크업 변환은 전통적인 영상 처리 기반의 방법과 딥러닝 기반의 방법으로 나눌 수 있다. 특히 딥러닝 기반의 방법에서는 적대적 생성 신경망을 기반으로 한 연구가 많이 수행되었다. 하지만 두 가지 방법 모두 결과 영상이 부자연스럽거나 메이크업 변환의 결과가 뚜렷하지 않고 번지거나 메이크업 스타일 얼굴 영상의 영향을 많이 받는다는 단점이 있다. 메이크업의 뚜렷한 경계를 표현하고 메이크업 스타일 얼굴 영상에서 받는 영향을 완화시키기 위해 본 연구에서는 메이크업 영역을 분할하고 HoG(Histogram of Gradient)를 사용해 손실 함수를 계산한다. HoG는 영상 내에 존재하는 에지의 크기와 방향성을 통해 영상의 특징을 추출하는 방법이다. 이를 통해 에지에 대해 강건한 학습을 수행하는 메이크업 변환에 대해 제안한다. 제안한 모델을 통해 생성된 영상과 베이스 모델로 사용하는 BeautyGAN을 통해 생성된 영상을 비교해 본 연구에서 제안한 모델의 성능이 더 뛰어남을 확인하고 추가로 제시할 수 있는 얼굴 정보에 대한 사용 방법을 향후 연구로 제시한다.

비정형 패션 이미지 검색을 위한 MASK R-CNN 선형처리 기반 CNN 분류 학습모델 구현 (Implementation of CNN-based Classification Training Model for Unstructured Fashion Image Retrieval using Preprocessing with MASK R-CNN)

  • 조승아;이하영;장혜림;김규리;이현지;손봉기;이재호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.13-23
    • /
    • 2022
  • 본 논문에서는 패션 분야의 비정형 데이터 검색을 위한 패션 아이템별 세부 컨포넌트 이미지 분류 알고리즘을 제안한다. 코로나-19 환경으로 인하여 최근 AI 기반 쇼핑몰이 증가하는 추세이다. 하지만 기존의 키워드 검색과 사용자 서핑 행위 기반 개인 맞춤형 스타일 추천으로는 정확한 비정형 데이터 검색에는 한계가 있다. 본 연구는 다양한 온라인 쇼핑 사이트에서 크롤링한 이미지를 사용하여 Mask R-CNN을 활용한 전처리를 진행한 후, CNN을 통해 패션 아이템별 컴포넌트에 대한 분류를 진행하였다. 셔츠의 카라 및 패턴과 청바지의 핏, 워싱 및 컬러에 대한 분류를 진행하였으며, 다양한 전이학습 모델을 비교 분석한 후 가장 높은 정확도가 나온 Densenet121모델을 사용하여 셔츠의 카라는 93.28%, 셔츠의 패턴은 98.10%의 정확도를 도달하였으며, 청바지의 핏은 Notched, Spread, Straight 3가지의 클래스의 경우 91.73%, Regular 핏을 추가한 4가지의 클래스의 경우 81.59%, 청바지의 색상은 93.91%, 청바지의 Washing은 91.20%, 청바지의 Demgae는 92.96%의 정확도를 도출하였다.

The Role of Fundamentalization of Education in Improving the Future Specialists Professional Training with Usage of Multimedia Technologies

  • Palshkov, Kostiantyn;Kochubei, Olena;Tsokur, Olga;Tiahur, Vasyl;Tiahur, Liubomyra;Filimonova, Tetiana;Kuzminskyi, Anatolii
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.95-102
    • /
    • 2022
  • The article considers the fundamentalization of education in improving the future specialists professional training with usage of multimedia technologies by various scientists. Various points of view and approaches to defining the concepts of fundamentalization of education and multimedia technologies are identified. The concept of fundamentalization of professional training of a future specialist is based on the goals and functions of fundamentalization and - on the ways and means of achieving it, etc. Most authors agree only in their views that the fundamentalization of education is aimed at improving the quality of education and the education of the individual. Others involve the formation of a culture and worldview, increasing the creative and intellectual potential, forming the professional competence of a specialist and the potential for further education, and so on. The term multimedia refers to interactive systems that provide processing of moving and still video images, animated graphics, high-quality audio and speech. It is found out that professional training of a specialist by means of multimedia technologies includes not only the activities of the teacher and student, which form the learning process, but also the independent activity of the subject, self-development, assimilation of experience by the subject through analysis, comprehension and transformation of the field of activity in which he is included. It is revealed through the implementation of which approaches to the fundamentalization of higher professional education, it becomes possible to fully present theoretical training courses and effectively pass practical training by students, which contributes to improving the quality of training of future specialists in higher education institutions. Theoretical analysis of scientific views indicates a fairly serious attention of scientists to the problem of professional readiness of specialists and the possibility of higher educational institutions in preparing for it. At the same time, professional readiness is considered from different positions: as an active state of a person, which manifests itself in activity; as a result of activity; as goals of activity; as a quality that characterizes the attitude to solving professional problems and social situations; as a prerequisite for purposeful activity; as a form of activity of the subject; as an integral formation of personality; as a component of socio-professional culture; as a complex professionally significant neoplasm of the individual.

딥러닝을 이용한 농경지 팜맵 판독 적용 방안 (The Application Methods of FarmMap Reading in Agricultural Land Using Deep Learning)

  • 위성승;정남수;이원석;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.77-82
    • /
    • 2023
  • 본 논문은 농림축산식품부에서 구축한 농경지 전자지도인 팜맵을 딥러닝을 이용하여 농경지 속성정보인 논, 밭, 인삼, 과수, 시설, 비경지의 속성 정보를 판독하는 방안을 제안한다. 팜맵은 항공 및 위성 영상을 이용하여 현실 세계의 농경지를 디지털화하여 작물 생산 현황 파악과 드론 운영에 공간정보로 활용되고 있으며, 판독 매뉴얼을 작성하여 매년 사람을 통해 농경지의 경계를 구획하고 속성을 판독하여 갱신한다. 사람을 통한 농경지 속성판독은 사람의 판독 역량과 경험에 따라 차이를 보이며, 판독 오류는 예산과 공간적 시간적 한계로 직접 현장에 갈 수 없어 현실적으로 검증이 쉽지 않다. 팜맵은 5가지의 농경지 속성의 이미지에 해당 객체의 위치 정보와 클래스 정보를 가지고 있어 적합한 AI의 기법은 인스턴스 분할 모델인 ResNet50으로 실험을 진행하였으며, 딥러닝을 이용한 농경지 속성판독과 사람에 의한 속성판독 결과를 비교하여, 향후 다른 결과를 나타내는 속성판독에 집중하여 기술을 개발한다면 속성 오류를 줄이고 농경지 전자지도의 정확성 향상에 큰 역할을 할 것으로 기대된다.

햅틱 피드백 장치를 이용한 치과 수술 시뮬레이션 (Dental Surgery Simulation Using Haptic Feedback Device)

  • 윤상연;성수경;신병석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.275-284
    • /
    • 2023
  • 가상 현실 시뮬레이션은 다양한 분야에서의 교육과 훈련에 활용이 되며, 특히 최근에는 의료 분야에서 많이 사용되고 있다. 교육/훈련용 시뮬레이터는 의사가 실제 수술 도구를 이용하여 실제 환자에 대해 처치를 하는 것과 같은 느낌이 나게 하는 촉감/역감 생성 및 영상/음향 출력 하드웨어와 여기에 실감 나는 영상과 촉감을 생성해주는 소프트웨어로 이루어진다. 기존의 시뮬레이터들은 수술 시에 사용되는 다양한 수술 도구들을 모사하기 위해 다양한 형태의 하드웨어들을 사용해야 하므로 복잡하고 비용이 많이 소요되는 문제가 있다. 이 논문에서는 포스 피드백 장치와 변형 가능한 햅틱 컨트롤러를 이용한 치과 수술 시뮬레이션 시스템을 제안한다. 햅틱 하드웨어들은 수술 도구와 수술 부위의 충돌 여부를 파악하고 그에 따른 저항감과 진동감을 제공한다. 특히 길이 변화, 굽힘과 같은 변형이 가능한 햅틱 컨트롤러는 여러 수술 도구들의 형태에 따라 느껴지는 다양한 감각을 표현할 수 있다. 사용자가 햅틱 피드백 장치를 조작하면 햅틱 피드백 장치의 움직임이나 버튼 클릭 등의 이벤트가 시뮬레이션 시스템에 전달되어 치과용 수술 도구와 구강 내부 모델들 사이의 상호작용이 발생하고 이에 따른 햅틱 피드백이 햅틱 피드백 장치로 전달된다. 이러한 기반 기술들을 활용하여 정교한 3차원 모델로 표현된 가상 환경에서 대표적인 치과 수술기법인 매복 사랑니 발치 수술의 현실적인 훈련 경험을 제공한다.

축방향 서브 나이퀴스트 샘플링 기반의 횡탄성 영상 기법 (Shear-wave elasticity imaging with axial sub-Nyquist sampling)

  • 오우진;윤희철
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.403-411
    • /
    • 2023
  • 탄성 영상과 미세 혈류 도플러 영상과 같은 기능성 초음파 영상은 조직의 기계적, 기능적 정보를 제공함으로써 진단 성능을 향상시킨다. 그러나 기능성 초음파 영상의 구현은 데이터 획득 및 처리 시 대용량 데이터 저장과 같은 한계를 야기한다. 본 논문에서는 효율적인 횡탄성 영상 기법을 위해 데이터 획득 양을 절감시키는 서브 나이퀴스트 접근법을 제안한다. 제안하는 방법은 기존 나이퀴스트 샘플링 속도보다 1/3배 낮은 샘플링 속도로 데이터를 획득하고, 주파수 스펙트럼의 주기성을 이용하여 대역 통과 필터링 기반의 보간을 통해 재구성된 Radio Frequency(RF) 신호를 사용하여 횡파 신호를 추적한다. 이때 RF 신호는 67 % 미만의 비대역폭으로 제한된다. 제안하는 접근법을 검증하기 위해 기존 샘플링 속도로 획득한 횡파 추적 데이터를 이용하여 서브 나이퀴스트 샘플링된 RF 신호를 재현하고, 기존 접근법과 횡파 속도 영상을 재구성한다. 정량적 평가를 위해 재구성한 횡파 속도 영상의 군속도, 대조도 잡음 비, 그리고 구조적 유사성 지수를 비교하였다. 우리는 서브 나이퀴스트 샘플링 기반 횡탄성 영상의 가능성을 정성적, 정량적으로 입증하였고, 향후 실시간 3차원 횡탄성 영상 기술에 유용하게 적용 가능할 것으로 기대된다.

MobileNetV3 기반 요검사 서비스 어플리케이션 구현 (Implementation of Urinalysis Service Application based on MobileNetV3)

  • 박기조;최승환;김경석
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.41-46
    • /
    • 2023
  • 인체 소변은 혈액 내의 노폐물을 배출하는 과정으로 채취가 쉽고 다양한 물질들이 포함되어 있습니다. 요검사는 이를 통해 질병, 건강상태, 요로 감염 여부 등을 확인하는 용도로 사용됩니다. 요검사에는 물리적 성상 검사, 화학적 검사, 현미경 검사의 세 가지 방법이 있으며, 화학적 검사는 요검사지를 사용하여 쉽게 결과를 확인할 수 있다. 요검사지에는 다양한 항목들을 검사할 수 있으며, 이를 통해 다양한 질병들을 확인할 수 있다. 최근 스마트폰의 보급으로 스마트폰을 이용한 요검사지 판독 연구가 진행되고 있다. 스마트폰을 이용하여 요검사지의 색 변화를 감지하고 판독하는 방법이 있다. 이러한 방법은 RGB값과 색 차이 공식을 사용하여 판별한다. 그러나 다양한 환경 요인으로 인해 정확도가 떨어지는 문제가 있다. 본 논문은 이러한 문제를 해결하기 위해 딥러닝 모델을 적용한다. 특히, 경량화된 CNN(Convolutional Neural Networks) 모델을 사용하여 스마트폰 내에서 요검사지의 색 판별을 개선한다. CNN은 이미지 인식과 패턴 찾기에 유용한 모델로, 경량화된 버전도 사용 가능하다. 이를 통해 스마트폰에서 딥러닝 모델을 운영하고 정확한 요검사지 결과를 추출할 수 있다. 요검사지는 다양한 환경에서 촬영하여 딥러닝 모델 학습 이미지를 준비 하였으며 MobileNet V3을 사용하여 요검사 서비스 어플리케이션을 설계하였다.

Computer Vision-based Continuous Large-scale Site Monitoring System through Edge Computing and Small-Object Detection

  • Kim, Yeonjoo;Kim, Siyeon;Hwang, Sungjoo;Hong, Seok Hwan
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.1243-1244
    • /
    • 2022
  • In recent years, the growing interest in off-site construction has led to factories scaling up their manufacturing and production processes in the construction sector. Consequently, continuous large-scale site monitoring in low-variability environments, such as prefabricated components production plants (precast concrete production), has gained increasing importance. Although many studies on computer vision-based site monitoring have been conducted, challenges for deploying this technology for large-scale field applications still remain. One of the issues is collecting and transmitting vast amounts of video data. Continuous site monitoring systems are based on real-time video data collection and analysis, which requires excessive computational resources and network traffic. In addition, it is difficult to integrate various object information with different sizes and scales into a single scene. Various sizes and types of objects (e.g., workers, heavy equipment, and materials) exist in a plant production environment, and these objects should be detected simultaneously for effective site monitoring. However, with the existing object detection algorithms, it is difficult to simultaneously detect objects with significant differences in size because collecting and training massive amounts of object image data with various scales is necessary. This study thus developed a large-scale site monitoring system using edge computing and a small-object detection system to solve these problems. Edge computing is a distributed information technology architecture wherein the image or video data is processed near the originating source, not on a centralized server or cloud. By inferring information from the AI computing module equipped with CCTVs and communicating only the processed information with the server, it is possible to reduce excessive network traffic. Small-object detection is an innovative method to detect different-sized objects by cropping the raw image and setting the appropriate number of rows and columns for image splitting based on the target object size. This enables the detection of small objects from cropped and magnified images. The detected small objects can then be expressed in the original image. In the inference process, this study used the YOLO-v5 algorithm, known for its fast processing speed and widely used for real-time object detection. This method could effectively detect large and even small objects that were difficult to detect with the existing object detection algorithms. When the large-scale site monitoring system was tested, it performed well in detecting small objects, such as workers in a large-scale view of construction sites, which were inaccurately detected by the existing algorithms. Our next goal is to incorporate various safety monitoring and risk analysis algorithms into this system, such as collision risk estimation, based on the time-to-collision concept, enabling the optimization of safety routes by accumulating workers' paths and inferring the risky areas based on workers' trajectory patterns. Through such developments, this continuous large-scale site monitoring system can guide a construction plant's safety management system more effectively.

  • PDF

드론 열화상 화소값의 타겟 온도변환을 위한 방사율 영향 분석 (Study on the Effect of Emissivity for Estimation of the Surface Temperature from Drone-based Thermal Images)

  • 조현정;이재왕;정나영;오재홍
    • 한국측량학회지
    • /
    • 제40권1호
    • /
    • pp.41-49
    • /
    • 2022
  • 최근 열화상 카메라의 수요 증가와 함께 열화상 카메라를 활용한 연구 또한 관심이 높아지고 있다. 그 중, 기존의 드론에 열화상 카메라를 부착하여 촬영하는 등의 단순 촬영에서 나아가 열 영상 처리를 통한 디지털 트윈 구축, 영상화된 데이터를 통한 관리 시스템 구축 등 열 영상 처리 후 데이터를 응용한 연구가 증가하고 있다. 본 논문에서는 열화상 카메라를 처리하는 과정에서 생성되는 화소값인 DN값(Digital Number)이 실제 표면 온도로 변환하기 위한 관계식 유도과정에서 방사율이 DN값에 미치는 영향을 알아보기 위한 연구를 진행하였다. DN값은 열 영상의 스펙트럼 밴드 값을 나타내는 숫자로 열 영상 데이터를 구성하는 중요한 요소이다. 하지만 DN값은 실제 표면 온도를 표시하는 온도 값이 아닌 열이 높고 낮음을 밝기로 표시한 밝기 값으로 실제 표면 온도와 비 선형적인 관계이다. 그러므로 열화상 카메라로 획득한 영상 이미지의 DN값을 실제 표면 온도와 관계성을 보일 수 있다면 데이터를 처리하기 수월하며, 더 많은 활용성을 기대할 수 있다. 그러므로 본 연구에서는 우선, 실제 표면 온도와 열 영상의 DN값의 관계를 분석하고, 열화상 카메라와 같은 원리로 작용하는 비접촉 열화상 온도계가 실제 표면 온도에 근접한 참값으로 변환할 수 있도록 방사 조정을 진행하였다. 그 결과 실제 표면 온도 및 DN값의 관계 그래프와 방사 조정된 비접촉 열화상 온도계 및 DN값의 관계 그래프가 유사한 선형관계를 보였으며 방사율을 조정하기 전보다 조정한 후의 비접촉 온도가 실제 표면 온도에 더 근접한 결과를 얻었다.