• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.029초

A dual path encoder-decoder network for placental vessel segmentation in fetoscopic surgery

  • Yunbo Rao;Tian Tan;Shaoning Zeng;Zhanglin Chen;Jihong Sun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.15-29
    • /
    • 2024
  • A fetoscope is an optical endoscope, which is often applied in fetoscopic laser photocoagulation to treat twin-to-twin transfusion syndrome. In an operation, the clinician needs to observe the abnormal placental vessels through the endoscope, so as to guide the operation. However, low-quality imaging and narrow field of view of the fetoscope increase the difficulty of the operation. Introducing an accurate placental vessel segmentation of fetoscopic images can assist the fetoscopic laser photocoagulation and help identify the abnormal vessels. This study proposes a method to solve the above problems. A novel encoder-decoder network with a dual-path structure is proposed to segment the placental vessels in fetoscopic images. In particular, we introduce a channel attention mechanism and a continuous convolution structure to obtain multi-scale features with their weights. Moreover, a switching connection is inserted between the corresponding blocks of the two paths to strengthen their relationship. According to the results of a set of blood vessel segmentation experiments conducted on a public fetoscopic image dataset, our method has achieved higher scores than the current mainstream segmentation methods, raising the dice similarity coefficient, intersection over union, and pixel accuracy by 5.80%, 8.39% and 0.62%, respectively.

CNN 알고리즘을 기반한 얼굴인식에 관한 연구 (A Study on the Recognition of Face Based on CNN Algorithms)

  • 손다연;이광근
    • 한국인공지능학회지
    • /
    • 제5권2호
    • /
    • pp.15-25
    • /
    • 2017
  • Recently, technologies are being developed to recognize and authenticate users using bioinformatics to solve information security issues. Biometric information includes face, fingerprint, iris, voice, and vein. Among them, face recognition technology occupies a large part. Face recognition technology is applied in various fields. For example, it can be used for identity verification, such as a personal identification card, passport, credit card, security system, and personnel data. In addition, it can be used for security, including crime suspect search, unsafe zone monitoring, vehicle tracking crime.In this thesis, we conducted a study to recognize faces by detecting the areas of the face through a computer webcam. The purpose of this study was to contribute to the improvement in the accuracy of Recognition of Face Based on CNN Algorithms. For this purpose, We used data files provided by github to build a face recognition model. We also created data using CNN algorithms, which are widely used for image recognition. Various photos were learned by CNN algorithm. The study found that the accuracy of face recognition based on CNN algorithms was 77%. Based on the results of the study, We carried out recognition of the face according to the distance. Research findings may be useful if face recognition is required in a variety of situations. Research based on this study is also expected to improve the accuracy of face recognition.

디지털 패션필름 제작 교과에 관한 커리큘럼 개발 (Curriculum Design for Digital Fashion Film Making)

  • 김미경;임은혁
    • 한국의류산업학회지
    • /
    • 제25권4호
    • /
    • pp.429-438
    • /
    • 2023
  • In the 21st century fashion industry, the rise of digital environments has transformed it into a dynamic medium, expanding the horizons of media utilization. Consequently, digital fashion film has emerged as a pivotal tool for fashion communication. Functioning as a visual expression medium, fashion film animates fashion concepts into immersive moving images. Proficiency in digital fashion communication has become imperative, considering the attributes of fashion media. Notably, the role of creative directors in ensuring coherent communication across diverse fashion media platforms has gained prominence, underscoring the need for systematic fashion education to nurture specialized talent. This study, therefore, devised a comprehensive curriculum amalgamating fashion communication and practical digital media skills, implemented within fashion major courses. Through this approach, students gained experimental media proficiency and explored innovative approaches to crafting fashion films that eloquently convey fashion narratives. The participants were exposed to the entire spectrum of fashion media production, encompassing digital storytelling, fashion film conceptualization, filming techniques, meticulous editing, and adept utilization of special effects technology. The study's pedagogical strategy, characterized by a focused learning trajectory, garnered significant acclaim. In essence, this study holds significance by formulating a curriculum that nurtures the imaginative and pragmatic aptitudes of fashion majors, immersing them in the dynamic realm of rapidly evolving digital fashion films and their integration with fashion content.

Perceptron 신경회로망에 근거한 광 패턴인식 시스템의 구현 (Implementation of Optical Pattern Recognition System Based on Perceptron Neural Network)

  • 한종욱;용상순;이진호;이기서;김은수
    • 한국통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.545-555
    • /
    • 1991
  • 본 논문에서는 단층 퍼센트론 모델의 학습기능과 신경회로망 형성메모리의 오류정정 능력이 서로 보완적으로 결합된 새로운 적응 패턴인식 시스템의 광학적구현을 실현하였다. 여기서, 단층 퍼센트론 모델은 2차원 LCTV 공간 광변조기를 이용하여 편광인코딩방법과 비전형 양자화 방법으로 구현하였으며, Hopfield 연장메모리는 2차원 모델로 황장하고multifocus holoens를 이용하여 광학적으로 구현하였다. 아리비아 숫자 짝.홀수 판별에 고나한 광학적 실험 결과, 오류 및 부분 입력에 대한 정확한 패턴 분류가 됨을 확인함으로서, 본 논문에서 제시한 새로운 적응 광 패턴인식 시스템이 실제로 영상처리, 패턴인식 등의 분야에서 그 응용 가능성을 제시하였다.

  • PDF

패턴인식의 정화성을 향상하기 위한 지능시스템 연구 (A study of intelligent system to improve the accuracy of pattern recognition)

  • 정성부;김주웅
    • 한국정보통신학회논문지
    • /
    • 제12권7호
    • /
    • pp.1291-1300
    • /
    • 2008
  • 본 논문에서는 패턴인식의 정확성을 향상시키기 위한 지능시스템을 제안한다. 제안한 지능시스템은 신경회로망의 무감독학습 방법인 SOPM(Self Organizing Feature Map), LVQ(Learning Vector Quantization), 그리고 퍼지이론의 FCM(Fuzzy C-means)을 이용하여 구성한다. 제안한 지능시스템의 유용성은 실험을 통해 확인한다. 실험은 Fisher의 Iris 데이터 분류, Cambridge 대학의 Olivetti 연구실(ORL; Olivetti Research Laboratory)에서 제공하는 얼굴 데이터베이스를 이용한 얼굴 영상 데이터 분류, 그리고 근전도(EMG, Electromyogram) 데이터를 분류하는 것이다. 제안한 지능시스템은 일반적인 LVQ와 비교한다. 실험을 통해 제안한 지능시스템이 일반적인 LVQ보다 패턴 인식의 정확성이 더 우수함을 알 수가 있었다.

모바일 쇼핑 환경에서 사용자 데이터 수집 및 개인화 서비스 방법 (User Data Collection and Personalization Services in Mobile Shopping Environment)

  • 김성진;김성규;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.560-561
    • /
    • 2018
  • 스마트폰의 보급으로 온라인 쇼핑 시장에서 모바일 쇼핑의 비중이 확대되고 있다. 대부분의 모바일 쇼핑은 애플리케이션을 통해 서비스를 제공하고 있다. 기업들은 온라인 마켓의 경쟁력 확보와 소비자의 다양한 요구사항 응대를 위해 개인화 서비스를 제공한다. 하지만 개인화 서비스는 사용자 데이터 수집과 분석이 매우 중요하다. 따라서 본 논문에서는 모바일 쇼핑 환경의 사용자 데이터 수집을 위해 스마트폰의 카메라를 이용하여 물품의 바코드 인식기능과 머신러닝 기반 물품의 이미지 인식 기능을 구현하였다. 구현된 기능과 푸시 알림 서비스를 통해 온라인 쇼핑 플랫폼 애플리케이션의 개인화 서비스와 사용자 데이터 수집 및 분석을 할 수 있었다.

  • PDF

An ANN-based gesture recognition algorithm for smart-home applications

  • Huu, Phat Nguyen;Minh, Quang Tran;The, Hoang Lai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.1967-1983
    • /
    • 2020
  • The goal of this paper is to analyze and build an algorithm to recognize hand gestures applying to smart home applications. The proposed algorithm uses image processing techniques combing with artificial neural network (ANN) approaches to help users interact with computers by common gestures. We use five types of gestures, namely those for Stop, Forward, Backward, Turn Left, and Turn Right. Users will control devices through a camera connected to computers. The algorithm will analyze gestures and take actions to perform appropriate action according to users requests via their gestures. The results show that the average accuracy of proposal algorithm is 92.6 percent for images and more than 91 percent for video, which both satisfy performance requirements for real-world application, specifically for smart home services. The processing time is approximately 0.098 second with 10 frames/sec datasets. However, accuracy rate still depends on the number of training images (video) and their resolution.

GANs(Generative Adversarial Networks)를 활용한 모션캡처 이미지의 hole-filling 기법 연구 (Study on hole-filling technique of motion capture images using GANs (Generative Adversarial Networks))

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.160-161
    • /
    • 2019
  • 3차원 객체를 모델링 하기 위한 방법으로 3D 스캐너를 이용하는 방법과 모션캡처 시스템을 이용하는 방법 그리고 키넥트(Kinect) 시스템을 이용하는 방법 등이 있다. 이러한 방법을 통해 3차원 객체를 생성하는 과정에서 가려짐에 의해 촬영되지 않는 부분이 발생한다. 완벽한 3차원 객체를 구현하기 위해서는 가려진 부분을 임의로 채워줘야 하는 상황이 발생한다. 다양한 영상처리 방법을 통해 가져져 촬영되지 않은 부분을 메우는 기법이 존재한다. 본 연구에서는 보다 자연스러운 hole filling을 위한 방법으로 비지도기계학습의 최신 트렌드인 GANs를 이용한 방법을 제안한다.

  • PDF

SVM 기반 실리콘 웨이퍼 마이크로크랙의 분류성능 분석 (Classification Performance Analysis of Silicon Wafer Micro-Cracks Based on SVM)

  • 김상연;김경범
    • 한국정밀공학회지
    • /
    • 제33권9호
    • /
    • pp.715-721
    • /
    • 2016
  • In this paper, the classification rate of micro-cracks in silicon wafers was improved using a SVM. In case I, we investigated how feature data of micro-cracks and SVM parameters affect a classification rate. As a result, weighting vector and bias did not affect the classification rate, which was improved in case of high cost and sigmoid kernel function. Case II was performed using a more high quality image than that in case I. It was identified that learning data and input data had a large effect on the classification rate. Finally, images from cases I and II and another illumination system were used in case III. In spite of different condition images, good classification rates was achieved. Critical points for micro-crack classification improvement are SVM parameters, kernel function, clustered feature data, and experimental conditions. In the future, excellent results could be obtained through SVM parameter tuning and clustered feature data.

보행자의 검출 및 추적을 기반으로 한 실시간 이상행위 분석 시스템 (Real-time Abnormal Behavior Analysis System Based on Pedestrian Detection and Tracking)

  • 김도훈;박상현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.25-27
    • /
    • 2021
  • 최근 딥러닝 기술의 발전으로 CCTV 카메라를 통해 획득한 영상 정보에서 객체의 이상행동을 분석하기 위한 컴퓨터 비전 기반 AI 기술들이 연구되었다. 위험 지역이나 보안 지역에는 범죄 예방 및 경계 감시를 위해 감시카메라가 설치되어 있는 경우가 다수 존재한다. 이러한 이유로 기업들에서는 감시카메라 환경에서 침입, 배회, 낙상, 폭행 같은 주요한 상황을 판단하기 위한 연구들이 진행되고 있다. 본 논문에서는 객체 검출 및 추적 방법을 사용한 실시간 이상 행위 분석 알고리즘을 제안한다.

  • PDF