• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.024초

에이다부스트 알고리즘을 이용한 인체 영역의 강인한 검출 (Robust Detection of Body Areas Using an Adaboost Algorithm)

  • 장석우;변시우
    • 한국산학기술학회논문지
    • /
    • 제17권11호
    • /
    • pp.403-409
    • /
    • 2016
  • 최근 들어, 나체 사진이나 그림과 같은 유해한 영상 콘텐츠가 쉽게 유통 및 보급되고 있는 실정이어서 이런 유해 영상 콘텐츠를 효과적으로 검출하고 필터링하기 위한 연구 방법들이 지속적으로 소개되고 있다. 따라서 본 논문에서는 입력되는 칼라 영상으로부터 영상의 유해성을 나타내는 요소인 사람의 배꼽 영역을 하르-라이크(Haar-like) 특징과 에이다부스트(Adaboost) 알고리즘을 이용하여 강인하게 검출하는 새로운 접근 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 입력 영상으로부터 색상 정보를 이용하여 사람의 유두 영역을 검출하고, 검출된 유두 영역과의 위치 정보를 사용하여 배꼽의 후보 영역을 검출한다. 그런 다음, 하르-라이크 특징과 에이다부스트 알고리즘을 이용한 필터링을 통해 실제 배꼽 영역들만을 검출한다. 실험 결과에서는 제안된 방법이 입력되는 칼라 영상으로부터 배꼽 영역을 기존의 방법보다 1.6% 더 정확하게 추출한다는 것을 보여준다. 본 논문에서 제안된 배꼽 영역 검출 알고리즘은 2 차원이나 3 차원의 유해 콘텐츠 검출 및 필터링과 관련된 여러 가지 응용 분야에서 매우 효과적으로 이용될 것으로 기대된다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.

교육 영상제작 시스템 설계 및 구현 (Efficient Multicasting Mechanism for Mobile Computing Environment)

  • 김정국;조위재;박수빈;박수현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.482-484
    • /
    • 2017
  • 지난 70여 년간 영화와 텔레비전은 인류의 소통 방식에 획기적인 변화를 가져왔다. 하지만 이러한 발전에도 TV는 전파, 영화는 스크린이라는 매체의 제약으로 인해 다수를 대상으로 하는 소통 수단으로만 사용되어 왔다. 그러나 인터넷과 온라인 비디오의 발전은 이러한 제약을 없애고 지구 반대편에서 올린 유투브 영상을 1억 명의 사람이 시청하는 시대가 왔다. 지금 전달하고자 하는 메시지도 누구에게든 전달될 수 있지만 이러한 메시지를 담은 영상을 제작하는 것은 소통의 마지막 장애물로 남아있다. 이러한 문제점을 해결하기 위해서 본 논문에서는 웹 어플리케이션과 AWS를 통한 동영상제작 프로그램을 구현하였다. 본 시스템은 기본적으로 웹 애플리케이션을 통해 관리자에게 쉬운 인터페이스를 통한 영상제작, 정보관리와 AWS를 통해 인터넷 상의 서버에 프로그램을 두고 컴퓨터나 스마트 폰 등에 할당받은 강의, 학습자료, 추천학습 가이드 등을 제공하여 교육 영상제작 서비스에 효율을 높이기 위해 구현하였다.

  • PDF

정보 증류 및 재귀적인 방식을 이용한 심층 학습법 기반 경량화된 초해상도 네트워크 (Lightweight Super-Resolution Network Based on Deep Learning using Information Distillation and Recursive Methods)

  • 우희조;심지우;김응태
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.378-390
    • /
    • 2022
  • 최근 심층 합성 곱 신경망 학습의 발전에 따라 단일 영상 초해상도에 적용되는 심층 학습 기법들을 좋은 성과를 보여주고 있으며 깊은 네트워크의 강한 표현 능력으로 저해상도 영상과 고해상도 영상 사이의 복잡한 비선형 매핑이 가능해졌다. 하지만 과도한 합성곱 신경망의 사용으로 인해 증가하는 파라미터와 연산량으로 실시간 또는 저전력 장치에 적용하는데 제한이 있다. 본 논문은 정보 증류 방식을 이용하여 계층적인 특징을 조금씩 추출해내는 블록을 재귀적인 방식으로 사용하며 고주파수 잔여 정제 블록을 통해 더 정확한 고주파수 성분을 만들어 성능을 향상시키는 경량화된 네트워크인 Recursive Distillation Super Resolution Network (RDSRN) 를 제안한다. 제안하는 네트워크는 RDN과 비교했을 때 비슷한 화질의 영상을 복원하며 약 32배 적은 파라미터와 약 10배 적은 연산량을 가지고 약 3.5배 더 빠르게 영상을 복원하며 기존 경량화 네트워크 CARN과 비교했을 때 약 2.2배 적은 파라미터와 약 1.8배 빠른 처리시간으로 평균 0.16dB 더 좋은 성능을 만들어 냄을 확인 하였다.

FFT 적용을 통한 Convolution 연산속도 향상에 관한 연구 (A Study on the Optimization of Convolution Operation Speed through FFT Algorithm)

  • 임수창;김종찬
    • 한국멀티미디어학회논문지
    • /
    • 제24권11호
    • /
    • pp.1552-1559
    • /
    • 2021
  • Convolution neural networks (CNNs) show notable performance in image processing and are used as representative core models. CNNs extract and learn features from large amounts of train dataset. In general, it has a structure in which a convolution layer and a fully connected layer are stacked. The core of CNN is the convolution layer. The size of the kernel used for feature extraction and the number that affect the depth of the feature map determine the amount of weight parameters of the CNN that can be learned. These parameters are the main causes of increasing the computational complexity and memory usage of the entire neural network. The most computationally expensive components in CNNs are fully connected and spatial convolution computations. In this paper, we propose a Fourier Convolution Neural Network that performs the operation of the convolution layer in the Fourier domain. We work on modifying and improving the amount of computation by applying the fast fourier transform method. Using the MNIST dataset, the performance was similar to that of the general CNN in terms of accuracy. In terms of operation speed, 7.2% faster operation speed was achieved. An average of 19% faster speed was achieved in experiments using 1024x1024 images and various sizes of kernels.

컴퓨터 모니터와 혼합현실기기의 3차원 이미지 인지 효과 비교 연구 (A Comparison of the Cognitive Effect of Three-dimensional Images on a Computer Monitor and a Mixed Reality Device)

  • 최성진
    • 한국BIM학회 논문집
    • /
    • 제13권4호
    • /
    • pp.45-53
    • /
    • 2023
  • The educational benefits and potential of XR as a new medium are well recognized. However, there are still limitations in understanding the specific effects of XR compared to the more widely utilized representation of images on computer monitors. This study therefore aims to demonstrate the differences in effectiveness between the two technologies and to draw implications from a cognitive comparison of three-dimensional objects represented on a flat surface and virtually. The study was conducted a quantitative research method with an experiment involving two independent groups, and the results were tested using regression analysis. The results showed that for low-level, two-dimensional objects, the computer monitor method may be more effective, but above a certain level of complexity, the effectiveness of learning through the monitor tends to decrease rapidly. On the other hand, the group that used extended reality technology showed relatively high comprehension compared to the monitor group even as the complexity increased, and in particular, unlike the monitor group's rapidly decreasing comprehension level, the extended reality technology group showed a trend of decreasing comprehension with the level of complexity, suggesting the potential for compatibility and predictability in the use of technology.

A Delphi Approach to the Development of an Integrated Performance Measurement and Management Model for a Car Assembler

  • Shawyun, Teay
    • Industrial Engineering and Management Systems
    • /
    • 제7권3호
    • /
    • pp.214-227
    • /
    • 2008
  • Today's dynamic competitiveness requires an organization to improve its performance measurement and management. Quality Management Systems (QMS) abound, the main ones being: ISO series, Malcolm Baldridge National Quality Award (MBNQA), European Forum for Quality Management (EFQM), Six Sigma Business Scorecard and the Balanced Scorecard. Based on the literature, the IPMMM (Integrated Performance Measurement and Management Model) identified 7 key synthesized factors: leadership, strategy management and policy, customer and market, learning and growth, partnership and resources, internal processes and business results that are employed to investigate the key performance indicators of a car assembler using the Delphi methodology. In the 2 rounds of Delphi panels consisting of 20 senior management personnel, the $1^{st}$ round of 198 indicators in the IPMMM yielded 90 indicators. The $2^{nd}$ round yielded 43 performance indicators with 18 rated as critical based on the % assigned in the $1^{st}$ and $2^{nd}$ priority rating of "very important factor" and "key performance indicator" that must be ranked high on both of the priorities. The very critical indicators appeared to be: defect percentage and first time capability (tie in $1^{st}$ place) and revenue, goal setting, customer satisfaction index, on-time delivery, brand image, return on investment, Claim Occurrence Ratio, and debt being ranked from $3^{rd}$ to $10^{th}$. It can be surmised that an organization can identify and develop an appropriate set of performance indicators through the Delphi methodology and implement and manage them based on the Balanced Scorecard.

레시피 데이터 기반의 식재료 궁합 분석을 이용한 레시피 추천 시스템 구현 (Implementation of Recipe Recommendation System Using Ingredients Combination Analysis based on Recipe Data)

  • 민성희;오유수
    • 한국멀티미디어학회논문지
    • /
    • 제24권8호
    • /
    • pp.1114-1121
    • /
    • 2021
  • In this paper, we implement a recipe recommendation system using ingredient harmonization analysis based on recipe data. The proposed system receives an image of a food ingredient purchase receipt to recommend ingredients and recipes to the user. Moreover, it performs preprocessing of the receipt images and text extraction using the OCR algorithm. The proposed system can recommend recipes based on the combined data of ingredients. It collects recipe data to calculate the combination for each food ingredient and extracts the food ingredients of the collected recipe as training data. And then, it acquires vector data by learning with a natural language processing algorithm. Moreover, it can recommend recipes based on ingredients with high similarity. Also, the proposed system can recommend recipes using replaceable ingredients to improve the accuracy of the result through preprocessing and postprocessing. For our evaluation, we created a random input dataset to evaluate the proposed recipe recommendation system's performance and calculated the accuracy for each algorithm. As a result of performance evaluation, the accuracy of the Word2Vec algorithm was the highest.

빅데이터 감성분석에 따른 공항 공공예술 디자인 요소 및 선호도 연구 (Research on Airport Public Art Design Elements and Preferences Based on Big Data Sentiment Analysis)

  • 장온;추장운;김치용
    • 한국멀티미디어학회논문지
    • /
    • 제25권10호
    • /
    • pp.1499-1511
    • /
    • 2022
  • In the context of globalization, circulation between cities has become more frequent. The airport is no longer just a place for boarding, disembarking, and transportation, but a public place that serves as the communication function of the "aviation city". The intervention of public art in the airport space not only gives users a sense of space experience, but also becomes a unique carrier for city and country image shaping. The purpose of this paper is to study the emotional value brought by airport public art to users, and to investigate the correlation analysis of public art design elements and user preferences based on this premise. The research methods are machine learning method and SPSS 21.0. The user's emotional value is introduced in the big data evaluation, and the preference and inclination of airport users to various elements of public art are analyzed by questionnaire. Through the research conclusion, the preference and main contradiction of users in the airport for the four dimensions of public art design elements are obtained. Opinions and optimization methods to provide reference data and theoretical support for public art design.

웹캠 기반 거북목 판별 알고리즘을 활용한 자세 교정 반응형 헬스케어 시스템 (Responsive Healthcare System for Posture Correction Using Webcam-Based Turtle Neck Syndrome Discrimination Algorithm)

  • 박소연;류서진;동서연
    • 한국멀티미디어학회논문지
    • /
    • 제24권2호
    • /
    • pp.285-294
    • /
    • 2021
  • This study developed a responsive healthcare system that users can easily use in real life to prevent turtle neck syndrome by posture correction. We propose a system that naturally induces direct posture improvement by adjusting the height with a responsive cradle through a turtle neck discrimination algorithm detecting the turtle neck posture in real time using a webcam. The turtle neck algorithm was developed based on machine learning, using the points that the distance relationship between the jaw line and the shoulder varies depending on the posture. For the younger age group, which is particularly problematic due to the increase in the use of IT devices, image data in different situations according to the height and posture of the cradle was collected and learned as a support vector machine classifier. In addition, a height-adjustable cradle that can support a laptop has been created and expanded into a responsive cradle that can be controlled with software by interlocking with the Arduino. Therefore, this service enables posture correction of many modern people suffering from turtle neck syndrome and will become an essential platform in the increasing online environment in the non-contact era.