• 제목/요약/키워드: Vision-language model

검색결과 41건 처리시간 0.027초

AI-BASED Monitoring Of New Plant Growth Management System Design

  • Seung-Ho Lee;Seung-Jung Shin
    • International journal of advanced smart convergence
    • /
    • 제12권3호
    • /
    • pp.104-108
    • /
    • 2023
  • This paper deals with research on innovative systems using Python-based artificial intelligence technology in the field of plant growth monitoring. The importance of monitoring and analyzing the health status and growth environment of plants in real time contributes to improving the efficiency and quality of crop production. This paper proposes a method of processing and analyzing plant image data using computer vision and deep learning technologies. The system was implemented using Python language and the main deep learning framework, TensorFlow, PyTorch. A camera system that monitors plants in real time acquires image data and provides it as input to a deep neural network model. This model was used to determine the growth state of plants, the presence of pests, and nutritional status. The proposed system provides users with information on plant state changes in real time by providing monitoring results in the form of visual or notification. In addition, it is also used to predict future growth conditions or anomalies by building data analysis and prediction models based on the collected data. This paper is about the design and implementation of Python-based plant growth monitoring systems, data processing and analysis methods, and is expected to contribute to important research areas for improving plant production efficiency and reducing resource consumption.

정보처리모형을 활용한 중학교 특수 국어 교과서 심화 학습활동 수록 매체 분석 (An Analysis of Media in Advanced Learning Activities of Middle School Special Korean Textbooks by the Information Processing Model)

  • 송기호;노정임
    • 한국비블리아학회지
    • /
    • 제31권3호
    • /
    • pp.29-50
    • /
    • 2020
  • 본 연구의 목적은 장애 학생용 교과서에 수록된 매체의 특징을 정보처리모형을 기반으로 분석하고, 도서관 자료를 장애 학생의 수업 개선에 활용할 수 있는 방안을 모색하는 것이다. 이를 위하여 2015 개정 특수교육 기본교육과정 중학교 국어 교과서 심화 학습활동에 포함된 매체를 분석하였다. 분석 결과 장애 학생은 심화 학습활동을 수행하기 위하여 주로 시각을 통해서 정보를 수용하고 이해를 통해서 정보를 처리한 후에, 언어지능을 활용해서 결과를 산출하는 것으로 나타났다. 구체적으로는 삽화와 텍스트를 통해서 학습 내용을 수용하고, 추론과 설명 등 이해를 토대로 내용을 처리한 후에 쓰기와 말하기와 같은 언어 지능을 활용하여 결과를 산출한다. 이러한 분석 결과를 토대로 도서관 자료를 장애 학생의 국어 수업에 활용할 수 있는 현실적인 방안을 다음과 같이 제안하였다. 장애 학생의 독서 흥미 발달단계와 장서 맵핑을 활용한 다양한 투입 매체를 개발한다. 읽기-듣기를 활용하여 도서 자료를 제공한다. 심화 학습활동을 자기 주도적으로 해결할 수 있는 적절한 방법적 지식을 지도한다. 그리고 다양한 산출 활동을 도울 수 있는 글의 유형과 글쓰기 전략을 개발한다.

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

  • 김태석;김석훈;임광혁
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.27-40
    • /
    • 2021
  • Click-Through Rate(CTR) 예측은 추천시스템에서 후보 항목의 순위를 결정하고 높은 순위의 항목들을 추천하여 고객의 정보 과부하를 줄임과 동시에 판매 촉진을 통한 수익 극대화를 달성할 수 있는 핵심 기능이다. 자연어 처리와 이미지 분류 분야는 심층신경망(deep neural network)의 활용을 통한 괄목한 성장을 하고 있다. 최근 이 분야의 주류를 이루던 모델과 차별화된 어텐션(attention) 메커니즘 기반의 트랜스포머(transformer) 모델이 제안되어 state-of-the-art를 달성하였다. 본 연구에서는 CTR 예측을 위한 트랜스포머 기반 모델의 성능 향상 방안을 제시한다. 자연어와 이미지 데이터와는 다른 이산적(discrete)이며 범주적(categorical)인 CTR 데이터 특성이 모델 성능에 미치는 영향력을 분석하기 위해 임베딩의 일반화(regularization)와 트랜스포머의 정규화(normalization)에 관한 실험을 수행한다. 실험 결과에 따르면, CTR 데이터 입력 처리를 위한 임베딩 과정에서 L2 일반화의 적용과 트랜스포머 모델의 기본 정규화 방법인 레이어 정규화 대신 배치 정규화를 적용할 때 예측 성능이 크게 향상됨을 확인하였다.

Educational Framework for Interactive Product Prototyping

  • Nam Tek-Jin
    • 디자인학연구
    • /
    • 제19권3호
    • /
    • pp.93-104
    • /
    • 2006
  • When the design profession started, design targets were mainly static hardware centered products. Due to the development of network and digital technologies, new products with dynamic and software-hardware hybrid interactive characteristics have become one of the main design targets. To accomplish the new projects, designers are required to learn new methods, tools and theories in addition to the traditional design expertise of visual language. One of the most important tools for the change is effective and rapid prototyping. There have been few researches on educational framework for interactive product or system prototyping to date. This paper presents a new model of educational contents and methods for interactive digital product prototyping, and it's application in a design curricula. The new course contents, integrated with related topics such as physical computing and tangible user interface, include microprocessor programming, digital analogue input and output, multimedia authoring and programming language, sensors, communication with other external devices, computer vision, and movement control using motors. The final project of the course was accomplished by integrating all the exercises. Our educational experience showed that design students with little engineering background could learn various interactive digital technologies and its' implementation method in one semester course. At the end of the course, most of the students were able to construct prototypes that illustrate interactive digital product concepts. It was found that training for logical and analytical thinking is necessary in design education. The paper highlights the emerging contents in design education to cope with the new design paradigm. It also suggests an alterative to reflect the new requirements focused on interactive product or system design projects. The tools and methods suggested can also be beneficial to students, educators, and designers working in digital industries.

  • PDF

웹기반의 치매 예방용 융합교육 프로그램 개발 (Convergent Web-based Education Program to Prevent Dementia)

  • 박경순;박재성;반금옥;김경옥
    • 한국콘텐츠학회논문지
    • /
    • 제13권11호
    • /
    • pp.322-331
    • /
    • 2013
  • 최신 정보기술(IT)을 이용하여 웹(web) 기반으로 동작하는 치매 예방용 융합교육 콘텐츠를 개발하는 것을 목적으로 하였다. 사전 준비단계로 치매관련 국내 외 문헌분석 및 산업체 요구분석을 통해 개발 범위를 규정하였고, 이를 근거로 프로그램을 작성하였다. 개선단계에서는 다양한 분야의 전문가들과 함께 수정 작업을 거쳐 프로그램의 완성도를 최대화 하였다. 본 프로그램 개발내용을 요약하면, 첫째, 통합교육 및 융합교육의 교육학적 이론과 관련 전문가로부터 타당성 검증을 통해 645지능계발 모형을 개발한 후 "사물을 가리어 판단할 만한 지각"을 뜻하는 순 우리말인 "가리사니" 모형이라 명명하였다. 둘째, 웹기반 좌뇌 훈련 융합교육으로 수리영역에 "길 찾기" 및 "선 잇기"와 언어영역에 "문자 찾기(I, II)" 프로그램을 개발하였다. 셋째, 웹기반 우뇌 훈련 융합교육으로 주의영역에 "나의 자동차 찾기" 및 "시각 훈련"과 인지영역에 "사물추리" 및 "그림비교" 프로그램을 개발하였다. 넷째, 웹기반 좌 우뇌 훈련 융합교육으로 공간지각영역에 "펜토미노" 및 "BQ마제"(Brain Quotient와 maze 합성어)와 기억영역에 "시각 훈련" 프로그램을 개발하였다. 다섯째, 연구결과를 종합하여 총 52주 차시의 영역별 융합교육 운영 프로그램을 제시하였다.

보건계열 일부 대학생의 토익학습의 학업소진 영향과 관련된 융복합적 요인 연구 (A study on Convergence Factors Related with Academic Burnout of Students in Health Majors in Studying for TOEIC)

  • 홍수미;김승희;배상윤
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.315-327
    • /
    • 2017
  • 본 연구는 보건계열 일부 대학생의 토익학습에서 학업소진과 관련된 융복합적 요인들을 조사하고자 수행하였다. 조사대상은 J지역에 소재한 대학의 보건계열 토익학습반에서 임의로 선정된 재학생 291명으로 하였으며, 자료수집은 2017년 4월 3일부터 4월 14일까지 기간에 무기명 자기기입식 설문지를 통해 이루어졌다. 다중회귀분석 결과, 여학생이, 수면시간이 부적절할수록, 자아존중감, 자기효능감, 학교적응유연성 및 학습몰입이 낮을수록, 자기유능감, 취업스트레스 및 시험불안이 높을수록 토익학습의 학업소진이 높았으며 이들의 설명력은 65%이었다. 이상의 연구결과를 볼 때, 보건계열 대학생의 토익학습의 학업소진을 낮추기 위해서는 적절히 수면하고, 자아존중감, 자기효능감, 학교적응유연성 및 학습몰입을 높이고 자기유능감, 취업스트레스 및 시험불안을 관리하는 노력이 필요하다. 이러한 결과는 보건계열 대학생의 토익학습의 학업소진을 낮추어 국제화 역량을 키우기 위한 영어 학습 능률을 높이는 데 활용이 기대된다. 향후연구에서는 이들 요인들이 학업소진에 미치는 조절 및 매개효과에 대한 융복합적인 영향 분석이 필요하다.

애니메이션의 역사적 양식에 대한 연구:개인양식과 미국의 디즈니.일본의 지브리 양식을 중심으로 (The study about historical style of animation :Focused on the individual style and USA's style & Japan's style)

  • 김재웅
    • 만화애니메이션 연구
    • /
    • 통권16호
    • /
    • pp.49-65
    • /
    • 2009
  • 이 논문에서는 애니메이션의 양식에 대한 유형을 분석하였다. 역사적 양식에는 자기 자신만의 고유한 특정기질을 드러내는 개인양식과 유사한 환경을 공유하는 보편적 성향인 시대양식, 그리고 집단의 형태적 취향과 민족정서를 드러내는 민족양식으로 분류할 수 있다. 이리 트른카와 팀 버틀, 유리 놀스테인 등의 개인양식은 각 개인의 독특한 감수성과 관찰력이 뛰어난 영상미로 표현하고 있으며, 주제에 대한 해석과 매체를 다루는 기술이 뛰어남을 알 수 있다. 애니메이션의 고전적 규범의 신기원을 구축한 디즈니는 풍부한 표정언어와 섬세한 동세의 풀 애니메이션으로 미국애니메이션의 민족양식을 완성시켰고, 일본 아니메의 역사양식에는 몇 몇 감독들의 노력과 함께 휴머니즘적 사상, 그리고 일본의 사회문화와 전통의 맥을 이어가는 지브리가 그 중심에 있었다.

  • PDF

Design of Image Extraction Hardware for Hand Gesture Vision Recognition

  • Lee, Chang-Yong;Kwon, So-Young;Kim, Young-Hyung;Lee, Yong-Hwan
    • 한국정보기술학회 영문논문지
    • /
    • 제10권1호
    • /
    • pp.71-83
    • /
    • 2020
  • In this paper, we propose a system that can detect the shape of a hand at high speed using an FPGA. The hand-shape detection system is designed using Verilog HDL, a hardware language that can process in parallel instead of sequentially running C++ because real-time processing is important. There are several methods for hand gesture recognition, but the image processing method is used. Since the human eye is sensitive to brightness, the YCbCr color model was selected among various color expression methods to obtain a result that is less affected by lighting. For the CbCr elements, only the components corresponding to the skin color are filtered out from the input image by utilizing the restriction conditions. In order to increase the speed of object recognition, a median filter that removes noise present in the input image is used, and this filter is designed to allow comparison of values and extraction of intermediate values at the same time to reduce the amount of computation. For parallel processing, it is designed to locate the centerline of the hand during scanning and sorting the stored data. The line with the highest count is selected as the center line of the hand, and the size of the hand is determined based on the count, and the hand and arm parts are separated. The designed hardware circuit satisfied the target operating frequency and the number of gates.

고객 맞춤형 서비스를 위한 관객 행동 기반 감정예측모형 (The Audience Behavior-based Emotion Prediction Model for Personalized Service)

  • 유은정;안현철;김재경
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.73-85
    • /
    • 2013
  • 정보기술의 비약적 발전에 힘입어, 오늘날 기업들은 지금까지 축적한 고객 데이터를 기반으로 맞춤형 서비스를 제공하는 것에 많은 관심을 가지고 있다. 고객에게 소구하는 맞춤형 서비스를 효과적으로 제공하기 위해서는 우선 그 고객이 처한 상태나 상황을 정확하게 인지하는 것이 중요하다. 특히, 고객에게 서비스가 전달되는 이른바 진실의 순간에 해당 고객의 감정 상태를 정확히 인지할 수 있다면, 기업은 더 양질의 맞춤형 서비스를 제공할 수 있을 것이다. 이와 관련하여 사람의 얼굴과 행동을 이용하여 사람의 감정을 판단하고 개인화 서비스를 제공하기 위한 연구가 활발하게 이루어지고 있다. 얼굴 표정을 통해 사람의 감정을 판단하는 연구는 좀 더 미세하고 확실한 변화를 통해 정확하게 감정을 판단할 수 있지만, 장비와 환경의 제약으로 실제 환경에서 다수의 관객을 대상으로 사용하기에는 다소 어려움이 있다. 이에 본 연구에서는 Plutchik의 감정 분류 체계를 기반으로 사람들의 행동을 통해 감정을 추론해내는 모형을 개발하는 것을 목표로 한다. 본 연구는 콘텐츠에 의해 유발된 사람들의 감정적인 변화를 사람들의 행동 변화를 통해 판단하고 예측하는 모형을 개발하고, 4가지 감정 별 행동 특징을 추출하여 각 감정에 따라 최적화된 예측 모형을 구축하는 것을 목표로 한다. 모형 구축을 위해 사람들에게 적절한 감정 자극영상을 제공하고 그 신체 반응을 수집하였으며, 사람들의 신체 영역을 나누었다. 특히, 모션캡쳐 분야에서 널리 쓰이는 차영상 기법을 적용하여 사람들의 제스쳐를 추출 및 보정하였다. 이후 전처리 과정을 통해 데이터의 타임프레임 셋을 20, 30, 40 프레임의 3가지로 설정하고, 데이터를 학습용, 테스트용, 검증용으로 구분하여 인공신경망 모형을 통해 학습시키고 성과를 평가하였다. 다수의 일반인들을 대상으로 수집된 데이터를 이용하여 제안 모형을 구축하고 평가한 결과, 프레임셋에 따라 예측 성과가 변화함을 알 수 있었다. 감정 별 최적 예측 성과를 보이는 프레임을 확인할 수 있었는데, 이는 감정에 따라 감정의 표출 시간이 다르기 때문인 것으로 판단된다. 이는 행동에 기반한 제안된 감정예측모형이 감정에 따라 효과적으로 감정을 예측할 수 있으며, 실제 서비스 환경에서 사용할 수 있는 효과적인 알고리즘이 될 수 있을 것으로 기대할 수 있다.

인공지능 기술 기반 인슈어테크와 디지털보험플랫폼 성공사례 분석: 중국 평안보험그룹을 중심으로 (Analysis of Success Cases of InsurTech and Digital Insurance Platform Based on Artificial Intelligence Technologies: Focused on Ping An Insurance Group Ltd. in China)

  • 이재원;오상진
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.71-90
    • /
    • 2020
  • 최근 전 세계 보험업계에도 기계학습, 자연어 처리, 딥러닝 등의 인공지능 기술 활용을 통한 디지털 전환이 급속도로 확산하고 있다. 이에 따라 인공지능 기술을 기반으로 한 인슈어테크와 플랫폼 비즈니스 성공을 이룬 해외 보험사들도 증가하고 있다. 대표적으로 중국 최대 민영기업인 평안보험그룹은 '금융과 기술', '금융과 생태계'를 기업의 핵심 키워드로 내세우며 끊임없는 혁신에 도전한 결과, 인슈어테크와 디지털플랫폼 분야에서 괄목할만한 성과를 보이며 중국의 글로벌 4차 산업혁명을 선도하고 있다. 이에 본 연구는 평안보험그룹 인슈어테크와 플랫폼 비즈니스 활동을 ser-M 분석 모델을 통해 분석하여 국내 보험사들의 인공지능 기술기반 비즈니스 활성화를 위한 전략적 시사점을 제공하고자 했다. ser-M 분석 모델은 기업의 경영전략을 주체, 환경, 자원, 메커니즘 관점에서 통합적으로 해석이 가능한 프레임으로, 최고경영자의 비전과 리더십, 기업의 역사적 환경, 다양한 자원 활용, 독특한 메커니즘 관계가 통합적으로 해석되도록 연구하였다. 사례분석 결과, 평안보험은 안면·음성·표정 인식 등 핵심 인공지능 기술을 활용하여 세일즈, 보험인수, 보험금 청구, 대출 서비스 등 업무 전 영역을 디지털로 혁신함으로써 경비 절감과 고객서비스 발전을 이루었다. 또한 '중국 내 온라인 데이터'와 '회사가 축적한 방대한 오프라인 데이터 및 통찰력'을 인공지능, 빅데이터 분석 등 신기술과 결합하여 금융 서비스와 디지털 서비스 사업이 통합된 디지털 플랫폼을 구축하였다. 이러한 평안보험그룹의 성공 배경을 ser-M 관점에서 분석해 보면, 창업자 마밍즈 회장은 4차 산업혁명 시대의 디지털 기술발전, 시장경쟁 및 인구 구조의 변화를 빠르게 포착하여 새로운 비전을 수립하고 디지털 기술중시의 민첩한 리더십을 발휘하였다. 환경변화에 대응한 창업자 주도의 강력한 리더십을 바탕으로 인공지능 기술 투자, 우수 전문인력 확보, 빅데이터 역량 강화 등 내부자원을 혁신하고, 외부 흡수역량의 결합, 다양한 업종 간의 전략적 제휴를 통해 인슈어테크와 플랫폼 비즈니스를 성공적으로 끌어냈다. 이와 같은 성공사례 분석을 통하여 인슈어테크와 디지털플랫폼 도입을 본격 준비하고 있는 국내 보험사들에게 디지털 시대에 필요한 경영 전략과 리더십에 대한 시사점을 줄 수 있다.