• 제목/요약/키워드: 미디어 AI

검색결과 341건 처리시간 0.027초

머신러닝을 이용한 지하철 고장 탐지 및 예측 (Detection and Prediction of Subway Failure using Machine Learning)

  • 성국경
    • 산업과 과학
    • /
    • 제2권4호
    • /
    • pp.11-16
    • /
    • 2023
  • 지하철은 현대 도시의 교통 체계에서 중요한 역할을 하는 대중 교통 수단이다. 하지만, 갑작스런 고장 및 시스템 불통 등의 이유로 혼잡을 야기시키는 경우가 종종 발생하여 불편을 초래하고 있다. 따라서, 본 논문에서는 지하철 시스템의 효율적 운영을 위해 머신러닝을 활용한 고장 예측 및 예방 연구를 진행하였다. UC Irvine의 MetroPT-3 데이터셋을 활용하고, 로지스틱 회귀를 이용하여 지하철 고장 예측 모델을 구축하였다. 모델은 0.991의 높은 정확도로 비고장 상태를 예측하나, 정밀도와 재현율은 상대적으로 낮아 고장 예측에 있어 오류 가능성을 시사하고 있다. ROC_AUC 값이 0.901로, 모델이 무작위 추측보다 뛰어난 분류를 할 수 있다. 구축한 모델은 지하철 시스템의 안정적인 운영 운영에 유용하나, 성능 개선을 위한 추가 연구가 필요하다고 생각한다. 따라서 학습 데이터가 많고 데이터의 정제가 잘 이루어진다면 고장 예측을 통해 사전 점검을 하여 예방할 수 있다.

딥러닝 기반의 의료 OCR 기술 동향 (Trends in Deep Learning-based Medical Optical Character Recognition)

  • 윤성연;최아린;김채원;오수민;손서영;김지연;이현희;한명은;박민서
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.453-458
    • /
    • 2024
  • 광학 문자 인식(Optical Character Recognition, OCR)은 이미지 내의 문자를 인식하여 디지털 포맷(Digital Format)의 텍스트로 변환하는 기술이다. 딥러닝(Deep Learning) 기반의 OCR이 높은 인식률을 보여줌에 따라 대량의 기록 자료를 보유한 많은 산업 분야에서 OCR을 활용하고 있다. 특히, 의료 산업 분야는 의료 서비스 향상을 위해 딥러닝 기반의 OCR을 적극 도입하였다. 본 논문에서는 딥러닝 기반 OCR 엔진(Engine) 및 의료 데이터에 특화된 OCR의 동향을 살펴보고, 의료 OCR의 발전 방향에 대해 제시한다. 현재의 의료 OCR은 검출한 문자 데이터를 자연어 처리(Natural Language Processing, NLP)하여 인식률을 개선하였다. 그러나, 정형화되지 않은 손글씨(Handwriting)나 변형된 문자에서는 여전히 인식 정확도에 한계를 보였다. 의료 데이터의 데이터베이스(Database)화, 이미지 전처리(Pre-processing), 특화된 자연어 처리를 통해 더욱 고도화된 의료 OCR을 발전시키는 것이 필요하다.

소셜 미디어 상에서의 인공지능 관련 사회적 여론에 대한 다 범주 감성 분석 (Multi-Category Sentiment Analysis for Social Opinion Related to Artificial Intelligence on Social Media)

  • 이상원;최창욱;김동성;여운영;김종우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.51-66
    • /
    • 2018
  • 인공지능 기술의 비약적인 발전으로 인하여, 사용자의 편의성 증대를 목적으로 다양한 분야에서 관련된 제품과 서비스들의 개발이 이루어지고 있다. 이러한 기술의 발전에는 긍정적인 파급 효과에 대한 기대감이 존재하나, 향후 발생 가능한 부정적인 측면에 대한 논의도 활발히 이루어지고 있다. 예를 들어, 인공지능 기술 기반의 자율주행 자동차의 경우 안정성의 향상이라는 측면에서 많은 관심을 받고 있으나, 트롤리 딜레마, 시스템 보안 문제 등의 사회적 이슈 또한 활발히 논의되고 있다. 이에 따라, 인공지능 관련 기술의 발전과 사회적 수용을 위해서는 사회적으로 논의되는 주요 관련 이슈들에 대한 확인과 효과적인 분석이 요구된다. 이를 위해, 본 연구에서는 '이세돌 vs 알파고' 시점인 2016년 3월을 포함하여 2016년 1월부터 2017년 12월까지 2년 동안의 인공지능과 관련된 사회적인 이슈들을 파악하고 온라인상에서 발생되는 사회적 여론에 대하여 다 범주 감성을 분석하고자 한다. 이를 위하여 국내 대표적인 포털 사이트에서 인공지능 관련 뉴스의 수와 관련된 뉴스 제목, 뉴스의 댓글을 웹 크롤링(Web Crawling) 하였다. 사회적 여론에 대한 다 범주 감성 분석은 논의되는 이슈들의 중요성을 고려하여 단순 긍정 또는 부정이 아닌, 분노, 혐오, 두려움, 행복, 중립, 슬픔, 놀라움의 7가지 다 범주 감성으로 분석하였다. 분석 결과, 대부분의 이벤트 기간에 대하여 1위 감성은 '행복'으로 나타났지만 각 키워드에 대하여 나오는 감성이 상이함을 볼 수 있었다. 또한 2016년 상반기, 하반기, 2017년 상반기, 하반기로 나누어 보았을 때 시간이 지남에 따라 '분노'의 감성이 낮아짐을 확인하였다. 이러한 분석 결과를 바탕으로 인공지능과 관련하여 현재 논의되고 있는 다양한 이슈와 동향 파악이 가능하며, 이에 대한 대응 방안 마련에 활용이 가능할 것이다. 향후 감성 분석기의 성능 향상과 댓글에 대한 공감 및 비공감도의 가중치를 추가하여 분석한다면 사회적 여론을 보다 세밀하게 파악 할 수 있을 것이다.

임베디드 보드에서의 CNN 모델 압축 및 성능 검증 (Compression and Performance Evaluation of CNN Models on Embedded Board)

  • 문현철;이호영;김재곤
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.200-207
    • /
    • 2020
  • CNN 기반 인공신경망은 영상 분류, 객체 인식, 화질 개선 등 다양한 분야에서 뛰어난 성능을 보이고 있다. 그러나, 많은 응용에서 딥러닝(Deep Learning) 모델의 복잡도 및 연산량이 방대해짐에 따라 IoT 기기 및 모바일 환경에 적용하기에는 제한이 따른다. 따라서 기존 딥러닝 모델의 성능을 유지하면서 모델 크기를 줄이는 인공신경망 압축 기법이 연구되고 있다. 본 논문에서는 인공신경망 압축기법을 통하여 원본 CNN 모델을 압축하고, 압축된 모델을 임베디드 시스템 환경에서 그 성능을 검증한다. 성능 검증을 위해 인공지능 지원 맞춤형 칩인 QCS605를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대해서 원 CNN 모델과 압축 CNN 모델의 분류성능과 추론시간을 비교 분석한다. 본 논문에서는 이미지 분류 CNN 모델인 MobileNetV2, ResNet50 및 VGG-16에 가지치기(pruning) 및 행렬분해의 인공신경망 압축 기법을 적용하였고, 실험결과에서 압축된 모델이 원본 모델 분류 성능 대비 2% 미만의 손실에서 모델의 크기를 1.3 ~ 11.2배로 압축했을 뿐만 아니라 보드에서 추론시간과 메모리 소모량을 각각 1.2 ~ 2.1배, 1.2 ~ 3.8배 감소함을 확인했다.

텍스트 마이닝 기법을 이용한 컴퓨터공학 및 정보학 분야 연구동향 조사: DBLP의 학술회의 데이터를 중심으로 (Investigation of Topic Trends in Computer and Information Science by Text Mining Techniques: From the Perspective of Conferences in DBLP)

  • 김수연;송성전;송민
    • 정보관리학회지
    • /
    • 제32권1호
    • /
    • pp.135-152
    • /
    • 2015
  • 이 논문의 연구목적은 컴퓨터공학 및 정보학 관련 연구동향을 분석하는 것이다. 이를 위해 텍스트마이닝 기법을 이용하여 DBLP(Digital Bibliography & Library Project)의 학술회의 데이터를 분석하였다. 대부분의 연구동향 분석 연구가 계량서지학적 연구방법을 사용한 것과 달리 이 논문에서는 LDA(Latent Dirichlet Allocation) 기반 다항분포 토픽모델링 기법을 이용하였다. 가능하면 컴퓨터공학 및 정보학과 관련된 광범위한 자료를 수집하기 위해서 DBLP에서 컴퓨터공학 및 정보학과 관련된 353개의 학술회의를 수집 대상으로 하였으며 2000년부터 2011년 기간 동안 출판된 236,170개의 문헌을 수집하였다. 토픽모델링 결과와 주제별 문헌 수, 주제별 학술회의 수를 조사하여 2000년부터 2011년 사이의 주제별 상위 저자와 주제별 상위 학술회의를 제시하였다. 주제동향 분석 결과 네트워크 관련 연구 주제 분야는 성장 패턴을 보였으며, 인공지능, 데이터마이닝 관련 연구 분야는 쇠퇴 패턴을 나타냈고, 지속 패턴을 보인 주제는 웹, 텍스트마이닝, 정보검색, 데이터베이스 관련 연구 주제이며, HCI, 정보시스템, 멀티미디어 시스템 관련 연구 주제 분야는 성장과 하락을 지속하는 변동 패턴을 나타냈다.

모던 웹 브라우저(Modern-Web-Browser) 기반 애플리케이션 성능분석을 위한 요소 연구 (Research for the Element to Analyze the Performance of Modern-Web-Browser Based Applications)

  • 박진태;김현국;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.278-281
    • /
    • 2018
  • 초기의 웹 기술은 텍스트 위주의 정보를 브라우저를 통해 보여주는 것이었다. 하지만 웹 기술이 발전하면서 브라우저를 통해 대용량의 멀티미디어 데이터를 보여주는 것이 가능해졌다. 웹 기술이 센서 네트워크, 하드웨어 제어, 빅 데이터와 인공지능 서비스를 위한 데이터 수집 및 분석 등 다양한 분야에 적용되고 있다. 대표적으로 사물인터넷의 인터페이스에 웹 브라우저를 탑재해 HTTP 통신으로 센서를 제어하고, 정보를 사용자에게 제공하는 사물 웹 플랫폼에 대한 표준이 마련되었다. 또한, 최근에는 웹 어셈블리의 개발로 웹 브라우저에서 실행할 수 없었던 3D 객체, 가상/증강 현실 콘텐츠를 C계열의 네이티브 언어를 통해 실행 가능해졌다. 기존 웹 애플리케이션의 성능을 평가하는 요소는 퍼포먼스, 네트워크 리소스, 보안 등의 요소들이 있었다. 하지만 웹 애플리케이션이 적용되는 분야가 다양해진 만큼 이 요소들에 대한 재해석과 검토가 필요한 시점이다. 이에 본 논문에서는 웹 애플리케이션의 성능을 평가하는 요소들에 대한 분석을 진행하고자 한다. 각 요소들에 대한 분석과 주요점, 보완되어야 하는 사항 등을 검토하여, 웹 기반 애플리케이션 개발의 한 지표를 정립하고자 한다.

  • PDF

YOLOv4 기반의 소형 물체탐지기법을 이용한 건설도면 내 철강 자재 문자 검출 및 인식기법 (Character Detection and Recognition of Steel Materials in Construction Drawings using YOLOv4-based Small Object Detection Techniques)

  • 심지우;우희조;김윤환;김응태
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.391-401
    • /
    • 2022
  • 최근 딥러닝 기반의 객체 검출 및 인식 연구가 발전해가면서 산업 및 실생활에 적용되는 범위가 넓어지고 있다. 건설 분야에도 딥러닝 기반의 시스템이 도입되고 있지만 아직은 미온적이다. 건설 도면에서 자재 산출이 수작업으로 이뤄지고 있어 많은 소요시간과 부정확한 적산 결과로 잘못된 물량산출의 거래가 생길 수 있다. 이를 해결하기 위해서 빠르고 정확한 자동 도면 인식시스템이 필요하다. 따라서 본 논문은 건설도면 내 철강 자재를 검출하고 인식하는 인공지능기반 자동 도면 인식 적산 시스템을 제안한다. 빠른 속도의 YOLOv4 기반에 소형 객체 검출성능을 향상하기 위한 복제 방식의 데이터 증강기법과 공간집중 모듈을 적용하였다. 검출한 철강 자재 영역을 문자 인식한 결과를 토대로 철강 자재를 적산한다. 실험 결과 제안한 방식은 기존 YOLOv4 대비 정확도와 정밀도를 각각 1.8%, 16% 증가시켰다. 제안된 방식의 Precision은 0.938, Recall은 1, AP0.5는 99.4%, AP0.5:0.95 68.8%의 향상된 결과를 얻었다. 문자 인식은 기존 데이터를 사용한 인식률 75.6%에 비해 건설도면에 사용되는 폰트에 맞는 데이터 세트를 구성하여 학습한 결과 99.9%의 인식률을 얻었다. 한 이미지 당 평균 소요시간은 검출 단계는 0.013초, 문자 인식은 0.65초, 적산 단계는 0.16초로 총 0.84초의 결과를 얻었다.

메타버스와 메타피직스의 영화적 순환 (Cinematic Circulation of Meta-verse and Meta-physics)

  • 심광현
    • 트랜스-
    • /
    • 제12권
    • /
    • pp.81-106
    • /
    • 2022
  • 메타버스 시스템이 향후 초연결 사회의 촉매가 될 수 있을지는 인공지능 기술과 마찬가지로 연관 기술의 발전 속도와 사회적 활용 범위의 확장 여부에 달려 있다. 이 글에서는 이런 현실화 과정의 문제를 괄호치고, 기술 발전이 가속화될 경우 이 복합적인 기술-사회의 짝패구조가 영화의 미래와 연관된 인지생태학적 변화와 관련된 몇 가지 철학적-정치적 논점에 한정해 논의해 보고자 한다. 흔히 메타버스의 핵심은 '몰입도'에 있다고 보지만 인지생태학적으로 보면 한 장의 그림이나 사진의 몰입도는 '재현의 정확성'보다는 그것이 주는 메시지의 맥락적 연결성에 달려 있다는 점을 환기해 보면 정확한 판단은 아니다. 이런 맥락에서 볼 때 메타버스의 진정한 잠재력은 새로운 자연적-사회적-기술적 짝패구조의 형성 속에서 활성화될 인간 뇌의 다중지능적 연결 능력(증강-시뮬레이션, 외부-내부의 교차)의 변화라는 인지생태학적인 맥락에서 파악할 필요가 있다. 그리고 이런 인지생태학적 잠재력은 이미 오래 전부터 [현실의 모순/갈등(M1)-->허구적 변형을 통한 영화적 해결책(M2)-->관객의 소원-성취 욕망에 의한 선택적 해석(M3)-->현실의 변화(M1']라는 삼중 미메시스의 영화적 순환 과정에서 부분적으로 실현되어 왔다. 따라서 메타버스 시스템의 진정한 잠재력은 현실적인 분리/문제들과 이상적인 연결/해결 사이의 영화적 순환을 더욱 확장하고 심화시킬 수 있는가에 달려 있다. 이런 측면에서 보자면 발전된 메타버스는 피직스-메타피직스의 이상적 순환의 현대적인 기술적 버전으로 비유될 수 있을 것이다

경기도 책꾸러미 사업을 통한 양육자의 독서육아 효과 분석을 위한 지표개발 및 효과성 연구 (A Study on Development and Effectiveness of the Indicatives for Analysis of the Effects of a Book Sharing Project on pre-schoolers of Supporter' Reading Care in Gyeonggi-do)

  • 최인자;윤성은;김수경;황금숙;이선애
    • 한국문헌정보학회지
    • /
    • 제56권2호
    • /
    • pp.133-155
    • /
    • 2022
  • 본 연구는 2021년도 경기도 책꾸러미 정기배송 사업에서 양육자의 독서 육아의 효과를 분석함에 그 목적이 있다. 이를 위해 지표를 개발하고 효과성을 분석한 뒤 향후 경기도 독서문화 진흥 정책 수립 시 활용하고자 하였다. 이 사업은 소외 지역에 거주하는 유아 대상의 독서 복지를 위해, 기관과 가정이 연계하여, 가정에 책꾸러미를 정기 배송하고, 유아와 양육자를 대상으로 맞춤형으로 개별적인 교육을 실시하였다. 양육자의 독서 육아 효과 분석을 위한 측정지표는 가정 문식성, 부모 효능감 이론에 대한 문헌 검토를 바탕으로 설정되었고, 이후 17개 설문 문항을 개발하여 전문가를 통해 델파이로 타당도를 검증하였다. 이후 경기도 7개 시군(포천시, 양평군, 여주시, 동두천시, 가평군, 연천군, 양주시)의 양육자 105명을 대상으로 효과성 검증을 위하여 사전/사후조사를 실시하였다. 결과적으로 사전/ 사후 효과성을 조사한 결과, 유아 책꾸러미 정기배송 사업의 양육자는 독서 상호작용과 독서 육아 효능감 면에서 향상을 가져왔다. 이러한 사업 효과를 고려할 때, 이 정책은 특정 지역을 넘어서 보편적인 조기 유아 독서 복지 정책으로 가정과 기관이 연계한 형태로 지속적인 사업으로 실시될 필요가 있다.

MF sampler: 동영상 기반 패션 검색 모델의 성능 향상을 위한 샘플링 방법 (MF sampler: Sampling method for improving the performance of a video based fashion retrieval model)

  • 백상훈;박종혁
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.329-346
    • /
    • 2022
  • 최근 소셜 미디어의 숏폼(Short form) 동영상(인스타그램, 틱톡, 유튜브) 시장이 점차 증가하면서 인공지능 영역에서는 이를 활용한 연구가 활발히 진행되고 있다. 대표적인 연구분야로 동영상 내의 패션 상품을 탐지하고 상품 이미지를 검색하는 Video to shop 을 들 수 있다. 이와 같은 동영상 기반 인공지능 모델에서는 Convolution 연산을 사용하여 상품의 특징을 추출한다. 하지만 연산 자원의 제한으로 인해, 동영상의 모든 프레임을 사용하여 특징을 추출하는 것은 현실적으로 불가능하다. 이로 인해, 기존 연구에서는 전체 프레임 중 일부만 샘플링해서 사용하거나, 주제의 특성을 활용한 샘플링 방법을 개발하여 이를 통해 위 문제점을 개선하고, 모델의 성능도 향상시켰다. 기존의 Video to shop 연구에서는 프레임을 샘플링 할 때, 무작위로 일부분의 프레임을 샘플링하거나 균등한 간격으로 샘플링 한다. 하지만 이러한 샘플링 방법은 상품이 존재하지 않는 노이즈 프레임을 샘플링 하면서 패션 상품 검색 모델의 성능을 저하시킨다. 이에 본 연구는 노이즈 프레임을 제거하고 검색 모델의 성능을 향상시키는 샘플링 방법 MF(Missing Fashion items on frame) sampler를 제안한다. MF sampler는 키 프레임 메커니즘(Mechanism)을 발전시켜 자원 한계의 문제점을 개선했다. 또한, 노이즈 탐지 모델을 활용한 노이즈 프레임 제거를 통해 검색 모델의 성능을 향상시켰다. 이와 같은 결과는 실험을 통해 확인되었고, Video to shop 패션 상품 검색에 있어 성능 향상과 효과적인 학습이 가능하다는 것을 확인할 수 있었다.