• 제목/요약/키워드: 딥러닝 융합연구

검색결과 434건 처리시간 0.026초

인공지능기반의 자동 창작 영상에 관한 논구 (A Discussion on AI-based Automated Picture Creations)

  • 김정회;윤준성
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.723-730
    • /
    • 2024
  • 본 연구는 자동 창작 영상에 관한 개념과 이해의 변화를 추적하기 위하여, 기존의 영상분야를 대표하는 사진과 영화의 창작 방식을 인공지능 기반의 영상 창작 방법과 '자동'이라는 측면에서 유비적으로 탐구하고, 새로운 자동영상창작에 관한 이해와 가능성을 논구 한다. 사진과 영화의 발명 시기에는, 회화를 비롯한 전통예술 장르와 비견하여, 이들에게 '자동 창작'이라는 영역을 설정한 바 있다. 최근 인공지능이 영상 제작에도 적용되면서 '자동 창작'에 관한 개념도 확장되어, 기존의 문학, 미술, 사진, 영화의 경계를 자유롭게 넘나드는 실험적 창작이 활발하다. 인공지능의 자동 창작은 머신 러닝과 딥 러닝과 같은 기술을 활용하여, 인공지능이 독립적으로 창작 과정을 수행하게 한다. 인공지능을 활용한 자동 창작은 효율성을 크게 향상시킬 수 있지만, 동시에 예술창작과정의 주관적인 판단의 문제에 직면하게 된다. 자동 창작으로 몰렸던 사진과 영화의 창작과정과 인공지능의 창작과정을 비교하면, 자동 창작 영상의 입면은 작가의 문제로 귀착될 수 있다. 그러나 다원적이 예술분야가 소통할 수 있는 기회로 작동된다면, 인공지능기반의 자동 창작 영상은 장르를 넘나드는 방법론이 될 수 있을 것이다.

인공지능 기반 자연어처리를 적용한 욕창간호기록 분석 (Analysis of Pressure Ulcer Nursing Records with Artificial Intelligence-based Natural Language Processing)

  • 김명수;류정미
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.365-372
    • /
    • 2021
  • 본 연구의 목적은 자연어처리에 의해 생성된 욕창간호진술문의 특성을 파악하고, 욕창 단계판별 예측정확도를 평가하기 위함이다. 욕창관련 간호기록은 서술통계를 이용하여 분석하였고, 워드클라우드 생성기를 활용하여 욕창예방 간호기록에서 단어의 특성을 파악하였다. 딥러닝을 이용하여 욕창단계판별 정확도(accuracy ratio) 를 구하였다. 연구결과, 욕창의 단계에 대한 기록 중 2단계와 심부조직손상의심단계가 각각 23.1% 와 23.0 % 로 가장 많았고, 빈도수가 높은 핵심단어는 홍반, 수포, 가피, 부위, 크기 등으로 나타났다. 예측의 정확도가 높은 단계는 0단계, 심부조직손상의심단계, 2단계 순으로 나타났다. 따라서, 이를 활용하여 임상적 의사결정지지 시스템으로 개발된다면, 임상간호사의 욕창관리역량 향상 전략 개발에 기초가 될 수 있을 것이다.

비소세포폐암 환자의 재발 예측을 위한 흉부 CT 영상 패치 기반 CNN 분류 및 시각화 (Chest CT Image Patch-Based CNN Classification and Visualization for Predicting Recurrence of Non-Small Cell Lung Cancer Patients)

  • 마세리;안가희;홍헬렌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권1호
    • /
    • pp.1-9
    • /
    • 2022
  • 비소세포폐암(NSCLC)은 전체 폐암 중 85%의 높은 비중을 차지하며 사망률(22.7%)이 다른 암에 비해 현저히 높은 암으로 비소세포폐암 환자의 수술 후 예후에 대한 예측은 매우 중요하다. 본 연구에서는 종양을 관심영역으로 갖는 비소세포폐암 환자의 수술 전 흉부 CT 영상 패치의 종류를 종양 관련 정보에 따라 총 다섯 가지로 다양화하고, 이를 입력데이터로 갖는 사전 학습 된 ResNet 과 EfficientNet CNN 네트워크를 사용하여 단일 모델과 간접 투표 방식을 이용한 앙상블 모델, 그리고 3 개의 입력 채널을 활용한 앙상블 모델에서의 실험 결과 및 성능을 오분류의 사례와 Grad-CAM 시각화를 통해 비교 분석한다. 실험 결과, 종양 주변부 패치를 학습한 ResNet152 단일 모델과 EfficientNet-b7 단일 모델은 각각 87.93%와 81.03%의 정확도를 보였다. 또한 ResNet152 에서 총 3 개의 입력 채널에 각각 영상 패치, 종양 주변부 패치, 형상 집중 종양 내부 패치를 넣어 앙상블 모델을 구성한 경우에는 정확도 87.93%를, EfficientNet-b7 에서 간접 투표 방식으로 영상 패치와 종양 주변부 패치 학습 모델을 앙상블 한 경우에는 정확도 84.48%를 도출하며 안정적인 성능을 보였다.

전통문화 이미지를 위한 세부 자질 주목형 이미지 자동 분석기 (Detail Focused Image Classifier Model for Traditional Images)

  • 김규경;허윤아;김경민;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.85-92
    • /
    • 2017
  • 이 논문에서는 최근 전통문화의 늘어나는 콘텐츠와 대조적으로 전통문화에 대한 접근성이 떨어지는 점에 주목하여 이러한 콘텐츠의 접근성의 향상을 위해 지속된 관리와 연구를 위하여 전통문화 이미지를 위한 이미지 자동 분석기를 소개한다. 이 논문에서 소개하는 이미지 자동 분석기는 인공신경망을 기반으로 입력 이미지의 자질들을 벡터스페이스로 변환하여 이를 RNN 기반의 모델을 통하여 세부 자질들을 파악하여 전통문화 이미지의 분류를 행한다. 이러한 방법을 통하여 전체적으로 비슷하게 보이는 전통문화 이미지들의 분류를 가능케 한다. 해당 모델의 훈련을 위하여 한민족정보문화마당 기반의 형식을 토대로 넓은 폭의 이미지 데이터를 수집 및 정리하여 차후 전통문화 이미지 관련 분야에서 사용할 수 있는 데이터셋의 구축에 기여를 하였다. 또한 이러한 연구가 최종적으로 전통문화와 관련된 수요, 공급 및 연구가 한층 더 활발해지는 것에 기여를 한다.

통사문법적 지식이 '독서기계'의 음성출력에 미치는 영향과 중요성 (The Influence and Impact of syntactic-grammatical knowledge on the Phonetic Outputs of a 'Reading Machine')

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.225-230
    • /
    • 2020
  • 인공지능, 딥러닝, 머신러닝 등이 괄목할만한 발전을 이루면서 2016년경부터 100여개의 언어를 비롯하여 가장 보편적으로 사용되어 온 Google Translate (구글기계번역기)는 자연언어처리(NLP) 분야와 외국어 학습 등 언어활용 분야에 독보적인 역할을 하고 있다. 본 논문은 구글기계번역기, Google Translate에 있어서, 영어모국어화자가 가진 통사문법적-범주적 지식의 중요성과 그 영향력에 대해 살펴보고자 한다. Jackendoff (1999)는 맹인을 위한 독서기계(Reading Machine)등을 구축하려면 통사구조적 지식과 문법적 분해력(parsing)이 매우 중요하고, 적어도 현재의 컴퓨터는 엄청난 발전을 이루기는 하였으나, 인간의 두뇌를 따라갈 수 없다는 결론을 내렸다. Jackendoff가 논의했던 몇 가지 어휘항목과 통사구조적 중의성을 활용하여, Google Translate 기계발음번역기를 통해 그의 주장을 확인하는 실험을 실시하고, 그 결과를 분석하는 것이 이 논문의 목표이다. 이 연구는 Jackendoff의 주장처럼 L1 화자가 내재화한 통사문법적, 범주-구조적 지식은 NLP, 혹은 "독서기계"등의 구축에서 중요하며, 이는 Chomsky (1986, 2005)등에서 논의된 내재적언어 (I-language)의 핵심이라는 점을 시사한다.

딥러닝을 이용한 열영상 기반 마스크 검출 시스템 설계 (Design of Face with Mask Detection System in Thermal Images Using Deep Learning)

  • 김용중;최병상;이기섭;정경권
    • 융합보안논문지
    • /
    • 제22권2호
    • /
    • pp.21-26
    • /
    • 2022
  • 마스크 착용은 COVID-19 감염을 예방하기 위한 효과적인 방안이다. 적외선 열화상 기반의 온도 측정과 신원 인식 시스템이 기업에서 널리 사용되고 있는 상황에서 마스크 감지를 위한 연구는 필수적이다. 최근 비전분야에 소개된 MTCNN은 객체 인스턴스 세분화를위한 개념적으로 간단하고 유연하며 일반적인 프레임 워크를 제시한다. 본 논문에서는 열적외선 카메라로부터 획득한 열감지영상에서 발열체인 인스턴스에 대해 발열부위의 세그멘테이션을 생성하는 동시에 이미지 내의 오브젝트 발열부분을 효율적으로 탐색하는 알고리즘을 제안한다. MTCNN(Multi-task Cascaded Convolutional Networks) 기법은 바운딩 박스 인식을 위해 기존 브랜치와 병렬로 객체 마스크를 예측하기 위한 브랜치를 추가한 알고리즘이다. MTCNN은 다른 작업으로 일반화하기 용이하다. 본 논문에서는 MTCNN기반 적외선 열영상 검출알고리즘을 제안하여 RGB영상에서 구별할 수 없는 마스크 착용 여부를 탐지하였다.

인공지능의 이론으로서 연결주의에 대한 재평가: 체계성 문제에 대한 연결주의의 인과적 설명의 가능성 (Reviewing connectionism as a theory of artificial intelligence: how connectionism causally explains systematicity)

  • 김준성
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권8호
    • /
    • pp.783-790
    • /
    • 2019
  • 인공 신경망의 성공을 토대로 인지과학에서 인간 지능을 설명하려는 시도가 연결주의이다. 딥러닝 등 신경망 컴퓨터의 성과는 연결주의에 대한 전망도 낙관적일 것으로 보여준다. 그러나 고전적 계산주의, 또는 기호주의를 옹호하는 학자들(포더, 필리신, 맥래플린)은 인간의 언어와 사고의 관계를 토대로 연결주의는 성공할 수 없다고 주장하여 왔다. 연결주의에 대한 비판의 핵심은, 인공 신경망에는 체계성이 없기 때문에 신경망의 결과물은 우연적인 연합이나 조합에 불과하다는 것이다. 저자는 이 연구에서 연결주의에 대한 고전적 계산주의의 비판을 검토하고 연결주의가 인공 지능의 이론뿐 아니라 인간 지능의 이론으로서 여전히 확장될 수 있는 가능성을 제시한다. 이 연구의 구조는 다음과 같다. 첫째, 인공 신경망의 구조와 함께 연결주의에 대한 이해를 제시한다. 둘째, 고전적 계산주의자가 연결주의에 제기한 체계성 문제가 무엇인지를 소개한다. 셋째, 그 문제에 대한 연결주의의 대응으로 스몰렌스키의 벡터곱 이론을 소개한다. 넷째, 계산주의와 연결주의의 논쟁을 검토하여 체계성 문제가 어떤 방향으로 갈 때 연결주의와 고전적 계산주의 모두에게 발전적인 논의가 될 수 있는지를 모색한다.

CAE 알고리즘을 이용한 레이더 강우 보정 평가 (Application of convolutional autoencoder for spatiotemporal bias-correction of radar precipitation)

  • 정성호;오성렬;이대업;레수안히엔;이기하
    • 한국수자원학회논문집
    • /
    • 제54권7호
    • /
    • pp.453-462
    • /
    • 2021
  • 최근 몇 년 동안 국지성 집중호우의 빈도가 증가함에 따라 고해상도 레이더 자료의 중요성 및 활용성이 증가하고 있다. 하지만 여전히 레이더 자료의 경우 시·공간적 편의가 존재하고 이를 보정하는 것이 매우 중요하며 많은 연구에서 레이더 강우의 편의 보정을 위해 다양한 통계적 기법이 시도되었다. 본 연구에서는 시·공간적으로 강우를 추정할 수 있는 이중편파레이더의 편의를 지점 강우와 비교하여 보정하는 것을 목표로 한다. 환경부의 수자원관리 및 홍수 예측에 사용되는 S-밴드 이중편파레이더의 편의 보정을 위하여 합성곱신경망(Convolutional Neural Network, CNN)기반의 Convolutional Autoencoder (CAE) 알고리즘을 구축하여 편의 보정을 수행하였다. CAE 모델의 입력자료는 환경부의 10분 단위 레이더 합성 강우자료와 같은 공간해상도로 보간된 지점 관측 강우자료를 사용하였으며, 자료의 기간은 미호천 유역에 홍수 경보가 발령된 2017년 7월 16일 00시부터 13시까지의 10분 단위 자료를 사용하였다. 그 결과로 지점 강우 대비 원시 레이더 강우의 편의가 줄어듦을 확인할 수 있으며 시·공간적으로 개선된 결과를 보여주고 있다. 따라서 각 인접한 격자 간의 공간 관계를 학습하는 CAE 모델은 레이더 및 위성에서 추정되는 격자형 기후 자료의 실시간 편의 보정에 사용할 수 있을 것으로 분석되었다.

Development of an intelligent skin condition diagnosis information system based on social media

  • Kim, Hyung-Hoon;Ohk, Seung-Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.241-251
    • /
    • 2022
  • 화장품 및 뷰티산업에서 고객의 피부상태 진단과 관리는 중요한 필수기능이다. 소셜미디어 환경이 사회 전 분야에 확산되고 일반화되면서 피부 상태의 진단과 관리에 대한 다양하고 섬세한 고민과 요구 사항의 질문과 답변의 상호작용이 소셜미디어 커뮤니티에서 활발하게 다루어지고 있다. 그러나 소셜미디어 정보는 매우 다양하고 비정형적인 방대한 빅데이터이므로 적절한 피부상태 정보분석과 인공지능 기술을 접목한 지능화된 피부상태 진단 시스템이 필요하다. 본 논문에서는 소셜미디어의 텍스트 분석정보를 학습데이터로 가공하여 고객의 피부상태를 지능적으로 진단 및 관리하기 위한 피부상태진단시스템 SCDIS를 개발하였다. SCDIS에서는 딥러닝 기계학습 방법인 인공신경망 기술을 사용하여 자동적으로 피부상태 유형을 진단하는 인공신경망 모델 AnnTFIDF을 빌드업하여 사용하였다. 인공신경망 모델 AnnTFIDF의 성능은 테스트샘플 데이터를 사용하여 분석되었으며, 피부상태 유형 진단 예측 값의 정확성은 약 95%의 높은 성능을 나타내었다. 본 논문의 실험 및 성능분석결과를 통하여 SCDIS는 화장품 및 뷰티산업 분야의 피부상태 분석 및 진단 관리 과정에서 효율적으로 사용 가능한 지능화된 도구로 평가할 수 있다. 본 논문에서 제안된 시스템은 소셜미디어 기반의 새로운 환경에서 화장품 및 피부미용에 대한 사용자의 요구를 체계적으로 파악하고 진단하는 기초 기술로 사용 가능할 것이다. 그리고 이 연구는 새로운 기술 트렌드인 맞춤형 화장품제조와 소비자중심의 뷰티산업기술 수요를 해결하기 위한 기초 연구로 사용될 수 있을 것이다.

전이학습 기반 특징융합을 이용한 누출판별 기법 연구 (A Study on Leakage Detection Technique Using Transfer Learning-Based Feature Fusion)

  • 한유진;박태진;이종혁;배지훈
    • 정보처리학회 논문지
    • /
    • 제13권2호
    • /
    • pp.41-47
    • /
    • 2024
  • 시간 및 주파수 영역에서 각각 학습한 모델 간에 성능 차이가 발생할 경우, 앙상블을 수행하더라도 개별 모델 간의 성능 불균형으로 인하여 앙상블의 성능이 오히려 저하되는 현상을 확인할 수 있었다. 따라서, 본 논문은 시간 영역과 주파수 영역에서 특징을 추출하고, 이들을 융합한 단계적 학습 방법을 통해 파이프라인 누출 감지의 정확성을 높이기 위한 누출판별 기법을 제안한다. 이 방법은 두 단계의 학습 과정으로 이루어지며, 먼저, 단계 1에서는 시간 영역과 주파수 영역에서 독립적으로 모델 학습을 수행하여 도메인별로 주어진 데이터로부터 중요한 특징들을 효과적으로 추출하도록 하였다. 단계 2에서는 사전학습 완료된 각 모델로부터 해당 분류기를 제거한 후, 두 도메인의 특징들을 서로 융합하고 새로운 분류기를 추가하여 재학습을 수행하였다. 본 논문에서 제안하는 전이학습 기반 특징융합 기법은 시간 및 주파수 영역에서 추출된 특징들을 융합하여 모델 학습을 수행함으로써, 두 영역의 특징이 상호 보완적으로 작용하여 모델이 다양한 정보를 활용함으로 인해 99.88%의 높은 정확도를 달성하여 파이프 누수 감지에 있어 우수한 성능을 입증하였다.