통합 검색 | Korea Science

심층신경망 언어이해에서의 벡터-그래프 변환 방법을 통한 설명가능성 확보에 대한 연구 (Vector2graph : A Vector-to-Graph Conversion Framework for Explainable Deep Natural Language Understanding)

허세훈;정상근
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
- /
- pp.427-432
- /
- 2020
딥러닝(Deep-learning) 기반의 자연어 이해(Natural Language Understanding) 기술들은 최근에 상당한 성과를 성취했다. 하지만 딥러닝 기반의 자연어 이해 기술들은 내적인 동작들과 결정에 대한 근거를 설명하기 어렵다. 본 논문에서는 벡터를 그래프로 변환함으로써 신경망의 내적인 의미 표현들을 설명할 수 있도록 한다. 먼저 인간과 기계 모두가 이해 가능한 표현방법의 하나로 그래프를 주요 표현방법으로 선택하였다. 또한 그래프의 구성요소인 노드(Node) 및 엣지(Edge)의 결정을 위한 Element-Importance Inverse-Semantic-Importance(EI-ISI) 점수와 Element-Element-Correlation(EEC) 점수를 심층신경망의 훈련방법 중 하나인 드랍아웃(Dropout)을 통해 계산하는 방법을 제안한다. 다양한 실험들을 통해, 본 연구에서 제안한 벡터-그래프(Vector2graph) 변환 프레임워크가 성공적으로 벡터의 의미정보를 유지하면서도, 설명 가능한 그래프를 생성함을 보인다. 더불어, 그래프 기반의 새로운 시각화 방법을 소개한다.
PDF

심전도 및 맥파신호 기반의 감정인식 시스템에 관한 연구 (Research on the Emotion Recognition System based on Electrocardiograph and Pulse Signals)

홍윤정;황윤경;신동규;김동현;신동일
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2008년도 춘계학술발표대회
- /
- pp.175-178
- /
- 2008
본 논문은 생체 신호들 중 데이터 획득이 간편한 심전도와 맥파를 실시간으로 취득하여 기계학습 기법인 SVM (Support Vector Machine)알고리즘과 클러스터링 기법인 k-NN (Nearest Neighbor)알고리즘을 적용한 인간의 감정을 분석하는 시스템에 대한 연구결과를 제시한다.
https://doi.org/10.3745/PKIPS.y2008m05a.175 인용 PDF

생성형 AI 모델을 활용한 요약 성능 평가 연구 ( A Study on Evaluating Summarization Performance using Generative Al Model)

최규리;박서윤;강예지;김한샘
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- pp.228-233
- /
- 2023
인간의 수동 평가 시 시간과 비용의 소모, 주석자 간의 의견 불일치, 평가 결과의 품질 등 불가피한 한계가 발생한다. 본 논문에서는 맥락을 고려하고 긴 문장 입출력이 가능한 ChatGPT를 활용한 한국어 요약문 평가가 인간 평가를 대체하거나 보조하는 것이 가능한가에 대해 살펴보았다. 이를 위해 ChatGPT가 생성한 요약문에 정량적 평가와 정성적 평가를 진행하였으며 정량적 지표로 BERTScore, 정성적 지표로는 일관성, 관련성, 문법성, 유창성을 사용하였다. 평가 결과 ChatGPT4의 경우 인간 수동 평가를 보조할 수 있는 가능성이 있음을 확인하였다. ChatGPT가 영어 기반으로 학습된 모델임을 고려하여 오류 발견 성능을 검증하고자 한국어 오류 요약문으로 추가 평가를 진행하였다. 그 결과 ChatGPT3.5와 ChatGPT4의 오류 요약 평가 성능은 불안정하여 인간을 보조하기에는 아직 어려움이 있음을 확인하였다.
PDF

손을 다루는 컴퓨터 비전 작업들을 위한 멀티 모달 합성 데이터 생성 방법 (Generating A Synthetic Multimodal Dataset for Vision Tasks Involving Hands)

이창화;이선경;김동욱;정찬양;백승렬
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2020년도 추계학술발표대회
- /
- pp.1052-1055
- /
- 2020
본 논문에서는 3D 메시 정보, RGB-D 손 자세 및 2D/3D 손/세그먼트 마스크를 포함하여 인간의 손과 관련된 다양한 컴퓨터 비전 작업에 사용할 수 있는 새로운 다중 모달 합성 벤치마크를 제안 하였다. 생성된 데이터셋은 기존의 대규모 데이터셋인 BigHand2.2M 데이터셋과 변형 가능한 3D 손 메시(mesh) MANO 모델을 활용하여 다양한 손 포즈 변형을 다룬다. 첫째, 중복되는 손자세를 줄이기 위해 전략적으로 샘플링하는 방법을 이용하고 3D 메시 모델을 샘플링된 손에 피팅한다. 3D 메시의 모양 및 시점 파라미터를 탐색하여 인간 손 이미지의 자연스러운 가변성을 처리한다. 마지막으로, 다중 모달리티 데이터를 생성한다. 손 관절, 모양 및 관점의 데이터 공간을 기존 벤치마크의 데이터 공간과 비교한다. 이 과정을 통해 제안된 벤치마크가 이전 작업의 차이를 메우고 있음을 보여주고, 또한 네트워크 훈련 과정에서 제안된 데이터를 사용하여 RGB 기반 손 포즈 추정 실험을 하여 생성된 데이터가 양질의 질과 양을 가짐을 보여준다. 제안된 데이터가 RGB 기반 3D 손 포즈 추정 및 시맨틱 손 세그멘테이션과 같은 품질 좋은 큰 데이터셋이 부족하여 방해되었던 작업에 대한 발전을 가속화할 것으로 기대된다.
https://doi.org/10.3745/PKIPS.y2020m11a.1052 인용 PDF

위치 데이터에서 유도된 속도의 확률분포 (Use of Probability Distribution of Speed derived from Positioning Data)

온경운;이준석;송하윤
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2013년도 추계학술발표대회
- /
- pp.1092-1095
- /
- 2013
오늘날 모바일 스마트 기기의 발전은 위치기반의 새로운 기술을 이끌었다. 현재 위치 데이터를 사용하는 많은 응용프로그램들이 소개되었고, 또한 널리 사용되고 있다. 하지만 아직 이러한 위치 데이터들은 환경적인 요소 등으로 인해 오류가 많다. 우리는 이전 연구에서 위치 데이터의 오류 검출 및 교정 알고리즘을 제안하였다. 또 다른 연구에선 인간의 이동속도가 어떠한 확률분포모델을 따르는지 연구하였다. 그리하여 본 논문에서는 인간의 이동속도의 분포로서 적합하다고 판명된 확률분포모델 중 Lognormal 분포, Gamma 분포, Weibull분포를 선택하여 위치데이터 오류 검출 및 교정 알고리즘에 적용하기 위한 확률분포 계산을 제안한다. 그 중 일부는 계산의 복잡도를 낮추기 위해 확률분포표를 제공할 것이다.
https://doi.org/10.3745/PKIPS.y2013m11a.1092 인용 PDF

Unity 기반 물리 실험 교육 시뮬레이터 개발 (Development of Unity-based Physics Experiment Education Simulator)

김연정;윤세희;신병석
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2020년도 춘계학술발표대회
- /
- pp.635-637
- /
- 2020
공학기술의 발전에 따라 인간은 Smart Learning을 넘어서 증강/가상현실 기술을 현실에 접목하여 교육의 매체로 사용을 하고자 여러 방면으로 시도를 하고 있다. 이에 과학교육 방면에서도 가상현실 환경 구축 기술을 이용하여 공간 및 상황 등의 여러 제한에서 벗어나 보다 다양하고 활동적인 실험을 할 수 있는 물리 실험 시뮬레이션을 필요로 하고 있다. 본 연구에서는 Unity Editor를 이용하여 코드 스크립트를 적용하여 가상 세계를 구축하고 물리 현상 중 하나인 포물선 운동 공식을 활용한 실험 프로그램을 만들어 VR 구현기기인 Vive를 이용하여 실제 물리실험에 적용한 사례를 소개한다.
https://doi.org/10.3745/PKIPS.y2020m05a.635 인용 PDF

테이블-탑 디스플레이 기반의 온라인 필기 문자인식을 위한 전처리 기법 (Preprocessing Techniques for On-Line Handwritten Character Recognition based on Table-Top Display)

김지웅;김의철;김수형
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2007년도 추계학술발표대회
- /
- pp.171-174
- /
- 2007
최근에 인간과 컴퓨터의 상호작용을 위한 입력장치 중 테이블-탑 디스플레이라는 멀티터치 입력장치가 활발히 연구되고 있다. 본 논문에서는 테이블-탑 디스플레이라는 환경에서 인간에게 가장 직관적인 도구인 손을 사용하여 입력된 온라인 필기 숫자를 전처리하는 방법을 제안한다. 테이블-탑 디스플레이 환경에 적합한 전처리 기법으로 대표점 추출을 위한 거리 필터링과 획 구분 및 잡음제거 등을 사용하였고, 데이터를 16방향 체인코드로 변환하였다. 이는 실제 필기운동 시의 궤적을 크게 왜곡 시키지 않으면서 테이블-탑 디스플레이가 갖는 환경에 기인한 잡음을 없애고, 데이터양을 줄일 수 있는 장점이 있다. 총450개의 필기 숫자 데이터를 사용하여 실험한 결과, 잡음이 제거되고 데이터양이 줄어들었으며 인식에 용이한 체인코드를 형성해 내었다.
https://doi.org/10.3745/PKIPS.y2007m11a.171 인용 PDF

신경망을 이용한 감정추론 모델 (The Emotion Inference Model Bassed using Neural Network)

김상헌;정재영;이원호;이형우;노태정
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
- /
- pp.309-312
- /
- 2004
본 논문에서는 인간과 로봇의 상호작용을 위해 감정에 기반한 감정 처리 모델을 설계하였다. 감정 재현 기술은 사용자에게 친근감을 주기 위해 로봇 시스템이 제스처, 표정을 통하여 사람이나 동물의 감성과 동작을 표현하는 분야이다. 로봇이 감정을 표현하는 문제에는 많은 심리학적, 해부학적, 공학적 문제가 관련된다. 여러가지 애매모호한 상황임에 불구하고 심리학자인 Ekman과 Friesen에 의해 사람의 여섯 가지 기본 표정이 놀람, 공포, 혐오, 행복감, 두려움, 슬픔은 문화에 영향을 받지 않고 공통적으로 인식되는 보편성을 가지고 있는 것으로 연구됐다. 사람의 행동에 대한 로봇의 반응이 학습되어 감정모델이 결정되고, 그 결과가 행동결정에 영향을 주어 로봇의 행동에 반영되도록 하였다. 본 논문에서는 인간과 로봇과의 상호작용을 통해 정보를 축적하고 인간의 반응에 적응해나 갈 수 있는 감정 처리 모델을 제안한다.
PDF

한국어 어휘의미망 KorLex 1.5의 구축방법론과 정보구조 (Methodologies for Constructing KorLex 1.5 (a Korean WordNet) and its Semantic Structure)

윤애선;권혁철;이은령;황순희
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
- /
- pp.42-47
- /
- 2008
1980년대 중반부터 지난 20여 년간 구축해 온 영어 워드넷(PWN)은 인간의 심상어휘집을 재현하려는 목적으로 개발되기 시작하였으나, 그 활용 가능성에 주목한 것은 자연언어처리와 지식공학 분야다. 컴퓨터 매개 의사소통(CMC), 인간-컴퓨터 상호작용(HCI)에서 인간 언어를 자연스럽게 사용하여 필요한 정보를 획득하기 위해서는 의미와 지식의 처리가 필수적인데, 그 해결의 실마리를 어휘라는 실체를 가진 언어단위에서 찾을 수 있기 때문이다. 이후 전 세계적으로 약 50개 언어의 어휘의미망이 PWN을 참조모델로 구축되어 다국어처리의 기반을 제공할 뿐 아니라, 시맨틱 웹 이후 더욱 주목 받고 다양한 방식으로 활용되고 있다. 본고는 PWN을 참조 모델로 2004년부터 2007년까지 구축한 한국어 어휘의미망 KorLex 1.5를 소개하는 데 있다. 현재 KorLex은 명사, 동사, 형용사, 부사 및 분류사로 구성되며, 약 13만 개의 신셋과 약 15만 개의 어의를 포함하고 있다.
PDF

움직임 분석 기반의 시각인지 모델을 이용한 비디오 코딩 방법 (Video Coding Method Using Visual Perception Model based on Motion Analysis)

오형석;김원하
- 방송공학회논문지
- /
- 제17권2호
- /
- pp.223-236
- /
- 2012
본 논문에서는 인간 인지 기반 비디오 코딩을 위한 비디오 처리 방법을 개발한다. 제안하는 방법은 율-왜곡(rate-distortion) 최적화의 영향뿐만 아니라 제한적인 시, 공간 해상도, 지역적인 움직임 이력(history), visual saliency에 의한 인간 시각 인지를 고려한다. 이러한 인간의 인지적인 효과들을 고려하기 위하여 본 논문에서는 움직임 패턴을 모델링하고 Hedge 알고리듬을 사용하여 움직임 패턴을 결정하는 기법을 개발한다. 그 다음, 제안한 움직임 패턴과 기존의 visual saliency와의 결합을 통하여 인간 시각 인지 모델을 수립한다. 제안된 인간 시각 인지 모델을 구현하기 위하여 기존의 foveation filtering 방법을 확장한다. 시각적 자극이 덜한 지역만을 부드럽게(smoothing)하는 기존의 foveation filtering 기법과 비교하여 제안하는 foveation filtering 기법은 인간 시각 인지 모델에 따라 지역적으로 부드럽게 또는 지역적 특성을 향상시킴으로써, 시각적 자극이 덜한 지역에서 줄여진 대역폭을 효과적으로 시각적 자극이 큰 지역에서 사용하도록 이동 시킬 수 있는 장점이 있다. 제안된 방법의 성능은 전반적인 비디오 화질을 만족할 뿐만 아니라 인간이 인지하는 화질의 품질을 12%~44% 향상시킨다.
https://doi.org/10.5909/JEB.2012.17.2.223 인용 PDF KSCI

검색결과 463건 처리시간 0.029초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)